不久前,国家科研主管部门印发“关于开展科技人才评价改革试点的工作方案”,将在部分科研院所、高等学校及附属机构进行为期两年的试点。在基本原则的第一条中,提出要着力克服“四唯”(唯论文、唯职称、唯学历、唯奖项)倾向,重点解决好科技人才评价改革落实难等问题。“工作方案”拟针对承担国家重大攻关任务、基础研究应用研究、技术开发、社会公益研究等各类人才,破四唯、立新标。
对此,科研人员似乎没有表现出强烈反响。尽管“工作方案”的表述极其严密,但人们仍然对其可行性和后果表示了一定的疑问。例如,一位高校教师就担心破四唯可能会流于形式:虽然采取更客观的评价和激励手段是大势所趋,但现阶段还难以改变,原因是在管理部门由于破四唯而失去评价权的同时,却不能保证同行评价的实效,掌握同行评价权力的人当初正是靠了四唯才取得这个地位的。
我在研读“工作方案”之后也有类似的担心。就其可行性而言,学历与能力、职称与经验、资历与成绩、身份与水平在操作层面上难以割裂,从统计数据上看,这两组状态之间甚至是有明显相关性的。比如说,一位科研人员能力很强,学历却很低,这恐怕不是普遍现象。既然如此,只要当作特例来处理就可以了;如果破四唯是为了处理特例,那么我们的总体科研水平是由特例决定的吗?另一方面,试点工作的成败与如何立新标有关。有的评论意见认为,立新标并不是不要学历、职称、资历、身份,而是还需要考虑其他因素。这个意见是中肯的。关于这“其他因素”,我感到目前缺失的或关注不够的是以下两个必要条件。
第一个条件是科研业绩的内涵评价。同行评价并不天然地等同于内涵评价,虽然在科学共同体中人们确实寄希望于同行们来做内涵评价。内涵评价要依靠学术水平高、办事公正的同行。
理想的状况是评价者有较高的学术站位,能够高瞻远瞩地看到研究成果的学术价值,以高质量的内涵评价为己任。但现实情况下,评价者的学术水平受到发展阶段的制约,并非都能达到理想的水准。这样一来,在管理上就很有讲究了。例如,评科学技术奖的时候,主管部门曾提出过一个很大的难题,就是胜任内涵评价的专家太少,而需要被评审的成果太多。其实,少评奖就可以解决这个问题;如果每次只评一个或少数几个奖,就能大大减少评奖的负担,提高奖励的信誉。即使某一个稍为逊色的成果得了奖,被评成了第一位的,也不会有很大的损失。让奖励变成科研团体内部的事情,不要从外部去干预,是明治的管理办法。科研人员的职称晋升所需的评价也有相似性。年度业绩考核则有所不同,科研人员中的每一人都要被考核,在此情形下,如何才能对他们进行内涵式评价呢?可以邀请学术水平相对较高的人员,如大学里的教授委员会;同时,也需要对评价者进行适度的指导,使他们明白什么是内涵评价并努力做好。
这里以学术论文为例,来讨论如何进行内涵评价的问题。主流期刊发表的论文,一般来说质量较好,因为其编辑队伍和审稿专家的水平都相对较高。但对于具体的每一篇论文而言,确实存在很大的差别。如果要准确评价每一位科研工作者的业绩,论文就不能单看所在期刊,而要作进一步的分析。对于此项任务,选择同行专家是必须的,同时还要判定论文的水平和价值,而后者是一件细致的工作,需要回答许多具体的、细节性的问题,举例如下。
首先,研究者对前人的工作基础是否已经掌握?好论文一定是尊重前人的,不会通过贬低前人来抬高自己,而是会认真梳理于前人研究的逻辑关联性。有些论文,明明是针对前人早就已经研究过的问题,却刻意抹煞前人的发现和理论贡献,把文章写得像是本文首创。参考文献的引用也会暴露处这一点,明明参考了别人的研究结果,却刻意不引用或歪曲引用相关文献。这样的论文,从内涵上看就是有缺陷的。
其次,所研究的科学问题是否具有新颖性?好的论文,其内容在总体上或在某些方面是前人没有详细考虑过的,是代表了科研进展方向的。如何判断?需要根据科研历史的宏观趋势进行仔细分析。过去的科研论文讲究新方法、新理论、新发现,但是经过长期的研究,这种类型的论文现在越来越难写了。比较现实的论文写作,是在形成一个具体的科学问题时,按照时空尺度、地点、系统过程、重要现象的机制的类型、方法技术、等等,进行排列组合。这样一来,论文的相互之间的重复性就可以避免。这也是目前人工智能用于科研的一个趋势:在所有的可能性都穷尽之后,事情的真相就可能被完整地揭示出来。但是,这一研究路线与过去不同的是,需要写作的论文数量巨大,正因为这个原因,一个人即使发表很多论文,也不一定能像过去那样获得很高的荣誉,因为在这个层次上需要写的论文是太多了。因此,在内涵评价上,要求论文一定要有新方法、新理论、新发现,是过于苛求了。应该评价的是,发表的论文是否对AI导向的研究范式有所贡献?在所有的排列组合当中,待评论文是否处于一个新的位置?过去如果有人写过这种论文,是否还没有写得足够好?待评论文比前人写得更好,体现在哪里?
再次,论文的写作是否遵循弄清事实、理顺逻辑的规范?好的论文,必定是按照科学自身的规范去求取科学问题的答案的,因而会下功夫去准确刻画事实,并且通过理论分析将事实于科学问题相联系。对于待评论文提出以下问题是有助于内涵评价的:文中所用的数据质量如何?这些数据是作者本人采集的还是收集的,是否已清晰地给出了说明?作者对数据分析有多大的贡献?所采用的数据对想要得出的科学问题答案有多大的帮助?
最后,内涵评价要看科研人员努力工作的程度。过去,在人们的比较少能够发表高影响因子期刊论文的情况下,在这些期刊里发表的论文数量,可以看作是努力工作的标志。但现在未必是这样,高影响因子的期刊迅速增加,发表同样一篇论文所需的工作量则较少了。过去,人们很难发表Nature和Science及其子刊的论文,现在容易多了,以后说不定会很普遍,因为子刊数量和刊载论文数量都在急剧增加。此外,在学术期刊市场化的今天,发表论文的标准也发生了很大的变化,从论文格式到写作思路上,都有另类的做法,只要掌握了这种另类写作法,可以预见未来许多人都能够在期刊上发表大量论文。因此,论文数量不能继续作为判据,科研人员是否努力工作,要看其是否在研究工作上的投入时间精力、是否保持学习的态度、是追求创造还是重复泡制相似论文。
内涵评价的细节是可以商榷的,这里提出的要点是同行评价一定要针对内涵,而且内涵评价要有理念、有能力、有规范。是个同行就能进行评价、无论怎样评都行,这样的“同行评价”是不行的。
第二个必要条件是保障科研人员的工作条件。前面提到,内涵评价需要回答科研工作者是否努力工作、是否有成效的问题。然而,假如工作条件很差,还能谈什么努力工作、有成效?设想,一个研究者上了岗,拿了一份工资,却不提供工作条件,要求他(或她)自己创造条件,拿项目做研究,拿不到项目就整天空转、做无用功,这对科研机构来说是好事吗?长远来看,研究机构会有成果累积吗?管理有方的研究机构都会主动给科研人员提供工作条件,包括办公实、实验室、数据采集和分析设备、计算设备使用等等,即便没有任何项目资助,这些工作条件也要保障。这样才有可能让科研工作者安下心来,认真做有意义的工作;随着成果逐渐积累,研究机构声誉也逐年提高。我们的许多单位不是这样,科研人员获得一定的项目成了考核指标,有项目才能进行科研工作,否则实验室分析做不了,出野外也没有经费。这种管理方式的逻辑很奇特,付给工资,却不给工作条件,那到底要研究人员干什么?最贴近此种情形的一句老话是,“要马儿跑,又要马儿不吃草”。
目前过度强调竞争性项目的趋势发展下去,将使资源过分集中,造成浪费和效率低下。与此同时,广大一线研究人员面临日趋严峻的项目获取难、工作条件受限的困境,有沦为廉价劳力、创新能力丧失的危险。从研究人员个人角度看,如果获得项目的难度已经几乎耗掉了全部精力,而这不过是才刚刚取得了研究条件,那接下来还能怎么样?能拿项目的人就继续拿项目,无需再做研究,项目交账的事包出去,让别人或下属去应付,运气好的话把论文包装一下拿个奖;拿不到项目的人更无需做研究了,挣点额外的钱补贴生活,这更加实惠、更有诱惑力。在一定程度上,这是当下正在发生的情况,“躺平”就是这个意思。
改革开放的一段时期内,我国科研工作者努力工作,在艰苦的条件下产出了不少高质量的成果,我国跟西方国家的科研差距逐渐减小,在某些领域已经开始超越。但现在不少科研工作者没有忙到点子上,他们把大量时间花在乏味的文章上,给国际上许多掠夺性刊物交纳很高的版面费。久而久之,科学前沿在哪里?我们需要学习什么?我们需要发展什么样的创造能力?这些都变成了虚无缥缈的问题,人们很少关注了。如果我们不能使年轻一代的科研工作者努力学习、追求创造,科研的前景会怎么样?
为了科技事业的健康发展,调整科技资助结构已经刻不容缓。具体而言,应该尽快减少竞争性项目的占比,提高一线人员实验和研究条件保障的占比,使他们在缺乏项目资助的情况下,依然能够正常进行研究工作。
在保障一线人员的工作条件的思路下,竞争性项目的作用要重新定义。竞争性项目的获得意味着更多的科研资源,可以招收更多的博士生、博士后,可以让研究团队变得更加强大,可以让那些有更强能力的人发挥更大的作用。能人们会主动追求这份资源,根本用不着用考核来激励。既然如此,把科研项目获取列入年度考核内容,有必要吗?
上述的两个必要条件多年来不够重视,目前“四唯”状况的出现可能与此有关联性。我认为,基本问题不解决,“破四唯、立新标”的成效将大打折扣。立新标、走老路的可能性也存在:几年后说不定又会出现“既要破老四唯,也要破新四唯”、甚至“破八唯”的口号。
相关专题:谈谈科学
转载本文请联系原作者获取授权,同时请注明本文来自高抒科学网博客。
链接地址:https://wap.sciencenet.cn/blog-2336082-1369096.html?mobile=1
收藏