|||
我国科技评价体系广为关注,又广为诟病。似乎没有一个满意的标准能够简洁而客观公正地评价科技成果。用论文数量吗?论文多不代表影响力大;用影响因子吗?不同专业领域有很大差距;用领域期刊排名吗?不同领域的研究深度和难度确实有差别。靠人评价吧?中国人有关系、派别、背景,还有名不符实者,好像更不靠谱;那全部请外国人来评吧,外国人也是猿猴变的,咱们的那些缺点他们照样有,咱们中国的国情他们还不一定理解。于是,众说纷纭,莫衷一是。
大家都找不到一致的办法,于是只好沿用既有的办法评下去。一直到不久前,国家重点实验室评估,把微生物领域3个实验室齐整整地评到黄牌警告那个行列里,我感到受了刺激,因为这里至少有两个实验室是我认为在微生物领域水平很高的。这样评下去,不是要人为地把一些重要领域和专业方向从中国版图上抹去吗?
看央视“机智过人”,深为我国人工智能技术的进步感到兴奋。近日又有报道,中科院自动化研究所研发出评分机器人,将参与音乐比赛评分。人工智能可做声像识别、棋局推演,甚至行文作诗,基于算法、利用大数据,加上自主学习,表现往往超过人类中的专业高手。而且,人工智能真的没有门派关系,没有专业偏见——如果没有被主人设定某种歧视软件的话。
于是,俺喜欢做白日梦的脑子放飞了一会,想象着让自动化所和科大讯飞各做一批人工智能机器人,奔赴国家奖、省奖、杰青、长江,重点研发计划、重大专项、重点实验室评估,还有各类职称、荣誉评定等等,各种不见硝烟的战场。让不同型号、算法的人工智能定量、定性评价,占总分的50%,另外50%让人类专家评定,两相加权,得出总体评价和取舍意见。当然,我说的这些不包括院士评选,谁建议让人工智能掺乎到院士评选中,那简直就是犯政治错误,对吧?
这样做靠谱吗?我们来论证一下吧!
首先,这样做又让中国多一个领先世界的突破口。当年,就是中国人率先把SCI影响因子变成大范围学术评价的规范做法,可谓领世界科学风气之先,后来西方科学期刊纷纷标明自己的影响因子,洋教授们投稿也看看期刊有几分。当然这只是故事的开始,我们要不断领先,而且要从头创新。SCI影响因子毕竟是外国人发明的,我们最多是应用推广。现在,如果我们能把科技评价机器人做成功,广为应用,推向世界,岂不是对世界科学的又一大原创性贡献?
其次,除了公正无私的特点,人工智能有绝对超人的文献储备和阅读耐心,更有批量、快速处理的特征,可谓专家满意,官员满意。博主见过太多评审,申报人多年的工作在评审会上只是几分钟决定命运。没有多少专家有耐心或者有时间认真阅读申请人的论文,更不可能研究其在专业领域的真实水平和实质性贡献。往往只能靠一两个恰好在场的小同行专家的介绍。那么,在更大领域里怎样比较出优良中差呢?其实几乎没有办法,最后只好用公认的硬通货——CNS论文,或者影响因子。可是,人工智能不同,以它们每秒数万亿,甚至亿亿次的运算,可以在一分钟内搞定送审材料原文的阅读、专业文献检索、对学术水平和贡献的权衡掂量,还有对未来影响力的判断。假如有一篇热门问题的文章发表于Nature,另一篇原始创新的论文发表于JBC,到了人工智能面前,它要依据自身对这两篇论文的阅读,与大领域、小领域文献的比较、分析,凭借历史上科学评价的大数据和其自我学习功能,作出独立判断,而不是像Nature小编那样查查是不是热点问题和大牛实验室做是否送审决定。
再次,人工智能不仅评价论文,还适合于评价专利、转化、推广等各类贡献。总有一天,物联网、大数据的应用会把足够多的经济社会信息融会贯通,成为人工智能做评价的信息资源。一项成果的原始创新性、应用价值、实际效果和未来前景在专业评价机器人面前将一览无遗。
最后,我们中国人真的太喜欢评价、打分了。从科技评价机器人做起,将来各类评价机器人的市场将极为广阔。譬如,城市排名,大学排名,年终评优,人才选拔,恋爱相亲,等等,罗列不尽。说不定恋爱相亲会成为评价机器人的最大市场,如果你去那些家长替大龄孩子相亲的地方看看就会同意我的说法了。
半真半假的一个说法,供各位评说吧,或许还能有点启发性。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-11-9 07:16
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社