闵应骅的博客分享 http://blog.sciencenet.cn/u/ymin 一位IEEE终身Fellow对信息科学及其发展的看法

博文

关于学术不端检测仪(100430)

已有 4353 次阅读 2010-4-30 15:25 |个人分类:做学问|系统分类:科研笔记| 学术不端, 检测

关于学术不端检测仪(100430)
闵应骅
    西安日报记者发表文章“学术不端检测仪能否保证学术纯洁”。文章说“所谓“学术不端检测仪”,是指利用全文文献为比对资源,通过软件全面检测学术不端行为的系统。”““学术不端检测仪”从2009年3月起在部分高校研究生院开始使用。该系统的官方操作介绍说:到目前为止,仅对研究生学术论文的检测,其检测量已达到20万篇次。在每一次检测过程中,待检文章首先按照篇章、段落、句子等层级分层处理,然后创建指纹。指纹即语言的特征,就好像每个人说话的口头禅,之后比对数据库中的比对文献。通俗来说,就是将论文和数据库进行比对,根据其重合处的比例,判断该论文是否存在抄袭行为。通常情况下,高校将这个重合比的限度定为25%~30%。若检测发现超过这个比率,论文就会被提交至该校学术委员会来判定是否存在抄袭行为。”
    近几年来,在中国国内,由于社会环境、学术环境的原因,学术不端行为比较多,揭发出来的学术不端行为也较多。本人是坚决反对学术不端的,但是对学术不端检测仪却抱怀疑态度。原因是:
1.“学术不端”没有形式定义
    究竟什么叫学术不端?没有形式定义写不了软件。篇章段落名相同就算抄袭吗?每篇无非都有序言、实验结果、结论,这能算抄袭吗?至于句子,一、两句相同,毫不为奇。例如中央的方针政策是统一规定的,用一、两句话概括,你能随便改吗?所谓“重合比”是指什么东西的重合比?句子、短语还是文字?有学生说:“由于高校的“学术不端检测系统”软件所用的都是中国论文库,抄袭国外的文章是检测不出来的。”何况,比对文献库如果要想涵盖所有学科,不可能全,那是海量数据。学术不端行为表现多种多样,不可能形式地罗列所有可能。
2.“学术不端”不要扩大化
    要求论文“即使是引用一两句话,也要说明出处。”我想实际上是不可能的,也没有必要。例如序言中说某个问题很重要,许多人都说过,难免有重复,不足为怪。定理叙述中的假定很多,有一、两个相同,有何不可?做学术不端检测系统的人可能想:多测出一些来,让专家去检验吧!这就把学术不端扩大化了。你想想,被检测出学术不端的作者会怎么想?有没有可能一篇创新性极高的论文被检测出来说是学术不端?有没有可能一篇权威的早已发表的论文却被指控为学术不端?已经检测了20万篇,结果如何?有多少篇是扩大化了的?有多少是真正的学术不端?有多少真正学术不端的文章没有检测出来?这个系统本身没有经过公开的足够的测试是不可信的。
3.根治“学术不端”主要不靠法律
    当今我们国内不诚信的实例太多,并不限于学术界,在商业界、制造业、甚至政界,都层出不穷。学术界的不诚信行为比较容易揭露而已,尤其是学生的学术不端,而对教授、院长、校长的学术不端就不那么容易揭露了。学术不端行为触犯法律的应该法办,但这仅仅是极少数。大量的是做学问的方法不对、目的扭曲、急于求成、名利驱使。关键还是教育,教育者要先受教育。古今中外,偷窃、沽名钓誉都是可耻的,为什么有些人会无所谓呢?
    文章最后说:“若检测发现超过这个比率,论文就会被提交至该校学术委员会来判定是否存在抄袭行为。”这是好的。这就是说,让这个学术不端检测仪做个初选。但给学生这种压力和威慑似乎是没有必要的。其实,对校学术委员会也不能寄予过高的希望。文章说:“校方还是希望同学们认真写作。”这无疑是好的。

https://wap.sciencenet.cn/blog-290937-318069.html

上一篇:云计算与供电(100426)
下一篇:中国学术不端事件频发原因分析(100506)
收藏 IP: .*| 热度|

0

发表评论 评论 (2 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-16 19:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部