前不久完成的《“山寨版”PDF文档的利与弊》(已经投稿)对于以方正书版排版结果转化为PDF文档为例进行了分析,在其弊中就谈到利用一些廉价插件组装的转化系统,形成的PDF文档能够导致学术不端检测失灵。因为这种“山寨版”的PDF文档无法复制拷贝或者无法选中,仅仅是图片格式而已。不过应该注意,一些“山寨版”PDF文档可以通过OCR处理,转化为可以搜索、拷贝与复制的PDF文档,有些处理后仅仅有英文部分可以搜索、拷贝与复制;但是更多的是无法处理或者处理后可以选中,但是拷贝复制结果全部是乱码。因此这类PDF文档存在着许多问题,仅仅适宜于“定向”交流,即交流双方或者多方之间的目标非常明确,不是通过数据库或者搜索引擎来协助完成需求信息搜索的场合;对于非定向交流适应性不佳或者根本无法适应。网络期刊或者是OA不宜使用。
为了进一步说明这个问题,我特意从CNKI网站上,随便拷贝“组装”了一篇,采用方正打印驱动(FOUNDER WordJet A6000)将方正书版10.0大样文件生成所谓“标准”的PS文件,在利用Acrobat Distiller将PS文件转化为PDF格式,尽管生成的PDF文件也可以选中、复制、拷贝,但是拷贝结果全部是乱码。将其PDF文件上传之“
科技期刊学术不端文献检测系统”进行检测,结果:“[无问题记录]” !这是一个多么可怕的结果!?
因此建议各种数据库,对于上传的PDF文档的功能必须进行严格要求,不要让一些貌似酷相的“山寨版”PDF文档所迷惑,让一些学术不端行为、奇谈怪论、甚至蛊惑人心的谬论、谣言逃避严格的学术监管肆意泛滥。
“山寨版”PDF文档的出现,对编辑出版工作、机要保密工作、节能环保工作、无纸化办公等诸多领域带来的利好,尚需要积极推广,扩大应用范围。如保密部门、档案部门、军政部门、金融部门等应该优先考虑使用“山寨版”PDF文档,来有效提高文件材料的安全性,因为逆主流、异样化的PDF文档制作方法可能最适合一些特殊行业或者部门应用。所有单位以及各部门之间的定向交流等文件,只要不涉及非定向交流的一切场合,均可积极推广应用“山寨版”PDF文档,因为其制作过程费用低廉,方便可靠,有利于节能减排、构建节约型社会。
当然,我们也不要被其貌似酷相方正书版排版原样的外表所迷惑,认为通过各种“捷径”,转弯抹角形成的廉价“山寨版”PDF文档,就是我们实现数字出版的基础,就可以满足我们制作光盘和网络型期刊的需要,如果我们对“山寨版”PDF文档自身存在的功能缺陷认识不足,不分场合与用途,随意到处使用,特别是对于非定向交流场合的使用,不仅不会促使我们的数字出版朝着正确的方向健康发展,而且会使我们背离数字出版,误入歧途越走越远。同样的期刊,不同文章的PDF文件可能存在差异,就是在不同数据库中相同论文的PDF文件之间,由于转化过程不同也可能存在差异,是否可以读取PDF文件中的每个数据信息,关键与PDF文件的功能是否齐全有关,唯有一分为二看待“山寨版”PDF文档的功能缺陷,分用途选择使用,扬长避短,充分发挥其优势,才是我们的明智选择。当然我们也期待,在未来能够看到一个具有自主特色的PDF文档标准化制作过程,使方正书版不同版本的排版结果具有完全相同的、功能完备的PDF文档输出格式(如克服英文搜索需要全角状态),应用于我国的数字化出版,推进我国数字出版业以及期刊OA化的快速发展。
学术不端
https://wap.sciencenet.cn/blog-212210-416314.html
上一篇:
郭氏哥德巴赫猜想证明新作(修改稿)-“完美素数定理”下一篇:
C6-神经酰胺与癌