孙学军
应对文献洪流有何秒招? 精选
2014-9-4 17:22
阅读:6081

作为科研人员,随时了解外界信息十分必要,在当前信息方便的时代,获得信息的途径和手段容易,但是随之而来的信息轰炸会让一些人对过多的信息产生厌恶情绪。获取信息的方便和信息分类的准确性不够已经给许多人带来了负面影响,有时候我们会对大量信息很恼火,甚至有大量删除信息的欲望。如何应对这种问题?今天《自然》杂志介绍了一些学者正在使用的新武器。这些工具的思路对国内学术网络技术开发者应该有一定启发。

和许多学者一样,Casey Bergman的日常科研工作中包括检查邮件和网络快讯,从中找到自己领域中的最新论文。但是他逐渐对许多杂志丰富站点摘要和PubMed自动发送的推荐数据有一些厌恶,虽然这些信息很方便管理,但是如果有几天不处理,将会因为信息太多变成一种负担。

Bergman是曼彻斯特大学研究果蝇(Drosophila)的计算遗传学家,去年开始他使用一种新的新文献信息途径,自动推特帐号FlyPapers。这个工具可以利用网络机器人拖网技术从PubMedarXiv中查找包含Drosophila的文献,然后在群内分发。Bergman发现这种技术非常容易使用,这种思路迅速引起大家的关注,已经有大约55个类似的twitterbots在不同领域中效仿。

每天新发表论文数量大约6000篇,虽然不可能阅读所有这些文章,但学者又不希望错过真正对自己学术具有重要价值的文章。在这种如洪水般的海量文献时代,跟踪检索新文献已经成为一种折磨,但每个学者往往有自己应对的独特个性。纽约哥伦比亚大学发育遗传学家Sally Burn 使用Scizzle,这种工具能定期给给她发送PubMed的检索结果,这种方法给她带来了很大方便。

但是利用关键词检索到的文章只是从技术层面说明文献的可能重要性,最新的文献推荐引擎不仅能检索或过滤关键词,而且能根据学者的阅读兴趣提供新文献阅读建议,本质上这和淘宝、亚马逊等使用的技术是一样的。德克萨斯大学计算生物学家Matthew Davis就在开发这种软件PubChase,这是一款给科学家用移动网络使用的检索服务。

最好的也最有名的网络文献服务仍然属于谷哥学术,这种工具能通过对学者已经发表和被引用为线索推荐文献。这种推荐非常准确和及时,我本人也使用多个文章为线索的检索。大家不仿使用,找到你这个领域最早最厉害的几篇文章,将所有引用这些文章的新文献作为推荐目录,只要有更新立刻会发到你信箱内。例如本人将2007年日本太田教授发表的国际上第一篇关于氢研究的论文,虽然其他领域的研究也会引用,但几乎有60%的文献都是这个领域我必须阅读的文献,这种效率几乎没有任何工具能比拟。(虽然SCI数据库也有这个功能,但时间延迟的可怕,不建议使用)。

PubChase推荐来自PubMed的论文基于使用者的发表记录,也可以根据使用者过去阅读的文章作为依据,定期检索并储存于网络图书馆内,该技术还使用了其他机器学习技术,能将不同用户的图书馆进行比较,可以根据同行的共同爱好推荐文献,这相当于计算机帮助学者进行相互参考的功能。

英国巴斯大学进化生物学家Ross Mounce认为PubChase对非生物医学领域的学者没有太大用。他更喜欢Sparrho,该工具能让用户对软件进行训练,帮助提供论文、基金、专利、海报、会议进展等所有相关信息。

根据《自然》对3000名科学家的最新调查,使用PubChase只有8%,定期访问不到1%

Bergman对这些根据算法进行的检索服务表示担心,这些机器推荐的文献遇到交叉学科容易出现失误,例如他希望了解基因组和文本挖掘相关的文献,谷哥学术在推荐这类文献中就容易过滤掉重要文献。Davis说这种局限性能根据共同兴趣的用户推荐来解决。

更多科学家并不采用这些新的搜索技术,而是简单地通过社区网络跟踪他人推荐的文献,这是大部分人的习惯,有的人连基本的检索都不喜欢用,只喜欢等别人推荐,这符合实际情况。Twitter在推荐新文献方面是绝对领先的工具。也有一些人更喜欢使用文献管理服务网站如Faculty of 1000 Mendeley。个人兴趣爱好不同,会选择使用不同的手段,网络世界的快速发展也给大家提供了不同的体验类型。

本文根据《自然》信息改写,包含个人理解和评价信息,如有误解请谅解。

http://www.nature.com/news/how-to-tame-the-flood-of-literature-1.15806

转载本文请联系原作者获取授权,同时请注明本文来自孙学军科学网博客。

链接地址:https://wap.sciencenet.cn/blog-41174-824993.html?mobile=1

收藏

分享到:

当前推荐数:5
推荐到博客首页
网友评论5 条评论
确定删除指定的回复吗?
确定删除本博文吗?