|||
文本挖掘与信息检索和文本总结不同,信息检索和文本总结(text summarisation)侧重于文本的更大单位,如整篇文章,而文本挖掘则侧重于较小的粒度水平并检查文章内部和文章之间特定信息之间的关系。
文本挖掘也与自然语言处理不同,因为自然语言处理试图从整体上理解文本的含义,而文本挖掘则是注重解决特定重要领域中的特定问题(也许会用到一些自然语言处理的技术)。
例如,通过选择最可能含有感兴趣信息的文章,文本挖掘可以数据库维护人员提供帮助;或者通过寻找与偏头疼的特定生物学过程相关的药物,发现偏头疼的潜在的新治疗方法。
因此上,生物医学文本挖掘的目标就是帮助研究人员更加有效地确认所需信息,发现隐藏在大量信息中的关系,更加宽泛地说,通过给存在于文献和生物医学数据库中的自由文本字段中的大量生物医学知识应用应用算法、统计方法和数据管理的方法,去除信息过量给研究人员造成的障碍。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-9-9 03:45
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社