崔雷的窗口分享 http://blog.sciencenet.cn/u/zilu85 我在专业领域里的感受

博文

按标题搜索
喜大普奔:课程视频上线了!
2022-3-1 17:16
生物医学数据库利用和文本挖掘在科研选题中应用两门课已上线,以下是课程连接: 生物医学数据库利用 https://www.xuetangx.com/course/CMUP1010006416/11685268?channel=i.area.manual_search 文本挖掘在科研选题中应用 https://www.xuetangx.com/course/CMUP1010006417/11685217?channel=i.area.manual_search
个人分类: 生物医学文本挖掘|2013 次阅读|没有评论
共现分析的7个瓶颈(6)
2022-2-18 10:16
6 聚类含义的解释 共现聚类分析的诸多关键节点中,对于聚类分析结果的语义判读和解释是整个分析研究的最后一道程序。聚类结果经过解读后把所研究的领域研究热点等直接呈现给用户,因此解读是否准确和可靠决定着整个分析的成败;而结果的准确和可靠程度受制于分析者的专业知识背景和逻 ...
个人分类: 生物医学文本挖掘|1802 次阅读|没有评论
共现分析的7个瓶颈(2)
2022-2-18 09:58
2 、频次统计 书目共现聚类分析中,条目出现频次是最基本的数据,也是截取高频条目以及共现分析的基础,研究者一般直接将文献记录输入到已有的软件(如citespace、bicomb)中,直接得到书目文献记录中的各字段(如作者、主题词等)中条目的出现频次,但是这种频数统计实际上也隐藏着差异。 (1)引用频次的统 ...
个人分类: 生物医学文本挖掘|2013 次阅读|没有评论
共现分析的7个瓶颈(1)
2022-2-18 09:52
1 、共词聚类分析样本的收集 分析样本的收集是开展后续研究的基础。显然,对于特定的领域研究状况的分析,如果样本采集出现错误,或者收集不全,或者误检率过高,那么无论其后的分析过程多么严谨,所得到的结论都是不可信的。 对于书目信息的共现分析,涉及到的主要问题就是在文献数据库中如何制定检索策略的问 ...
个人分类: 生物医学文本挖掘|1513 次阅读|没有评论
基于R语言的PubMed信息抽取工具
2021-1-23 12:21
暂时名字叫做PubMR,放在GitHub上。 建设中,因此还不完善,欢迎大家使用,有什么问题和需求大家尽可能提出来,打算作为bicomb的升级版。 https://github.com/xizhou/pubMR
个人分类: 生物医学文本挖掘|2568 次阅读|没有评论
Bicomb针对PubMed不能下载xml格式的补丁
热度 1 2020-7-23 11:34
把这个可执行文献复制到目录里,覆盖原有的文件就可以了。 在pubmed网站下载pubmed格式,用软件里的pubmed-2模板进行分析。 提取后,主题词的星花可以通过批量修改去掉。 目前上传一个压缩包,解压缩后应该可以使用。 安装包.rar 稍后可以到这个地址下载: https://www.cmu.edu.cn/dmi/nr.jsp?urltype=news.Ne ...
个人分类: 生物医学文本挖掘|4822 次阅读|3 个评论 热度 1
MeSHy:Mining unanticipated PubMed information
2020-7-13 16:41
T. Theodosiou et al. / Journal of Biomedical Informatics 44 (2011) 919–926 The basic assumption is that the terms that have almost the same probability of being observed within the results of a query and also in the entire PubMed database (excluding the results of the query) do not contain imp ...
个人分类: 生物医学文本挖掘|2854 次阅读|没有评论
BICOMB下载网址及升级
热度 1 2020-7-13 09:38
学校网站调整,bicomb的下载地址变更为: https://www.cmu.edu.cn/dmi/nr.jsp?urltype=news.NewsContentUrlwbtreeid=2161wbnewsid=4589archive=0 ;途径是中国医科大学-院系-医学信息学院-科学研究-科研成果-书目共现分析系统bicomb。 关于PubMed数据库最近下载格式中没有了XML格式途径,我们正在开发针对该 ...
个人分类: 生物医学文本挖掘|9830 次阅读|1 个评论 热度 1
从生物医学文献中自动识别出科学严谨临床研究报告的深度学习方法:比较分析研究
2019-2-27 15:45
背景: 开展循证医学实践中遇到的主要障碍是有效地找到关于特定临床主题的科学合理的研究。 目的: 探索采用深度学习方法从生物医学文献中检索科学合理的治疗研究。 方法: 我们使用 403,216 条 PubMed 记录作为噪声数据集,以标题和摘要作为特征训练卷积神经网络。将深度学习模型与目前 ...
个人分类: 生物医学文本挖掘|2700 次阅读|没有评论
Bicomb软件处理pubmed的xml格式中出现问题的临时解决办法
热度 3 2018-4-2 10:44
最近发现,提取pubmed2016年以后的记录过程中出错,如下图: 经过反复调查,发现是因为下载的文献中,标题内容中存在sup或sub或i字符,导致提取意外终止。包括: b (bold) i (italic) sup (superscript) su ...
个人分类: 生物医学文本挖掘|7308 次阅读|4 个评论 热度 3

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-28 20:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部