ChaomeiChen的个人博客分享 http://blog.sciencenet.cn/u/ChaomeiChen

留言板

每天23点到次日7点之间禁止发表留言。

[113]shftanya   2012-1-4 18:37
尊敬的陈老师:您好!又来向您请教:
1、我的数据是自然科学类的。删减了最末尾的期刊数据源,由原来的4万余条文献缩减为2万8千条,由原来的226M缩减为149M。作CR分析时,分别选2001-2010年,出来15个聚类;选2005-2010年6年数据,则出来22个聚类。对比了两个聚类效果的标签号的内容,有共同的内容,但也有不相同的。请问,这属于正常结果吗?我应该选择哪种结果来分析?是不是10年的结果对分析知识前沿领域更具说服力。但不相同的聚类结果部分,又应做何处理?
2、数据缩减后,又尝试做KW分析,无论选top=30,或50,还是top=2o%依旧没有聚类,或cluster=1。又作了institution和country的分析,也基本同前,没有聚类。是数据有问题,还是我不会设置参数的原因(因我是初学使用者,所以基本参数我都选择默认值)?
3、虽说作institution和country等的分析时,没有聚类,但左侧数据显示正常的Freq 值,能看到比如,USA排列第一,Germany 排第二等,能否认为即使没有聚类,但这个结果可以导成EXCEL表或折线图作为“国家或机构”在这方面研究的重要程度分析的?
4、我发现即使分析CR有了聚类,但中心性几乎都=0或为数不多几个出现=0.01,0.02,这是否意味与我结果出来的聚类图中连线相对不多有关系?在拜读《科学知识图谱:方法与应用》有关使用您的软件的一章P169,连线到了几百,而我的只是几十个,top=50时,所有nodes=50,这都正常吗?如下:
1-year slices         criteria        space        nodes        links
2001-2001        top 50        81530        50        34
2002-2002        top 50        79749        50        38
2003-2003        top 50        89852        50        19
2004-2004        top 50        90115        50        21
2005-2005        top 50        101582        50        37
2006-2006        top 50        97458        50        24
2007-2007        top 50        92897        50        31
2008-2008        top 50        84025        50        51
2009-2009        top 50        75423        50        40
2010-2010        top 50        77385        50        28

5、最后还有一个:发现聚类号后面标注出现(48.04),比如#4(48.04)knowledge structure ,这在哪设置就能显示,又代表什么意思?是不是这个数值越大,中心性越强,越代表它的重要性或前沿性?
恳请陈老师能在百忙中能抽出时间回答我的问题,非常感谢!并祝您身体健康!
我的回复(2012-1-6 21:17):能说说从一开始数据是如何查的吗,by topic, source, etc.?
我的回复(2012-1-4 21:16):最关键的步骤还是数据选择的范围,是否有足够的依据。
top 50 限定了 nodes的个数最大为50. 你可以提高Top N的设置,如top N=100.
其他问题我等我有时间尽快回答。
[112]tangchenglin   2012-1-4 10:09
陈老师,我按照您的教程,一步一步做。sci下载了txt,命名为download_2001.txt。project home填了C:\Users\tcl\Desktop\test\project,data directory填了C:\Users\tcl\Desktop\test\data。可是,一点“go”,space status里的space、nodes、links全是0,什么也分析不出来。请教您怎么办?
它提示,make sure that your data files indeed include relevant information,sucn as references;try again with lower thresholds.
[111]qyf12143   2012-1-1 12:59
陈老师,路径我检查了,没有错,java也是最新版的。
可启动时还是一样的提示,还可能是其他原因吗?
谢谢陈老师的回复!
我的回复(2012-1-2 11:26):检查以下你的内存是否能满足launch.jnlp中的要求。jnlp文件可以修改。
[110]shftanya   2011-12-31 19:33
谢谢您,陈老师,我会再试试,在这儿先祝你新年快乐!
[109]shftanya   2011-12-30 23:34
陈老师,您好,2005-2010,Node types=CR,topN=40,pathfinder,15个聚类,
N=103,E=130   modularity Q=0.8428 silhouette=0.9214
我的回复(2011-12-31 11:10):N好像相对小一点。只能建议重新考虑一下数据收集的细节。
[108]qyf12143   2011-12-30 23:22
陈老师,您好。我是一名在校本科生,近期跟老师做一个信息可视化的项目,需要用到您开发的citespace,可我的电脑怎么也启动不了,我已经装了java,但每次启动launch.jnlp时,都会弹出“应用程序错误”的对话框,点击详细信息,会看到——
错误:无法加载资源:file:/C:/CitespaceII/dist/launch.jnlp
异常:
com.sun.deploy.net.FailedDownloadException: 无法加载资源:file:/C:/CiteSpaceII/dist/launch.jnlp
        at com.sun.deploy.net.DownloadEngine.actionDownload(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getCacheEntry(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getCacheEntry(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getResourceCacheEntry(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getResourceCacheEntry(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getResource(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getResource(Unknown Source)
        at com.sun.javaws.Launcher.updateFinalLaunchDesc(Unknown Source)
        at com.sun.javaws.Launcher.prepareToLaunch(Unknown Source)
        at com.sun.javaws.Launcher.prepareToLaunch(Unknown Source)
        at com.sun.javaws.Launcher.launch(Unknown Source)
        at com.sun.javaws.Main.launchApp(Unknown Source)
        at com.sun.javaws.Main.continueInSecureThread(Unknown Source)
        at com.sun.javaws.Main$1.run(Unknown Source)
        at java.lang.Thread.run(Unknown Source)
封装异常:
java.io.FileNotFoundException: C:\CiteSpaceII\dist\launch.jnlp (系统找不到指定的路径。)
        at java.io.FileInputStream.open(Native Method)
        at java.io.FileInputStream.<init>(Unknown Source)
        at java.io.FileInputStream.<init>(Unknown Source)
        at sun.net.www.protocol.file.FileURLConnection.connect(Unknown Source)
        at com.sun.deploy.net.BasicHttpRequest.doRequest(Unknown Source)
        at com.sun.deploy.net.BasicHttpRequest.doRequest(Unknown Source)
        at com.sun.deploy.net.BasicHttpRequest.doGetRequest(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.actionDownload(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getCacheEntry(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getCacheEntry(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getResourceCacheEntry(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getResourceCacheEntry(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getResource(Unknown Source)
        at com.sun.deploy.net.DownloadEngine.getResource(Unknown Source)
        at com.sun.javaws.Launcher.updateFinalLaunchDesc(Unknown Source)
        at com.sun.javaws.Launcher.prepareToLaunch(Unknown Source)
        at com.sun.javaws.Launcher.prepareToLaunch(Unknown Source)
        at com.sun.javaws.Launcher.launch(Unknown Source)
        at com.sun.javaws.Main.launchApp(Unknown Source)
        at com.sun.javaws.Main.continueInSecureThread(Unknown Source)
        at com.sun.javaws.Main$1.run(Unknown Source)
        at java.lang.Thread.run(Unknown Source)
不知是何原因,迫切需要的到陈老师您的解答!
我的回复(2011-12-31 23:33):核对一下文件的路径:
C:\CiteSpaceII\dist\launch.jnlp
也可以重装最新的java试试.
[107]shftanya   2011-12-28 10:13
topN% 上限是100
看一下下列信息:
N=137
modularity Q=0.44
silhouette=0.064
.
我的回复(2011-12-29 09:22):如果这是用slice=1得到的,这比一般类似数据量下生成的网络小很多。数据是关于自然科学领域吗?
[106]shftanya   2011-12-27 16:09
陈老师,您好,我用.CiteSpace 3.0.R2 ,做关键词分析,2001-2010,topN%=20%,数据量为四万余条,pathfinder,可视化图形只有两个聚类,算正常吗?
我的回复(2011-12-28 00:09):topN% 上限是多少?
看一下下列信息:
N=?
modularity=?
silhouette=?
[105]haufull   2011-12-27 01:31
收到。呵呵。
[104]haufull   2011-12-25 11:01
陈老师,Merry Christmas,新年快乐。
citespace对一个领域做了DCA聚类分析之后,对较大的聚类做了
cluster members == cited references == intellectual base
cluster makers == citing articles == research fronts
知识基础和研究前沿分析,那么这些研究前沿可以代表本领域的研究前沿吗?是根据burst term得到的吗?
我的回复(2011-12-26 23:30):节日快乐。
此前沿可代表本领域的主要研究前沿,是由其对偶关系决定的,即在知识基础上的新知识。在Cluster Explorer中这个关系是由左,中两列文献表示的。
[103]魏新岗   2011-12-25 10:24
您好陈老师:
    我想问一下,如果对国外的某本杂志做主题热点的研究,怎样使用您这一软件
我的回复(2011-12-31 23:23):看一下:http://cluster.ischool.drexel.edu/~cchen/citespace/videos/
[102]haufull   2011-12-23 22:05
好的,我知道了,陈老师,谢谢您。
[101]haufull   2011-12-23 17:02
陈老师,我在DCA聚类分析中,按步骤做到了Cluster Explorer,但是无法做到像您的著作《The Structure and Dynamics of Co‐Citation Clusters:A Multiple‐Perspective Co‐Citation Analysis》中,从最大的聚类中找到cited references as the Intellectual Base或者Citing Articles as Research Fronts,那些cited reference还有citing article是怎么找出来的?我在cluster explorer中可以找到每个聚类的cluster members还有cluster makers。cluster members中有author但是title下面都是省略号“.....”。cluster makers显示正常,下面的文献是不是应该对应的是citing article呢?谢谢陈老师,我的每步都是在您的指导下完成的,真心感谢您,真想拜您当导师。
我的回复(2011-12-23 21:39):cluster members == cited references == intellectual base
cluster makers == citing articles == research fronts
cited references的title你要逐个找一下,最简单的办法是在网络中找到相应的节点,右键》DOI, 或Google Scholar来找title.
[100]haufull   2011-12-23 11:07
数据不是按期刊搜索的,就是按主题搜索的,也可能是实际就是如此吧,我正在试聚类分析,谢谢陈老师。
[99]haufull   2011-12-23 00:23
陈老师,我看您的著作《The Structure and Dynamics of Co‐Citation Clusters:
A Multiple‐Perspective Co‐Citation Analysis》中关于ACA的操作,在做出来ACA的timeline图谱之后,表4做的是“labels of the  largest ACA clusters”,我知道操作,但后面的表5”top-10 most cited authors of the  largest ACA clusters“的具体操作时怎样的,我试了很久都没有试出来,陈老师能告诉我一下吗?我最近在写论文,频繁的请教陈老师真是不好意思,谢谢陈老师。麻烦您了。
我的回复(2011-12-23 03:29):可按下列步骤:
1 - cluster
2 - label
3 - Synthesizing>Cluster Explorer
细节上有些变动,如引文前面0.41指该文引用了相应聚类中41%的文献。
[98]haufull   2011-12-22 23:15
六篇文献是:1.Ferretti A,1990.Knee injuries in volleyball  2.Ferretti A,1992.Knee ligament injuries in volleyball players 3.Lian O,1996.Characteristics of the leg extensors in male volleyball players with jumper’s knee  4.Briner WW,1997.Common injuries in volleyball  5.Bahr R,2003.Injuries among word-class professional beach volleyball players 6.Ferretti A,1998. Injuries of the suprascapular nerve at the spinoglenoid noth
基本上都是关于伤病的,我数据的主题是“volleyball”。我试了很多次,一直是这种情况,不知道该怎么分析了!麻烦陈老师了。谢谢您!
我的回复(2011-12-23 03:36):看到了。
数据是如何选的,是按期刊,还是别的办法?
也许实际如此,除非你有别的线索。
可聚类,表明主题后,再分析, 如Cluster Explorer.
[97]haufull   2011-12-22 23:08
刚才的地址不好用,这个能看到:http://hi.baidu.com/haufull/album
[96]haufull   2011-12-22 23:07
陈老师,我没有您的邮箱,不知道怎么把图谱传给您,我把生成的图谱传到我的百度空间相册里面了,地址是:http://hi.baidu.com/haufull/albu ... 7912395dd8cac.html#。
不知道您能看到不能.
[95]haufull   2011-12-22 12:48
陈老师,您好,我在分析web of scienc数据的过程中,做了文献共被引的图谱,年份是从1982年到2011图谱中有六个关键点,我查看了六篇原文,但是我发现这六篇文献的范围局限在1990年到2000年之间,并且都是关于一个主题(injuries),但是我得数据是以“体育”为主题搜索的。我看到您的文章中认为,共被引网络能够反映研究前沿的发展轨迹,那么像这样的数据的研究前沿就一直是“injuries”吗?我该怎么分析呢?麻烦陈老师百忙之中抽空帮我解答一下,谢谢陈老师。
我的回复(2011-12-22 22:04):把图给我看一看。标一下你指的这6个点。
[94]李建伟   2011-12-21 13:41
陈老师,您好,最近刚刚开始学习Citespace的使用,在作者分析的时候我也发现了和ruixue8269相同的问题,如果文献中出现了编者(BE)这个标示,就会自动把BE加入到名字中,比如这个:
PT S
AU Li, YS
   Wang, FL
   Ma, CH
AF Li, YS
   Wang, FL
   Ma, CH
BE Iwahori, S
   Gemma, H
   Tanabe, K
   Webster, AD
   White, AG
TI Adaptability and use of introduced cultivars of Pyrus pyrifolia nakai in
   Gansu province of China
SO PROCEEDINGS OF THE INTERNATIONAL SYMPOSIUM ON ASIAN PEARS COMMEMORATING
   THE 100TH ANNIVERSARY OF NIJISSEIKI PEAR, VOLS I AND II
SE ACTA HORTICULTURAE
LA English
DT Proceedings Paper
CT International Symposium on Asian Pears, Commemorating the 100th
   Anniversary of Nijisseiki Pear
CY AUG 25-29, 2001
CL KURAYOSHI, JAPAN
SP Japan Soc Hort Sci
分析的时候会出现S BE Iwahori这个作者的信息,请问应该怎么处理?
我的回复(2011-12-22 10:14):下一版中会解决这个问题。
目前可用下面的临时方法:
右键选则不需要的节点,exclude.

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2021-12-4 23:16

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部