李老师好,导入citespace的数据对格式和编码有什么隐含的要求吗?我有问过陈老师但是没有得到明确的回答。我出现的问题是:我将从CNKI爬取下来的数据按照WOS格式写入txt,然后经由data->以WOS格式导入mysql,清理数据后,再由data->数据库export导出成wos格式的txt,导出的编码格式为ANSI,分析这个文件时,虽然乱码,但是author,institution,cited xxxxx等都可以分析。为了解决乱码问题,我将该文件转换为utf-8,而分析这个文件时,乱码没有了,但是institution无法分析了,提示为the time slicing setting is outside of you data.the range of you data is XXXX-XXXX,手动选择年份不行,重复多次无果。请问这个问题如何解决呢?
我的回复(2017-4-26 09:36):1. Search on PubMed and save search results to files in the XML format.
(Hint: Pull down the 'Send to' list, select File, and then the XML format)
2. Convert the XML files using the conversion function here.
使用CiteSpace ,测试数据在.citespace/Examples/WOS/FSC/data ,文件名download2010_0x5unique,运行结果如下:
(1) THE DATA DIRECTORY IN THE CURRENT PROJECT IS CORRECTLY SPECIFIED
(2) DATA FILES MUST BE NAMED AS download *.TXT, E.G.download_2008a.txt(3) the path and the filenames should be in English only