科学网

 找回密码
  注册
爬取HTML的Java库-Jsoup
赵建保 2014-5-4 09:25
jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 主要功能: 1. 从一个URL,文件或字符串中解析HTML;2. 使用DOM或CSS选择器来查找、取出数据;3. 可操作HTML元素、属性、文本;jsoup是基于MIT协议发布的,可放心使用于商业项目。官 ...
个人分类: IT研究|3990 次阅读|没有评论
CNKI参考文献进展
热度 2 赵建保 2014-4-24 11:58
近期计划研究一下如何把知网CNKI的参考文献采集出来,供citespace可视化软件做分析用,不知大家有没有需要?有什么好的建议,请分享出来!知网客服回复:“目前知网没有提供参考文献这一字段的导出,不过已经反馈给研发部门,但是无法提供具体的时间表,非常感谢您的关注与反馈!”,看来还是wait!
个人分类: IT研究|3510 次阅读|2 个评论 热度 2

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-27 23:20

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部