wengewsh的个人博客分享 http://blog.sciencenet.cn/u/wengewsh

博文

基于R语言爬取BOSS网站招聘信息

已有 2771 次阅读 2019-5-14 10:01 |个人分类:研究生课程论文|系统分类:教学心得

数据采集小作业-(9)基于R语言爬取BOSS网站招聘信息

作者:王堃

指导教师:王文武

单位:曲阜师范大学  统计学院


       在众多数据科学与网络技术中,人们对于爬虫的兴趣不断高涨。作为网络爬虫的两个有力工具:R和Python,在选择上已知饱受争议。本文主要介绍通过R语言实现网络爬虫。首先,第一部分简要介绍了Python和R两种爬虫工具的特点及选择。然后,在第二部分杰少Hadley等人开发的rvest包及相关函数的用法。最后,在第三部分机型实例操作,结合stringr包爬去BOSS直聘网北京地区数据分析师的招聘信息。其中,后两部分室本文的重点,对于理解和实现R语言爬虫十分重要。


       具体研究见附件。

王堃-基于R语言爬取BOSS网招聘信息.pdf




https://wap.sciencenet.cn/blog-3316039-1178909.html

上一篇:采集NBA常规赛历史数据 预测2019季后赛总冠军所在联盟
下一篇:R语言豆瓣图书Top250数据采集
收藏 IP: 60.211.229.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-23 17:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部