lucheng918的个人博客分享 http://blog.sciencenet.cn/u/lucheng918

博文

tab页切换的网页如何使用火车头抓取

已有 2380 次阅读 2015-5-23 11:06 |个人分类:爬虫|系统分类:科研笔记| Fiddler

例如:

http://my.39.net/yanfuhai2011

要抓取医生的回复信息,这时候需要使用一个抓包工具,推荐Fiddler。从抓包工具的信息中提取地址:

http://ask.39.net/my/person/docdetail.aspx?pageIndex=1&typeId=1&mid=12472352&stateId=1&time=Sat%20May%2023%202015%2010%3A52%3A00%20GMT+0800%20%28%u4E2D%u56FD%u6807%u51C6%u65F6%u95F4%29

抓取页面如下:


修改typeId就可以切换四个tab页,修改pageindex可以变换页码

 



https://wap.sciencenet.cn/blog-780964-892540.html

上一篇:几个不错的政府网站展现形式
下一篇:德温特专利数据库的由来
收藏 IP: 218.30.100.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-21 17:45

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部