科学网

 找回密码
  注册
网络数据采集方法及其应用
王文武 2021-7-12 09:58
2021.03-2021.04 , 曲阜师范大学统计学院王文武博士主持讨论《基于R语言的自动数据收集---Web数据抓取和文本挖掘》( Automated Data Collection with R: A Practical Guide to Web Scraping and Text Mining )。参加讨论的硕士 ...
2976 次阅读|没有评论
基于R的中国人口及污染物地图绘制探索
王文武 2019-8-31 12:00
数据采集大作业-(6)基于R的中国人口及污染物地图绘制探索 作者: 支席年、曹智苗 指导教师: 王文武 单位:曲阜师范大学 统计学院 当前社会生活和发展所遇到的种种问题,无一不直接和间接的与人口问题相联系。首先,人口压力使社会在提供现有人口生活条件和提高人民生活水平方面 ...
个人分类: 研究生课程论文|2525 次阅读|没有评论
对NBA赛事的数据挖掘及分析
王文武 2019-8-31 11:48
数据采集大作业- (3)对NBA赛事的数据挖掘及分析 作者: 贺 真、黄晨玮 指导教师: 王文武 单位:曲阜师范大学 统计学院 本文先对腾讯网站NBA评论新闻的题目进行文本抓取并对其进行简单的文本分析。首先,从词云图中可以看到截至2019年5月26日,大众对于2018-2019NBA ...
个人分类: 研究生课程论文|2778 次阅读|没有评论
关于手机评论的情绪分析---华为 VS iPhone
王文武 2019-8-31 11:44
数据采集大作业-(2) 关于手机评论的情绪分析---华为 VS iPhone 作者: 何珊珊 韩婷婷 指导教师: 王文武 单位:曲阜师范大学 统计学院 在本案例分析中,我们要采集关于在亚马逊网站上销售的华为和iPhone手机的文字评价,来调研是否能利用对产品的评论来测算消费者的评 ...
个人分类: 研究生课程论文|2621 次阅读|没有评论
Robust Estimation of Derivatives Using LowLAD
王文武 2019-6-15 11:17
作者: 王文武 单位:曲阜师范大学 统计学院 论文: Robust Estimation of Derivatives Using Locally Weighted Least Absolute Deviation Regression 随着机器学习与人工智能的发展,更多数据利用计算机设备等时间间隔自动收集。针对该类型数据,其变化趋势(导数估计)受到越来越多的关注,如探测气候 ...
个人分类: 机器学习|2020 次阅读|没有评论
贵州茅台个股历史交易数据的自动采集与简单分析
王文武 2019-5-15 11:00
数据采集小作业-(15)贵州茅台个股历史交易数据的自动采集与简单分析 作者:周潇 指导教师: 王文武 单位:曲阜师范大学 统计学院 随着股票市场不断发展,对股票的研究也越来越深入,无论研究股票价格走势,还是透过历史数据探究经济发展,股票交易数据的采集都是不可缺少的步骤。本文基于R语言,利用Rcurl ...
个人分类: 研究生课程论文|2228 次阅读|没有评论
R语言豆瓣图书Top250数据采集
王文武 2019-5-14 10:10
数据采集小作业-(10)R语言豆瓣图书Top250数据采集 作者:支席年 指导教师:王文武 单位:曲阜师范大学 统计学院 本文主要介绍了基于R语言rvest包的网络数据采集,包括其中一些函数的用法,如负责读取网页内容的read_html()函数,对提取信息进行定位的htmo_nodes()函数等。简单 ...
个人分类: 研究生课程论文|2469 次阅读|没有评论
青岛市安居客房价数据提取———基于 R
王文武 2019-5-13 11:35
数据采集小作业-(4)青岛市安居客房价数据提取———基于 R 作者:闫文 指导教师:王文武 单位:曲阜师范大学 统计学院 青岛作为山东省发展最快的城市,掌握山东省经济命脉,其房价一直以来都是人们关注的焦点。我国房地产价格在经历了2008年之后快速增长后,近年来依旧居高临下,使得房地产销售价格在居民 ...
个人分类: 研究生课程论文|1843 次阅读|没有评论
基于天气后报网的温度信息采集分析
王文武 2019-5-13 11:28
数据采集小作业-(2)基于天气后报网的温度信息采集分析 作者:杨静 指导教师:王文武 单位:曲阜师范大学 统计学院 R和Python是两个非常有力的爬虫工具。Python倾向于做大型爬虫,与R相比,语法相对复杂,因此Python爬虫的学习曲线会相对陡峭。所以对于想从网上获取数据的初学者而言,用R做爬虫是相对比较好 ...
个人分类: 研究生课程论文|2359 次阅读|没有评论
R语言爬虫:济宁市二手车信息的收集
王文武 2019-5-13 11:23
数据采集小课题-(1)R语言爬虫:济宁市二手车信息的收集 作者:周璇 指导教师:王文武 单位:曲阜师范大学 统计学院 本文主要介绍如何使用R软件快速获取网页数据的一种方法技巧。首先简单介绍R语言爬虫,即使用R软件的相关程序从网页上获取数据,将非结构化的数据转化为结构化的数据;简介R语言爬虫常用的包R ...
个人分类: 研究生课程论文|2416 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 05:00

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部