|||
数据采集大作业-(2)关于手机评论的情绪分析---华为 VS iPhone
作者:何珊珊 韩婷婷
指导教师:王文武
单位:曲阜师范大学 统计学院
在本案例分析中,我们要采集关于在亚马逊网站上销售的华为和iPhone手机的文字评价,来调研是否能利用对产品的评论来测算消费者的评分,并根据d对消费者评论的文本分析来比较华为和iPhone手机。这个练习可能看起来特别学术化,因为我们已经得到了更结构化的以星星数量形式表达的消费者评分信息。不过,在很多情况下,这类结构化信息是无从获取的。如果能从纯文本里复原消费者的评分,我们手头就有了一个强有力的工具,可以用来在其他应用里采集消费者的情绪。
实际上,虽然结构化的消费者评分给生产商提供了及其有用的反馈,但是在文字评论里的信息会详细很多。考虑一下我们在当前应用中调研的对手机的产品评论案例。除了评论产品本身,消费者还对产品中他们喜欢或者不喜欢的具体部分以及发现有缺陷的地方进行了详细的评议。在本练习中,我们要调研是否能根据文本评论来测算评论者对产品给出的星星数量。
在本案例中,我们针对亚马逊网站上部分华为和iPhone手机的评论文本及星星数进行情绪分析。首先先利用R软件采集了两类手机的评论信息;其次,对消费者评论进行数据清洗,进而进行了文本分析,计算词频并绘制词云图,分析二者的区别;接着基于字典计算了情感得分,由于没有合适的情感字典可用,所以我们在分析过程中自定义了字典,通过分析观察情感得分与星星数情况是否一致;最后利用支持向量机对评论文本进行分类,观察预测星星数与实际星星数的情况。
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-10-20 02:55
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社