李维
大数据挖掘问答2:会哭的孩子有奶吃
2013-12-27 15:44
阅读:5276
标签:大数据

RE:有人在网上叫得最凶,所以这种大数据分析很容易受网上的vocal minority影响,不是么?


叫得最响用处不大,要叫得多。叫得响可以影响情绪烈度指标(passion index),但不影响最关键的褒贬指数(net sentiment)。叫得多也不能靠水军和僵尸,因为容易当作噪音被剔除,所以必须要叫得多种多样。

作者: 立委
日期: 12/26/2013 12:14:43


不排除有人精力旺盛,变着法儿叫,或者游说亲朋好 友一起喊冤。

这时候应该可以给每个 ID 限定一个对话题影响的 limit,这是容易实现的,但好像还没观测到这种矫正机制的需要。

更主要的其实是大 V,影响因子大的 ID,比如小F小H这类。情报用户很看重他们,让系统提供机制给大 V 加权。

也就是说,影响力大的声音本身就大,而情报使用的客户不给他打折扣,反而要加权和重视,因为他们害怕公关危机会由大 V 的喧嚣而爆发。想防患于未然。小鱼小虾翻不起大浪。譬如我吧,几个月前孩子使用 JCreator 软件学习 Java 编程,试用期到了要求付费,结果信用卡40美金划给它买一个教育license以后,还是打不开软件,尝试很多次花了很多时间才发现,这是一家 evil 的公司,它先引诱你付费教育许可,然后逼迫你继续购买它的所谓 professional 许可(70美金)才让你使用。你投诉,它根本不回音。上网查了一下,上当的不是一个,待遇都是一样,白交钱,不服务,不理睬。为了区区40美金,哪有功夫跟它折腾,而且我们是小人物,抱怨了也没人听见,可气不。如果我是大 V,就能叫它吃不了兜着走。(过两天有空可以找信用卡公司 dispute 这个交易,把钱要回来,还是蛮麻烦。) 大家都听说过老罗砸西门子冰箱的公关灾难吧,就是因为老罗是大 V,嗓子亮,西门子公关不当,没把他搞定,结果是直接经济损失据说上百万呢。

在企业大数据运用的10多个主要的 use scenarios,其中 risk management 最容易打动客户,他们也最愿意花大钱帮助实时监控。一个可能的公关灾难从火种到无法收拾,里面可以调控的时间不长,他们希望电脑大数据监控能在第一时间发出预警,然后他们可以及时应对。


“wow 立委可以去北大淑女班上课了:谈怎么叫才能听得畅快”


【置顶:立委科学网博客NLP博文一览(定期更新版)】

相关专题:转基因问题

转载本文请联系原作者获取授权,同时请注明本文来自李维科学网博客。

链接地址:https://wap.sciencenet.cn/blog-362400-753416.html?mobile=1

收藏

分享到:

当前推荐数:3
推荐人:
推荐到博客首页
网友评论2 条评论
确定删除指定的回复吗?
确定删除本博文吗?