科学网

 找回密码
  注册
《Identifying and Analyzing Judgment Opinions》论文笔记
热度 1 常晓龙 2011-3-28 19:23
今天阅读了《Identifying and Analyzing Judgment Opinions》这篇论文,是关于情感分析中主观判断的识别和分析。这篇论文可以说是上一篇博文《Automatic detection of opinion bearing words and sentences》的延续,作者是同一个人Kim SM,来自韩国的一名女学者,目前在雅虎做情感分析。作者将情感分为 ...
个人分类: 情感分析|5001 次阅读|2 个评论 热度 1
关于数据平滑的一些理解
热度 1 常晓龙 2011-3-17 21:57
前段时间看论文时,论文里面采用了Kneser-Ney平滑算法对未登录词和稀有词进行了处理。看到这个陌生的名词,心里不由产生了几个问题,什么是平滑算法,它是干什么用的,什么是Kneser-Ney,它有什么特殊之处,利用平滑算法对于未登录词和稀有词处理后会产生什么样的效果。带着这些疑问,我阅读了宗成庆的 ...
个人分类: 统计学习|14557 次阅读|没有评论 热度 1
评论Kim-SM的《自动识别带有情感的词和句子》
常晓龙 2011-3-8 11:38
最近做了情感分析的综述,然后就开始一步步进行这个领域的学习。前两天看了一篇关于评价词语抽取的论文,是Kim-SM的《Automatic Detection of Opinion Bearing Words and Sentences》,论文是2005年发表在ACL会议上的,思想比较简单,但是一些细节处还是有的模糊不清,这里提出来,希望大家给予指点。 & ...
个人分类: 情感分析|8028 次阅读|没有评论
评论《识别文本中的感情、判断和评定》
热度 3 常晓龙 2010-12-23 13:58
该论文是老板发给我的,是东京大学的几个学者写的。但重要的是这篇论文发表在COLING会议上的,COLING大家晓得不,还是很牛的,SCI、EI收录就不说了。根据CCF推荐的人工智能领域的会议,COLING是属于仅次于ICJAI这样A类会议的B类。A类那几个太牛了,而且太大太全。应该说,COLING在自 ...
个人分类: 情感分析|7669 次阅读|2 个评论 热度 3
评论《竖起拇指?使用机器学习技术进行情感分析》
常晓龙 2010-12-16 10:58
前几天看了号称是情感分析领域的开篇之作《Thumbs up?Sentiment Classification using Machine Learning Techniques》。看完后,感觉从学术角度考虑,这篇文章并没有太多的学术成就,大概只因为是开山之作吧,大家还是给予了很多的关注。下面就详细谈谈这篇文章的内容。 &n ...
个人分类: 情感分析|8296 次阅读|没有评论
论坛回帖提取问题的分析
热度 3 常晓龙 2010-12-14 17:15
前面已经说到,论坛的抽取目标是楼主帖、回复帖,然后在从楼主帖和回复贴中提取发布时间等详细信息。回帖符合以前提到的最大连续重复子串的特点。所以这里先谈下回帖的提取。然后再讨论剩下的提取目标。 字符串中提取最大连续重复子串是个传统的算法问题。其实最大和重复两个条件在很多中情 ...
个人分类: 网页抽取|3902 次阅读|没有评论 热度 3
聊聊论坛网页抽取
常晓龙 2010-12-14 17:14
网页信息抽取是一切网页文本研究分析的前提工作。目前的传统信息抽取主要分为两种,一种是基于规则的抽取,规则可以人工定制,也可以通过学习得到,另一种就是利用机器学习方法进行分类。网页信息抽取可以采用传统的文本信息抽取技术进行,但是效果大打折扣。因为网页文本与传统文本的不同在于, ...
个人分类: 网页抽取|7530 次阅读|4 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-30 11:31

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部