吴怀宇_中国科学院分享 http://blog.sciencenet.cn/u/wuhuaiyu 博士、副教授 「模式识别国家重点实验室」&「中国-欧洲信息,自动化与应用数学联合实验室」

博文

[CV论文读讲][2012.10.10]Transferring Naive Bayes Classifiers

已有 3434 次阅读 2012-11-30 14:39 |系统分类:科研笔记| 标签, 文章, 数据源, Documents

相关PPT下载详见 “视觉计算研究论坛”「SIGVC BBS」:http://www.sigvc.org/bbs/thread-171-1-1.html
 
 
讲者:李海昌
报告时间:2012.10.10
文章信息:
paper #1:Wenyuan Dai, Gui-Rong Xue, Qiang Yang, Yong Yu, Transferring Naive Bayes Classifiers for Text Classification, AAAI 2007.
paper #2:Kamal Nigam, Andrew Kachites Mccallum, Sebastian Thrun, Tom Mitchell, Text Classification from Labeled and Unlabeled Documents using EM, Machine Learning 1999.
文章简介:
Problem: 训练集和测试集来自不同的数据源,分布不同,但来自相同的特征空间。比如:以标注的新闻文档为训练集,对博客文档的话题进行分类。
Model:在已有的贝叶斯分类器和EM结合的算法基础上,给出计算标签数据集和未标签数据集在分类器中所占的比重的方法:计算标签数据分布和未标签数据分布的KL离散度,并手工调出标签数据集和未标签数据集在分类器中所占的最优比重与KL离散度的函数关系。将计算出的比重,作为全局常量带入原模型求解。
Paper #2:
Problem: 文档分类。
Motavition: 使用未标注样本的信息。
Model:使用EM与贝叶斯分类器的组合对文档进行分类,是半监督分类的方法。首先使用标注的数据训练传统的贝叶斯分类器,然后利用得到的分类器对测试样本分类,再使用标注样本和得到的测试样本的后验概率,训练贝叶斯分类器,如此循环直到收敛。


https://wap.sciencenet.cn/blog-4099-637834.html

上一篇:[CV论文读讲] [2012.9.26]Boosting for Transfer Learning
下一篇:[CV论文读讲]Supervised Dictionary Learning
收藏 IP: 123.118.210.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-30 09:51

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部