科学网

 找回密码
  注册
谱聚类简介
吴建军 2015-1-24 21:32
本文是作者毕业设计基于用户物品成对分块的协同过滤算法的节选,现粘贴在此为的是重温,如果对读者有益,倍感荣幸。 谱聚类将对象映射成无向图中的点,对象之间的相似度做为点之间的边的权值,然后基于一些准则设计出合适的图划分算法。谱聚类在图像分割,电路设计,文档分析中都得到了广泛 ...
6113 次阅读|没有评论
话题模型之LDA(Latent Dirichlet Allocation)介绍
吴建军 2014-6-4 22:39
最近我阅读了文献 的一部分,在这里说说自己对LDA的理解,希望有助于读者对LDA的学习。有不正确的地方,请留言赐教。 LDA是一种话题建模的方法,他认为每个文档是按如下算法产生的: 其中 都是 维向量, 是预设的话题个数, 表示本文档属于话题 的概率。 是当前文档的单词总数。 表示第 个单词来自哪 ...
8474 次阅读|没有评论
Bayes统计分析简述
吴建军 2014-5-30 10:24
下面是我在阅读 , 和 中相关章节后,对Bayes统计分析做的一个很简单的概述,希望对读者有益。 这里所说的统计分析是对概率分布中参数进行推断,具体有三个任务:点估计,区间估计,假设检验。Bayes分析有三个最关键的输入:先验分布,样本信息,损失函数。 当我们需要对概率分布 中 ...
5992 次阅读|没有评论
pLSI( Probabilistic latent semantic indexing)简述
吴建军 2014-5-11 23:11
pLSI可以用于文档分类和话题检测,下面我根据自己对文献 的理解给出了他的推导,希望对读者有益。 假设整个语料库中单词集合为 ,文档集合为 。每个单词文档对 都对应隐变量 的一种概率分布 。隐变量可以理解为话题,我们假设有 个话题,每个单词文档对 被认为是经过话题而联系在一起的,并 ...
5038 次阅读|没有评论
受限玻尔兹曼机(RBM,Restricted Boltzmann Machines)浅介
热度 1 吴建军 2014-4-28 21:55
本文是我在阅读 之后做的一个读书笔记,所以这里的内容几乎也是翻译外加一些自己的理解,希望对读者有益。 概括地说,RBM根据MLE原理来估计预定义分布中的参数,以便预定义分布能尽可能地逼近产生观测数据的未知分布。多个RBM分层堆叠而成的DBN(deep belief networks)构成深度学习的主要框 ...
10566 次阅读|1 个评论 热度 1
Multinomial分布和Dirichlet分布
吴建军 2014-4-27 20:45
多项分布( multinomial distribution )是二项分布的推广。设每次实验结果有k种, ,一次实验中,每种结果发生的概率分别为 。进行n次实验, 总共发生 次, 总共发生 次, , 总共发生 次的概率为: 这就是多项分布的概率密度函数。有时间我们需要某个分布的显示概率密度函数,比如Bernoulli ...
13641 次阅读|没有评论
Latex术语表的生成
吴建军 2014-2-19 20:56
第一步:在文件最前面加入包引入命令和术语表文件生成命令 (makenomenclature 会让 Latex 在 tex 文件所在目录下生成一个 .nlo 的文件,其中是你每条术语说明 ) 。 第二步:编写每个术语说明项 ( 每项用命令 nomenclature 说明 ) ,并在你希望出现术语表的位置加入打印术语表的命令 (printnomenclature. 命令将 ...
21483 次阅读|没有评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-29 23:10

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部