科学网

 找回密码
  注册
聚簇间的相异度计算
热度 1 徐硕 2012-3-21 17:36
令聚簇 ,聚簇 , 和 分别表示聚族 和 的质心(centroid),则常用的计算 与 间相异度 方法如下: (1)单连锁(Single linkage)或最小相异度 (2) 全连锁(Complete linkage)或最大相异度 (3) 平均连锁(Average linkage)或平均相异度,也常称为UPGMA(unweighted pair-group average) (4) ...
个人分类: 相似度计算|5135 次阅读|3 个评论 热度 1
共现聚类分析的新方法: 最大频繁项集挖掘
徐硕 2012-3-12 13:54
@ARTICLE{XQZZ+12, AUTHOR = {徐硕,乔晓东,朱礼军,张运良,薛春香}, TITLE = {共现聚类分析的新方法:最大频繁项集挖掘}, JOURNAL = {情报学报}, YEAR = {2012}, volume = ...
个人分类: Proximity|4437 次阅读|没有评论
Python字典的并集与交集
徐硕 2012-3-12 13:42
给定两个字典,计算两个字典都包含的键(交集),或者至少被一个字典包含的键(并集) 令a,b为两个字典,则计算并集的最快方法为: dict(a, **b) 计算交集 最快且最简洁的方法是 dict.fromkeys(x for x in a if x in b) Note: 如果字典a和b的条目的数目差异很大,那么在for子句中用较短的那个字典,在i ...
个人分类: Python|10900 次阅读|没有评论
利用矩估计Beta分布的参数
徐硕 2012-2-17 17:33
利用矩估计Beta分布的参数
Beta分布是定义在连续变量 上的一种分布,它的概率密度函数为 其中 a 0, b 0。 下图为Beta分布在参数 a 和 b 取不同值时的概率密度曲线: Beta分布是二项式分布的共轭先验(conjugate prior),因此经常被用于二项式分布的先验分布 由于Beta分布的概率密度曲线形状比较多样,而Gaussian ...
个人分类: 机器学习|14977 次阅读|没有评论
Fast but Not Bad Initial Configuration for Metric MDS
徐硕 2012-2-9 15:43
@ARTICLE{XQZZ+12, AUTHOR = {Xu, Shuo and Qiao, Xiaodong and Zhu, Lijun and Zhang, Yunlinag and Li, Lin}, TITLE = {Fast but Not Bad Initial Configuration for Metric Multidimensional Scaling}, JOURNAL = {Jou ...
个人分类: Proximity|3157 次阅读|没有评论
四篇应该仔细读的关于文本分析的tutorial类文章
热度 1 徐硕 2012-2-9 15:24
对文本分析进行详细深入介绍的肯定不只这四篇,这是本人目前读过的,其他比较好的tutorial类文章欢迎大家推荐补充。 第一篇:详细介绍了离散数据的参数估计方法,而不是像大多数教材中使用的Gaussian分布作为例子进行介绍。个人觉得最值得一读的地方是它使用Gibbs采样对LDA进行推断,其中相关公式的推导非常详细,是许 ...
个人分类: 机器学习|12171 次阅读|2 个评论 热度 1
推荐一款Windows下将jpeg文件转换成eps文件的小工具
徐硕 2012-1-29 08:57
使用latex的用户在将图片插入文件中时,经常会遇到将各种图像文件转成eps格式的问题 因为一般jepg, tif等格式文件在latex中是不能直接使用的 目前网上有很多相关方法,比如借助虚拟打印机,利用一些商业软件等或开源软件等。但许多开源软件在windows下需要重新编译,非常麻烦。 今天偶然发现一款不错的小工具, ...
个人分类: Latex|5738 次阅读|没有评论
HMM-LDA模型简介
热度 5 徐硕 2012-1-29 08:31
Griffiths et. al.~cite{GSBT05}认为,一个词出现在句子中是有原因的。作者将原因分为两种:一种是它起到的是句法(syntactic)功能,使整个句子符合一定的语言规范,也就是常说的虚词(function words);另一种它起到语义(semantic)功能,传递句子的真实含义,也就是常说的实词(content words)。 句法约束通常 ...
个人分类: 机器学习|12376 次阅读|8 个评论 热度 5

本页有 2 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 19:38

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部