-
GibbsLDA++ 使用记录
-
2013-1-18 02:21
-
1. 下载 下载地址: http://gibbslda.sourceforge.net/ 解压: $ gunzip GibbsLDA++.tar.gz $ tar -xf GibbsLDA++.tar 2. 编译 $ make clean $ make all 注意:如果出现以下错误: g++ -c -o utils.o utils.cpp utils.cpp: 在静态成员函数‘static int utils::parse_args(int, char**, ...
-
个人分类: data mining|11958 次阅读|没有评论
-
About frequent graph mining
-
2012-4-7 03:09
-
Part 1: Algorithms. Generally two categories: 1) Apriori-based - AGM: Inokuchi, et al. (PKDD’00) - FSG: Kuramochi and Karypis (ICDM’01) - FFSM: Huan, et al. (ICDM’03) and SPIN: Huan et al. (KDD’04) 2) Pattern-growth - MoFa: Borgelt and Berthold (ICDM’02) - gSpan: Yan and Han (ICDM’02) ...
-
个人分类: cloud|8083 次阅读|没有评论
-
Big Data: Principles and best practices of scalable realtime
-
热度 1 2012-1-13 05:36
-
本文是《Big Data: Principles and best practices of scalable realtime data systems》一书 样章第一章 的读后感。 原书信息在 这里 。 本书是分布式实时处理系统Storm的作者及另一位twitter老兄合作写的。 针对big data的处理问题,本文提出了一种新的大数据处理框架。就这点上说,论述方式有点像xx学术论文,提 ...
-
个人分类: book|13161 次阅读|1 个评论 热度 1
-
Iterative MapReduce
-
2011-12-28 13:56
-
使用MapReduce模型实现迭代式算法,最straightforward也是最general的方法就是,将多个map/reduce任务链接起来,构成一个chain。这种manual的方法需要user driver做两件事情: (1)termination终止条件判断:或者设定一个最大迭代次数,或者给定一个终止阈值,或者需要比较相邻两次迭代的结果的差异性(这种比较 ...
-
个人分类: 未分类|8255 次阅读|没有评论
-
弹性分布式数据集:基于内存的集群计算的容错性抽象(3)
-
热度 1 2011-12-22 15:43
-
弹性分布式数据集:基于内存的集群计算的容错性抽象(1) —— 引言、RDD 弹性分布式数据集:基于内存的集群计算的容错性抽象(2) —— 编程接口、RDD实现实例、任务调度 弹性分布式数据集:基于内存的集群计算的容错性抽象(3)—— 实现、实验结果 6. 实现 我们使 ...
-
个人分类: 译文|8794 次阅读|8 个评论 热度 1
-
弹性分布式数据集:基于内存的集群计算的容错性抽象(2)
-
2011-12-22 15:18
-
弹性分布式数据集:基于内存的集群计算的容错性抽象(1)—— 引言、RDD 弹性分布式数据集:基于内存的集群计算的容错性抽象(2)—— 编程接口、RDD实现实例、任务调度 弹性分布式数据集:基于内存的集群计算的容错性抽象(3)—— 实现、实验结果 3. Spark 编程接口 Spark 用 ...
-
个人分类: 译文|9004 次阅读|没有评论
-
弹性分布式数据集:基于内存的集群计算的容错性抽象(1)
-
2011-12-22 14:09
-
弹性分布式数据集:基于内存的集群计算的容错性抽象(1)—— 引言、RDD 弹性分布式数据集:基于内存的集群计算的容错性抽象(2)—— 编程接口、RDD实现实例、任务调度 弹性分布式数据集:基于内存的集群计算的容错性抽象(3)—— 实现、实验结果 摘要: 本文提出了弹性分布式数据集( RDD, ...
-
个人分类: 译文|15586 次阅读|没有评论
本页有 3 篇博文因作者的隐私设置或未通过审核而隐藏