xiaohai2008的个人博客分享 http://blog.sciencenet.cn/u/xiaohai2008

博文

FastMap降维方法

已有 8228 次阅读 2011-10-20 15:39 |个人分类:Python|系统分类:科研笔记| Python, 机器学习, FastMap

FastMap方法最原始文献为[1],该方法的最大优点就是速度快,具体来说,它的时间复杂度为O(p*n),其中p为目标空间维数,n为进行嵌入或映射操作的对象数量。

类似方法还有MetricMap(个人觉得这个还是比较难理解的)[2], Landmark MDS[3]等,而且Platt已经证明这三种方法均可归结于Nystrom方法[4]。

从实现的角度来说,FastMap方法和Landmark MDS均不难,而MetricMap可能会麻烦点。

本人参照[5]实现了FastMap方法,源代码见fastmap.py,该源代码比[5]中多了对out of sample对象的处理,而且采用了统一的方法。

本人认为FastMap方法虽然速度比较快,但精度不算太高(做过大量的实验,以后会贴出相关结果),不过可以结合MDS一块来使用。目前初始化MDS比较不错的方法是classical MDS,但classical MDS速度特别慢,因此可以采用FastMap、MetricMap或Landmark MDS得到的输出来初始化MDS,让MDS通过迭代的方法找到最优解(当然一般是局部最优解)。

参考文献:
[1] Christos Faloutsos and King-Ip (David) Lin, 1995. FastMap: a fast algorithm for indexing, data-mining and visualization of traditional and multimedia datasets. Proceedings of the ACM SIGMOD International Conference on Management of Data, Michael J. Carey and Donovan A. Schneider, eds., San Jose, California, 163-174.
[2] Jason Tsong-Li Wang, Xiong Wang, Dennis Shasha, Kaizhong Zhang, 2005. MetricMap: An Embedding Technique for Processing Distance-based Queries in Metric Spaces. IEEE Transactions on Systems, Man, and Cybernetics: Part B: Cybernetics, Vol. 35, No. 5, pp. 973--987. 
[3] Vin de Silva,  Joshua B. Tenenbaum, 2004. Sparse Multidimensional Scaling using Landmark Points. Technical Report, Stanford University. 
[4] John C. Platt, 2005. FastMap, MetricMap, and landmark MDS are all Nystrom Algorithms. Proceedings of the 10th International Workshop on Artificial Intelligence and Statistics, pp. 261-268. 



https://wap.sciencenet.cn/blog-611051-499019.html

上一篇:Matlab2011b下载地址
下一篇:MaxEnt经典文献相关公式推导
收藏 IP: 168.160.25.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-22 11:29

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部