科学网

 找回密码
  注册
ETL工具Kettle
吕璐成 2014-4-9 09:36
Kettle是一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
个人分类: data mining|2901 次阅读|没有评论
libsvm
吕璐成 2014-3-31 11:37
Libsvm有两个参数需要用户指定: c 和 gamma 。实际上在 LibSVM 中用户需要给出一个 c 和 gamma 的区间, LibSVM 采用交叉验证 cross-validation accuracy 的方法确定分类效果最好的 c 和 gamma。 举个例子说明什么是交叉验证,假如把训练样本集 拆成三组,然后拿 1 跟 2 ...
个人分类: data mining|4319 次阅读|没有评论
数据挖掘——分类
吕璐成 2014-3-24 11:39
缺失值处理:EM算法 分类: single task learning naive bayes support vector machine(SVM) least square svm(LS-SVM) multiple task learning multiple label classification(如图像标注、 文档标注:每个文档属于多个类,先建一个分类model,再对新文档分类 ) 文本分类: 每个类在坐标系上都有自己的位 ...
个人分类: data mining|2587 次阅读|没有评论
正交矩阵
吕璐成 2014-3-17 21:08
如果:AA'=E(E为单位矩阵,A'表示“矩阵A的转置矩阵”。)或A′A=E,则n阶实矩阵A称为正交矩阵, 若A为单位正交阵,则满足以下条件: 1) A T 是正交矩阵 2) (E为单位矩阵) 3) A的各行是单位向量且两两正交 4) A的各列是单位向量且两两正交 5) (Ax,Ay)=(x,y) x,y∈R 6) |A| = 1或-1 矩阵的模:
个人分类: data mining|3420 次阅读|没有评论

本页有 5 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 06:27

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部