科学网

 找回密码
  注册
sql连接
吕璐成 2014-4-12 12:09
select from A表 inner join B表 on A字段=B字段:内连接。将A表中的字段与B表中的字段连接显示。用于显示A表中没有的一些信息。 left join:将A表中的字段全部显示,B表中未找到的用空值表示。 right join:将B表中的字段全部显示,A表中未找到的用空值表示。如一个学生的信息,去档案库查,如果没有信息就为空。 ...
个人分类: database|1966 次阅读|没有评论
ETL工具Kettle
吕璐成 2014-4-9 09:36
Kettle是一款国外开源的etl工具,纯java编写,绿色无需安装,数据抽取高效稳定(数据迁移工具)。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
个人分类: data mining|2901 次阅读|没有评论
libsvm
吕璐成 2014-3-31 11:37
Libsvm有两个参数需要用户指定: c 和 gamma 。实际上在 LibSVM 中用户需要给出一个 c 和 gamma 的区间, LibSVM 采用交叉验证 cross-validation accuracy 的方法确定分类效果最好的 c 和 gamma。 举个例子说明什么是交叉验证,假如把训练样本集 拆成三组,然后拿 1 跟 2 ...
个人分类: data mining|4320 次阅读|没有评论
数据挖掘——分类
吕璐成 2014-3-24 11:39
缺失值处理:EM算法 分类: single task learning naive bayes support vector machine(SVM) least square svm(LS-SVM) multiple task learning multiple label classification(如图像标注、 文档标注:每个文档属于多个类,先建一个分类model,再对新文档分类 ) 文本分类: 每个类在坐标系上都有自己的位 ...
个人分类: data mining|2587 次阅读|没有评论

本页有 6 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-1 16:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部