科学网

 找回密码
  注册
对weka 度量分类模型优劣指标的说明
李向东 2012-11-27 18:30
示例如下: === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.93 0.002 0.989 0.93 0.959 0.997 体 ...
个人分类: weka|10636 次阅读|没有评论
利用11月21日的方法,对韩新超发来的新浪新闻进行分类的结果
李向东 2012-11-27 16:46
Number of instances: 700 Number of attributes: 5236 === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.93 0.002 0.989 0.93 ...
个人分类: weka|2116 次阅读|没有评论
采用新的策略,分类的各项指标明显提升
李向东 2012-11-21 19:22
下面是交叉验证的结果: === Detailed Accuracy By Class === TP Rate FP Rate Precision Recall F-Measure ROC Area Class 0.99 0.002 0.98 0.99 ...
个人分类: weka|2392 次阅读|没有评论
WEKA的分类模型文件model中包含哪些内容
李向东 2012-6-1 14:06
WEKA的分类模型文件model中包含哪些内容
在 weka 中可以使用分类器对训练集训练得到分类模型,并存入 model 文件: Instances data=… //from somewhere // train NaiveBayes and output model NaiveBayes classifier = new NaiveBayes(); classifier.buildClassifier(data); ...
个人分类: weka|6010 次阅读|没有评论
使用DataSource和DataSink
李向东 2012-5-24 09:19
weka中有许多实现数据格式转换的工具,都包含在weka.core.converters包中。 其中的DataSource和DataSink最值一提。 原来我们这样写: BufferedReader reader = new BufferedReader(new FileReader(trainsetfile)); ArffReader arff = new ...
个人分类: weka|4580 次阅读|没有评论
使用独立测试集对分类模型进行评估
李向东 2012-5-23 15:09
这两天还是纠结于分类模型的准确率。因为对从网上随机摘录的文本进行分类时,结果总是不甚理想,不像使用cross-validation得到的结果那么好。 于是决定使用独立测试集(含1402个实例)进行评估。训练集实例9804个,特征9302个,没有使用特征选择。准确率大约78%,其中“历史”和“艺术”有点分不清。结果如下 ...
个人分类: weka|5769 次阅读|没有评论
weka中使用TFIDF进行特征选择
热度 1 李向东 2012-5-21 17:53
我首先对训练集进行了中文分词处理,在不做特征选择的情况下,只进行向量化处理: weka.filters.unsupervised.attribute.StringToWordVector in:9804 Number of instances: 9804 Number of attributes: 9302 产生的arff文件大约30M. 使用TFIDF进行特征选择,仍然使用这个训练集,代码很简单:   ...
个人分类: weka|10834 次阅读|1 个评论 热度 1
SMO分类器的训练模型评估结果
李向东 2012-5-17 09:37
SMO分类器的训练模型评估结果
昨晚又用SMO重新对上次的训练集做了训练,效果有所改观,结果如下: Number of instances in the arff file: 9804 Number of attributes: 9302 weka.filters.unsupervised.attribute.ReplaceMissingValues in:9804 weka.filters.unsupervised.attribute.Normalize in:9804 weka.filters.unsupervised.attribute.Replace ...
个人分类: weka|4615 次阅读|没有评论

本页有 2 篇博文因作者的隐私设置或未通过审核而隐藏

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 20:18

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部