||
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。
常用的相似性度量包括:
1. 欧氏距离
2. 曼哈顿距离
3. 切比雪夫距离
4. 闵可夫斯基距离
5. 标准化欧氏距离
6. 马氏距离
7. 夹角余弦
8. 汉明距离
9. 杰卡德距离 & 杰卡德相似系数
10. 相关系数 & 相关距离
11. 信息熵
这些方法能否用来区分态、势、感、知的相似度?
如果不能,则应该如何区分态、势、感、知的相似度?
物理的相似性与心理的相似性一样吗?
心理距离不是一种距离,而是一组距离的定义。
心理相关系数是衡量心理随机变量X与Y相关程度的一种方法,相关系数的取值范围是[-1,1]。相关系数的绝对值越大,则表明X与Y相关度越高。当X与Y线性相关时,相关系数取值为1(正线性相关)或-1(负线性相关)。
心理信息熵并不属于一种相似性度量。
心理信息熵是衡量分布的混乱程度或分散程度的一种度量。分布越分散(或者说分布越平均),信息熵就越大。分布越有序(或者说分布越集中),信息熵就越小。
计算给定的样本集X的信息熵的公式:
参数的含义:
n:样本集X的分类数
pi:X中第i类元素出现的概率
信息熵越大表明样本集S分类越分散,信息熵越小则表明样本集X分类越集中。。当S中n个分类出现的概率一样大时(都是1/n),信息熵取最大值log2(n)。当X只有一个分类时,信息熵取最小值0。
以上11种方法能否用来区分态、势、感、知的相似度?
如若不能,应该如何区分态、势、感、知的相似度?
如何用计算计实现相似性的接近?
人造(别人造的势和自己造的势)的相似度是如何干扰态势感知的?
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2024-5-4 11:11
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社