张伟
KNN算法
2020-4-29 16:49
阅读:4219

(1)最符合直觉的分类器-K近邻算法(一种灵活的分类器)

image.png

(2)距离

①欧式距离

image.pngimage.png

②曼哈顿距离

image.pngimage.png

image.png

③明可夫斯基距离(用的少)

(3)KNN投票机制

image.pngimage.png


(4)如何选择K值--交叉验证

image.png

image.png

(5)过拟合与欠拟合

image.png

(one more example)

image.png

过拟合与欠拟合的直观类比


(6)KNN困境

①维度增加,距离失效

②数据量大,算法超慢

详细说明维度灾难与邻近失效:

image.png

image.png

image.png

       当维数N越大时,体积(面积)相对于表面积(周长变小趋势),当N无穷大时,相邻点距离变大,相邻点距离都差不多(很远),“近邻”距离的意义失效。


      点滴分享,福泽你我!Add oil!

转载本文请联系原作者获取授权,同时请注明本文来自张伟科学网博客。

链接地址:https://wap.sciencenet.cn/blog-3428464-1230804.html?mobile=1

收藏

分享到:

当前推荐数:0
推荐到博客首页
网友评论0 条评论
确定删除指定的回复吗?
确定删除本博文吗?