机器学习第一周打卡:knn算法学习

本文深入解析KNN算法的原理及应用,包括距离度量、K值选择与分类决策规则。阐述了算法流程,如距离计算、排序、K值确定及分类结果预测。同时讨论了算法优缺点,如简单直观但可能受数据分布影响,并提出高维数据降维的解决方案。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用途:用来做分类或者做逻辑回归用
模型是由三个核心元素构成:
1、距离度量
2、K值
3、分类决策规则

整体算法流程:
1、计算测试集到训练集的各个数据点的距离,这里就可以用很多距离进行考核
2、对距离进行排序
3、选择K值,这个K值,是指距离测试集最近的训练集要选多少个
4、看选择K值后的几个训练值频次是怎么样的,然后把测试集的结果=频次最高的那个结果就完事儿了

其实挺简单,可以理解为:找距离我最近的几个样本,他们中大部分的样子就是我的样子
在这里插入图片描述
回答上面问题哈:
1、优点:简单已理解,可以给业务迅速讲清楚
缺点:如果测试集数据在训练集范围外部,就不好进行预测
2、在这里插入图片描述
可能存在距离相等,但是位置对称的情况,这样就选错范围了
3、如何选取K值
多测几遍,看预测值与真实值的误差,最终选取最小误差情况下的k值
4、时间复杂度o(n),高维数据进行降维。

内容概要:《绿色转型美丽乡村——汾渭平原地区低碳乡村案例集》由西安空气侠环保科技有限公司编写,北京市企业家环保基金会支持,聚焦汾渭平原地区乡村低碳发展的典型实践。报告梳理了国内外相关理论研究及政策背景,展示了中央与地方在低碳乡村发展方面的政策措施。通过五个典型案例,包括芮城县庄上村的“光储直柔”模式、铜川耀州区克坊村的“光伏+普惠金融”、浮山县臣南河村的循环经济模式、澄城县权家河村的“风光储一体化”以及麟游县紫石崖村的“光伏+生态养殖”,详细分析了这些案例的技术路线、项目成效、主要政策、典型经验和存在问题。报告总结了清洁能源在乡村低碳发展中的核心地位,强调了因地制宜发展策略的关键作用,并指出了多重效益综合追求的重要性。 适合人群:从事环保、农业、能源领域研究的专业人士,以及关注乡村低碳发展和可持续发展的政策制定者和社会学者。 使用场景及目标:①为全国其他地区开展乡村能源转型实践提供有益的借鉴;②助力推动我国乡村低碳发展,为实现碳达峰、碳中和目标贡献积极力量;③为政策制定者提供决策参考,促进乡村绿色转型和乡村振兴战略的实施。 其他说明:报告由多家单位参编,感谢北京市企业家环保基金会提供资金支持。文中内容及意见仅代表作者的个人观点,与北京市企业家环保基金会的立场或政策无关。报告期望为全国其他地区开展乡村能源转型实践提供有益的借鉴,助力推动我国乡村低碳发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值