没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【内容大纲】 机器学习导论 第01章 绪论 共39页.pdf 机器学习导论 第02章 模型评估与选择 共28页.pdf 机器学习导论 第03章 线性模型 共23页.pdf 机器学习导论 第04章 决策树 共41页.pdf 机器学习导论 第05章 神经网络 共27页.pdf 机器学习导论 第06章 支持向量机 共24页.pdf 机器学习导论 第07章 贝叶斯分类器 共23页.pdf 机器学习导论 第08章 集成学习 共14页.pdf 机器学习导论 第09章 聚类 共16页.pdf 机器学习导论 第10章 降维与度量学习 共23页.pdf 机器学习导论 作业2.pdf 机器学习导论 作业3.pdf 机器学习导论 作业4.pdf 机器学习导论 作业5.pdf
资源推荐
资源详情
资源评论































机器学习导论 (2016 春季学期)
十、降维与度量学习

k 近邻学习器
k 近邻 (k-Nearest Neighbor, kNN)
懒惰学习 (lazy learning) 的代表
which class?
基本思路:
近朱者赤,近墨者黑
关键: k 值选取;距离计算
(投票法;平均法)

最近邻学习器和贝叶斯最优分类器
给定测试样本 , 若其最近邻样本为 ,则最近邻分类器出错的概率就是
和 类别标记不同的概率,
但是在真实的应用中,我们是否能够准确的找到k近邻呢?
最近邻分离器的泛化错误率不会超过
贝叶斯最优分类器错误率的两倍!

维数灾难
但是在真实的应用中,我们是否能够准确的找到k近邻呢?
密采样(dense sampling)
假定维度为20,如果样本需要满足密采样条件
需要的样本数量近10
60
想象一下:一张并不是很清晰的图像:70余万维
我们为了找到恰当的近邻,需要多少样本?
如果近邻的距离阈值设为10
-3

维数灾难
高维空间给距离计算带来很大的麻烦
当维数很高时甚至连计算内积都不再容易
更严重的是:样本变得稀疏
降维
为什么能进行降维?
数据样本虽是高维的,但与学
习任务密切相关的也许仅是某
个低维分布,即高维空间中的
一个低维“嵌入” (embedding)
剩余22页未读,继续阅读
资源评论

- ShawnX.Dong2025-05-01这个资源内容超赞,对我来说很有价值,很实用,感谢大佬分享~

passionSnail
- 粉丝: 681
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 用EXCEL制作模拟模拟测试系统.doc
- 华为项目管理模板.doc
- “互联网-”大学生创新创业大赛项目具体计划书-程政协.doc
- 电子商务专业术语.doc
- 定西市委一号楼信息化建设解决方案.doc
- 互联网环境下的大学生党建工作路径创新探究.docx
- 信息系统项目管理个人整理笔记.doc
- 基于网络图的计算机算法分析.docx
- 二季度风电拟在建项目管理.doc
- 探究中职计算机专业的有效教学.docx
- 基于物联网技术电力环网柜环境监控定位系统.docx
- 利用Matlab仿真平台设计单闭环直流调速系统.doc
- 关于审理网络纠纷案件中法律适用的思考.docx
- P2P网络借贷中担保法律风险控制探究.docx
- 保险公司信息化工作管理指引.pdf
- 博途V13已创建的WINCC项目管理如何设置成开机自动启动.doc
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈



安全验证
文档复制为VIP权益,开通VIP直接复制
