会员
周边
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
归去_来兮
博客园
首页
新随笔
联系
订阅
管理
2025年4月27日
Bagging、Boosting、Stacking的原理
摘要: Bagging、Boosting、Stacking是常见集成学习的形式,它们都是通过对多个学习器进行有机组合,达到比单个学习器性能更好的目标。 一、Bagging 1.算法概述 Bagging(Bootstrap Aggregating)算法即自助聚合算法,是一种基于统计学习理论的集成学习算法,主要
阅读全文
posted @ 2025-04-27 15:14 归去_来兮
阅读(71)
评论(0)
推荐(0)
2024年9月6日
感知机模型
摘要: 一、概述 感知机模型(Perceptron Model)也叫做神经元模型,设计灵感即来自于生物神经元的运行机制,依次完成信息接收、处理、输出的过程。当前大放异彩的各种人工神经网络模型即由一个个人工神经元构成,因此,本文介绍的感知机模型(神经元模型)就是各种神经网络模型的基本单元。 二、模型原理 模型
阅读全文
posted @ 2024-09-06 11:54 归去_来兮
阅读(584)
评论(0)
推荐(0)
2024年9月5日
逻辑回归模型
摘要: 核心:线性回归+sigmoid映射。 一、概述 逻辑回归模型(Logistic Regression,LR),由名称上来看,似乎是一个专门用于解决回归问题的模型,事实上,该模型更多地用于解决分类问题,尤其是二分类问题。这并不矛盾,因为逻辑回归直接输出的是一个连续值,我们将其按值的大小进行切分,不足一
阅读全文
posted @ 2024-09-05 23:03 归去_来兮
阅读(289)
评论(0)
推荐(0)
2024年7月9日
分类模型的算法性能评价
摘要: 一、概述 分类模型是机器学习中一种最常见的问题模型,在许多问题场景中有着广泛的运用,是模式识别问题中一种主要的实现手段。分类问题概况起来就是,对一堆高度抽象了的样本,由经验标定了每个样本所属的实际类别,由特定算法训练得到一个分类器,输入样本属性即自动计算出其所属类别,从而完成特定的识别任务。依实现原
阅读全文
posted @ 2024-07-09 15:47 归去_来兮
阅读(373)
评论(0)
推荐(0)
2024年6月27日
聚类模型的算法性能评价
摘要: 一、概述 作为机器学习领域的重要内容之一,聚类模型在许多方面能够发挥举足轻重的作用。所谓聚类,就是通过一定的技术方法将一堆数据样本依照其特性划分为不同的簇类,使得同一个簇内的样本有着更相近的属性。依不同的实现策略,聚类算法有很多种,如基于距离的k-means、基于密度的DBSCAN等。在聚类完成之后
阅读全文
posted @ 2024-06-27 17:43 归去_来兮
阅读(663)
评论(1)
推荐(0)
2024年6月5日
回归模型的算法性能评价
摘要: 一、概述 在一般形式的回归问题中,会得到系列的预测值,它们与真实值(ground truth)的比较表征了模型的预测能力,为有效量化这种能力,常见的性能评价指标有可解释方差(EVS)、平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)、决定系数(R2)等。值得一提的是,回归问题分单输
阅读全文
posted @ 2024-06-05 17:06 归去_来兮
阅读(411)
评论(0)
推荐(0)
2023年11月28日
Python缺失值处理实现
摘要: 在数据处理相关工作中,读取的数据中常常会有缺失值的情况,为顺利进行后续的操作,需要首先对缺失值进行处理,处理的方式一般为删除或填充,Python中提供了专门的工具包,可以方便地进行实现。读取操作可以由pandas模块实现,通常直接读一个excel或csv文件,创建为DataFrame对象,模块中的d
阅读全文
posted @ 2023-11-28 23:54 归去_来兮
阅读(233)
评论(0)
推荐(0)
2023年8月10日
三种常见的平滑滤波方法
摘要: 均值滤波、中值滤波、高斯滤波是三种常见的平滑滤波方法,其中均值滤波和高斯滤波是线性技术,中值滤波是非线性技术。它们实现的基本原理是基本一致的,指定一个滑动窗口,计算其中的均值、中值、卷积值输出到当前位置。 均值滤波、高斯滤波对高斯噪声表现较好,但对椒盐噪声表现较差;中值滤波则对椒盐噪声表现较好,对高斯噪声表现较差。
阅读全文
posted @ 2023-08-10 00:41 归去_来兮
阅读(1091)
评论(0)
推荐(0)
2023年8月5日
DBSCAN聚类
摘要: DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类算法,簇集的划定完全由样本的聚集程度决定。聚集程度不足以构成簇落的那些样本视为噪声点,因此DBSCAN聚类的方式也可以用于异常点的检测。
阅读全文
posted @ 2023-08-05 18:49 归去_来兮
阅读(346)
评论(0)
推荐(0)
2023年8月2日
常见距离计算的Python实现
摘要: 常见的距离有曼哈顿距离、欧式距离、切比雪夫距离、闵可夫斯基距离、汉明距离、余弦距离等,用Python实现计算的方式有多种,可以直接构造公式计算,也可以利用内置线性代数函数计算,还可以利用scipy库计算。 ### 1.曼哈顿距离 也叫城市街区距离,是两点差向量的L1范数,也就是各元素的绝对值之和。A
阅读全文
posted @ 2023-08-02 23:18 归去_来兮
阅读(524)
评论(0)
推荐(0)
下一页
公告