数据分析
文章平均质量分 58
王小葱鸭
数据分析、机器学习、深度学习
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于决策树模型和支持向量机的旅游客户流失数据分析项目【子木工作室】
【摘要】本文介绍了一个基于决策树和支持向量机(SVM)的旅游客户流失预测系统。通过分析客户历史数据(年龄、消费金额等),系统预测流失风险并识别关键因素。决策树具有可解释性强、处理非线性关系等优势;SVM则在泛化能力、高维数据处理方面表现突出。项目采用Python的scikit-learn库实现模型训练,准确率较高。帮助企业制定客户留存策略。该系统为旅游行业提供了有效的客户管理决策支持。原创 2025-06-10 10:53:43 · 1156 阅读 · 0 评论 -
分类2:LDA-KNN 处理iris(鸢尾花)数据集代码
使用KNN对鸢尾花数据集进行分类,并且使用LDA进行降维,然后再使用KNN做对比实验2 加载数据注意:3 使用KNN进行分类KNN模型,K=5 为K紧邻,K=1为最近邻,使用费fit训练模型,使用predict函数进行预测,最后使用acc计算精度。4 先使用LDA进行降维,再使用KNN进行分类使用LDA将维度降低到1维使用transform对原数据进行降维,例如原来是4维的,现在是1维的,则会生成一个4*1的矩阵,降维后的数据特征是1维;使用KNN进行降维原创 2022-09-24 14:54:23 · 440 阅读 · 0 评论 -
分类5:机器学习处理帕尔默企鹅数据
机器学习处理:帕尔默企鹅数据集,包含数据清洗、缺失值处理、特征编码、数据集划分、模型训练和验证原创 2023-02-28 14:34:09 · 4499 阅读 · 3 评论 -
回归预测4:机器学习处理加利福尼亚房价数据集
我们使用California Housing Prices数据集进行预测,特征编码,回归模型,给定数据集。原创 2023-02-27 16:03:01 · 2904 阅读 · 0 评论 -
回归预测3:机器学习处理悉尼-墨尔数据集
我们处理悉尼-墨尔本的房价预测问题,数据集有些变量是字符串形式,有些和时间相关,在本实验中,我们主要使用时间编码、异常点检测zscore、特征编码:LabelEncoder、MEstimateEncoder,最后通过实验对比,给出结论。原创 2023-02-27 14:15:25 · 420 阅读 · 0 评论 -
回归预测2:机器学习处理共享单车数据集
我们使用随机森林处理共享单车回归模型,主要包含:数据集划分,建立日期特征,对缺失值进行填补。原创 2023-02-24 14:31:18 · 767 阅读 · 0 评论 -
回归预测1:机器学习处理共享单车数据集
使用线性回归、随机森林处理共享单车预测问题,数据集中包含了缺失值,我们使用随机森林先对缺失值进行预测,并且该数据集是和时间序列相关,但是我们将时间特征拆分为多个特征,将问题转换为了回归预测问题。原创 2023-02-23 08:30:00 · 2667 阅读 · 0 评论 -
分类4:机器学习处理乳腺癌数据集代码
乳腺癌数据属于二分类问题,包含569条样本,31个特征,1个标签维度。数据归一化、机器学习。原创 2023-02-22 11:54:12 · 2937 阅读 · 0 评论 -
分类3:机器学习处理read-wine(红酒)数据集代码
红酒分类数据集属于分类问题,共有13个特征,类别共有10个,因此属于分类问题,我们使用svm、knn、决策树、随机森林等方法对其进行分析,本文还包含PCA降维数据可视化超参数数据归一化等操作,代码可以直接跑通。原创 2023-02-21 11:17:37 · 4775 阅读 · 2 评论 -
AttributeError: ‘numpy.ndarray‘ object has no attribute ‘append‘ python
这个问题是因为直接使用a.append(b)的格式了,要使用a = np.append(a,b)格式。原创 2022-09-23 11:02:46 · 681 阅读 · 0 评论 -
城市-降水-降雪-位置分析
2 分析54种天气情况哪个天气出现的次数重点分析下雨、下雪、晴天3 计算降雪-纬度之间的关系使用scatter函数绘制图像,并且点的大小代表降雪(降雨)量的大小。横纵坐标表示经纬度。原创 2022-06-14 11:27:37 · 258 阅读 · 0 评论 -
城市气温-湿度-位置等数据分析
本文分析城市天气数据,包含气温、温度、气压、纬度等关系,数据来源链接:https://pan.baidu.com/s/12NUbEwhFgfcY4yb6xVOfvg提取码:fa4u2.2 使用时间序列进行分析asfreq、resample、rolling2.3 取多个城市进行绘制Vancouver气温-气压相关系数:-0.11716415412170467所有城市中相关系数小于0的城市所占比例:0.9722222222222222纬度-气温相关系数:-0.90144708403原创 2022-06-09 11:34:24 · 1854 阅读 · 0 评论 -
gdp数据分析
本文主要分析china,usa,king,japan,russia5个国家的gdp,时间从1800-2040,后面的数据为预测数据,不准确。使用柱状图进行分析均值、方差、最大值、最小值原创 2022-06-07 11:32:11 · 1364 阅读 · 1 评论 -
泰坦尼克号数据分析报告
先大体分析数据特性,然后分析Survived、Pclass、Sex、Age的数据,最后使用这些svm模型做训练和预测。结果展示:3 死亡率-幸存率分析使用饼状图展示:6.2 绘制频率分布直方图原创 2022-06-07 11:21:13 · 3873 阅读 · 0 评论
分享