
数据挖掘案例
文章平均质量分 97
笔记
卖山楂啦prss
数据分析师——唯有知识,让我们免于平庸
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
「机器学习」天池比赛:金融风控贷款违约预测
https://zhuanlan.zhihu.com/p/255105477https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.18.3b3022faqoVnOw&postId=129318https://www.jianshu.com/u/63b7115ac4eehttps://blog.csdn.net/qq_43401035/category_10383961.html比赛地址:https://tia原创 2021-03-29 20:46:23 · 32560 阅读 · 22 评论 -
【数据挖掘案例】财政收入影响因素分析及预测模型
分析方法与过程(选择的原则)以往对财政收入的分析会使用 多元线性回归模型和最小二乘估计方法来估计回归模型的系数,通过系数能否通过检验来检验它们之间的关系,但这样的结果对数据依赖程度很大,并且求得的往往只是局部最优解,后续的检验可能会失去应有的意义。因此本案例运用Adaptive-Lasso变量选择方法来研究。LassoAdaptive-Lasso变量选择方法Adaptive_lasso算法是近些年来被广泛应用于参数估计于变量选择的方法之一。Adaptive_Lasso算法能够解决最小二乘法和逐步回归原创 2021-03-06 14:26:34 · 18787 阅读 · 11 评论 -
泰坦尼克号成员获救情况预测
转载自:https://blog.csdn.net/ling_mochen/article/details/80219850原作者:莫晨一、前言RMS泰坦尼克号的沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在首次航行期间,泰坦尼克号撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难。这场轰动的悲剧震撼了国际社会,并导致了更好的船舶安全条例。海难导致生命损失的原因之一是没有足够的救生艇给乘客和机组人员。虽然幸存下来的运气有一些因素,但一些人比其他人更有可能生存,比如妇女,儿童和转载 2020-10-14 22:44:55 · 1864 阅读 · 0 评论 -
案例:乳腺癌威斯康星州(原始)数据集
数据:http://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+%28Original%29import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom pylab import mpl# 正常显示中文标签mpl.rcParams['font.sans-serif'] = ['SimHei']#原创 2020-10-09 17:27:58 · 45674 阅读 · 18 评论 -
案例:儿童呼吸道疾病数据集
数据:http://www.statsci.org/data/general/fev.htmlimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsfrom pylab import mpl# 正常显示中文标签mpl.rcParams['font.sans-serif'] = ['SimHei']# 正常显示负号mpl.rcParams['axes.unicode_m原创 2020-10-09 00:25:35 · 2211 阅读 · 5 评论 -
案例:红酒数据集分析
数据集介绍这份红酒通用数据集,有1599个样本,12个特征。其中11个为红酒的理化性质,quality列为红酒的品质。本项目的目的是分析不同理化性质与红酒品质之间的关系。# 导入接下来要使用的python工具包import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sns%matplotlib inline# 打印数据的精度pd.set_option('precision原创 2020-10-06 15:45:21 · 32791 阅读 · 13 评论