自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 天池-金融风控-贷款违约预测-特征工程

先列个大纲 数据预处理 缺失值 时间格式 字符型转换为数值型 异常值处理 基于3个标准差原则 基于箱型图 数据分箱 固定宽度分箱 分位数分箱 特征挖掘 特征组合 特征衍生 特征编码 one-hot编码 label-encode编码 特征选择 Filter Wrapper (RFE) Embedded ...

2020-09-21 22:37:13 310

原创 天池-金融风控-贷款违约预测-数据分析

Part I:背景 Part II:结论 Part III:分析框架 数据概览 数据量、数据类型、数据缺失情况和数据分析; 相关性分析 两两特征的散点图和相关系数; Part IV:详细分析 4.1.数据概览 4.1.1数据条数 4.1.2数据类型 4.1.3数据缺失 4.1.4数据分布 4.2.相关性分析 4.2.1散点图 4.2.2相关系数 Part V:遗留问题 ...

2020-09-18 23:47:37 485

原创 天池-金融风控-贷款违约预测-赛题理解

目录目标评估指标数据数据概况字段 目标 预测用户贷款是否违约,提交每个测试样本=1的概率; 评估指标 指标:AUC(越大越好); 数据 数据概况 来源:某信贷平台的贷款记录; 数据量:超过120w,80w条训练集,20w条测试集A,20w条测试集B; 字段:47列变量,其中15列为匿名变量; 其他:employmentTitle、purpose、postCode和title等信息脱敏; 字段 id 为贷款清单分配的唯一信用证标识 loanAmnt 贷款金额 term 贷款期限(year) interestR

2020-09-15 23:52:28 1657

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除