- 博客(3)
- 收藏
- 关注
原创 天池-金融风控-贷款违约预测-特征工程
先列个大纲 数据预处理 缺失值 时间格式 字符型转换为数值型 异常值处理 基于3个标准差原则 基于箱型图 数据分箱 固定宽度分箱 分位数分箱 特征挖掘 特征组合 特征衍生 特征编码 one-hot编码 label-encode编码 特征选择 Filter Wrapper (RFE) Embedded ...
2020-09-21 22:37:13
310
原创 天池-金融风控-贷款违约预测-数据分析
Part I:背景 Part II:结论 Part III:分析框架 数据概览 数据量、数据类型、数据缺失情况和数据分析; 相关性分析 两两特征的散点图和相关系数; Part IV:详细分析 4.1.数据概览 4.1.1数据条数 4.1.2数据类型 4.1.3数据缺失 4.1.4数据分布 4.2.相关性分析 4.2.1散点图 4.2.2相关系数 Part V:遗留问题 ...
2020-09-18 23:47:37
485
原创 天池-金融风控-贷款违约预测-赛题理解
目录目标评估指标数据数据概况字段 目标 预测用户贷款是否违约,提交每个测试样本=1的概率; 评估指标 指标:AUC(越大越好); 数据 数据概况 来源:某信贷平台的贷款记录; 数据量:超过120w,80w条训练集,20w条测试集A,20w条测试集B; 字段:47列变量,其中15列为匿名变量; 其他:employmentTitle、purpose、postCode和title等信息脱敏; 字段 id 为贷款清单分配的唯一信用证标识 loanAmnt 贷款金额 term 贷款期限(year) interestR
2020-09-15 23:52:28
1657
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人