数据挖掘流程 (一)数据读取 读取数据,并进行展示统计数据各项指标明确数据规模与要完成的任务 (二)特征理解分析 单特征分析,逐个变量分析其对结果的影响多变量统计分析,综合考虑多种情况的影响统计绘图得出结论 (三)数据清洗与预处理 对缺失值进行填充特征标准化/归一化筛选有价值的特征分析特征之间的相关性 (四)建立模型 特征数据与标签准备数据集切分多种建模算法对比集成策略等方案改进