- 博客(5)
- 收藏
- 关注
原创 模型评价指标
这里将模型分为两类:回归模型、分类模型 分类(目标值是离散的分类问题) 逻辑回归 1、auc : ROC曲线下的面积;较大的AUC代表了较好的performance。 2、计算ROC曲线:TPR纵坐标,FPR横坐标 TPR = TP/(TP+FN) = recall(真正例率,敏感度) FPR = FP/(FP+TN)(假正例率,1-特异性) 3、KS值:累计好样本与累计坏样本的差值,差值最大的点就是”截断点“,一般大于0.2表示模型不错 支持向量
2021-06-28 15:40:26
200
1
原创 数据仓库的理解
数据仓库本身并不“生产”任何数据,基本架构包含三部分:源数据、数据仓库、数据应用。 https://zhuanlan.zhihu.com/p/88467971
2021-06-17 11:29:58
316
原创 python数据导入mysql
sqlalchemy.exc.DataError: (pymysql.err.DataError) (1265, "Data truncated for column 'Timestamp' at row 1") [SQL: INSERT INTO `UserBehavior` (user_id, item_id, category, `Behavior`, timestamp) VALUES (%(user_id)s, %(item_id)s, %(category)s, %(Behavior)s, %(
2021-06-07 15:19:15
5865
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人