模型收敛了嘛-CSDN博客

原创 task10

阅读《李航统计学习方法》的65-74页学习Gini指数学习回归树剪枝 CART算法 1984年提出，1和2由此引入，CART算法同样由特征选择、树生成、剪枝组成，既可用来分类也可用于回归。分类树的生成本质是递归的构建二叉决策树，回归树用平方误差最小化准则，分类树用Gini指数选择最优特征，同时决定该特征的最优二值切分点。回归树的生成：停止条件可以为树深度等。 ...

2019-06-18 19:59:13 160

原创 Datawhale AI夏令营科大讯飞AI大赛大模型方向

3. tf-idf表征能力弱，规则定义不了的，使用embedding加分类代替。1. kmeans较为粗糙，聚类可分为更多细分主题。2. 可根据经验手动定义规则。

2025-07-14 09:06:25 66

原创【数据结构】线性表、栈、队列的笔记

栈，队列，字符串，都可以看成是线性表

2022-07-21 02:49:49 122

原创 task9

""" 绘制树图形 """ import pandas as pd #from task8 import createTree import numpy as np import matplotlib.pyplot as plt from collections import Counter def plotNode(text, centerPt, parentPt, nodeTyp...

2019-06-14 20:49:39 122

原创李宏毅机器学习第七期-task8

阅读《李航统计学习方法》中p55-p58页总结决策树模型结构理解决策树递归思想阅读《李航统计学习》中p58-p63页学习信息增益学习信息增益率阅读《李航统计学习》中p63-65页学习ID3算法优缺点学习C4.5算法优缺点理解C4.5算法在ID3算法上有什么提升学习C4.5算法在连续值上的处理学习决策树如何生成阅读《机器学习实战》中p37-p41页划分数...

2019-06-10 18:02:02 185

信息熵（香浓熵）是一种信息的度量方式，表示信息的混乱程度，也就是说：信息越有序，信息熵越低。定义如下： KaTeX parse error: Expected group after '_' at position 14: Ent(D)=−\sum_̲\limits{k=1}^yp… 其中满足： 0⩽H(p)⩽log2n0⩽H(p)⩽log_2n0⩽H(p)⩽log2n, 这里 H(p)H(...

2019-06-05 20:48:38 184

原创 task6

coding: utf-8 In[1]: -- coding: utf-8 -- import numpy as np class LogisticRegression(object): def __init__(self, learning_rate=0.1, max_iter=100, seed=None): self.seed = seed # 随机数种子 self.lr ...

2019-06-03 11:15:36 180

原创 task5

【李宏毅机器学习任务五】学习视频内容：观看观看李宏毅课程内容：p9 视频连接： https://www.bilibili.com/video/av35932863/?p=9 学习Datawhale整理笔记 https://datawhalechina.github.io/Leeml-Book/#/chapter9/chapter9(目前已100%复现) 学习打卡内容：推导LR损失函数(1) ...

2019-05-29 20:34:31 174

weixin_39534398的博客

原创 task10

原创 Datawhale AI夏令营科大讯飞AI大赛大模型方向

原创 joyful pandas-1

原创【数据结构】线性表、栈、队列的笔记

原创南瓜--4

原创南瓜--3

原创南瓜--2

原创南瓜--1

原创 task9

原创李宏毅机器学习第七期-task8

原创 task7

原创 task6

原创 task5

原创 task4

原创 task2

原创 task3-预测pm2.5

原创 Datawhale李宏毅ml打卡week-1

分词以及未分词的小黄鸡语料库+CDNOW数据集

空空如也