Work（沉淀版）-CSDN博客

原创 DAY 39

batchisize和训练的关系。图像数据的格式：灰度和彩色数据。今日代码较少，理解内容即可。

2025-05-30 13:10:59 60

原创 DAY 38

了解下cifar数据集，尝试获取其中一张图片。

2025-05-29 15:59:18 70

原创 DAY 37

对信贷数据集训练后保存权重，加载权重后继续训练50轮，并采取早停策略。

2025-05-28 21:08:43 221

原创 DAY 36

对之前的信贷项目，利用神经网络训练下，尝试用到目前的知识点让代码更加规范和美观。

2025-05-27 21:22:29 197

原创 DAY 35

训练进度: 100%|██████████| 20000/20000 [00:10<00:00, 1885.37epoch/s, Loss=0.0630]三种不同的模型可视化方法：推荐torchinfo打印summary+权重分布可视化。进度条功能：手动和自动写法，让打印结果更加美观。作业：调整模型定义时的超参数，对比下效果。使用设备: cuda:0。推理的写法：评估模式。

2025-05-26 18:34:53 211

1. 分类任务中，若标签是整数（如 0/1/2 类别），需转为long类型（对应 PyTorch 的torch.long），否则交叉熵损失函数会报错。2. 回归任务中，标签需转为float类型（如torch.float32）。作业：今日的代码，要做到能够手敲。这已经是最简单最基础的版本了。2. 查看显卡信息的命令行命令（cmd中使用）a. 数据预处理（归一化、转换成张量）i. 继承nn.Module类。iii. 定义前向传播流程。c. 定义损失函数和优化器。d. 定义训练流程。

2025-05-24 10:42:06 337

原创 DAY 32

参考pdpbox官方文档中的其他类，绘制相应的图，任选即可。

2025-05-23 18:42:42 139

原创 DAY 31

尝试针对之前的心脏病项目ipynb，将他按照今天的示例项目整理成规范的形式，思考下哪些部分可以未来复用。

2025-05-22 11:55:18 151

原创 DAY 30

自己新建几个不同路径文件尝试下如何导入。

2025-05-21 16:34:19 137

原创 DAY 29

Python 是一种简洁高效的编程语言，以易读性和灵活性著称，广泛应用于数据分析、人工智能、Web 开发等领域。其 “优雅” 的设计哲学让代码如同自然语言般易懂，适合初学者快速入门，也能满足复杂项目的开发需求。函数是 Python 中实现模块化编程的核心工具，它将重复使用的代码封装为独立单元，通过参数传递数据，以返回值输出结果。例如，定义一个计算平方的函数，可在需要时直接调用，避免代码冗余，提升可维护性。函数还支持默认参数、可变参数等特性，增强了代码的灵活性。类（Class）是面向对象编程（OOP）的基

2025-05-20 22:01:22 193

原创 DAY 28

calculate_perimeter()：计算周长（公式：2×(长+宽)）。is_square() 方法，判断是否为正方形（长 == 宽）。calculate_circumference()：计算圆的周长（公式：2πr）。shape_type="rectangle"：创建长方形（参数：长、宽）。calculate_area()：计算圆的面积（公式：πr²）。shape_type="circle"：创建圆（参数：半径）。calculate_area()：计算面积（公式：长×宽）。

2025-05-19 23:31:25 514

原创 DAY 27

编写一个装饰器 logger，在函数执行前后打印日志信息（如函数名、参数、返回值。

2025-05-18 09:03:37 159

原创 DAY 26

编写一个名为 calculate_circle_area 的函数，该函数接收圆的半径 radius 作为参数，并返回圆的面积。编写一个名为 calculate_average 的函数，该函数可以接收任意数量的数字作为参数（引入可变位置参数 (*args)），并返回它们的平均值。编写一个名为 print_user_info 的函数，该函数接收一个必需的参数 user_id，以及任意数量的额外用户信息（作为关键字参数）。user_id 是一个必需的位置参数。的函数，该函数接收图形的名称。

2025-05-17 23:09:55 214

原创 DAY 25

理解今日的内容即可，可以检查自己过去借助ai写的代码是否带有try-except机制，以后可以尝试采用这类写法增加代码健壮性。在即将进入深度学习专题学习前，我们最后差缺补漏，把一些常见且重要的知识点给他们补上，加深对代码和流程的理解。try-except-else-finally机制。debug过程中的各类报错。try-except机制。

2025-05-16 13:06:26 181

原创 DAY 24

对自己电脑的不同文件夹利用今天学到的知识操作下，理解下os路径。

2025-05-15 15:17:01 160

原创 DAY 23

整理下全部逻辑的先后顺序，看看能不能制作出适合所有机器学习的通用pipeline。

2025-05-14 10:58:27 179

原创 DAY 22

自行学习参考如何使用kaggle平台，写下使用注意点，并对下述比赛提交代码。

2025-05-13 22:27:39 123

原创 DAY 21

1.探索下什么时候用到降维？降维的主要应用？

2025-05-12 16:48:04 348

原创 DAY 20

尝试利用svd来处理心脏病预测，看下精度变化。

2025-05-11 09:11:28 131

原创 DAY 19

参考示例代码对心脏病数据集采取类似操作，并且评估特征工程后模型效果有无提升。推断簇含义的2个思路：先选特征和后选特征。科研逻辑闭环:通过精度判断特征工程价值。通过可视化图形借助ai定义簇的含义。

2025-05-10 09:17:32 142

原创 DAY 18

参考示例代码对心脏病数据集采取类似操作，并且评估特征工程后模型效果有无提升。SHAP 重要性筛选后的精度: 0.5901。皮尔逊相关系数筛选后的精度: 0.8688。Lasso 筛选后的精度: 0.8688。树模型重要性筛选后的精度: 0.8524。递归特征消除筛选后的精度: 0.8852。方差筛选后的精度: 0.8524。

2025-05-09 12:36:15 187

原创 DAY 17

numpy数组的创建：简单创建、随机创建、遍历、运算。numpy数组的索引：一维、二维、三维。SHAP值的深入理解。

2025-05-08 18:01:54 151

原创 DAY 16

对心脏病数据集进行聚类。

2025-05-07 23:27:05 163

原创 DAY 15

1.3划分数据集和模型训练。1.4使用网格搜索优化算法。的地应力反演回归分析。

2025-05-06 23:44:19 131

原创 DAY 14

【代码】DAY 14。

2025-05-05 23:25:23 200

原创 DAY 13

-- 2. 带权重随机森林 + 交叉验证 (在训练集上进行) ------ 1. 默认参数随机森林 (训练集 -> 测试集) ---训练集中各类别数量: [4328 1672]默认模型训练与预测耗时: 0.9860 秒。平均 accuracy: 0.7798。少数类标签: 1, 多数类标签: 0。交叉验证耗时: 2.4092 秒。开始进行 5 折交叉验证...

2025-05-04 23:47:42 161

原创 DAY 12

通过以上步骤的不断迭代，粒子群中的粒子不断调整自己的位置，逐渐向全局最优位置聚集，从而实现对问题最优解的搜索。对于一个 D 维的优化问题，第 i 个粒子的位置可以表示为向量 Xi=(xi1,xi2,⋯,xiD)，速度表示为向量 Vi=(vi1,vi2,⋯,viD)，其中 i=1,2,⋯,N，N 是粒子群的规模。适应度函数的输出值反映了个体对环境的适应能力，在优化问题中，通常是目标函数的值（如求最大值问题中，目标函数值越大，适应度越高）。将每个粒子的位置代入适应度函数，计算出相应的适应度值。

2025-05-03 23:47:08 543

原创 DAY 11

最佳参数: OrderedDict({'n_neighbors': 27, 'p': 2, 'weights': 'distance'})最佳参数: {'n_neighbors': 29, 'p': 1, 'weights': 'uniform'}--- 2. 网格搜索优化KNN(训练集 -> 测试集) ------ 2. 贝叶斯优化KNN (训练集 -> 测试集) ------ 1. 默认参数KNN (训练集 -> 测试集) ------ 1. 默认参数LGB (训练集 -> 测试集) ---

2025-05-02 22:22:12 578

原创 DAY 10

对心脏病数据集采用机器学习模型建模和评估。

2025-05-01 23:52:12 96

原创 DAY 9

2.单特征分布（子图）

2025-04-30 23:40:30 164

原创 DAY 8

2.对连续特征标准化归一化。结果为[ ]----无。

2025-04-29 17:32:44 120

原创 DAY 7

1.导入相应库，并打开对应数据表。2.检查缺失值与数据类型。4.绘制特征与标签的关系。

2025-04-28 10:04:06 194

原创 DAY 6

2.特征和标签的关系图。

2025-04-27 18:38:27 183

原创 DAY 5

3. 对独热编码后的变量转化为int类型。2. 对离散变量进行one-hot编码。4. 对所有缺失值进行填充。1. 读取data数据。

2025-04-24 22:30:53 852

原创 DAY 4

1.打开数据（csv文件、excel文件）2.查看数据（尺寸信息、查看列名等方法）初识pandas库与缺失数据的补全。5.利用循环补全所有列的空值。4.众数、中位数填补空值。

2025-04-23 17:00:50 136

原创 DAY 3

1.创建一个包含三个字符串元素的列表 tech_list，元素分别为 “Python”, “Java”, “Go”。4.修改 tech_list 中的第二个元素（索引为 1），将其从 “Java” 更改为 “Ruby”。1.定义一个包含整数的列表 scores，赋值为 [85, 92, 78, 65, 95, 88]。6.计算当前 tech_list 的长度，并将结果存储在变量 current_length 中。- 28-35度：打印"黄色预警：天气炎热"- 20-27度：打印"绿色提示：适宜温度"

2025-04-22 23:29:48 301

原创 DAY 2

定义两个整数变量，score_a 赋值为 75，score_b 赋值为 90。比较 score_a 是否大于 score_b，将比较结果（布尔值）存储在变量 is_a_higher 中；比较 score_a 是否小于等于 score_b，将结果存储在变量 is_a_lower_or_equal 中；比较 score_a 是否不等于 score_b，将结果存储在变量 is_different 中。获取 greeting 字符串的第一个字符，存储在变量 first_char 中。

2025-04-21 22:22:35 245 1

原创 DAY 1

计算这两个变量的和，并将结果存储在一个新的变量 a 中；计算这两个变量的商，叫做b；计算这两个变量的余数，叫做c。然后，使用 f-string 打印出类似 “20 加 8 的结果是：28” 的信息，分成三行打印。(1.如果想在输出的姓名两边加上引号，例如姓名: "小明", 城市: 北京，f-string 语句应该怎么写？2.只用一个 print() 和 f-string，如何让姓名和城市分两行输出？计算折扣后的价格，并将结果存储在变量。print() 函数将每个变量的值单独打印出来，每个值占一行。

2025-04-20 19:30:57 248

DAY 10 不同模型的测试结果

空空如也