- 博客(39)
- 收藏
- 关注
原创 DAY 35
训练进度: 100%|██████████| 20000/20000 [00:10<00:00, 1885.37epoch/s, Loss=0.0630]三种不同的模型可视化方法:推荐torchinfo打印summary+权重分布可视化。进度条功能:手动和自动写法,让打印结果更加美观。作业:调整模型定义时的超参数,对比下效果。使用设备: cuda:0。推理的写法:评估模式。
2025-05-26 18:34:53
211
原创 DAY 33
1. 分类任务中,若标签是整数(如 0/1/2 类别),需转为long类型(对应 PyTorch 的torch.long),否则交叉熵损失函数会报错。2. 回归任务中,标签需转为float类型(如torch.float32)。作业:今日的代码,要做到能够手敲。这已经是最简单最基础的版本了。2. 查看显卡信息的命令行命令(cmd中使用)a. 数据预处理(归一化、转换成张量)i. 继承nn.Module类。iii. 定义前向传播流程。c. 定义损失函数和优化器。d. 定义训练流程。
2025-05-24 10:42:06
337
原创 DAY 29
Python 是一种简洁高效的编程语言,以易读性和灵活性著称,广泛应用于数据分析、人工智能、Web 开发等领域。其 “优雅” 的设计哲学让代码如同自然语言般易懂,适合初学者快速入门,也能满足复杂项目的开发需求。函数 是 Python 中实现模块化编程的核心工具,它将重复使用的代码封装为独立单元,通过参数传递数据,以返回值输出结果。例如,定义一个计算平方的函数,可在需要时直接调用,避免代码冗余,提升可维护性。函数还支持默认参数、可变参数等特性,增强了代码的灵活性。类(Class) 是面向对象编程(OOP)的基
2025-05-20 22:01:22
193
原创 DAY 28
calculate_perimeter():计算周长(公式:2×(长+宽))。is_square() 方法,判断是否为正方形(长 == 宽)。calculate_circumference():计算圆的周长(公式:2πr)。shape_type="rectangle":创建长方形(参数:长、宽)。calculate_area():计算圆的面积(公式:πr²)。shape_type="circle":创建圆(参数:半径)。calculate_area():计算面积(公式:长×宽)。
2025-05-19 23:31:25
514
原创 DAY 26
编写一个名为 calculate_circle_area 的函数,该函数接收圆的半径 radius 作为参数,并返回圆的面积。编写一个名为 calculate_average 的函数,该函数可以接收任意数量的数字作为参数(引入可变位置参数 (*args)),并返回它们的平均值。编写一个名为 print_user_info 的函数,该函数接收一个必需的参数 user_id,以及任意数量的额外用户信息(作为关键字参数)。user_id 是一个必需的位置参数。的函数,该函数接收图形的名称。
2025-05-17 23:09:55
214
原创 DAY 25
理解今日的内容即可,可以检查自己过去借助ai写的代码是否带有try-except机制,以后可以尝试采用这类写法增加代码健壮性。在即将进入深度学习专题学习前,我们最后差缺补漏,把一些常见且重要的知识点给他们补上,加深对代码和流程的理解。try-except-else-finally机制。debug过程中的各类报错。try-except机制。
2025-05-16 13:06:26
181
原创 DAY 19
参考示例代码对心脏病数据集采取类似操作,并且评估特征工程后模型效果有无提升。推断簇含义的2个思路:先选特征和后选特征。科研逻辑闭环:通过精度判断特征工程价值。通过可视化图形借助ai定义簇的含义。
2025-05-10 09:17:32
142
原创 DAY 18
参考示例代码对心脏病数据集采取类似操作,并且评估特征工程后模型效果有无提升。SHAP 重要性筛选后的精度: 0.5901。皮尔逊相关系数筛选后的精度: 0.8688。Lasso 筛选后的精度: 0.8688。树模型重要性筛选后的精度: 0.8524。递归特征消除筛选后的精度: 0.8852。方差筛选后的精度: 0.8524。
2025-05-09 12:36:15
187
原创 DAY 13
-- 2. 带权重随机森林 + 交叉验证 (在训练集上进行) ------ 1. 默认参数随机森林 (训练集 -> 测试集) ---训练集中各类别数量: [4328 1672]默认模型训练与预测耗时: 0.9860 秒。平均 accuracy: 0.7798。少数类标签: 1, 多数类标签: 0。交叉验证耗时: 2.4092 秒。开始进行 5 折交叉验证...
2025-05-04 23:47:42
161
原创 DAY 12
通过以上步骤的不断迭代,粒子群中的粒子不断调整自己的位置,逐渐向全局最优位置聚集,从而实现对问题最优解的搜索。对于一个 D 维的优化问题,第 i 个粒子的位置可以表示为向量 Xi=(xi1,xi2,⋯,xiD),速度表示为向量 Vi=(vi1,vi2,⋯,viD),其中 i=1,2,⋯,N,N 是粒子群的规模。适应度函数的输出值反映了个体对环境的适应能力,在优化问题中,通常是目标函数的值(如求最大值问题中,目标函数值越大,适应度越高)。将每个粒子的位置代入适应度函数,计算出相应的适应度值。
2025-05-03 23:47:08
543
原创 DAY 11
最佳参数: OrderedDict({'n_neighbors': 27, 'p': 2, 'weights': 'distance'})最佳参数: {'n_neighbors': 29, 'p': 1, 'weights': 'uniform'}--- 2. 网格搜索优化KNN(训练集 -> 测试集) ------ 2. 贝叶斯优化KNN (训练集 -> 测试集) ------ 1. 默认参数KNN (训练集 -> 测试集) ------ 1. 默认参数LGB (训练集 -> 测试集) ---
2025-05-02 22:22:12
578
原创 DAY 5
3. 对独热编码后的变量转化为int类型。2. 对离散变量进行one-hot编码。4. 对所有缺失值进行填充。1. 读取data数据。
2025-04-24 22:30:53
852
原创 DAY 4
1.打开数据(csv文件、excel文件)2.查看数据(尺寸信息、查看列名等方法)初识pandas库与缺失数据的补全。5.利用循环补全所有列的空值。4.众数、中位数填补空值。
2025-04-23 17:00:50
136
原创 DAY 3
1.创建一个包含三个字符串元素的列表 tech_list,元素分别为 “Python”, “Java”, “Go”。4.修改 tech_list 中的第二个元素(索引为 1),将其从 “Java” 更改为 “Ruby”。1.定义一个包含整数的列表 scores,赋值为 [85, 92, 78, 65, 95, 88]。6.计算当前 tech_list 的长度,并将结果存储在变量 current_length 中。- 28-35度:打印"黄色预警:天气炎热"- 20-27度:打印"绿色提示:适宜温度"
2025-04-22 23:29:48
301
原创 DAY 2
定义两个整数变量,score_a 赋值为 75,score_b 赋值为 90。比较 score_a 是否大于 score_b,将比较结果(布尔值)存储在变量 is_a_higher 中;比较 score_a 是否小于等于 score_b,将结果存储在变量 is_a_lower_or_equal 中;比较 score_a 是否不等于 score_b,将结果存储在变量 is_different 中。获取 greeting 字符串的第一个字符,存储在变量 first_char 中。
2025-04-21 22:22:35
245
1
原创 DAY 1
计算这两个变量的和,并将结果存储在一个新的变量 a 中;计算这两个变量的商,叫做b;计算这两个变量的余数,叫做c。然后,使用 f-string 打印出类似 “20 加 8 的结果是:28” 的信息,分成三行打印。(1.如果想在输出的姓名两边加上引号,例如 姓名: "小明", 城市: 北京,f-string 语句应该怎么写?2.只用一个 print() 和 f-string,如何让姓名和城市分两行输出?计算折扣后的价格,并将结果存储在变量。print() 函数将每个变量的值单独打印出来,每个值占一行。
2025-04-20 19:30:57
248
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人