- 博客(265)
- 资源 (15)
- 收藏
- 关注
原创 脱发因素机器学习数据分析
随着年龄增长,脱发成为影响外貌与健康的重要问题。本数据集包含遗传、荷尔蒙变化、医疗状况、药物治疗、营养缺乏、心理压力等12个可能导致脱发的因素,旨在通过数据分析挖掘各因素与脱发的潜在关联,为健康管理和医疗干预提供参考。
2025-05-30 10:12:18
817
原创 基于心理健康与数字行为数据的多维度分析
随着数字设备的普及,人们在日常生活中的数字行为(如屏幕时间、社交媒体使用、通知数量等)与心理健康之间的关系逐渐受到关注。本案例旨在通过机器学习方法,分析数字行为与心理健康指标之间的关系,并探索潜在的模式和趋势。
2025-05-27 15:02:56
448
原创 使用 scikit-learn 库对乌克兰冲突事件数据集进行多维度分类分析
在现代冲突研究中,对冲突事件进行多维度分析和可视化可以帮助我们更好地理解冲突的模式、趋势和影响因素。本次作业将使用开源冲突数据,构建一个完整的机器学习分类流程,从数据预处理到模型构建,再到结果可视化,全面展示如何使用`scikit-learn`库处理多维度分类问题。
2025-05-27 08:53:11
1642
原创 基于 Ollama + LangChain 的 AI 旅行计划生成器开发教程
使用本地部署的 Ollama DeepSeek 模型和 LangChain 框架,开发一个能根据用户输入生成旅行计划的 AI 应用。通过本教程,你学会了:1. 本地部署和使用 Ollama 模型2. 使用 LangChain 最新 API 开发应用3. 处理库版本变更带来的兼容性问题4. 基于大模型构建实用工具的基本流程
2025-05-16 09:31:19
1815
原创 tensorflow-cpu
intel优化版本可以执行以下命令。intel优化版本可以执行以下命令。intel优化版本可以执行以下命令。intel优化版本可以执行以下命令。intel优化版本可以执行以下命令。
2025-05-12 08:20:53
1902
原创 基于文本的情感分析
1. 数据加载与特征转换2. 数据集划分3. 模型训练4. 模型测试5. 输出信息量较大的特征6. 对输入的句子进行情感分析7. 使用SnowNLP进行情感分析8. 主函数
2025-04-15 08:39:44
2738
原创 Pandas 中透视表(`pivot_table`)和交叉表(`crosstab`)的区别
**核心区别**1. **透视表 (`pivot_table`)** - 用于对数据进行 **聚合计算**(如求和、均值、计数等)。 - 支持多维度分组(行、列、甚至多层索引)。 - 可以指定 `values`(要聚合的值)和 `aggfunc`(聚合函数)。2. **交叉表 (`crosstab`)** - 专门用于 **计算频率分布**(即列联表,统计不同组合的出现次数)。 - 默认行为是计数,但也可通过参数自定义聚合函数。 - 语法更简洁,适合快速生成
2025-04-13 17:22:41
2851
原创 pandas 关于 `merge` 和 `join` 的区别
1. **`merge`**: - 更通用的合并方法,支持基于**列**或**索引**的合并。 - 可以指定左右DataFrame的合并键(`left_on`, `right_on`)。 - 支持多种合并方式(内连接、外连接、左连接、右连接)。2. **`join`**: - 是 `merge` 的简化版,默认基于**索引**合并。 - 只能基于**左DataFrame的索引**和**右DataFrame的索引或指定列**合并。 - 语法更简洁,适合快速操作。
2025-04-13 17:18:49
2643
原创 django数据迁移操作受阻
错误信息:django.db.utils.OperationalError: (1227, 'Access denied; you need (at least one of) the SYSTEM_VARIABLES_ADMIN or SESSION_VARIABLES_ADMIN privilege(s) for this operation')该问题是由于MySQL用户缺乏SYSTEM_VARIABLES_ADMIN或SESSION_VARIABL_ADMIN权限导致的Django数据迁移受阻
2025-04-11 11:24:08
3115
原创 seaborn基本绘图
# 导入绘图库 matplotlib 的 pyplot 模块,用于绘制图形。from matplotlib import pyplot as plt# 导入 pandas 库,用于数据处理和分析。import pandas as pd# 导入 seaborn 库,用于绘图import seaborn as sns
2025-04-01 18:00:16
4357
原创 matplotlib完整案例
Matplotlib 是 Python 中一个流行的绘图库,用于创建各种静态、动态和交互式的图表。本文将通过一系列完整的案例来教授如何使用 Matplotlib 进行数据可视化。
2025-03-25 16:34:16
4886
原创 垃圾短信分类
1. 数据加载阶段特别指定手机号为字符串类型,避免解析错误2. 清洗过程中通过 lambda 表达式生成垃圾短信标签,规则可根据需要调整3. 脱敏处理采用部分隐藏的方式保护隐私,同时处理异常情况4. 分词过程包含 URL 替换和停用词过滤,提高文本表示质量5. 模型训练使用 TF-IDF + 多项式贝叶斯组合,适合短文本分类6. 可视化部分展示了数据分布和关键词云,帮助理解数据特征
2025-03-25 11:24:55
4700
原创 关键词提取案例
在电商行业中,用户评论是了解用户需求和产品反馈的重要数据来源。通过分析用户评论,可以提取出用户关注的关键词,从而帮助商家优化产品和服务。本案例将展示如何结合`pandas`数据清洗、`jieba`分词和`scikit-learn`关键词提取技术,处理和分析用户评论数据。
2025-03-21 09:32:41
5200
原创 pandas基础
import pandas as pd# 设置DataFrame显示的宽度pd.set_option('display.width', 800) # 设置最大宽度为800个字符pd.set_option('display.max_columns', 100) # 最大列数为100
2025-03-11 16:19:41
5847
原创 基于规则的分词
基于规则或词典的分词方法是一种较为机械的分词方法,其基本思想如下。将待分词语句中的字符串和词典逐个匹配。找到匹配的字符串则切分,不匹配则减去边缘的某些字符。从头再次匹配,直至匹配完毕或者没有找到词典的字符串而结束。基于规则分词主要方法如下。正向最大匹配法(Maximum Match Method,MM法)。逆向最大匹配法(Reverse Maximum Match Method,RMM法)。双向最大匹配法(Bi-direction Matching Method,BMM法)。
2025-03-04 09:40:16
6906
原创 python 正则表达式
函数,从字符串起始位置匹配正则表达式,返回 Match 对象(匹配失败返回 None)。字符串开始(例:^Hello 匹配行首Hello)r’^’ 字符串开始(例:^Hello 匹配行首Hello)匹配除换行外任意字符(例:a.c 匹配 abc)单词边界(例:\bcat\b 匹配独立单词cat)或操作(例:cat|dog 匹配cat或dog)匹配除换行外任意字符(例:a.c 匹配 abc) 一个。1次或多次(例:\d+ 匹配连续数字)0次或多次(例:a* 匹配 aa)空白字符(例:匹配空格、制表符)
2025-02-28 11:12:14
7989
原创 deepin 安装 kafka
kafka 有两种部署模式,分别是zookeeper模式和kraft模式zookeeper模式需要提前部署zookeeperkraft模式不需要部署zookeeper本案例将分别使用zookeepper模式和kraft模式部署kafka
2024-12-24 09:20:50
9970
原创 scala 编写 hdfs 工具类
scala 编写 hdfs 工具类scala 创建 删除 hdfs 文件或目录scala 上传 下载 hdfs 文件 scala 读取 写入 hdfs 文件
2024-12-05 10:20:15
9893
原创 scala math 匹配模式
在Scala语言中,模式匹配是一种强大的控制结构,它允许你以声明式的方式检查一个值是否符合某个模式,并根据匹配的结果执行不同的代码块。Scala的模式匹配类似于正则表达式,但更加通用,可以用于数据结构的匹配。
2024-12-02 10:23:46
9978
脱发因素机器学习数据集
2025-05-30
基于文本的情感分析数据集 pos.txt 积极评论数据集 neg.txt 消极评论数据集
2025-04-15
finebi6.0 服务器版
2024-07-16
Javaweb Layui RBAC 项目 小金库
2022-06-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人