自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 【用 FastAPI + Ollama + WebSocket 实现可视化对话:全链路流程完全拆解】

阶段发生了啥0启动 Uvicorn1浏览器 GET,FastAPI 返回 HTML2HTML 里 JS 脚本准备好3用户输入,点击按钮或回车都触发4submitForm把输入写到页面,创建 WebSocket5FastAPI/ws接收消息,调用 Ollama6Ollama 流式生成,FastAPI 一段段发,JS 一段段接。

2025-07-17 22:30:26 558 1

原创 【使用 ChatOllama 绑定 Python 函数实现自然语言驱动工具调用】

随着大型语言模型(LLM)的快速发展,结合外部函数或工具,实现复杂任务自动化处理的需求日益增加。例如,用户用自然语言提问“你知道一千万乘二是多少吗?”,希望模型能精准调用计算器函数算出结果,而不是单凭模型“记忆”作答。这套方案通过 LangChain 和 Ollama 的结合,实现了“自然语言驱动的函数调用”能力,使复杂任务拆解成模型理解的指令,触发精确代码执行,提升了应用智能与可靠性。​。

2025-07-09 22:23:35 1000

原创 【AutoTokenizer】

Hugging Face的tokenizer方法详解:本文介绍了transformers库中tokenizer()的核心参数和返回值。主要参数包括输入文本(text)、句子对(text_pair)、特殊标记(add_special_tokens)、padding/truncation控制、max_length长度限制、返回张量格式(return_tensors)等。方法返回字典包含input_ids、attention_mask、token_type_ids等关键字段,用于将文本转换为模型可处理的格式。示例

2025-06-19 15:41:40 259

原创 【pandas学习路径】

【代码】【pandas学习路径】

2025-05-26 21:29:03 533

原创 【Jupyter Notebook 快捷键和魔法指令】

本文提供了Jupyter Notebook 快捷键和**魔法命令(Magic Commands)**的整合清单,帮助用户更高效地使用 Jupyter Notebook。快捷键分为命令模式和编辑模式,涵盖单元格的插入、删除、复制、粘贴、运行、自动补全等常用操作。魔法命令包括单行和多行指令,支持文件操作、时间测量、脚本运行、Bash 命令执行等功能。通过掌握这些快捷键和命令,用户可以显著提升在 Jupyter Notebook 中的工作效率。

2025-05-19 21:51:31 387

原创 Pandas 中 Series 与 DataFrame 的多种生成方式汇总

本文汇总了Pandas中Series和DataFrame的多种创建方式。Series作为一维数据结构,可以通过列表、字典、标量、NumPy数组或从DataFrame中提取一列来生成。DataFrame作为二维数据结构,创建方式更为多样,包括通过字典、列表嵌套列表、字典嵌套字典、列表嵌套字典、NumPy数组、Series字典、zip对象、from_dict方法、from_records方法以及读取外部文件(如CSV、Excel)等。这些方法为数据处理提供了灵活的选择,适用于不同的数据结构和分析需求。

2025-05-19 10:04:44 298

原创 清明黄山u

以下是专为3天假期(4.4-4.6)优化的。

2025-03-20 14:34:18 362

原创 【NLP 基础:文本预处理、分词与词袋模型(优化版】

文本预处理的目的是将原始文本数据转换为适合机器学习模型处理的格式。通过清洗和标准化文本数据,可以提高模型的性能和准确性。

2025-03-05 23:08:28 1062

原创 【线性逻辑回归和非线性逻辑回归】

具体体现在模型形式、决策边界和应用场景上。线性逻辑回归和非线性逻辑回归的核心区别在于。

2025-03-04 15:56:27 750

原创 深度学习--数据加载

1. **手写 `Dataset` 类**2. **数据集划分**2.1 使用Subset创建子集Subset 类的定义参数说明关键方法示例代码使用场景注意事项2.2 使用 `random_split` 将数据集划分为训练集、验证集和测试集。函数定义1. 基本用法2. 设置随机种子3. 划分为多个子集注意事项与 `Subset` 的区别3. **数据集加载**3.1 **`DataLoader` 的功能**3.2 **`DataLoader` 的参数**

2025-03-03 23:07:03 903

原创 【时间序列--相似性分析】

比较项DTW(动态时间规整)余弦相似度计算方式距离累积,通过最优路径规整向量间夹角是否等长要求不要求需要等长关注点时间序列中的对齐、匹配向量的方向或趋势应用场景时间序列分析、语音识别等文本相似度、推荐系统等DTW 更适合长度不一、非线性对齐的时间序列,而余弦相似度则适用于高维度向量的方向性相似性判断。时序相似性:适合关注特定时间点数据对齐的任务。形状相似性:适合关注整体趋势和形状的任务。变化相似性:适合需要识别和跟踪变化模式的任务。

2024-11-12 15:29:57 2135

原创 【OpenCV】

cv.WINDOW_NORMAL 可以调整窗口大小。默认是cv.WINDOW_AUTOSIZE。-1:代表加载图像,包括alpha通道。1:代表彩色图像(忽略透明度)

2024-11-07 15:56:58 332

原创 【机器学习-----聚类】

SSE 计算的是每个数据点到其簇中心的距离的平方和,用于衡量聚类的紧密度。值越小表示聚类效果越好,常用于 K-Means 聚类评估。

2024-11-06 22:50:20 1066

原创 数据分析

使用pandas 进行数据处理,用machine learning进行数据预测。

2024-10-14 22:19:17 181

原创 大模型学习记录

微调是指在预训练模型的基础上,使用特定任务的数据集进行进一步的训练,使模型能够适应特定的应用场景。

2024-08-03 15:26:15 508

原创 python 常用函数

python。

2024-07-27 17:44:34 676

原创 python

可以使用大括号 { } 或者 set() 函数创建集合,但是注意如果创建一个空集合必须用 set() 而不是 { },因为{}是用来表示空字典类型的。不可变数据(3 个):Number(数字)、String(字符串)、Tuple(元组);可变数据(3 个):List(列表)、Dictionary(字典)、Set(集合)。t = (100, 200) # 不能修改。在 func.py 中写了func1 函数。

2024-07-22 20:43:42 371 2

原创 深度学习面试准备

Markdown编辑器 CSDN

2024-06-19 18:27:34 1124

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除