- 博客(29)
- 收藏
- 关注
原创 AI编程/RAG基础教程(一)基于本地大模型和 FAISS 的 RAG 实战教程
本文详细介绍了如何从零开始构建一个基于检索增强生成(RAG)技术的智能问答系统。主要内容包括:1)RAG的基本原理,通过检索外部知识增强大语言模型回答的准确性和实时性;2)具体实现步骤:PDF文档加载、文本拆分、向量存储与检索、大模型初始化;3)使用LangChain框架、Ollama本地模型和FAISS向量数据库的代码实现;4)系统优化方向如数据预处理、文本拆分策略、检索技术等;5)可替代的技术栈选项。通过本教程,读者可以掌握RAG的核心技术,并搭建一个完整的本地智能问答系统。
2025-06-25 00:54:31
328
原创 RAG实战基础篇/windows电脑快速部署qwen3:14B
本文介绍了在Windows系统上快速部署ollama运行Qwen3:14B大模型的方法。首先下载安装ollama后,通过命令行拉取Qwen3:14B模型,该模型在int4量化下占用11.5G显存。文章展示了如何通过本地API接口(localhost:11434)进行模型调用,并提供了POST请求示例,支持常规和流式输出两种模式。最后提到后续将基于该本地大模型搭建RAG应用,实现个人知识库问答功能。整个部署过程简单高效,适合快速搭建本地AI开发环境。
2025-06-23 23:49:53
135
原创 qwen2:7b本地化部署:Ollama更新、设置、api调用qwen2服务
本篇介绍了如何使用Ollama本地化部署qwen2:7b,以及进行Ollama的参数设置以及使用api调用qwen2的api服务的方法。
2024-08-26 00:33:01
18490
2
原创 Ubuntu22.04本地部署qwen模型、jupyterlab开发环境、LoRA微调全流程-续
接着上一篇,在Ubuntu22.04本地部署qwen模型,准备数据,进行LoRA微调。
2024-05-18 16:25:44
1375
3
原创 Ubuntu22.04本地部署qwen模型、jupyterlab开发环境、LoRA微调全流程
这段时间在自己的Win11系统上部署了chatGLM以及Qwen模型,进行对话、推理以及工具调用都没有问题,但是在尝试进行微调的时候发现好像并不能成功,因此花费了很大的力气,又分别在ubuntu桌面版、windows子系统WSL2 Ubuntu上部署了Qwen模型,并尝试进行LoRA的微调实践。由于过程比较多,步骤较为繁琐,我可能会分几个部分进行叙述。首先介绍一下我的两个环境(平民玩家,勿喷):一台笔记本安装的Ubuntu22.04桌面版:显卡是1070M 8G。
2024-05-18 15:31:40
3469
原创 Qwen学习笔记3:Qwen模型调用外部API实现模型增强(openai的形式)
本文进一步记录了千问模型的函数调用功能使用方法,大家可以一起学习交流~
2024-05-15 19:11:37
7050
3
原创 Qwen学习笔记2:Qwen模型基于ReAct原理实现function calling
本文继续记录了Qwen模型的function calling功能的实践代码。
2024-05-15 18:26:51
5132
5
原创 Qwen学习笔记1:Qwen模型使用ReAct原理实现function calling,增强模型能力
本文记录使用Qwen模型基于ReAct原理实现的函数调用功能,并附带记录一些代码。
2024-05-15 17:30:39
4808
原创 千问模型flash-attention加速框架的部署
本文记录了windows系统安装flash-attention,以加速通义千问模型的推理速度,降低显存占用的安装部署过程
2024-05-14 16:47:36
1569
2
原创 本地部署 Langchain-ChatGLM
本文记录了在windows11上部署和测试langchain+chatGLM3这个项目的过程。
2024-05-11 19:30:59
1352
3
原创 chatGLM3-6b与FastGPT互联测试
简单介绍了将chatGLM2升级为chatGLM3之后,再次连接FastGPT进行知识库链接的操作过程,给大家进行参考。
2024-05-09 13:52:46
338
1
原创 本地部署chatGLM3-6b教程
之前一直用的chatGLM2,将FastGPT本地化跑通后,现在试试将chatGLM2升级为chatGLM3。升级就比较顺利了,过程如下,该过程参考了哔哩哔哩网站的一个视频。
2024-05-09 12:54:21
2413
1
原创 FastGPT连接oneapi报错:Connection error.后续:真正的原因
FastGPT连接oneapi报错:Connection error.后续
2024-05-07 15:16:36
1960
3
原创 FastGPT连接oneapi报错:Connection error.
FastGPT连接oneapi报错:Connection error解决办法。
2024-05-06 18:21:07
3114
4
原创 使用NextChat搭建本地ChatGTP应用,调用本地chatGLM2-6B模型
本文记录了使用NextChat,调用本地chatGLM2-6B模型
2024-04-30 16:12:00
3573
3
原创 采用API的方式调用本地chatGLM2-6B,postman方式访问接口,openai格式调用接口
本文记录了采用api的方式访问本地chatGLM2-6B的方法
2024-04-30 11:05:08
1792
1
原创 harbor服务器配置完成,网页能访问,使用docker login登录失败,提示:unauthorized: authentication required
服务器登录harbor失败
2022-08-30 09:36:09
6943
1
原创 虚拟机安装麒麟操作系统网络设置
麒麟操作系统安装在虚拟机上,设置网络时,发现一些问题,现在解决了,记录一下。1、虚拟机安装麒麟操作系统后,选择网络设置,没有连接选项,无法连接到主机网络。(截图忘保存了)这是由于安装麒麟系统时,未选择正确的linux版本,我们选择“CentOS 8”,重新安装,即可看到网络设置中,可以连接到主机的网络。2、主机与虚拟机麒麟系统无法ping通,可以参照以下步骤进行设置。(1)设置虚拟机IP点击右下角网络图标,右键,选择“编辑连接”选择已连接的网络,点击设置.
2022-04-18 17:50:03
29979
原创 虚拟机麒麟系统V10安装VMware Tools
虚拟机安装好麒麟系统后,无法设置到合适的分辨率,窗口无法随着虚拟机窗口的大小改变而改变,可以通过安装VMware tools解决。然而网上大部分的解决办法是通过虚拟机设置:->虚拟机(M)->安装VMware tools,这在应用于麒麟系统时不可取。因为“安装VMware tools”是灰色状态的,不可选。通过网上找到一个教程如下:虚拟机版本:VMwareworkstation16.2.3麒麟系统版本:Kylin-Server-10-SP2-x86-Release-Build09
2022-04-18 17:12:00
16736
2
原创 如何在公司内网机上安装.net framework 3.5(错误:0X8024402C DISM失败解决方案)
网上查找N种方法,都无法成功安装,直到看到这篇博客,感谢博主大大:原文链接:https://blog.csdn.net/knkn123/article/details/108456661
2021-07-15 16:29:04
5832
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人