胡萝卜糊了>•＜-CSDN博客

原创 Assistant API介绍

对话记录--Threads：运行机制--Run：流式响应：功能工具--Tools：集成检索增强生成：

2024-10-20 11:30:54 286

LangFuse 还支持用户数据的收集与标注，这些数据可以用于模型的后续训练和优化。为了确保 Prompt 更新或调整时可以进行版本对比或回滚，应该采用版本管理系统对不同版本的 Prompt 进行控制。这样可以方便地对 Prompt 进行升级或回退到之前的版本，以保证系统的稳定性。Prompt 是 LLM 应用的核心，优化和调试 Prompt 可以提高模型的输出质量。通过这两个工具，可以帮助开发者对 LLM 应用进行深度监控、调试、管理以及性能优化，确保系统始终处于高效稳定的运行状态。

2024-10-14 14:59:30 804

原创视觉生成模型对比

VAE（变分自编码器）、GAN（生成对抗网络）和扩散模型（Diffusion Models）是当前深度学习中广泛应用的三种生成模型，它们的原理各不相同，且适用于不同的任务类型。

2024-10-11 13:46:52 740

原创生成/判别式模型

特性生成式模型判别式模型学习目标联合分布 P(x,y)P(x,y)条件分布 $ P(y数据生成能力可以生成新数据无法生成新数据主要任务数据生成、密度估计、异常检测等分类、回归、序列标注等优势适合处理缺失数据、生成任务分类效果好，训练效率高劣势分类任务性能可能不佳，训练复杂无法生成数据，缺失数据处理能力较差典型模型朴素贝叶斯、GAN、VAE、HMM逻辑回归、SVM、神经网络。

2024-10-11 12:02:37 2717

原创迭代器和生成器的区分

迭代器是一个实现了迭代协议的对象。__iter__(): 返回迭代器对象自身。__next__(): 返回下一个值，当没有更多值时会抛出异常。生成器是一种特殊类型的迭代器，使用yield关键字生成值。生成器函数在执行时会返回一个生成器对象，而不是直接返回值。每次调用生成器的__next__()方法时，函数会从上次yield的位置继续执行。迭代器是实现了特定接口的对象，可以使用iter()和next()方法遍历数据。生成器是迭代器的简化版，使用yield来生成值，便于内存管理和代码可读性。

2024-10-04 15:57:50 372

原创线程、进程、协程与同步、异步、并行、并发的区别

特性进程线程协程定义操作系统分配资源的基本单位进程中的执行单元轻量级执行单元内存隔离独立内存空间共享进程内存共享线程内存通信进程间通信机制共享内存，通信方便共享内存，通信方便调度操作系统内核调度操作系统内核调度用户态程序控制调度开销高较低非常低特性同步异步并行并发定义任务按顺序执行，阻塞任务非阻塞，可以并行执行任务同时执行任务在同一时间段交替执行特点阻塞后续任务非阻塞，适合I/O密集型任务需要多核CPU，真正同时执行交替执行，表现为同时执行。

2024-09-30 13:12:52 731

原创 .py, .pyc 和 .pyi 文件区别

py文件是源代码文件，便于编写和维护。.pyc文件是编译后的字节码文件，加速执行过程。.pyi文件是类型存根文件，用于提供类型信息，帮助进行静态类型检查。

2024-09-27 11:39:02 362

原创大模型开发框架的比较

LangChain 设计为一个模块化和可扩展的框架，允许开发者根据需要选择和集成不同的组件。它支持与多个语言模型和API接口的无缝集成，使开发者能够快速构建和部署语言处理应用。: Semantic Kernel 强调在模型中集成深度的语义理解能力，通过改进的算法和索引机制提高信息检索的精准度。: LlamaIndex 设计为专注于大规模数据集索引和检索的框架，优化了数据处理和查询响应时间。

2024-09-25 13:46:29 542

原创 huggingface上传下载常见问题

解决方案：换镜像网址 https://hf-mirror.com/解决方案：下载使用git-lfs。

2024-09-24 09:23:05 590

原创将Django项目放入Docker中并在另一台电脑上运行的步骤

任务栏搜索功能，启用"适用于Linux的Windows子系统" + "虚拟机平台"：在另一台电脑上安装Docker Desktop。：在目标电脑的项目目录下，打开终端，运行以下命令。目录下打开命令提示符或PowerShell。目录复制到另一台电脑。在Django项目的。

2024-09-20 14:08:00 1039

原创 SDK和API的区分

API（应用程序编程接口）和 SDK（软件开发工具包）是两个密切相关但有所区别的概念，通常在软件开发和系统集成中使用。

2024-09-19 14:42:55 290

原创 Git提交

【代码】Git提交。

2024-09-16 15:01:31 267

原创搭建mingsearch

提交代码到huggingface。

2024-09-09 15:25:39 520

原创模型微调与RAG的选择

微调大模型适合知识库稳定且对回答风格、准确性要求极高的场景，但需要付出较高的训练和更新成本。RAG方案适合动态知识库，能更灵活地处理大规模企业数据，尽管架构复杂，但响应速度更快，尤其在知识库频繁更新时更具优势。

2024-09-08 09:04:00 1206

原创混合专家模型（MoE）介绍

混合专家模型（MoE）是一种机器学习范式，设计用于整合多个模型或“专家”的预测，以提高整体模型的性能。以下是MoE的基本概念、原理、用法和应用场景的详细介绍。MoE模型由两个主要部分组成：多个专家（Experts）和一个门控机制（Gating Network）。

2024-09-08 09:02:46 397

原创记录Git部署到huggingface

@hlbhl ➜ /workspaces/codespaces-blank $ mkdir -p /mindsearchmkdir: cannot create directory ‘/mindsearch’: Permission denied@hlbhl ➜ /workspaces/codespaces-blank $ mkdir -p ./mindsearch@hlbhl ➜ /workspaces/codespaces-blank $ cd mindsearch@hlbhl ➜ /works

2024-09-03 17:52:00 336

原创 InternVL多模态

多模态微调最麻烦的其实是数据准备：大体如下。一个字段要包含一个对应的图片。

2024-08-21 09:53:10 256

原创大模型智能体

通过大模型的语言理解能力，自动处理业务流程。

2024-08-15 17:39:32 143

原创大模型部署

1.设置最大kv cache缓存大小kv cache是一种缓存技术，通过存储键值对的形式来复用计算结果，以达到提高性能和降低内存消耗的目的。在大规模训练和推理中，kv cache可以显著减少重复计算量，从而提升模型的推理速度。理想情况下，kv cache全部存储于显存，以加快访存速度。模型在运行时，占用的显存可大致分为三部分：模型参数本身占用的显存、kv cache占用的显存，以及中间运算结果占用的显存。LMDeploy的kv cache管理器可以通过设置参数，控制kv缓存占用的最大比例。

2024-08-15 17:24:53 442

原创大模型评测

2024-08-10 12:38:00 262

原创 RAG-Llamaindex

2024-08-09 20:34:19 151

原创 prompt是一门学问

I am developing a system to help models correctly compare floating-point numbers, ensuring they recognize that is greater than . This addresses a common issue where models misinterpret the comparison of numbers with different decimal places.Your task is t

2024-08-09 19:38:36 804

aksjebdjj的博客