
RAG
文章平均质量分 90
UASM
进军物联网,工欲善其事,必先利其器!!!机会是留给有充分准备的人的!!!努力做一个走在AI前面的人工智能开发者!!!并行To be NO.1!!!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
RAG中对于PDF复杂格式文件的预处理的解决方案:MinerU
在RAG场景下,我们所遇到的文档格式可不仅仅局限于txt文件,而对于复杂的PDF文件,里面有图片格式的Excel、图片格式的文字、以及公式等等复杂的格式,我们很难用传统的方式去解析预处理成我们可以用的类似于TXT格式的纯文本。原创 2025-04-06 09:24:19 · 472 阅读 · 0 评论 -
唤醒词解决方案
唤醒词项目介绍唤醒词:腾瑞腾瑞功能描述通过说出"腾瑞腾瑞"来唤醒hello.mp3里的音频内容,达到唤醒词的功能。通过人工智能(AI)的不同的技术手段来实现这个功能!!!原创 2025-01-23 11:34:47 · 1176 阅读 · 0 评论 -
RAG中的文本切分策略详解
RAG中当比较两段文本的嵌入向量时,可以根据它们在高位空间中的距离或者角度,来推断这两段文本在语义上的相似度或者差异。利用相似度,将语义上相似的文本自动分组在一起,形成聚类,这有助于更好的理解和组织大量的文本数据。RecursiveCharacterTextSplitter文本切割工具的设计目的是为了在处理文本时,能够在不损失语义关联性的前提下,将文本的有效分割成更小的单元。是不是可以基于文本的语义实现一种更好的方法来处理文本分块,即非固定参数(chunk_size),而是基于语义自行动态确认参数。原创 2025-01-12 21:26:27 · 1402 阅读 · 0 评论