自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(146)
  • 收藏
  • 关注

原创 GPUGEEK:重塑AI开发,在线算力市场+大模型搭建全攻略

GPUGEEK定位于面向 AI 开发者和中小企业的 AI 赋能平台。在当前的 AI 生态系统中,AI 开发者和中小企业往往面临着诸多挑战。一方面,构建和维护自己的 AI 基础设施需要巨大的资金投入和专业的技术团队,这对于许多中小企业来说是难以承受的负担。另一方面,即使有了硬件设备,软件环境的搭建、模型的训练和优化等工作也需要耗费大量的时间和精力,这在一定程度上限制了 AI 技术在这些群体中的应用和发展。GPUGEEK旨在通过提供一站式的解决方案,帮助 AI 开发者和中小企业克服这些障碍。

2025-05-29 16:16:49 1079

原创 Dify 异构知识源融合架构解析:外部知识库 API 对接与智能调度原理

混合搜索非常适合需要高精确度的复杂情况,尤其是当一个实体可以由多个不同向量表示时。这适用于同一数据(如一个句子)通过不同的 Embeddings 模型进行处理的情况,或多模态信息(如个人的图像、指纹和声纹)转换为不同向量格式的情况。通过给这些向量分配权重,它们的综合影响可以极大地丰富召回率,提高搜索结果的有效性。它根据权重计算每个向量场的重要性,优先考虑权重较高的向量场。从技术上讲,可以在多个 AnnSearchRequest 对象中使用相同的向量字段进行混合搜索。正在计划在未来的更新中加入其他排名器。

2025-05-29 14:33:46 736

原创 阿里云函数计算深度应用:构建企业级 DeepSeek API 调用方案

当前,DeepSeek 的在线使用需求迅猛增长,导致出现服务器资源紧张,响应延迟增加,甚至无法响应的情况,我推荐选择大模型服务平台百炼,其提供了 DeepSeek 满血版调用的平替方案。若您希望进一步降低延迟,或需要基于私有数据微调模型、调整模型参数适配垂直领域,可选择独立部署 DeepSeek 模型。相比于本地部署所面临的高昂硬件和运维成本,还缺乏弹性扩缩容能力,难以应对业务量的波动等问题。

2025-05-28 18:22:10 809

原创 5分钟颠覆5小时!DeepSeek 让合同管理效率飙升

在传统办公场景中,处理大量PDF合同数据往往需要繁琐的手动录入、核对和整理,使用这种方式办公,不仅耗时耗力,而且还容易出错,对很多职场人来说,相信多多少少都有类似的经历。然而,借助DeepSeek,只需几分钟就能自动完成数据提取、格式转换,甚至生成Excel表格、折叠目录和可视化树图。本文将展示如何借助AI,让合同管理从“”升级为“

2025-05-28 17:39:39 576

原创 基于开源架构与智能代理的学术资源采集系统设计与大模型语义解析研究

该开源项目Google Scholar Spider是一个基于Python的工具,根据给定的关键字检索Google Scholar上发表的文章数据。它允许用户将结果保存为CSV文件,然后绘制结果,并通过年份和引用次数过滤结果。下面是"google_scholar_spider.py"代码中的一些主要函数,这里我就不细讲代码了,主要看有哪些函数即可。

2025-05-27 18:18:03 708

原创 Deepseek技术架构解密:MTP模型核心机制与设计思想全透视

MTP(Multi-Token Prediction)实际上就是将大模型原始的1-token的生成,转变成multi-token的生成,从而提升训练和推理的性能。具体来说,在训练阶段,一次生成多个后续token,可以一次学习多个后续位置上的label,进而有效提升样本的利用效率,提升训练速度;在推理阶段通过一次生成多个后续token,实现成倍的推理加速来提升推理性能。用个示意图可以表示为:通过【1】预测后续的【2345】,假如【2345】都是准的话,下一个预测的词就是【6】了,这样就提高了3倍预测效率。

2025-05-27 17:20:31 681

原创 基于需求文档的智能测试用例生成——Deepseek解决方案

本文将介绍如何从 DOCX 文档中提取标题为“需求内容”的部分,并将其作为 DeepSeek 模型的输入,生成详细且格式化的测试用例。我们将使用 Python 编写相关脚本,并展示最终的测试用例输出格式。

2025-05-27 16:08:26 797

原创 万亿参数实战:H20服务器部署DeepSeek R1 671B及高并发压力测试指南

最近,我有幸在工作中接触到了DeepSeek R1 671B模型,这是目前中文开源领域参数量最大的高质量模型之一。DeepSeek团队在2024年推出的这款模型,以其惊人的6710亿参数量和出色的推理性能,引起了业界广泛关注。作为一名AI基础设施工程师,我有机会在H20服务器上部署这个庞然大物,并对其进行了全面的压力测试。这篇文章将详细记录我的部署过程和性能测试方法,希望能为大家提供一些参考。💡为什么选择DeepSeek R1?超大规模参数量(671B)优秀的中英文理解能力开源可商用的许可证。

2025-05-27 15:21:29 838

原创 git rebase 合并提交与避免分叉合并

git rebase是一条集增删改查于一体的强大命令,它既可以对自己的分支进行修修剪剪,也可以在合并其他分支的时候缝缝补补,让我们的 commit 提交看上去干净清爽。只对尚未推送或未分享给别人的本地修改执行变基操作,清理历史, 从不对已推送至别处的提交执行变基操作。这样,你才能享受到两种方式(rebase 和 merge)带来的便利。更多AI学习资料请添加学习助手领取资料礼包视频学习资料:从0开始开发超级AI智能体,干掉所有重复工作基于字节的coze平台从0到1搭建我们自己的智能体。

2025-05-26 18:23:51 997

原创 云端智能新范式:DeepSeek在优云智算平台的深度训练全解析

优云智算平台在当今数字化与智能化飞速发展的时代,算力已成为推动科技创新、产业升级以及社会进步的核心驱动力。海量数据的处理、复杂模型的训练以及实时性的智能应用需求,都对计算能力提出了极高的要求。优云智算平台应运而生,作为行业内极具影响力的算力服务平台,它正以卓越的性能、丰富的功能和创新的服务模式,为众多领域的用户带来前所未有的计算体验,助力他们在智能时代的浪潮中抢占先机。平台的镜像社区是一大特色亮点。

2025-05-26 17:10:34 607

原创 DeepSeek智码:AI驱动的Python开发引擎

本文将详细介绍该项目vscode侧边栏的创建、前端用户界面的框架选择与搭建、主题背景的切换设计等。

2025-05-23 17:50:59 574

原创 【零成本高效编程】VS Code必装的12款AI插件,开发效率飙升!

今天给大家分享 12 个免费的VSCode AI代码编码插件!!!我们都知道,VSCode是一个非常强大的代码编辑器,而 AI 代码提示插件可以让我们更加高效地编写代码。下面是我为大家精选的12个【免费】的VSCode AI代码提示插件,亲测好用!!!

2025-05-23 17:18:14 938

原创 硅基流动(SiliconCloud):大模型云服务赛道的创新领跑者解析

硅基流动(SiliconCloud)平台凭借其多样的模型选择、卓越的性价比、简化的开发流程以及用户友好的体验,成为了开发者和普通用户探索生成式 AI 技术的理想之选。平台集成多种主流开源大模型,涵盖但不限于:文本生成模型(如 DeepSeek R1 & V3、Qwen2.5、GLM-4、Llama-3.X、Gemma-2、InternLM、Yi-1.5 等)和图片生成模型(如 Janus-Pro、Stable Diffusion(SDXL)、FLUX 等)。:不同的模型适用于不同的应用场景。

2025-05-23 16:35:46 1075

原创 AI赋能网络技术:Kimi大模型解析代理IP核心要点

我们来问问Kimi大模型对代理IP的定义。顾名思义,代理IP是指通过代理服务器替代用户的真实IP地址,用于访问互联网资源的一种技术。代理IP最早是源于网络转发中继,也就是在用户和目标网站之间充当中介,转发我们通信设备的网络请求与响应,所有来往的请求信息收发都会通过这个中介进行中转。在深入探索了代理IP的多方面应用之后,我们不难发现,代理IP不仅为我们的在线活动提供了匿名性和安全性,还极大地提高了我们的业务运行的效率。

2025-05-23 15:31:34 743

原创 腾讯云Serverless数据库+HAI平台:AI海报生成与数据飞轮驱动的电商智能升级实践

腾讯云推出了一款“高性能应用服务HAI”,是一款面向 Al、科学计算的 GPU 应用服务产品,以应用为中心,匹配GPU云算力资源,AI 2.0时代 GPU 新品,预装LLM、AI作画、数据科学等高性能应用,实现即插即用,助力中小企业及开发者快速部署LLM、AI作画、数据科学等高性能应用。“高性能应用服务HAI”,它具有澎湃算力,即开即用,基于腾讯云GPU云服务器底层算力,提供开箱即用的高性能云服务。以应用为中心,匹配GPU云算力资源,助力中小企业及开发者快速部署LLM、AI作画、数据科学等高性能应用。

2025-05-23 14:35:42 778

原创 知识蒸馏揭秘:零基础入门AI模型压缩与迁移

通过蒸馏技术,DeepSeek能够将具备强大推理能力的大型教师模型(例如参数规模高达 6710 亿的 DeepSeek R1 大模型)中的核心知识高效压缩并迁移至轻量级学生模型(例如仅含 70 亿参数的 Qwen 7B 模型),在保持推理精度的同时显著降低模型部署成本。老师不会只说“这是菠萝”,而是告诉学生:“这张图80%是菠萝,15%像松果(因为表面纹理相似),5%像榴莲(因为颜色接近)。通过学思路(软目标),学生在遇到“没见过的变异菠萝”(如被切块的)时,能通过“纹理相似性”正确识别。

2025-05-22 18:01:32 798

原创 基于中央处理器的DeepSeek容器镜像构建及实践应用——以KeyarchOS操作系统为例

在KeyarchOS(KOS)操作系统上使用容器技术部署Deepseek应用,能够有效实现环境隔离、快速部署和资源优化。本文详细讲解如何从零开始构建基于CPU的Deepseek容器镜像,并演示其使用方法。本方案适用于及以上版本,兼容CentOS生态体系。本次使用的软硬件环境如下:机型:NF5466G7操作系统:Keyarchos5.8 SP2内存:256G磁盘空间:4T。

2025-05-21 17:54:05 905

原创 基于Java与DeepSeek的企业级数据库智能交互系统设计与实现——整合达梦数据库的MCP服务端开发

在AI与大数据深度融合的今天,企业面临一个核心矛盾:业务人员需要即时数据洞察,却受限于SQL技能门槛。传统解决方案依赖IT部门手工编写查询,响应周期长、沟通成本高。尽管DeepSeek等大模型展现出极强的自然语言理解能力,但也一直难以直接与企业级数据库(如达梦)结合使用,更难以根据企业自身的个性化数据响应用户问题。

2025-05-21 17:04:12 840

原创 MCP架构实战:从零构建高可用Server-Client集成系统

构建可以连接到任何 MCP 服务器的 MCP 客户端创建公开资源(resource)、提示(Prompts)和工具(tools)的 MCP 服务器使用标准传输,如 stdio 和 Streamable HTTP处理所有 MCP 协议消息和生命周期事件。

2025-05-21 16:18:12 650

原创 基于Deepseek与亮数据爬虫框架的舆情分析系统构建指南

亮数据是一家领先的网络数据采集平台,提供全球范围的高匿名代理服务和强大的爬虫工具。它支持住宅、数据中心、移动等多种类型的代理IP,并配备自动化浏览器和结构化数据API,帮助用户高效、合规地抓取公开网页数据,广泛应用于电商监控、社交媒体分析、品牌保护等场景。以下是。

2025-05-21 15:55:57 590

原创 function call介绍和实现:DeepSeek平台函数调用技术详解

是一种机制,允许大语言模型在推理过程中动态调用外部函数或 API,以获取实时数据、执行特定任务或操作外部系统。通过 Function Call,模型能够直接与外部工具(如数据库、硬件设备、业务系统)交互,从而实现更复杂的任务。大模型调用外部函数完成用户的任务。当然大模型本身无法调用函数,还得通过程序实现。用户问:北京今天天气怎么样?这个问题是需要实时天气信息的,但是众所周知,大模型裸推的话是无法获取实时信息的。。大模型回答问题的时候发现需要调用函数,并提取参数location:"北京"。

2025-05-21 14:45:35 879

原创 智能协作效能对决:四大AI助手在DooTask项目管理中的实战评测

ChatGPTDeepSeek通义千问文心一言智谱清言Claude和Gemini等。这些AI工具各具特色,能够满足不同项目管理需求。ChatGPT:擅长自然语言处理和对话生成,适用于团队沟通、客户支持及文案创作等场景。DeepSeek:提供高效的信息检索和数据挖掘能力,帮助用户快速从海量信息中找到所需资料。通义千问:专注于知识问答,结合强大的知识图谱和推理能力,提供精准的答疑支持。文心一言:具备创意写作功能,能够生成富有创意和灵感的文案,适用于报告和内容创作。智谱清言。

2025-05-20 18:08:07 1176

原创 基于FastAPI的本地化知识引擎构建指南

实现文档管理 API 接口,有上传,更新,删除的操作。添加会话管理 API 接口,每一个会话都对应着相关的聊天历史记录。提供文档向量化 API 接口,目前只是简单的对所有文档全量向量化。后续我会更新,支持单个文档的向量化与去除向量化。聊天交互流式响应 API 接口,符合 OpenAI 规范。更多AI学习资料请添加学习助手领取资料礼包视频学习资料:从0开始开发超级AI智能体,干掉所有重复工作基于字节的coze平台从0到1搭建我们自己的智能体。

2025-05-20 17:22:09 567

原创 私有化大模型实战手记:Ubuntu系统下RAGFlow与DeepSeek-R1部署全解析

记录在ubuntu系统上本地私有化deepseek大模型。

2025-05-20 16:28:02 583

原创 高效推理解决方案:飞桨3.0框架下DeepSeek-R1蒸馏模型部署优化实践

飞桨3.0的架构革新与本地部署实战,不仅验证了国产深度学习框架在大模型时代的技术竞争力,更揭示了其在产业落地中的独特价值。结合本次DeepSeek-R1蒸馏版的部署经验,可以看到,飞桨3.0很大程度上解决了传统框架在动态图灵活性与静态图性能间的矛盾。在DeepSeek-R1部署中,FP8-WINT4混合量化将显存占用压缩至原模型的30%,而MLA算子的多级流水线设计也使得长序列推理的吞吐量大大提升。这种“精度-效率-显存”三重平衡的优化范式,为边缘设备部署百亿级模型提供了可能。

2025-05-19 18:01:56 1001

原创 从架构到实现:利用trae做一个Excel格式化工具

Trae可不只是在微服务通信(MCP)领域表现卓越,在开发小型工具方面也颇具潜力。比如借助 Trae 开发一个本地工具,专门用来处理 Excel 文件的数据格式化,主要实现以下操作:删除重复行: 删除数据表中完全相同的行,确保数据唯一性。删除空行: 清除所有值均为空的行,避免无效数据干扰分析。去除空格: 移除文本字段中的首尾空格,防止隐藏字符影响计算。统一大小写: 可选择转换为小写、大写或首字母大写,以确保数据格式一致。数值格式化: 统一数值的小数位数(默认保留2位),保证数据规范。

2025-05-19 16:36:56 595

原创 Trae技术栈实战:基于Mcp构建智能天气监测系统全解析

在数字化转型的浪潮中,Trae 作为全栈开发者的瑞士军刀,正在重新定义开发效率的边界。本文将带您亲历两个颠覆性场景:通过 Mcp 模块快速搭建实时天气系统,以及运用 AI 引擎实现 Excel 的自然语言交互。这些实测不仅展示了 Trae 的技术深度,更揭示了未来开发的无限可能。在最新版本的trae就支持了MCP功能了,内置 MCP 市场,可快速添加第三方 MCP Servers,灵活调用 MCP 工具以拓展执行能力。接下来,我们就展示下,如何在trae中使用mcp进行天气系统网站的搭建操作。

2025-05-19 16:00:15 737

原创 3小时颠覆3天开发!通义灵码2.0+DeepSeek技术解码:92%单元测试精准率如何炼成

随着技术的迅猛发展,AI 赋能编程成为了必然趋势。通义灵码应运而生,它是阿里巴巴集团在人工智能与编程领域深度探索的结晶。通义灵码旨在借助 AI 的强大能力,为开发者提供更加智能、高效的编程辅助工具。通义灵码 2.0 作为其升级版本,更是在功能和性能上实现了重大突破,成为编程领域的一颗璀璨新星。

2025-05-19 15:21:48 1071

原创 零基础玩转DeepSeek:本地部署+WebUI可视化训练+数据投喂训练全攻略

DeepSeek偶尔会出现反应迟缓甚至宕机的情况,万幸,DeepSeek是一个开源模型,我们可以通过本地部署,在自己的终端上随时使用!接下来就教大家具体的操作。

2025-05-16 18:05:40 897

原创 基于uniapp+Sumer UI仿DeepSeek APP开发指南:实现流式输出接入

本项目使用UniApp跨端框架实现仿DeepSeek的在线课程平台APP,支持课程浏览、搜索、播放、用户中心等功能。采用Vue3+uView Plus实现跨平台部署,配套RESTful API接口和本地Mock数据系统。

2025-05-16 17:00:11 556

原创 Spring Boot集成LangChain4j实现双AI模型接入(OpenAI+DeepSeek)

官网统一 API: LLM 提供商(如 OpenAI 或 Google Vertex AI)和嵌入(向量)存储(如 Pinecone 或 Milvus) 使用专有 API。LangChain4j 提供统一的 API,避免了学习和实现每个特定 API 的需求。要尝试不同的 LLM 或嵌入存储,您可以在它们之间轻松切换,无需重写代码。LangChain4j 目前支持 15+ 个流行的 LLM 提供商 和 20+ 个嵌入存储。

2025-05-16 16:18:36 991

原创 基于Spring Boot 3.x实现大模型SSE流式通信指南

WebClient发送 POST 请求:设置目标 API 地址。:设置 API 认证。:声明期望返回 SSE 数据。:解析 API 返回的流式 JSON 数据。处理流式响应:解析 SSE 数据并返回事件。:监听前端主动断开 SSE 连接。:监听 SSE 连接终止。:异常处理。

2025-05-16 15:34:45 698

原创 从零搭建企业级RAG系统:FastGPT+Xinference深度整合指南

你想拥有一个完全属于自己的智能问答系统,能够基于本地知识库回答各种问题么?不再依赖云端 API,数据安全更有保障?那么今天我向大家介绍一种方式!本文将教你如何使用 FastGPT 快速部署,并结合 Xinference 在本地运行大模型 (语言模型,向量模型,排序模型),搭建一个高效、安全的本地知识库问答系统。

2025-05-16 14:16:48 714

原创 【WordPress智能创作引擎】全能AI插件:图文/视频自动生成+长尾词优化,预装DeepSeek/Kimi双核驱动,开放API生态拓展

Linkreate wordperss AI插件:AI图文+视频+长尾关键词自动生成,已内置deepseek、kimi全模型。支持自定义接入其它API,包括但不限于腾讯云API和它的deepseek模型后台只需要设置对应的API url 、模型 、API key,就可以让插件调用自定义的API后台有腾讯云 deepseek模型的自定义接入示例,只需要按示例填写即可自定义接入其它更多的API服务商和模型同理。

2025-05-15 18:14:15 861

原创 智能编程加速器:PyCharm深度整合DeepSeek插件实战指南

本文我们来聊聊如何在代码编辑器中使用DeepSeek自动生成代码。注:本文适用于所有的JetBrains开发工具,如Pycharm、Idea等。

2025-05-15 17:40:37 797

原创 基于Vite 6+Deepseek+Arco Design构建流式AI问答系统

本文实现的系统将现代前端工程实践与AI能力深度融合,展示了如何通过流式传输提升用户体验。开发者可以在此基础上扩展知识库集成、对话记忆等功能,更可以替换不同的AI引擎来构建垂直领域的智能解决方案。这种技术组合为Web应用智能化提供了可靠的技术路径,期待看到更多创新应用的诞生。更多AI学习资料请添加学习助手领取资料礼包视频学习资料:从0开始开发超级AI智能体,干掉所有重复工作基于字节的coze平台从0到1搭建我们自己的智能体从coze到超级创业个体:2025是AI Agent大爆炸的元年!

2025-05-14 18:14:36 934

原创 基于DeepSeek R1与n8n的本地化AI智能体构建指南

在AI技术民主化的浪潮下,企业级智能体的构建不再局限于云端服务。DeepSeek R1作为高性能的开源大语言模型,结合n8n可视化自动化平台,为开发者提供了全新的本地化AI解决方案。这种组合不仅保障了数据隐私,更赋予智能体强大的任务处理能力,从简单的问答交互到复杂的业务流程自动化,都能在本地环境中高效完成。借助n8n、Ollama和DeepSeek-R1这三款超实用工具,你能在自己电脑上实现工作流程自动化、处理数据、与 AI 聊天。

2025-05-14 16:54:48 904

原创 Windows本地部署deepseek-r1大模型并通过浏览器远程交互实战指南

在人工智能技术飞速发展的当下,本地化部署大型语言模型已成为开发者探索的热点。本文将手把手指导您在Windows系统上完成deepseek-r1大模型的本地部署,并实现基于浏览器的远程交互功能。要实现本地部署DeepSeek R1大模型其实也不难,只需在电脑中安装能够运行各种AI模型的开源工具Ollama就可以了,不过如果感觉在终端中和AI交互不太美观,我们也可再安装一个图形化的界面,就能在网页中和大模型聊天了,下面就来具体演示一下。

2025-05-14 15:43:32 790

原创 10分钟用Trae+Dify构建Data McpServer与智能Agent:开启自动化数据处理新时代

在数字化转型的今天,仍有80%的企业困在电子表格的泥潭中。现在,Trae框架与Dify平台的强强联合,将用10分钟为你打开自动化数据处理的新世界。

2025-05-14 14:50:34 581

原创 职场效率升级指南——无代码搭建企业知识库的Dify+MiniMax实战教程

PS:但是我们现阶段还是会结合RAG来使用,有两个好处:1.利用RAG的能力缩小内容范围,节约tokens(节约成本)2.当知识库内容超出模型支持上下文长度时,还是需要借助RAG缩小范围。),是Claude-3.5-Sonnet的20倍,GPT-4o的32倍,DeepSeek的62.5倍!我测试了很多问题,回答的都很棒,都是既全面、又详细,而且minimax-01有自己的一套逻辑来总结表达,不是照搬原文。:RAG检索到的相关内容,需要尽可能全面、丰富,就算当中有不太相关的信息也没关系,只要。

2025-05-09 16:35:41 837

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除