- 博客(932)
- 收藏
- 关注
原创 OpenAI复刻了一个AI编程产品,还开源了~
Greg Brockman 表示,Codex CLI 仅是“一系列代码工具中的第一个”。可能OpenAI未来会构建一个覆盖开发全流程的 AI 工具矩阵,最终指向那个极具想象空间的“Agentic软件工程师”愿景。尽管 Codex CLI 处在早期,面临性能、成本、易用性等方面的问题,但开源的定位,意味着它将是一个快速进化且不容忽视的关键变量。
2025-04-18 11:17:45
964
原创 一文搞懂大模型推理(FastAPI)
一、FastAPI*******什么是FastAPI?***********为什么选择FastAPI构建推理服务?**FastAPI 是一个基于 Python 的现代 Web 框架,专为构建高性能 API 而设计。以下是选择 FastAPI 构建推理服务的核心原因:***********二、推理服务***使用框架(如 FastAPI、Flask)将*本地部署模型封装为 RESTful API,提供推理服务*。****FastAPI如何构建大模型推理服务?
2025-04-15 13:52:36
908
原创 技术动态 | 大语言模型增强的知识表示学习
知识表示学习通过将知识事实映射到向量空间,实现将知识图谱中的符号化知识应用于下游任务。尽管在刻画知识图谱结构信息方面表现出较好效果,但知识图谱的稀疏性依然制约其性能。随着基于 Transformer 架构的大语言模型兴起,为利用文本信息缓解知识图谱中信息稀缺问题、增强知识表示学习能力提供新机遇。利用大语言模型增强的知识表示学习方法主要包括三种策略:基于编码器的方法,借助详细上下文信息进行表征;基于编码-解码器的方法,采用统一序列到序列模型实现全面编解码;基于解码器的方法,充分利用大规模语料中的丰富知识。
2025-04-15 13:51:15
810
原创 AI教父吴恩达:一文简单掌握AI Agent基石概念“反思Reflection”
*今天来分享一下吴恩达老师关于Reflection的内容。***Reflection(反思)则是Agent几大能力中的基石,使Agent能够分析自身的行动、行为和输出。Coursera的联合创始人|Landing.ai的创始人兼CEO|deeplearning创立者**Reflection(反思)**,是一种常见且实用的Agent设计范式,也是吴恩达推崇的4种Agent设计范式之一*。他将**AI 代理工作流分为四种设计*范式,*认为这些模式将在2024年推动重大进展。
2025-04-12 11:29:00
902
原创 国内外知名大模型及应用列表(2025)
这两年的时间里,AI界的进展主要集中在AIGC领域,AIGC就是人工智能生成内容(Artificial Intelligence Generative Content),也就是用自然语言让AI帮你创作各种各样的内容,比如图片、视频、音乐、文字等等。而创造这些内容的主要是XLM,包括截止目前,AIGC领域大半壁江山还是的。通用模型最擅长的是文字创作,其中最擅长的细分领域是(1)各种语言之间的翻译,(2)各种长篇大论的机器阅读并总结,(3)各种命题作文的撰写。2024年9月OpenAI发布了o系列。
2025-04-12 11:27:07
1297
原创 AI Agent大变天!谷歌开源A2A,一夜改变智能体交互
A2A是一种开放协议,为Agent提供了一种标准的交互方式,使它们能够相互协作,无论底层框架或供应商是什么。例如,一家大型电商公司使用了多种企业平台和服务。Atlassian 用于团队项目管理,Box 用于文件存储和共享,Salesforce 用于客户关系管理,Workday 用于人力资源管理。以前这些平台上的Agent无法自由通信。现在通过A2A协议,这些企业平台可以安全、自由地自动化交互数据。
2025-04-11 14:16:02
798
原创 如何构建医疗健康等复杂场景下的Agentic GraphRAG?
上周,Memgraph 举办了一次社区电话会议,讨论 AI 中一个令人兴奋的话题 — Agentic GraphRAG。如果您错过了,以下是我们的开发人员体验工程师 Ante Javor 对网络研讨会亮点的深入探讨。讨论涵盖了从 GraphRAG 的基础知识到 Memgraph 3.0 版的新功能,以及为什么代理对于推进 GraphRAG 至关重要的所有内容。让我们来分析一下。
2025-04-11 11:58:32
846
原创 RAG篇「数据集构建」保姆级教程来了!
检索增强生成(Retrieval Augmented Generation),简称 RAG。在构建RAG(Retrieval-Augmented Generation)的向量知识库时,数据的处理方式直接影响系统的性能和可靠性。不能随意塞入未经处理的数据,否则可能导致检索效果差、生成结果不准确甚至安全隐患。构建向量知识库数据集的基本步骤与微调数据集(见前篇)基本一致,但有以下注意强调事项。
2025-04-10 11:35:53
1054
原创 Ollama保姆级教程:从 0 到 1带你学习Ollama
Ollama 是一个开源的本地大语言模型运行框架,专为在本地机器上便捷部署和运行大型语言模型(LLM)而设计。Ollama 支持多种操作系统,包括 macOS、Windows、Linux 以及通过 Docker 容器运行。Ollama 提供对模型量化的支持,可以显著降低显存要求,使得在普通家用计算机上运行大型模型成为可能。Ollama 适用于开发者、研究人员以及对数据隐私有较高要求的用户,它可以帮助用户在本地环境中快速部署和运行大型语言模型,同时提供灵活的定制化选项。使用 Ollama,我们可以在在本地运行
2025-04-09 11:56:58
760
原创 16.8k Star 的吴恩达大佬的小白模型手册
这是一份专为开发者打造的大模型学习手册,旨在帮助国内开发者快速掌握大型语言模型(LLM)的开发与应用能力。项目以吴恩达老师的大模型系列课程为基础,通过内容筛选、翻译、复现与优化,构建了一套系统化的学习路径,覆盖从 Prompt 设计到 RAG 开发、模型微调的全流程实践。
2025-04-09 11:37:49
1567
原创 Transformer+Unet这个组合是谁发明的?拿来创新简直太绝了!
在医学图像分割领域,Transformer和UNet作为两大主流架构各有特色。值得注意的是,Transformer架构在提取底层视觉特征时往往不够精细,导致目标边界定位不够准确;与此同时,UNet架构在建立远距离依赖关系时也面临明显挑战。采用【Transformer+UNet】的混合架构,恰好能够优势互补:既能利用Transformer强大的全局建模能力,又能发挥UNet优秀的局部特征提取优势。针对正在寻找医学图像研究方向的学者,这个创新思路尤其值得关注!
2025-04-08 21:42:14
705
原创 氛围编程(Vibe Coding)火爆了,AI 会取代程序员吗?
最近这段时间,**氛围编程(Vibe Coding)**真的是火爆了。这个概念是由 AI 大神 Andrej Karpathy 于今年 2 月初在社交平台上提出的,并迅速成为一种新兴的编码方式。
2025-04-08 21:41:18
737
原创 DeepSeek部署保姆级教程!DeepSeek-R1-Distill-Qwen-7B:Web聊天机器人部署指南
通过以上步骤,你已经成功搭建了基于 DeepSeek-R1-Distill-Qwen-7B 大模型的 Streamlit 聊天机器人。在实际使用过程中,你可以根据自己的需求对代码进行进一步优化和扩展,例如添加更多的功能模块、优化界面设计等。如果你在部署过程中遇到任何问题,可参考本文的步骤和注意事项,也可以查阅相关文档或寻求社区的帮助。希望你能在这个项目中充分发挥自己的创造力,探索大语言模型在聊天机器人领域的更多应用可能。
2025-04-05 11:15:00
1139
原创 从设计稿到代码:DeepSeek-VL 的 AI 驱动 UI 开发实践
DeepSeek-VL 是一款基于 AI 的视觉编程工具,能够将设计稿(如 Figma、Sketch 或 Photoshop 文件)自动转化为高质量的前端代码。自动化:无需手动编写代码,直接从设计稿生成 HTML、CSS 和 JavaScript。高精度:支持复杂的设计元素(如渐变、阴影、动效等)的精准还原。跨平台:支持多种前端框架(如 React、Vue、Angular 等)和响应式布局。可定制:允许用户自定义代码风格和输出格式。
2025-04-04 09:30:00
1080
原创 Office/WPS+DeepSeek,开启高效办公模式!提高工作效率!
在现代职场中,Office办公套件已成为工作和学习的必备工具,其功能强大但复杂,熟练掌握需要系统的学习。为了简化操作,使每个人都能轻松使用各种功能,市场上涌现出各类办公插件。这些插件不仅提升了用户体验,还有效提高了工作效率。此外,随着AI人工智能工具的发展,办公软件的操作变得更加多元化和智能化。可以借助AI工具实现更高效的文档处理、数据分析和信息检索等任务。分享一款集成DeepSeek-R1等多个AI工具的智能办公助手: OfficeAI 助手;
2025-04-02 10:25:03
1088
原创 3 分钟打造AI 智能体,《Manus极简入门:从0到1快速打造你的AI智能体》
在科技飞速发展的当下,人工智能已逐渐渗透到生活的方方面面,深刻改变着我们的生活与工作模式。今天,为大家带来一本极具价值的书籍——《Manus极简入门:从0到1快速打造你的AI智能体》,它将成为你探索AI世界的得力指南。
2025-04-02 10:20:19
897
原创 DeepSeek-V3-0324 发布,本次 V3 版本有哪些改进?
新一周的第一天,北京时间 3 月 24 日晚,DeepSeek 「突然」发布了模型更新。但暂时还不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。大家对这次「小版本升级」的 DeepSeek V3 模型体验如何呢?一起来看大模型、Python 话题领域优秀答主、答主与答主的回答吧~推理能力增强基准测试提升显著Web前端开发能力优化中文写作能力升级风格与内容优化功能增强中文搜索能力优化Function Calling 能力改进。
2025-04-01 10:37:53
1053
原创 抖音电商如何用扣子 Coze 打造 AI 客服?
在传统电商客服体系中,服务流程通常由智能客服系统与人工客服团队协同完成,并衍生出一系列前后端的配套服务。尽管大模型已经诞生近两年半,目前 AI 客服大都还停留在 SOP 辅助模式或 Copilot 协作模式。“不配置就回复不了”、“机械式单轮问答”、“幻觉问题误导客户”、“无法识别判读意图,答非所问”等问题仍然普遍存在。为了让 AI 客服更智能化,抖音电商客服团队基于扣子Coze 平台,提供了 Agent 模式下的全新解决方案,在 AI 客服场景构建了人机协作的新型服务范式。
2025-04-01 10:35:11
1523
原创 智谱AI悄悄发布AutoGLM,终于放大招了
他们发了一个AGI进程图,最好玩的还是用了《银河系漫游指南》里面那个终极答案42当了一个梗,而这个AGI进程图其实就是对标的人脑,而AutoGLM,就是AI,使用工具的能力。原始人类在70万年前,能走出非洲,依靠的,就是工具和火。而我,其实已经在3天前就拿到了AutoGLM的内测,在被封印了3天之后,也终于可以发出这篇文章。3天前第一次使用AutoGLM的那晚,它给我带来的震撼,给我带来的头皮发麻,到今天,我依然记忆犹新。现在,任何手机,你都可以把它,进化成贾维斯了。
2025-03-31 22:16:21
817
原创 实测AutoGLM沉思,AI牛马,能干活,会思考,不要钱
这个任务是 Manus 的示例任务,通过非常详细的指示,让 Agent 完成高度定制化的旅行方案规划,这样的规划在以往都需要专业的旅行规划师才能完成。报告很长,具体就不放了,直接截取一部分结果:AutoGLM 的完整报告在这里Manus 的在这里,可以作为对比replay=1体验 AutoGLM 沉思的过程,非常激动。因为我知道,就像 DeepSeek R1 是大部分读者对深度思考的第一次体验。AutoGLM 沉思将是大部分读者的第一次 Agent 体验。那种感受非常奇妙,请一定要试一试。
2025-03-31 22:15:09
768
原创 Text2SQL零代码实战!RAGFlow 实现自然语言转 SQL 的终极指南
在企业大模型应用方面,Text2SQL一直是应用热点。大家都希望小嘴一张,就完成一系列数据提取和分析工作。但是,使用大模型自动理解业务需求,实现 SQL 代码编写和代码执行一直都存在技术难点。传统的 Text2SQL 方案,往往依赖大模型微调,对于中小企业而言,带来非常高的应用成本。今天,介绍一个方法,使用开源 RAG 框架RAGFlow,应用知识库检索与大模型推理结合,不需要对模型做任何微调,只需要仅需配置少量结构化数据即可实现精准SQL生成,实现指定数据查询、负责查询、计算,跨表计算等多种场景。
2025-03-27 11:54:34
1162
1
原创 Nat. Med. | 人工智能赋能药物开发:现状、挑战与未来趋势
2025年1月20日,四川大学华西医院杨胜勇教授、温州医科大学眼视光医院张康教授、温州医科大学李校堃院士和北京生命科学研究所黄牛研究员等人在Nature Medicine期刊上发表了一篇题为“Artificial intelligence in drug development”的研究文章。该文章深入探讨了人工智能(AI)在药物开发全过程中的应用,包括疾病靶点识别、药物发现、临床试验管理以及上市后监测等环节。
2025-03-18 10:58:07
685
原创 腾讯元宝接入DeepSeek-R1满血版,首次引入第三方模型,能联网能调用微信独家生态
拥抱的不光是DeepSeek,更是用户体验最佳的模型——不管是否是自家研发或者投资的。
2025-03-18 10:53:37
2653
原创 多模态AI模型:读懂医学影像的超级大脑
2025年初,全球首款通过美国FDA认证的“AI放射学助手”横空出世。这款基于多模态大语言模型(LMMs)的系统,不仅能秒读CT/MRI影像生成诊断报告,还能结合患者病史提出治疗方案建议。在临床试验中,其对肺癌筛查的敏感度达到98.7%,误诊率仅1.2%,甚至比资深放射科医生还精准。这场由代码驱动的医疗革命,正悄然改变着300万放射科医生的职业命运。LLMs和LMMs在放射学和医疗保健领域的不同应用01 大语言模型:医疗领域的智能助手。
2025-03-17 21:31:01
1498
原创 IEEE TII | 论文荐读!对比学习+领域自适应!CTPA:对比时序预测自适应方法 , 用于工业时间序列的跨领域预测
所提出的CTPA方法能够将从一个条件(有标签的源域)学到的知识转移到另一个条件(无标签的目标域)。这种方法允许在源数据和目标数据之间发现相关性和域不变表示,同时保持每个域的固有结构。图1展示了CTPA的整体框架。CTPA的神经网络架构包括一个编码器、一个预测器、一个映射模块和一个对抗判别器。源模型通过使用有标签的源域数据进行监督预训练。预训练损失函数包括预测损失和对比域泛化损失。然后,预训练好的模型被转移到目标域,并将目标模型初始化为源模型。
2025-03-17 21:27:47
809
原创 搞懂推理大模型,看这篇就够了!
如果你从事人工智能(或一般的机器学习)工作,你可能对模糊且备受争议的定义并不陌生。“推理模型”这一术语也不例外。最终,有人会在一篇论文中正式定义它,但很快又会在下一篇论文中被重新定义,如此循环。在本文中,我将“推理”定义为回答需要复杂、多步生成并包含中间步骤的问题的过程。例如,像“法国的首都是哪里?”这样的事实性问题并不涉及推理。相比之下,像“如果一列火车以每小时60英里的速度行驶3小时,它会行驶多远?”这样的问题则需要一些简单的推理。例如,它需要在得出答案之前认识到距离、速度和时间之间的关系。
2025-03-14 10:37:07
408
原创 10几个国内AI大模型,让你的工作学习效率翻倍!
随着ChatGPT迅速走红,国内各大企业纷纷发力认知大模型领域。经过一段时间的酝酿,国内AI大模型也相继发布,快速点燃国内科技圈的热情。
2025-03-14 10:33:35
523
原创 2025年的风口!| 万字长文,带你纵观大模型Agent,涉及研究痛点、应用场景、发展方向
最近大家都在提Agent,例如AutoAgent、Dify、Manus等,突然想到一个问题,那么什么才是Agent,有没有明确的定义呢?为此关于Agent的定义,网上搜索了一圈,说其最早“Agent”这个词可以追溯到古罗马时期,并且还能够从一些哲学家的哲学作品找到影子。一篇文章中说Agent的哲学概念泛指具有自主性的概念或实体,它可以是人造的物体,可以是植物或动物,当然也可以是人。这定义挺好的,我没意见。感兴趣的小伙伴可以就这个定义去搜索了解一下,把故事线梳理清楚了可以整篇论文了。
2025-03-13 10:49:38
957
原创 deepseek+dify:爬取网站多篇文章,批量提取和输出热点摘要(一)
设想方案概述:Dify(迭代节点)+Firecrawl(网页抓取)+Deepseek(大模型)一)安装Firecrawl工具二)详细操作步骤第一步:创建Dify应用1. 点击创建工作流,命名 “AI资讯八爪鱼”2. 整体流程说明:开始节点 - 页面抓取 - 迭代节点(LLM节点) - 输出节点。第二步:配置开始节点第三步:配置网页工具节点选取 工具-firecrawl,选择“地图式快爬”(获取网站上所有的网址)。将输入变量设置为 开始节点的 URL参数;
2025-03-13 10:45:52
3195
原创 从国内爆红到国际冷场:Manus能否成为下一个DeepSeek?
Manus的崛起为国产AI智能体带来了新的希望,但其未来发展仍需在技术创新、生态圈融入和国际市场拓展等方面持续努力。如果能够克服这些挑战,Manus或许真的能够成为媲美DeepSeek的“国货之光”。
2025-03-12 11:39:56
915
原创 基于大模型的测试用例自动生成服务探索
通过上述示例,我们展示了大模型理解业务需求,识别测试要点并生成测试用例的过程。在需求文档比较详细的前提下,单个测试要点可以生成约3~5个测试用例,平均每个测试用例生成时间约5s左右(根据功能点的复杂度以及用例生成方法的不同而有所差异)。经过人工对多个需求的大模型生成的测试用例与手工撰写的测试用例进行对比测试,发现两者的用例相似度、匹配度较高,且大模型生成的用例可以基本覆盖业务重点流程和异常业务场景。
2025-03-12 11:36:15
950
原创 大模型入门的路很长,你敢走吗?零基础入门到精通,看这篇就够了!赶紧收藏!
作为大模型领域的“新兴战场”,越来越多的人在讨论如何入门、如何快速提升自己的能力。你是否也有过这样的困惑:想学大模型,但基础薄弱怎么办?到底该怎么学,才能在面试中脱颖而出?让我先给你一个简单的答案:学大模型不仅仅是做题、读文献那么简单,它关乎的是思维方式的转变,是对技术本质的深入理解。“大模型入门的路很长,你敢走吗?”首先,我得坦白说,大模型的学习不适合所有人,尤其是对于那些基础薄弱、没有相关项目经验的同学来说,这条路可能会比想象中的要艰难得多。有个朋友是26届的应届生,基础较为薄弱,没啥LLM(大语言模型
2025-03-10 22:02:33
2280
原创 人工智能大模型7大核心发展趋势!
*在文本能力上,**随着模型参数、训练数据和训练时间的增加,模型文本能力的上限不断刷新。**在多模态能力上,**实时对话延迟显著缩短;图片理解、视频生成、图像生成的基准测试最高分不断被突破。**在复杂思维能力上,**模型后训练从单次采样转化为思维链强化和规模化采样,大模型应对代码、数学等高阶推理能力快速演进。**模型处理容量上,**大模型的上下文窗口不断扩大,上下文窗口中位数已达128k,闭源最大已达200万。
2025-03-10 21:59:40
1283
原创 阿里发布最新开源推理模型,“性能比肩DeepSeek-R1”
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1,同时大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。QwQ-32B采用了Apache 2.0开源协议,目前,所有人都可免费下载及商用QwQ-32B模型,或通过网页版Qwen Chat进行体验,该模型也将免费上架通义APP。
2025-03-08 11:31:10
674
原创 QwQ-32B一键部署!真正的0代码,0脚本,0门槛
您可以自定义模型的系统提示词、函数调用、温度k等配置,调出最适合自己的模型参数。此外,OpenWebUI还有个性化知识库、AI对话游乐场等功能,您可以在官方文档[6]中继续探索!附录。
2025-03-08 11:27:38
1729
原创 Manus:通用AI Agent的野心与现实
昨晚,Monica团队推出的新产品Manus在AI圈引起广泛关注。卡兹克、赛博、小互等大号的宣传体验稿铺天盖地而来,Manus被描述为"真正自主的AI Agent",不仅能提供建议,还能直接交付完整任务成果。
2025-03-07 17:25:06
643
原创 为什么Manus底层模型没用DeepSeek?——Manus六问六答
在Manus迅速出圈之后,各种信息漫天飞舞,有严肃分析和解读,但并不多,更多的是各类博主(特别是短视频博主)震惊体式的摇旗呐喊。那么在Manus各类信息过载的同时,潘寒试图从各种信息中抽出部分有价值的进行分析,总结了六个问题。力求让读者看懂“是什么”之后也真正搞懂“为什么”,同时在眼花缭乱的AI信息爆炸中破除FOMO焦虑——一、为什么Manus底层模型没用DeepSeek?Manus各类出色任务背后到底用了什么模型?
2025-03-07 17:09:05
821
原创 关于Manus我们所知道的一切,一个和DeepSeek截然相反的产品故事
Manus爆火之后,网络上对他的评价开始两级分化。一方面,许多业内人士和科技爱好者对这款通用AI Agent的出现充满期待,认为它代表了人工智能领域的重大突破。另一部分则指责Manus过度营销。一款新产品刚亮相,就让整个 AI 圈陷入“抢号大战”,究竟是技术革命的前奏,还是又一场饥饿营销的极致演绎?。先说结论,Manus 是一个不错的产品。但**并不算是一项技术突破。**一是它主要依赖于预设的流程来执行任务。尽管在短期内确实能让系统表现得更好,这种预定义的流程会严重限制系统的上限性能。
2025-03-06 20:34:56
1181
原创 一夜之间火爆全网!又一个中国AI产品刷屏
并且,不同于此前各类功能相对简单的人工智能助手,Manus拥有具备超强学习能力和适应性的“数字大脑”,不再局限于单一任务,而是能够理解复杂指令、自主学习、跨领域协同,真正像人一样思考和行动。
2025-03-06 20:30:25
841
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人