1、豆包「深入研究」功能震撼上线!一键生成专业报告,AI助手再升级
2、文心4.5系列模型震撼开源!47B参数MoE架构引领多模态AI新纪元
3、OpenAI遭Meta疯狂挖角!全员放假一周应对人才危机
4、云知声港股上市:AI语音龙头三年亏损12亿,京东高通持股加持
5、LeCun团队震撼发布PEVA世界模型:16秒连贯预测,具身智能迎来"预判"时代!
6、国产GPU新锐「曦望」半年再融10亿!对标英伟达A100,创始团队背景惊人
7、华为开源720亿参数大模型!盘古双雄震撼发布,性能碾压主流AI
8、谷歌AI自主进化!自动编写GPU代码性能反超人类21%,开启编程新时代
9、美团秘密武器"袋鼠参谋"曝光!AI军师帮你开店选址、选品、运营一条龙
10、美图MOKI引爆AI视频革命!一张图片秒变爆款广告大片
11、MiQ Sigma震撼登场:AI驱动广告平台颠覆程序化购买市场
12、全球首个千亿级发电大模型"擎源"横空出世!电力行业迎来智能革命
13、中国首个海洋开源大模型OceanGPT震撼发布!海洋科研迎来AI革命
14、阿里Ovis-U1震撼发布:多模态AI三合一,开源赋能全球开发者
15、英伟达DLSS4震撼发布:游戏显存占用狂降20%,4K流畅度飙升!
16、谷歌Gemini2.5Pro API重磅回归!开发者狂欢,免费体验顶级AI模型
17、飞利浦8号Pro AI耳机震撼发布:17种语言互译+27种方言识别,商务神器来了!
18、开源AI新星OmniGen2震撼发布!双路径解码技术挑战GPT-4o多模态霸主地位
1、豆包「深入研究」功能震撼上线!一键生成专业报告,AI助手再升级
豆包APP全新推出「深入研究」功能,可快速处理复杂任务并生成可视化报告或文档。该功能支持旅行攻略、政策解读等各类深度信息需求,用户只需输入指令即可在几分钟内获得专业分析结果,还能将报告一键转为播客收听。
核心亮点
🐱支持多种复杂场景分析,从旅行规划到商业决策全覆盖
🍉一键生成可视化网页报告和文档,信息呈现更直观
🌳独创报告转播客功能,让知识获取方式更加灵活多样
原文链接: https://mp.weixin.qq.com/s/AUbfXEVecevWOp5_dYzR4w
2、文心4.5系列模型震撼开源!47B参数MoE架构引领多模态AI新纪元
百度正式开源文心4.5系列模型,包含10款不同规模的混合专家(MoE)和稠密参数模型,最大模型参数量达424B。该系列采用创新多模态异构结构,在文本和多模态任务中达到SOTA水平,并配套提供全流程开发工具链。
核心亮点
🚀首创多模态异构MoE架构,实现跨模态知识融合与专用参数保留
🌟训练效率突破性提升,FLOPs利用率达47%,推理支持4-bit无损量化
🛠️配套ERNIEKit和FastDeploy套件,提供从训练到部署的全流程支持
原文链接: https://mp.weixin.qq.com/s/BVQzYwcnpDzUAWvRzP5g_g
3、OpenAI遭Meta疯狂挖角!全员放假一周应对人才危机
OpenAI宣布全员放假一周,以应对Meta高薪挖走8名核心研究人员的危机。Meta开出高达1亿美元签字费,已成功挖走多位OpenAI顶尖AI专家,引发行业震动。
核心亮点
🐲Meta开出天价1亿美元签字费,已挖走8名OpenAI核心研究员。
🚀OpenAI首席研究官怒斥Meta"入室盗窃",誓言正面迎战人才争夺战。
🌟扎克伯格亲自下场挖人,组建"超级智能实验室"挑战OpenAI领导地位。
原文链接: https://mp.weixin.qq.com/s/Dmar8HCnoirIHbW_BwwUXQ
4、云知声港股上市:AI语音龙头三年亏损12亿,京东高通持股加持
云知声作为国内AI语音技术领军企业,历经5年4次闯关后成功在港交所上市,发行价205港元/股,市值约130亿元。公司三年营收22.66亿元,但净亏损累计达12.05亿元,高研发投入成关键挑战。
核心亮点
🚀三年卖出7300万颗AI芯片,消费级市场占有率持续攀升。
🏥医疗解决方案效率提升4-6倍,但客户留存率降至53.3%。
💡山海大模型参数达600亿,已签约客户潜在价值超3亿元。
原文链接: https://mp.weixin.qq.com/s/lEfBdCZ7Dc8oeIhiHGjOZA
5、LeCun团队震撼发布PEVA世界模型:16秒连贯预测,具身智能迎来"预判"时代!
Meta首席AI科学家Yann LeCun团队推出PEVA世界模型,首次实现16秒连贯场景预测,让机器人像人类一样具备"预判"能力。该模型通过结构化动作表示与条件扩散Transformer结合,突破长时序动作预测瓶颈。
核心亮点
🦾采用48维关节运动学数据,精准捕捉人体整体移动与细微关节变化。
🧠创新随机时间跳跃训练,解决长时序预测中的计算效率与延迟效应问题。
🚀实现智能规划能力,可筛选最优动作路径完成开冰箱等复杂任务。
原文链接: https://mp.weixin.qq.com/s/MBTNAYeu-J_9MI_-jpxQBA
6、国产GPU新锐「曦望」半年再融10亿!对标英伟达A100,创始团队背景惊人
国产GPU公司曦望Sunrise完成近10亿元新一轮融资,专注高性能自研GPU研发。其产品S2性能对标英伟达A100,已实现量产,核心技术团队仅150人却两代芯片一次流片成功,创始团队包括百度创始员工王湛和AMD芯片老将王勇。
核心亮点
🚀S2芯片性能追平英伟达A100,完全自研指令集到架构,已量产。
🌟创始团队含百度"凤巢之父"王湛和AMD芯片专家王勇,背景强大。
💡团队仅150人却两代芯片一次流片成功,效率远超同行企业。
原文链接: https://mp.weixin.qq.com/s/pCJjq0yB6Nc6L9u3uaW8Jw
7、华为开源720亿参数大模型!盘古双雄震撼发布,性能碾压主流AI
华为今日开源两款重磅大模型:720亿参数的盘古Pro MoE和70亿参数的盘古Embedded 7B,基于4000颗昇腾NPU训练,性能超越Qwen3-32B等主流模型,并开源昇腾推理技术。
核心亮点
🚀盘古Pro MoE激活参数16B,性能超越32B级模型,推理速度达1528 tokens/s
🌐盘古Embedded 7B首创快慢思考双系统,自动切换模式应对不同复杂度任务
🔥昇腾NPU优化技术全开源,包含超大规模MoE模型推理部署最佳实践
原文链接: https://mp.weixin.qq.com/s/tgzVFdrw_W7DlCZwawHHfg
8、谷歌AI自主进化!自动编写GPU代码性能反超人类21%,开启编程新时代
谷歌AlphaEvolve的开源实现OpenEvolve通过自我进化,在苹果芯片上自动生成了比人类优化快21%的GPU内核算法,在Transformer推理任务中实现平均12.5%的性能提升,峰值性能甚至飙升106%。
核心亮点
🚀无需人类干预,自动发现完美SIMD优化方案,硬件利用率直接拉满。
🌟独创两阶段在线Softmax算法,将计算步骤从三步精简为两步,效率大幅提升。
🍏针对苹果芯片量身定制内存布局优化,在特定任务中解码速度提升106%。
原文链接: https://mp.weixin.qq.com/s/WMxnoWgz37V16_McpVo2zg
9、美团秘密武器"袋鼠参谋"曝光!AI军师帮你开店选址、选品、运营一条龙
美团近日公测餐饮行业AI决策助手"袋鼠参谋",这款应用整合了美团10年餐饮数据和400万门店信息,为创业者提供开店选址、菜品研发等智能建议。通过对话式交互,它能快速生成包含竞争分析、盈利评估等关键数据的报告。
核心亮点
🍔依托美团10年餐饮数据,覆盖全国400万门店,信息权威可靠
🏪专注四大场景:赛道选择、开店选址、菜品研发、门店运营
📊提供需求分析、竞争格局、消费者洞察等深度数据报告
原文链接: https://mp.weixin.qq.com/s/Z91TJRgsrvmFfmiCm4-M4g
10、美图MOKI引爆AI视频革命!一张图片秒变爆款广告大片
美图旗下MOKI推出"AI创意广告"功能,用户仅需上传一张图片,选择模板即可生成专业级视频,无需剪辑经验。该工具整合七大主流视频生成模型,实现从创意到成片的一站式服务。
核心亮点
🎬七大视频模型集成,包括可灵2.0等,提供多样化创作选择。
🚀限时免费模板覆盖商品开箱、IP跳舞等热门场景,轻松上手。
💡电影级运镜效果自动生成,彻底颠覆传统视频制作流程。
原文链接: https://www.aibase.com/zh/news/19313
11、MiQ Sigma震撼登场:AI驱动广告平台颠覆程序化购买市场
全球程序化媒体合作伙伴MiQ推出革命性广告整合平台MiQ Sigma,该平台基于AI技术,整合300多种数据源和700万亿条消费者行为信号,为品牌和代理机构提供前所未有的营销效果提升。
核心亮点
🌐覆盖700万亿条消费者行为信号,实现全生态数据整合与深度分析。
🚀全球首个智能广告整合平台,支持多DSP/SSP平台无缝操作与精准触达。
💡结合Sophisticated AI技术,显著提升规划能力、用户挖掘和投放效果。
原文链接: https://www.aibase.com/zh/news/19318
12、全球首个千亿级发电大模型"擎源"横空出世!电力行业迎来智能革命
国家能源集团自主研发的全球首个千亿级发电行业大模型"擎源"正式发布,该模型具备全栈自主可控特性,覆盖发电产业13个应用场景,部署41个智能体,推动电力生产向数据驱动的智慧管理转型。
核心亮点
🚀全球首个千亿级发电大模型,开创多能协同动态优化新引擎
🏭覆盖安全环保、电力交易等四大领域,解决行业长期痛点问题
🌐构建开放共享生态体系,推动中国智能发电技术全球领先
原文链接: https://www.aibase.com/zh/news/19319
13、中国首个海洋开源大模型OceanGPT震撼发布!海洋科研迎来AI革命
浙江大学海洋精准感知技术实验室成功研发中国首个海洋领域开源大模型OceanGPT(沧渊),该模型具备海洋专业知识问答、声呐图像解读和机器人代码生成等多项能力,显著提升海洋科研效率。
核心亮点
🐋首创"慢思考"推理机制,有效降低海洋领域内容错误率,精准可靠。
🤖支持自然语言指令生成水下机器人代码,操作效率从数小时缩短至数秒。
🌊集成MCP大模型协议,实现多机器人协同作业,推动海洋装备自主化发展。
原文链接: https://www.aibase.com/zh/news/19321
14、阿里Ovis-U1震撼发布:多模态AI三合一,开源赋能全球开发者
阿里巴巴国际AI团队发布多模态大模型Ovis-U1,集多模态理解、图像生成和编辑于一体,采用3亿参数创新架构,开源共享推动全球AI技术发展。
核心亮点
🚀三合一功能突破:统一多模态理解、文生图和图像编辑,展现跨模态处理能力。
🌐开源共享策略:代码、模型权重和训练数据全面公开,采用Apache2.0许可协议。
🍉应用场景广泛:覆盖电商、教育、医疗等领域,支持多语言描述和精细图像编辑。
原文链接: https://www.aibase.com/zh/news/19327
15、英伟达DLSS4震撼发布:游戏显存占用狂降20%,4K流畅度飙升!
英伟达最新DLSS4技术大幅优化显存使用,Transformer模型显存占用减少20%,帧生成显存降低30%。在《战锤40K:暗潮》4K分辨率下,显存节省高达400MB,为玩家带来更流畅的高画质体验。
核心亮点
🚀Transformer模型显存占用锐减20%,1080P下仅85.77MB,压力大减。
🎮4K分辨率帧生成显存省400MB,DLSS4让高画质游戏更丝滑。
💡8K显存需求仍超1GB,但技术突破为未来极致体验铺路。
原文链接: https://www.aibase.com/zh/news/19328
16、谷歌Gemini2.5Pro API重磅回归!开发者狂欢,免费体验顶级AI模型
谷歌宣布Gemini2.5Pro API重新纳入免费层级,引发开发者社区热烈反响。这款旗舰AI模型支持百万token上下文窗口,具备卓越的多模态处理能力,为开发者提供低成本创新机会。
核心亮点
🚀Gemini2.5Pro重新免费开放,计算资源翻倍,降低开发者门槛。
🌐支持文本、图像、音频和视频多模态输入,处理复杂任务表现出色。
💡在WebDev Arena和LMArena排行榜领先,展现强大推理和编码能力。
原文链接: https://www.aibase.com/zh/news/19330
17、飞利浦8号Pro AI耳机震撼发布:17种语言互译+27种方言识别,商务神器来了!
飞利浦在西安新品发布会上推出8号Pro AI耳机,搭载腾讯混元AI语言大模型,支持17种语言互译和27种方言识别,配备55dB深度降噪技术,专为商务人士和年轻白领打造跨语言沟通解决方案。
核心亮点
🐉搭载腾讯混元AI大模型,实现17种语言精准互译,打破沟通壁垒。
🎧55dB深度主动降噪技术,有效隔绝噪音,打造沉浸式音频体验。
📚内置四大专业领域术语库,商务会议、旅行场景翻译更精准可靠。
原文链接: https://www.aibase.com/zh/news/19332
18、开源AI新星OmniGen2震撼发布!双路径解码技术挑战GPT-4o多模态霸主地位
北京人工智能研究院最新推出的开源系统OmniGen2采用独立文本/图像双解码路径设计,基于Qwen2.5-VL-3B变换器构建,在保持文本生成能力的同时显著提升多模态表现,其40亿参数扩散变换器可自动切换图像生成模式。
核心亮点
🐲采用双独立解码路径设计,文本与图像生成参数完全解耦,性能互不干扰。
🎨内置反思机制可自我评估图像缺陷,支持多轮迭代优化生成效果。
📊OmniContext基准测试得分7.18,创开源模型新纪录,仅次于GPT-4o的8.8分。
原文链接: https://www.aibase.com/zh/news/19342