国产 AI 太狠了,GLM-4.5 发布就开源。

最近,国内大模型公司智谱开源了模型 GLM-4.5。

推理、代码、智能体综合能力达到开源模型 SOTA 水平。

综合平均分 GLM-4.5 取得了全球模型第三、国产模型第一,开源模型第一。目前在 Hungging face 热度登顶。

太顶了。

图片

补充:SOTA 是 state-of-the-art model 缩写,指在该项研究任务中,目前最好/最先进。

01

直接看效果

我这里简单试了三个 prompt,确实 GLM-4.5 开源模型的效果还是挺惊艳的。

提示词:帮我写一个能够发补帖子的博客论坛 demo,要求里面内容,可以新发布帖子。

Kimi-K2 的效果:同样的提示词,Kimi-K2 实现了基础的发帖功能,但是 UI 有些简陋。

Claude-4-Sonnet的效果: UI 太 Claude 了。。。而且点击发布贴子没有响应,我又重新生成了几次,有几次是可以的。

GLM-4.5 的效果:前端 UI 更是那个味儿,发贴功能是没问题的,更重要的是 GLM-4.5 会自动实现前后端的代码。

提示词:帮我开发一个 Google 搜索网站 Demo。

Kimi-K2 的效果:没有去直接开发,而是给到了一个实现方案指引。

Claude-4-Sonnet:UI 的还原是挺不错的,但是搜索「逛逛 GitHub」都是 Mock 的数据。

GLM-4.5 的效果:试了一下,我输入「逛逛 GitHub」真的能检索出内容,而且 UI 样式也是比较还原的。

有点惊艳到我。

提示词:帮我写一个炫酷的 PPT,介绍一下最新开源的 GLM-4.5

Kimi-K2 效果:输入上面提示词还是直接给一个指引而不是直接生成样式,于是我真正给 Kimi 输入的提示词又添加了一个(生成一个 html 的 ppt)

Claude-4-Sonnet效果:也挺不错,就是这个样式太 AI 味儿了。

GLM-4.5效果:不管是内容丰富度、准确性、美观性,GLM-4.5 的表现还是非常 Nice 的。

我还测了几个 Case,GLM-4.5 的表现挺牛的。但是公众号文章最多只能上传 10 个视频,更多 Case 大家可以自己去试试。

地址:https://chat.z.ai/

02

开源地址

智谱 AI 已经正式在 Hugging Face 和 GitHub 平台公布这个新一代旗舰大模型 GLM-4.5,专为智能体应用打招的基础模型。

GitHub地址:https://github.com/zai-org/GLM-4.5huggingface地址:https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b

GLM-4.5 采用混合专家(MoE)架构,以更小的激活参数量(仅 DeepSeek-R1 的 1/2、Kimi-K2 的 1/3)获得惊艳的表现。开源模型包括:

GLM-4.5:总参数量 3550 亿,激活参数为 320 亿;

GLM-4.5-Air:总参数量 1060 亿,激活参数为 120 亿;

值得注意的是,GLM-4.5 成功将复杂推理、代码生成与智能体能力实现原生融合,首次在单一模型中统一支持多样化 Agent 场景。

在Agentic、推理、代码生成等评测基准任务中表现亮眼。

这技术突破,就是奔着 Agent 时代做应用基座模型去的。

而且模型权重完全遵循 MIT License 全球最宽松的开源协议之一,给开发者极大的使用自由度。

03

超低成本、超快速度

新模型 API 已在 BigModel.cn 上线,价格低至开发者狂笑:

输入:0.8 元 / 百万Tokens
输出:2 元 / 百万Tokens
生成速度 > 100 tokens/秒,推理成本直接砍半,企业级部署不再肉疼。

图片

图片

兼容性拉满,无缝接入 Claude 代码框架,开发者可一键兼容已有 Claude 项目生态,几乎零迁移成本。

智谱在他们的技术博客中说,现有模型有些擅长编程,有些精于数学,有些在推理方面表现出色,但没有一个能在所有任务上都达到最佳表现。

GLM-4.5 正是朝着‘统一各种能力’这一目标努力,它能自主拆解任务、调用工具、完成闭环;

期待 Agent 时代,国产 AI 大模型大放异彩,给国产开源 AI 大模型点赞。

智谱这边目前在推一个面向程序员「50块就能包月爽用GLM-4.5,调用量无上限」的活动,可以扫码或者访问下面链接瞧瞧:

https://bigmodel.cn/tokenspropay?productIds=product-38cebb

PS:我好多交流群里面,大家都在疯狂的用 GLM-4.5,效果真的是挺不错的,比之前的 GLM-4 模型强的不是一点半点。

快去亲自试试吧。

04

都看到这了,关注下吧。

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了。

#逛逛GitHub #AI大模型 #开源 #GitHub #GLM #智谱AI

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值