AI资讯
- AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!
- 港大字节提出多模态大模型新范式,模拟人类先感知后认知
- 435亿!马斯克xAI官宣B轮融资,估值突破1300亿
- 深扒大模型价格战:15家45款模型比拼,谁真便宜谁“打幌子”?
- 换了30多种方言,我们竟然没能考倒中国电信的语音大模型
- CoT提出者Jason Wei:大模型评估基准的「七宗罪」
- 苹果AI战略曝光:秘密大招Project Greymatter,GPT被整合进iOS,新AI工具主
- 大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布
- 五大AI聊天机器人盲测!ChatGPT未能夺冠,最终赢家竟来自这家“小公司”
- AI让联想松了口气
- 中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o
- GPT-4被证实具有「人类心智」登Nature!AI比人类更好察觉讽刺和暗示
- 谷歌AI搜索惨败,竟教唆网友自杀!
- 硅谷VC张璐:硅谷大模型市场分为三类,三大应用领域迭代速度较快
AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!
OpenAI面临内外交困,包括员工离职和外界批评。为了应对AI安全问题,上周五名与安全相关的员工离职,其中包括两名知名成员。《财富》杂志指出,OpenAI未兑现承诺给超级对齐团队20%计算资源。就在此时,Indent首席执行官FouadMatin宣布加入OpenAI,致力于为AGI做好安全准备。他和他的团队包括DanGillespie,后者将专注于建立用于AGI到来的安全计算平台。尽管OpenAI面临挑战,但新安全团队的加入被视为对构建更安全系统的积极努力。(报道详情)
港大字节提出多模态大模型新范式,模拟人类先感知后认知
当前多模态大模型在视觉任务中展现出强大认知理解能力,但大部分模型仅能单向图像理解,无法将内容映射回图像上,限制了其应用,如图像编辑、自动驾驶等。研究人员提出Groma,通过区域性图像编码提升多模态大模型的定位能力,将文本与图像区域直接关联,显著提高交互性和指向性。Groma将定位转移到visiontokenizer中,利用其空间理解能力,避免了外接专家模型。实验结果显示Groma在GroundingBenchmarks和VQABenchmark上表现超越其他模型,支持融合对话和定位能力的任务。Groma提供了一种新的解决思路,将感知和认知解耦,让visiontokenizer负责感知,大语言模型负责认知,这种先感知后认知的形式符合人类视觉过程,避免了重新训练大语言模型的计算开销。(报道详情)
435亿!马斯克xAI官宣B轮融资,估值突破1300亿
马斯克旗下的xAI获得60亿美元B轮融资,估值180亿美元,成为独角兽。投资方包括特斯拉早期投资