deepseek异军突起——2025年最新大模型排名

数据来源​​​​​​SuperCLUE

目前最新数据,截止到2025年1月8日,从分数来看,OpenAI依然处于断崖式领先地位,值的注意的是deepseek  v3 公司深度求索已经来到了机构第二名,可以说异军突起,期待后续发展。

SuperCLUE总排行榜(2024年12月)

排名

模型名称

机构

总分

Hard

理科

文科

使用方式

发布日期

-

o1

OpenAI

80.4

76.7

87.3

77.1

网页

2025年1月8日

-

o1-preview

OpenAI

74.2

63.6

80.6

78.5

API

2025年1月8日

-

ChatGPT-4o-latest

OpenAI

70.2

57.8

72.1

80.7

API

2025年1月8日

🏅️

DeepSeek-V3

深度求索

68.3

54.8

72

78.2

API

2025年1月8日

🏅️

SenseChat 5.5-latest

商汤

68.3

51.5

71.6

81.8

API

2025年1月8日

-

Gemini-2.0-Flash-Exp

Google

68.2

55.5

72.6

76.6

API

2025年1月8日

-

Claude 3.5 Sonnet(20241022)

Anthropic

67.7

54.6

71.4

77.2

API

2025年1月8日

🏅️

360zhinao2-o1

360

67.4

51.4

72.1

78.7

API

2025年1月8日

🥈

Doubao-pro-32k-241215

字节跳动

66.5

50.6

72.3

76.6

API

2025年1月8日

🥈

NebulaCoder-V5

中兴通讯

66.4

48.6

69.5

80.9

API

2025年1月8日

🥈

Qwen-max-latest

阿里巴巴

66.2

51.3

67.4

80

API

2025年1月8日

-

Qwen2.5-72B-Instruct

阿里巴巴

65.4

49.7

66.2

80.3

API

2025年1月8日

🥉

Step-2-16k

阶跃星辰

65.2

50

65.1

80.3

API

2025年1月8日

🥉

GLM-4-Plus

智谱AI

65.1

48.5

68.1

78.8

API

2025年1月8日

-

Grok-2-1212

X.AI

63.9

49.2

66.8

75.5

API

2025年1月8日

-

DeepSeek-R1-Lite-Preview

深度求索

63.8

44.9

69.7

76.8

网页

2025年1月8日

-

Qwen2.5-32B-Instruct

阿里巴巴

63.7

44.9

66.9

79.1

API

2025年1月8日

4

Sky-Chat-3.0

昆仑万维

63

44.5

65.4

79.1

API

2025年1月8日

-

DeepSeek-V2.5

深度求索

63

45.3

67.6

76.1

API

2025年1月8日

4

MiniMax-abab7-preview

MiniMax

62.8

42.8

64.9

80.7

API

2025年1月8日

4

Hunyuan-Turbo

腾讯

62.3

38.6

67.7

80.6

API

2025年1月8日

4

TeleChat2-Large

TeleAI

62.3

43.3

64.1

79.5

API

2025年1月8日

4

ERNIE-4.0-Turbo-8K-Latest

百度

62.2

45.6

61.4

79.5

API

2025年1月8日

5

Baichuan4

百川智能

61.8

45

62

78.2

API

2025年1月8日

-

GPT-4o-mini

OpenAI

60.6

42.8

63.3

75.8

API

2025年1月8日

6

kimi

Kimi

59.4

43.5

58.1

76.6

网页

2025年1月8日

-

Llama-3.3-70B-Instruct

Meta

59.4

38.8

66.4

72.9

API

2025年1月8日

7

TeleChat2-35B

TeleAI

57.1

37.6

55.6

78.2

模型

2025年1月8日

8

Qwen2.5-7B-Instruct

阿里巴巴

55.5

35.7

54.4

76.4

API

2025年1月8日

9

QwQ-32B-Preview

阿里巴巴

54.3

26.6

59.8

76.5

API

2025年1月8日

10

讯飞星火V4.0

科大讯飞

52.7

20.3

62.3

75.4

API

2025年1月8日

10

GLM-4-9B-Chat

智谱AI

52.4

31.6

50.6

75.1

模型

2025年1月8日

-

Gemma-2-9b-it

Google

48.6

22.7

49.5

73.7

模型

2025年1月8日

11

Yi-1.5-34B-Chat-16K

零一万物

48.2

20.6

48.2

75.9

模型

2025年1月8日

11

360Zhinao2-7B-Chat-4K

360

47.8

17.5

50.7

75.2

模型

2025年1月8日

12

Qwen2.5-3B-Instruct

阿里巴巴

46.1

18.6

44.2

75.5

API

2025年1月8日

13

Yi-1.5-9B-Chat-16K

零一万物

44.3

20.3

41.3

71.3

模型

2025年1月8日

13

MiniCPM3-4B

面壁智能

44.2

13.7

45.9

73

模型

2025年1月8日

-

Llama-3.1-8B-Instruct

Meta

43.9

20.9

42.8

68.1

API

2025年1月8日

-

Phi-3.5-Mini-Instruct

微软

42.4

14

42.4

70.7

模型

2025年1月8日

-

Gemma-2-2b-it

Google

39.2

11.8

36.4

69.4

模型

2025年1月8日

-

Mistral-7B-Instruct-v0.3

Mistral AI

33.2

11.4

31.2

56.9

模型

2025年1月8日

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孽小倩

非常荣幸能帮助到你

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值