数据集 - PhyX 物理推理基准测试 - 您的模型具备物理推理能力吗?


在这里插入图片描述

一、关于 PhyX 数据集

基础信息


数据集背景

核心价值
首个通过真实视觉场景评估模型物理推理能力的大规模基准测试,包含:

  • 3,000个多模态物理问题
  • 覆盖6大物理领域25个子领域
  • 专注于大学阶段的高难度视觉化物理推理

二、数据特性

1、核心特征

  • 多模态物理推理:结合高保真视觉场景与专业物理知识
  • 领域覆盖
    • 力学(550题)
    • 电磁学(550题)
    • 热力学(500题)
    • 波动/声学(500题)
    • 光学(500题)
    • 现代物理(400题)
  • 推理类型:6种专业物理推理模式

2、数据集版本

包含两个子集和12种评估配置:

文件名类型 & 输入形式说明
PhyX_mini.tsv开放式 / 完整文本(图像+完整描述+问题)原始完整版
PhyX_mini_MC.tsv选择题 / 完整文本选择题版本
PhyX_mini_SIMPLY.tsv开放式 / 简化文本(图像+简化描述+问题)描述简化版
PhyX_mini_MC_SIMPLY.tsv选择题 / 简化文本简化描述选择题版
PhyX_mini_IMG.tsv开放式 / 最小文本(仅图像+问题)无描述版
PhyX_mini_MC_IMG.tsv选择题 / 最小文本无描述选择题版
PhyX_mini_TL.tsv开放式 / 纯文本(图像描述+完整描述+问题)图像转文字版
PhyX_mini_TL_MC.tsv选择题 / 纯文本图像转文字选择题版
PhyX_mini_TL_SIMPLY.tsv开放式 / 简化纯文本简化描述+图像转文字
PhyX_mini_TL_MC_SIMPLY.tsv选择题 / 简化纯文本简化选择题纯文本版
PhyX_mini_TL_IMG.tsv开放式 / 最小纯文本(仅图像描述+问题)纯文字最小版
PhyX_mini_TL_MC_IMG.tsv选择题 / 最小纯文本纯文字最小选择题版

默认配置:推荐使用PhyX_mini_SIMPLY.tsv(开放式)和PhyX_mini_MC_SIMPLY.tsv(选择题)


3、数据字段说明

每个样本包含以下JSON字段:

字段类型说明
indexint问题索引
questionstring问题文本
question_descriptionstring完整问题描述
question_simplystring简化版问题描述
optionsstring选项(格式:A:"...", B:"...", ...
answerstring正确答案
imagestring图像文件名(如200.png
image_captionstring图像文字描述(仅TL版本)
categorystring物理大类(如"Optics")
subfieldstring物理子领域(如"Geometrical Optics")
reasoning_typestring物理推理类型

三、使用方式

Ss加载代码

from datasets import load_dataset
dataset = load_dataset("Cloudriver/PhyX")

四、更新日志


伊织 xAI 2025-05-27(周二)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

EAI工程笔记

请我喝杯伯爵奶茶~!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值