(十二)关于InternVL2.5的模型训练方法——InternVL2.5与InternVL2.0的训练区别以及步骤作用

(十二)关于InternVL2.5的模型训练方法——InternVL2.5与InternVL2.0的训练区别以及步骤作用


前言

大部分操作与前面系列文章InternVL2.0的操作一样,可作参考

2024.12.5 上海人工智能实验室发布了 InternVL2.5版本的多模态大模型,但未提供相关训练、微调的代码。2024.12.18 上海人工智能实验室又发布了InternVL2.5模型相关训练、微调的代码。所以本篇文章我们来介绍下InternVL2.5多模态大模型的训练方法,以及对比一下与之前InternVL2.0版本有什么区别。
查看官方文档后发现了一个特别令人兴奋的事情后面来说说~~
关于InternVL2.5在自定义数据集上的表现如何?与InternVL2.0在同样数据集上的训练测评效果如何?目前模型还在训练中,这个会在下一篇文章中介绍。

InternVL2.5代码仓库地址:点这里
InternVL2.5系列模型 HuggingFace 地址:点这里

地址失效的话直接网站搜索就可以


一、关于InternVL2.5的训练策略以及步骤具体作用

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值