InternVideo2-Chat-8B-stage3的视频编码器
具体细节查看/mnt/data/group/zzk/projects/models/InternVideo2-Chat-8B/modeling_internvideo2_vit.py的856行
下面代码是第三阶段的,图中Projection只用于第一阶段训练。详见InternVideo2_Paper
视频编码器架构【视频理解,视频生成】
于 2024-10-28 09:57:17 首次发布
InternVideo2-Chat-8B-stage3的视频编码器
具体细节查看/mnt/data/group/zzk/projects/models/InternVideo2-Chat-8B/modeling_internvideo2_vit.py的856行
下面代码是第三阶段的,图中Projection只用于第一阶段训练。详见InternVideo2_Paper