1.产品发布
1.1阿里团队推新AI模型I2VGen-XL:单张静止图像就能生成高质量视频
发布日期:2023.12.24
阿里团队推新AI模型I2VGen-XL:单张静止图像就能生成高质量视频 (msn.cn)
主要内容:视频合成领域迎来新突破,阿里团队提出I2VGen-XL模型,通过静态图像引导实现高质量视频生成。I2VGen-XL模型通过两阶段策略,解耦语义与细节,以单张图像为引导实现视频合成。研究人员收集了庞大数据集,包括3500万文本-视频对和60亿文本-图像对,提高模型的语义准确性和细节连续性。在与顶级方法的比较中,I2VGen-XL展示出更丰富、多样化的运动,具有良好的泛化能力,适用于不同图像类型。
项目体验网址:https://top.aibase.com/tool/i2v
2.技术更新
2.1智源开源数据集TACO
发布日期:2023.12.25
TACO:开源最大规模、面向复杂任务的代码生成训练数据集与评测基准_腾讯新闻
主要内容:智源研究院推出TACO代码生成数据集,为模型提供更具挑战性的训练数据和评测基准,规模庞大、质量高,挑战当前流行模型,促进代码生成领域创新。
论文:https://arxiv.org/abs/2312.14852
智源开放数据仓库:Data Hub
2.2李飞飞DeepMind全新「代码链」碾压CoT
发布日期:2023.12.24
李飞飞DeepMind全新「代码链」碾压CoT!大模型用Python代码推理,性能暴涨12%
主要内容:研究人员最近提出了一种名为「代码链」(CoC)的创新方法,将编码逻辑与自然语言理解相结合,以提升大型语言模型(LLM)基于代码的推理能力。CoC允许LLM生成伪代码来分解难题,并通过LMulator执行有效代码,模拟无效代码。在BIG-Bench Hard基准上,CoC实现了84%的准确率,比先前的技术提高了12%。此外,CoC在18项任务中超过了人类的平均表现。CoC非常适合机器人技术,可以进行语义和算法推理,其表现令人惊艳。
论文地址:https://arxiv.org/pdf/2312.04474.pdf