LVM 时代快要开启了 Pika,Gen-2,Emu Video,WALT

继本月AI文生视频工具Pika 1.0爆火出圈、Gen-2效果大升级之后,斯坦福大学AI科学家李飞飞的团队也有了新动作!

智东西12月12日报道,今日,李飞飞及其学生团队与谷歌合作,推出了AI视频生成模型W.A.L.T(窗口注意力潜在Transformer ,Window Attention Latent Transformer)。https://www.36kr.com/p/2557736232312201

项目地址:https://walt-video-diffusion.github.io/ 论文地址: https://walt-video-diffusion.github.io/assets/W.A.L.T.pdf

短短一个月时间里,AI生成视频赛道已成爆发态势,背后玩家不仅覆盖高校及科研团队,还有多家科技巨头及AI创企。

先是11月3日,视频生成领域的“老大哥”Runway宣布其AI视频生成工具Gen-2更新,分辨率提升至4K,大幅提高保真度和一致性。一周后,Runway又紧锣密鼓地发布了运动画笔功能,强化视频局部编辑能力。

11月16日,Meta推出了文生视频模型Emu Video。Emu Video可以通过自然语言生成高质量视频,它将视频生成分为两个步骤,首先生成以文本为条件的图像,然后生成以文本和生成的图像为条件的视频。


已发布

分类

来自

标签:

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注