国际顶尖水平!首个Sora级国产自研视频大模型Vidu发布
在2024中关村论坛年会未来人工智能先锋论坛上,生数科技联合清华大学发布中国首个长时长、高一致性、高动态性视频大模型Vidu。
这也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,还在加速迭代提升中。
据了解,该模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。
除了在时长方面突破,Vidu在视频效果方面也实现了显著提升,主要包括:
能够生成细节复杂的场景,且符合真实的物理规律;
能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容;
能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换;
在16秒的时长上保持连贯流畅,随着镜头的移动,人物和场景在时间、空间中能够保持一致;
能够生成特有的中国元素,例如熊猫、龙等。
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号
随时掌握互联网精彩
随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 习近平开始对巴西进行国事访问 7963505
- 2 何同学抄袭风波原作者发声 7978741
- 3 举报史航性骚扰当事人道歉 7854468
- 4 “互联网之光”闪耀乌镇 7727936
- 5 五月天演唱会引发超10幢居民楼摇晃 7637303
- 6 公交站椅子只能坐半个屁股被吐槽 7555796
- 7 罕见!苹果首次曝光中国开发者收入 7409122
- 8 周鸿祎说雷军是行业里30年的劳模 7335948
- 9 人民日报表扬国足 7293995
- 10 一图看中国30年“上网”史略 7193981