Vidu AI 视频生成器
Vidu 是由生数科技与清华大学合作开发的先进AI视频生成器。采用基于 U-ViT 骨干网络的扩散模型,Vidu 可创建高达 1080p 分辨率、长达 16 秒的高质量视频,具有卓越的一致性和动态运动效果。该模型支持三种不同的生成模式:单图动画、首尾帧过渡和基于参考的多主体一致性视频创建。
体验 Vidu
使用 Vidu 的三种强大生成模式创建专业质量的视频:为单张图片制作动画、在帧之间创建平滑过渡,或使用参考图片生成具有一致主体外观的视频
什么是 Vidu AI
具有卓越一致性的先进多模式视频生成
Vidu 是由生数科技与清华大学合作开发的尖端AI视频生成器。基于强大的扩散模型和通用视觉变换器(U-ViT)骨干网络,Vidu 代表了AI视频生成技术的重大突破。该模型擅长以出色的一致性和动态运动创建高质量视频,支持三种不同的生成模式以满足多样化的创意需求。无论您是为单张图像制作动画、在帧之间创建平滑过渡,还是生成具有一致角色外观的视频,Vidu 都能提供媲美传统视频制作方法的专业级结果。
Key Highlights
三种专业生成模式
单图动画让静态图像以自然运动呈现生机,首尾帧过渡在特定帧之间创建平滑变形,参考模式使用多个参考图像在整个视频序列中保持角色一致性。
U-ViT 扩散架构
革命性的通用视觉变换器骨干网络配合扩散模型,实现可扩展的高质量视频生成,最长可达16秒。该架构在扩展序列中提供卓越的连贯性和动态运动。
专业质量输出
生成高达1080p分辨率的视频,支持灵活的宽高比(16:9、9:16、1:1)和多种模型变体,针对不同用例进行优化,从快速生成到增强一致性的高级质量。
学术研究基础
通过生数科技与清华大学的重要合作开发,结合尖端学术研究与商业级可靠性和性能,适用于专业应用。
Technical Specifications
Duration
4-16秒(因模型而异)
Resolution
360p, 720p, 1080p
Aspect Ratio
16:9, 9:16, 1:1
Frame Rate
24 FPS
Audio
可选BGM生成
Input Types
文本提示词(最多1500字符)、图片(每模式1-7张)
Max Prompt Length
1500字符
Vidu 的强大功能
探索使 Vidu 在视频生成领域出类拔萃的先进能力
三种生成模式
支持单图动画、首尾帧过渡和基于参考的视频创建,满足多样化的创意工作流程和专业应用需求
U-ViT 扩散架构
基于通用视觉变换器骨干网络和扩散模型构建,实现可扩展的高质量长视频生成,最长可达 16 秒
多主体一致性
参考模式支持 viduq1 最多 7 张图片,其他模型最多 3 张图片,在整个视频中保持角色和物体外观的一致性
专业级质量输出
生成高达 1080p 分辨率的视频,支持 16:9、9:16 和 1:1 等多种宽高比,适配各种内容格式和平台
高级运动控制
可配置的运动幅度设置(自动、小、中、大)提供对运动强度和动画动态的精确控制
多种模型变体
提供快速生成的 viduq1、平衡质量的 vidu1.5、高级效果的 vidu2.0,以及专门用于首尾帧过渡的 viduq1-classic
灵活的时长选项
根据模型和模式支持 4 到 8 秒的视频长度,viduq1 生成 5 秒视频,其他变体支持多种时长
背景音乐集成
可选的 BGM 生成功能创建与视觉内容同步的背景音乐,增强整体观看体验
多分辨率支持
根据模型能力提供从 360p 到 1080p 的自适应分辨率选项,为不同带宽和存储需求优化输出质量
基于种子的可重现性
随机种子参数实现可重现的生成,允许用户重新创建特定结果并在多次生成中保持一致性
长文本提示词支持
接受最多 1500 个字符的文本提示词,支持详细的场景描述,实现复杂的叙事和视觉故事讲述能力
清华研究基础
由生数科技与清华大学合作开发,结合学术研究卓越性与商业级可靠性
Vidu 常见问题
关于 Vidu AI 视频生成功能的常见问题
如何使用 Vidu 文本生成视频
学习如何使用 Vidu 先进的 AI 视频生成技术从文本提示创建令人惊叹的视频
编写提示文本
配置生成设置
生成和优化
Vidu 图生视频使用指南
学习如何使用 Vidu 的三种生成模式从图片创建精彩视频
选择生成模式
上传和配置图片
优化设置并生成
价格
选择适合您的计划。没有隐藏费用,没有意外。