Logo

LTX-2.3 AI 视频生成器

Lightricks LTX-2.3 是一款220亿参数的DiT音视频基础模型,配备重建的VAE,可生成更清晰的纹理、面部、头发和文字渲染。具有4倍大的文本连接器以实现更好的提示词遵循,原生9:16竖屏模式最高1080x1920,支持最多3个自定义LoRA适配器,以及通过HiFi-GAN声码器生成更清晰的音频。生成480p至1080p、5至20秒的同步音视频。

公开
*

LTX-2.3 文生视频示例

体验LTX-2.3带来的下一代AI视频创作。通过详细的文本提示生成电影级、高保真的视频,具有令人惊叹的视觉质量和自然运动。

使用 LTX-2.3 创作
AI Video

金色时光中的雨林

航拍镜头在金色时光中缓缓掠过茂密的雨林,薄雾从树冠升起,瀑布倾泻入深绿色水潭。

Prompt

A wide aerial shot slowly drifts over a dense rainforest at golden hour. Thick mist rises from the canopy as shafts of warm orange light pierce through the trees. A winding river reflects the fading sky below. The camera tilts down gradually, revealing a waterfall cascading into a dark green pool. Ambient sounds of water and distant birds fill the scene.

LTX-2.3 图生视频示例

使用LTX-2.3将静态图像转换为动态高质量视频。看看静态照片如何通过逼真的运动、富有表现力的角色和电影级镜头运动变得栩栩如生。

试用图生视频
Input
竞速自行车手 - Input 1
Output
竞速自行车手

A side-tracking shot follows a competitive cyclist in a red, white and blue racing kit powering along a wet road at full speed. He is crouched low over the handlebars in an aggressive aero position, legs driving the pedals in a fast, powerful cadence. The camera tracks him at pace from the left, keeping him centered in frame. Trees and guardrails blur into streaks of green and grey behind him. Rain mist rises off the road surface. His jersey ripples in the wind. The sound of spinning wheels, fast breathing, and wet road noise fill the audio. The camera slowly pushes in toward his focused expression as he accelerates.

LTX-2.3 YouTube 视频

观看 LTX-2.3 演示和教程,220亿参数的开源音视频基础模型

  • Introducing LTX Desktop: An Open Source Video Editor Powered by LTX-2.3 - LTX-2
  • Run LTX 2.3 Video Generation AI Model Locally with ComfyUI - Easy Guide - Fahd Mirza
  • LTX 2.3 in Comfy UI — Text to Video & Image to Video - AI Ninja
  • LTX-2.3 In ComfyUI = AI Video Generation At 0 Credits Per Run - Nerdy Rodent
  • LTX-2.3 ComfyUI Workflow Tutorial | Text-to-Video, Image-to-Video, Talking Avatar & Audio Generation - Vantage with AI
  • LTX 2.3 Released - ComfyUI Workflow & A New Tool I Built To Run AI😃😃😃 - Benji’s AI Playground

LTX-2.3 YouTube 视频

观看 LTX-2.3 演示和教程,220亿参数的开源音视频基础模型

LTX-2.3 在 X 上的热门评价

了解 AI 社区对 LTX-2.3 的评价,220亿参数的开源音视频基础模型

Acaban de liberar LTX-2.3. Un modelo de video con IA que genera 4K + audio + lip-sync. 100% gratis y open-source. Puedes crear clips de hasta 20s desde tu propio PC. Te dejo el enlace en el comentario: (Si no, prueba lo último de Kling) x.com/ivnways/status…

Image
IVAN | IA
IVAN | IA
@ivnways

Kling 3.0 Motion Control se actualiza por completo. Basado en la versión 2.6, ahora ofrece: - Consistencia facial impecable - Estabilidad desde múltiples ángulos - Eidelidad en secuencias largas - Reproducción fiel de emociones complejas

Reply

LTX-2.3 releasing soon 😊 LTX-2.3 brings four major improvements over LTX-2. A redesigned VAE produces sharper fine details, more realistic textures, and cleaner edges. A new gated attention text connector means prompts are followed more closely – descriptions of timing,  Show more

Image
Wildminder
Wildminder
@wildmindai

LTX-2.3 officially released! Wait, unreleased. 404. ComfyUI team: “Nah, we already support it.” github.com/Comfy-Org/Comf…

Image
Reply

什么是LTX-2.3?

Lightricks 220亿参数的DiT音视频基础模型,具有重建VAE和开源权重

220亿参数量
最高4K分辨率
5-20秒时长
Apache 2.0许可证

新一代开源模型,在Apache 2.0许可下提供更清晰的细节、更好的提示词遵循、原生竖屏视频和更干净的同步音频。

LTX-2.3功能

探索Lightricks LTX-2.3用于新一代视频制作的强大功能

重建VAE引擎

完全重建的变分自编码器提供显著更清晰的精细细节,包括纹理、面部、发丝、文字叠加和锐利边缘。相比LTX-2的根本性升级,实现专业级输出质量。

增强提示词遵循

4倍大的文本连接器确保LTX-2.3以显著更高的准确性遵循您的提示词。复杂的场景描述、特定动作和详细的视觉指令都能在生成的视频中忠实呈现。

原生竖屏视频

一流的9:16竖屏视频支持,分辨率最高1080x1920,专为抖音、Instagram Reels和YouTube Shorts打造。无需再从横屏模型裁剪或添加黑边。

同步音视频

由全新HiFi-GAN声码器驱动的更干净、更高保真的音频生成。生成与视觉内容自然同步的上下文音效、环境音频和对话。

自定义LoRA适配器

支持同时应用最多3个LoRA适配器来自定义风格、角色一致性或运动模式。为品牌特定美学或专业创意工作流程微调输出。

多分辨率输出

灵活分辨率从480p快速草稿到1080p生产级输出,支持放大至4K。选择24或48 FPS帧率以匹配您的项目需求。

改进的图生视频

显著减少Ken Burns效果和静态冻结伪影。图像以真实的运动和动态镜头制作进行动画化,产生自然的运动,使静态图像栩栩如生。

开源基础

基于Apache 2.0许可发布,提供完整的模型权重和训练代码。构建自定义应用程序,针对特定用例微调,或直接集成到您的生产流程中。

LTX-2.3是Lightricks于2026年3月5日发布的220亿参数DiT音视频基础模型。具有完全重建的VAE以实现更清晰的纹理、面部、头发和文字渲染,4倍大的文本连接器以更好地遵循提示词,原生9:16竖屏支持,LoRA适配器支持,以及新的HiFi-GAN声码器以获得更清晰的音频。基于Apache 2.0开源。
LTX-2.3引入了几项重大升级:VAE已完全重建,精细细节显著更清晰。文本连接器大了4倍,提示词遵循效果大幅提升。图生视频改进了减少Ken Burns效果和冻结现象。由于新的HiFi-GAN声码器,音频质量更干净。还新增了原生9:16竖屏视频支持和LoRA适配器支持。
LTX-2.3原生生成480p至1080p的视频,支持放大至4K。支持横屏(16:9)和竖屏(9:16)两种宽高比,竖屏模式最高支持1080x1920分辨率。视频时长从5到20秒,帧率可选24或48 FPS。
LTX-2.3支持同时使用最多3个LoRA(低秩自适应)适配器来自定义模型输出。LoRA可用于保持一致的角色外观、应用特定的艺术风格或控制运动模式。这允许品牌特定的定制和专业创意工作流程,而无需重新训练完整模型。
LTX-2.3使用新的HiFi-GAN声码器生成同步的音视频内容,与LTX-2相比产生更干净、更高保真的音频。模型生成与视觉内容自然匹配的上下文音效、环境音频和对话。音频生成可根据需要开启或关闭。
是的,LTX-2.3基于Apache 2.0许可发布,这是最宽松的开源许可之一。完整的模型权重和训练代码可公开访问,允许开发者构建自定义应用程序、针对特定用例微调,或将模型直接集成到个人和商业用途的生产流程中。

如何使用LTX-2.3进行文生视频

通过三个简单步骤创建带同步音频的精彩AI视频

1
选择LTX-2.3文生视频模型
2
撰写提示词并配置设置
3
生成并下载视频

导航到视频生成页面并选择LTX-2.3文生视频模型。选择首选分辨率(480p至1080p)、宽高比(16:9横屏或9:16竖屏)、帧率(24或48 FPS)和视频时长(5-20秒)。可选附加最多3个LoRA适配器以自定义风格。

如何使用LTX-2.3进行图生视频

通过三个简单步骤将静态图像转化为具有改进运动的动态视频

1
选择LTX-2.3图生视频模型并上传图像
2
添加运动提示词并配置设置
3
生成并下载视频

导航到视频生成页面并选择LTX-2.3图生视频模型。上传高质量的静态图像(JPG、PNG或WEBP格式)。选择分辨率(480p至1080p)、宽高比(16:9或9:16竖屏)、帧率(24或48 FPS)和时长(5-20秒)。可选附加LoRA适配器以自定义风格。

灵活的 AI 定价

按量付费或订阅计划。无隐藏费用,随时取消。

年付账单,享受50%折扣

专业版

提升您的AI体验

29.99
15
1 月
USD
实际支付 179.99 USD / 1 年
-50%
8001 月
最多 801 月
最多 8001 月
3(并行任务数)
多模型支持
文本转视频
图片转视频
视频转视频
角色一致性
AI动画生成器
模板和特效
AI视频增强
互动社区
更快生成速度
无水印输出
更多相机运动
私密视频可见性
复制保护
优先客服支持
热门

旗舰版

解锁更多高级功能

99.99
50
1 月
USD
实际支付 599.99 USD / 1 年
-50%
28001 月
最多 2801 月
最多 28001 月
3(并行任务数)
多模型支持
文本转视频
图片转视频
视频转视频
角色一致性
AI动画生成器
模板和特效
AI视频增强
互动社区
更快生成速度
无水印输出
更多相机运动
私密视频可见性
复制保护
优先客服支持

顶级版

为您的团队提供强大支持

499.99
250
1 月
USD
实际支付 2999.99 USD / 1 年
-50%
160001 月
最多 16001 月
最多 160001 月
3(并行任务数)
多模型支持
文本转视频
图片转视频
视频转视频
角色一致性
AI动画生成器
模板和特效
AI视频增强
互动社区
更快生成速度
无水印输出
更多相机运动
私密视频可见性
复制保护
优先客服支持