Introducing LTX-2.3 Our most production-ready model yet. The fastest 4K video generation in the world with built-in native dialogue. Here’s what’s new 🧵 1/9
LTX-2.3 AI 视频生成器
Lightricks LTX-2.3 是一款220亿参数的DiT音视频基础模型,配备重建的VAE,可生成更清晰的纹理、面部、头发和文字渲染。具有4倍大的文本连接器以实现更好的提示词遵循,原生9:16竖屏模式最高1080x1920,支持最多3个自定义LoRA适配器,以及通过HiFi-GAN声码器生成更清晰的音频。生成480p至1080p、5至20秒的同步音视频。
LTX-2.3 文生视频示例
体验LTX-2.3带来的下一代AI视频创作。通过详细的文本提示生成电影级、高保真的视频,具有令人惊叹的视觉质量和自然运动。
金色时光中的雨林
航拍镜头在金色时光中缓缓掠过茂密的雨林,薄雾从树冠升起,瀑布倾泻入深绿色水潭。
“A wide aerial shot slowly drifts over a dense rainforest at golden hour. Thick mist rises from the canopy as shafts of warm orange light pierce through the trees. A winding river reflects the fading sky below. The camera tilts down gradually, revealing a waterfall cascading into a dark green pool. Ambient sounds of water and distant birds fill the scene.”
LTX-2.3 图生视频示例
使用LTX-2.3将静态图像转换为动态高质量视频。看看静态照片如何通过逼真的运动、富有表现力的角色和电影级镜头运动变得栩栩如生。

A side-tracking shot follows a competitive cyclist in a red, white and blue racing kit powering along a wet road at full speed. He is crouched low over the handlebars in an aggressive aero position, legs driving the pedals in a fast, powerful cadence. The camera tracks him at pace from the left, keeping him centered in frame. Trees and guardrails blur into streaks of green and grey behind him. Rain mist rises off the road surface. His jersey ripples in the wind. The sound of spinning wheels, fast breathing, and wet road noise fill the audio. The camera slowly pushes in toward his focused expression as he accelerates.
LTX-2.3 YouTube 视频
观看 LTX-2.3 演示和教程,220亿参数的开源音视频基础模型
- Introducing LTX Desktop: An Open Source Video Editor Powered by LTX-2.3 - LTX-2
- Run LTX 2.3 Video Generation AI Model Locally with ComfyUI - Easy Guide - Fahd Mirza
- LTX 2.3 in Comfy UI — Text to Video & Image to Video - AI Ninja
- LTX-2.3 In ComfyUI = AI Video Generation At 0 Credits Per Run - Nerdy Rodent
- LTX-2.3 ComfyUI Workflow Tutorial | Text-to-Video, Image-to-Video, Talking Avatar & Audio Generation - Vantage with AI
- LTX 2.3 Released - ComfyUI Workflow & A New Tool I Built To Run AI😃😃😃 - Benji’s AI Playground
LTX-2.3 YouTube 视频
观看 LTX-2.3 演示和教程,220亿参数的开源音视频基础模型
LTX-2.3 在 X 上的热门评价
了解 AI 社区对 LTX-2.3 的评价,220亿参数的开源音视频基础模型
Keyframes and structured control are now more deeply integrated. LTX-2.3 is trained with multi-task objectives from the pretraining stage, including image-to-video, retake, keyframes, and more. This makes transitions, controlled scene evolution, and multi-shot workflows more Show more
🚀 Today we’re releasing LTX-2.3 with open weights + training code, alongside the API, LTX Studio, and LTX-Desktop - a full-featured video editing app that runs on your local GPU. Audio+video generation just leveled up: quality + capabilities + tooling - all open-source. 🧵👇
Acaban de liberar LTX-2.3. Un modelo de video con IA que genera 4K + audio + lip-sync. 100% gratis y open-source. Puedes crear clips de hasta 20s desde tu propio PC. Te dejo el enlace en el comentario: (Si no, prueba lo último de Kling) x.com/ivnways/status…
Kling 3.0 Motion Control se actualiza por completo. Basado en la versión 2.6, ahora ofrece: - Consistencia facial impecable - Estabilidad desde múltiples ángulos - Eidelidad en secuencias largas - Reproducción fiel de emociones complejas
LTX 2.3 seems to be coming out soon. No models on Hugging Faces just yet, but soon I'm sure ~ ltx.io/model/ltx-2-3
LTX-2.3 releasing soon 😊 LTX-2.3 brings four major improvements over LTX-2. A redesigned VAE produces sharper fine details, more realistic textures, and cleaner edges. A new gated attention text connector means prompts are followed more closely – descriptions of timing, Show more
LTX-2.3 officially released! Wait, unreleased. 404. ComfyUI team: “Nah, we already support it.” github.com/Comfy-Org/Comf…
什么是LTX-2.3?
Lightricks 220亿参数的DiT音视频基础模型,具有重建VAE和开源权重
新一代开源模型,在Apache 2.0许可下提供更清晰的细节、更好的提示词遵循、原生竖屏视频和更干净的同步音频。
什么是LTX-2.3?
Lightricks 220亿参数的DiT音视频基础模型,具有重建VAE和开源权重
新一代开源模型,在Apache 2.0许可下提供更清晰的细节、更好的提示词遵循、原生竖屏视频和更干净的同步音频。
LTX-2.3功能
探索Lightricks LTX-2.3用于新一代视频制作的强大功能
重建VAE引擎
完全重建的变分自编码器提供显著更清晰的精细细节,包括纹理、面部、发丝、文字叠加和锐利边缘。相比LTX-2的根本性升级,实现专业级输出质量。
增强提示词遵循
4倍大的文本连接器确保LTX-2.3以显著更高的准确性遵循您的提示词。复杂的场景描述、特定动作和详细的视觉指令都能在生成的视频中忠实呈现。
原生竖屏视频
一流的9:16竖屏视频支持,分辨率最高1080x1920,专为抖音、Instagram Reels和YouTube Shorts打造。无需再从横屏模型裁剪或添加黑边。
同步音视频
由全新HiFi-GAN声码器驱动的更干净、更高保真的音频生成。生成与视觉内容自然同步的上下文音效、环境音频和对话。
自定义LoRA适配器
支持同时应用最多3个LoRA适配器来自定义风格、角色一致性或运动模式。为品牌特定美学或专业创意工作流程微调输出。
多分辨率输出
灵活分辨率从480p快速草稿到1080p生产级输出,支持放大至4K。选择24或48 FPS帧率以匹配您的项目需求。
改进的图生视频
显著减少Ken Burns效果和静态冻结伪影。图像以真实的运动和动态镜头制作进行动画化,产生自然的运动,使静态图像栩栩如生。
开源基础
基于Apache 2.0许可发布,提供完整的模型权重和训练代码。构建自定义应用程序,针对特定用例微调,或直接集成到您的生产流程中。
常见问题
如何使用LTX-2.3进行文生视频
通过三个简单步骤创建带同步音频的精彩AI视频
导航到视频生成页面并选择LTX-2.3文生视频模型。选择首选分辨率(480p至1080p)、宽高比(16:9横屏或9:16竖屏)、帧率(24或48 FPS)和视频时长(5-20秒)。可选附加最多3个LoRA适配器以自定义风格。
如何使用LTX-2.3进行图生视频
通过三个简单步骤将静态图像转化为具有改进运动的动态视频
导航到视频生成页面并选择LTX-2.3图生视频模型。上传高质量的静态图像(JPG、PNG或WEBP格式)。选择分辨率(480p至1080p)、宽高比(16:9或9:16竖屏)、帧率(24或48 FPS)和时长(5-20秒)。可选附加LoRA适配器以自定义风格。