Introducing LTX-2.3 Our most production-ready model yet. The fastest 4K video generation in the world with built-in native dialogue. Here’s what’s new 🧵 1/9
Gerador de Vídeo IA LTX-2.3
Lightricks LTX-2.3 é um modelo fundação áudio-vídeo DiT de 22 bilhões de parâmetros com VAE reconstruído para texturas, rostos, cabelos e textos mais nítidos. Com conector de texto 4x maior para melhor aderência ao prompt, modo retrato nativo 9:16 até 1080x1920, suporte LoRA com até 3 adaptadores personalizados e áudio mais limpo via vocoder HiFi-GAN. Gera vídeos 480p a 1080p de 5 a 20 segundos com áudio sincronizado.
Exemplos Text-to-Video LTX-2.3
Experimente a próxima geração de criação de vídeo com IA usando o LTX-2.3. Gere vídeos cinematográficos de alta fidelidade a partir de descrições textuais detalhadas com qualidade visual impressionante e movimento natural.
Floresta tropical na hora dourada
Uma tomada aérea sobrevoa uma densa floresta tropical na hora dourada, com névoa subindo da copa e uma cachoeira despencando em uma piscina verde escura.
“A wide aerial shot slowly drifts over a dense rainforest at golden hour. Thick mist rises from the canopy as shafts of warm orange light pierce through the trees. A winding river reflects the fading sky below. The camera tilts down gradually, revealing a waterfall cascading into a dark green pool. Ambient sounds of water and distant birds fill the scene.”
Exemplos Image-to-Video LTX-2.3
Transforme imagens estáticas em vídeos dinâmicos de alta qualidade com LTX-2.3. Veja como fotografias ganham vida com movimento realista, personagens expressivos e cinematografia profissional.

A side-tracking shot follows a competitive cyclist in a red, white and blue racing kit powering along a wet road at full speed. He is crouched low over the handlebars in an aggressive aero position, legs driving the pedals in a fast, powerful cadence. The camera tracks him at pace from the left, keeping him centered in frame. Trees and guardrails blur into streaks of green and grey behind him. Rain mist rises off the road surface. His jersey ripples in the wind. The sound of spinning wheels, fast breathing, and wet road noise fill the audio. The camera slowly pushes in toward his focused expression as he accelerates.
Vídeos do YouTube LTX-2.3
Assista demonstrações e tutoriais do LTX-2.3, o modelo fundação áudio-vídeo open-source de 22 bilhões de parâmetros
- Introducing LTX Desktop: An Open Source Video Editor Powered by LTX-2.3 - LTX-2
- Run LTX 2.3 Video Generation AI Model Locally with ComfyUI - Easy Guide - Fahd Mirza
- LTX 2.3 in Comfy UI — Text to Video & Image to Video - AI Ninja
- LTX-2.3 In ComfyUI = AI Video Generation At 0 Credits Per Run - Nerdy Rodent
- LTX-2.3 ComfyUI Workflow Tutorial | Text-to-Video, Image-to-Video, Talking Avatar & Audio Generation - Vantage with AI
- LTX 2.3 Released - ComfyUI Workflow & A New Tool I Built To Run AI😃😃😃 - Benji’s AI Playground
Vídeos do YouTube LTX-2.3
Assista demonstrações e tutoriais do LTX-2.3, o modelo fundação áudio-vídeo open-source de 22 bilhões de parâmetros
Avaliações populares do LTX-2.3 no X
Veja o que a comunidade de IA está dizendo sobre o LTX-2.3, o modelo fundação áudio-vídeo open-source de 22 bilhões de parâmetros
Keyframes and structured control are now more deeply integrated. LTX-2.3 is trained with multi-task objectives from the pretraining stage, including image-to-video, retake, keyframes, and more. This makes transitions, controlled scene evolution, and multi-shot workflows more Show more
🚀 Today we’re releasing LTX-2.3 with open weights + training code, alongside the API, LTX Studio, and LTX-Desktop - a full-featured video editing app that runs on your local GPU. Audio+video generation just leveled up: quality + capabilities + tooling - all open-source. 🧵👇
Acaban de liberar LTX-2.3. Un modelo de video con IA que genera 4K + audio + lip-sync. 100% gratis y open-source. Puedes crear clips de hasta 20s desde tu propio PC. Te dejo el enlace en el comentario: (Si no, prueba lo último de Kling) x.com/ivnways/status…
Kling 3.0 Motion Control se actualiza por completo. Basado en la versión 2.6, ahora ofrece: - Consistencia facial impecable - Estabilidad desde múltiples ángulos - Eidelidad en secuencias largas - Reproducción fiel de emociones complejas
LTX 2.3 seems to be coming out soon. No models on Hugging Faces just yet, but soon I'm sure ~ ltx.io/model/ltx-2-3
LTX-2.3 releasing soon 😊 LTX-2.3 brings four major improvements over LTX-2. A redesigned VAE produces sharper fine details, more realistic textures, and cleaner edges. A new gated attention text connector means prompts are followed more closely – descriptions of timing, Show more
LTX-2.3 officially released! Wait, unreleased. 404. ComfyUI team: “Nah, we already support it.” github.com/Comfy-Org/Comf…
O que é LTX-2.3?
Modelo fundação áudio-vídeo DiT de 22 bilhões de parâmetros da Lightricks com VAE reconstruído e pesos open-source
Um modelo open-source de nova geração com detalhes mais nítidos, melhor aderência ao prompt, vídeo retrato nativo e áudio sincronizado mais limpo sob licença Apache 2.0.
O que é LTX-2.3?
Modelo fundação áudio-vídeo DiT de 22 bilhões de parâmetros da Lightricks com VAE reconstruído e pesos open-source
Um modelo open-source de nova geração com detalhes mais nítidos, melhor aderência ao prompt, vídeo retrato nativo e áudio sincronizado mais limpo sob licença Apache 2.0.
Recursos LTX-2.3
Descubra as poderosas capacidades do Lightricks LTX-2.3 para produção de vídeo de nova geração
Motor VAE Reconstruído
Um autoencoder variacional completamente reconstruído entrega detalhes finos drasticamente mais nítidos, incluindo texturas, rostos, fios de cabelo, sobreposições de texto e bordas nítidas. Uma atualização fundamental em relação ao LTX-2 para qualidade de saída profissional.
Aderência ao Prompt Aprimorada
Um conector de texto 4x maior garante que o LTX-2.3 siga seus prompts com precisão significativamente maior. Descrições de cenas complexas, ações específicas e instruções visuais detalhadas são fielmente renderizadas no vídeo gerado.
Vídeo Retrato Nativo
Suporte de vídeo vertical 9:16 de primeira classe com até 1080x1920 de resolução, projetado para TikTok, Instagram Reels e YouTube Shorts. Sem mais cortes ou letterboxing de modelos somente paisagem.
Áudio-Vídeo Sincronizado
Geração de áudio mais limpa e de maior fidelidade alimentada por um novo vocoder HiFi-GAN. Produz efeitos sonoros contextuais, áudio ambiente e diálogos que sincronizam naturalmente com o conteúdo visual.
Adaptadores LoRA Personalizados
Aplique até 3 adaptadores LoRA simultâneos para personalizar estilo, consistência de personagem ou padrões de movimento. Ajuste as saídas para estéticas específicas de marca ou fluxos criativos especializados.
Saída Multi-Resolução
Resolução flexível de 480p para rascunhos rápidos até 1080p para saída pronta para produção, com suporte de upscaling até 4K. Escolha 24 ou 48 FPS para atender aos requisitos do seu projeto.
Imagem-Vídeo Aprimorado
Redução significativa do efeito Ken Burns e artefatos de congelamento estático. Imagens são animadas com movimento genuíno e trabalho de câmera dinâmico, produzindo movimento natural que dá vida a imagens estáticas.
Fundação Open-Source
Lançado sob licença Apache 2.0 com pesos completos do modelo e código de treinamento disponíveis. Construa aplicações personalizadas, ajuste para casos de uso específicos ou integre diretamente em seu pipeline de produção.
Perguntas Frequentes
Ainda tem dúvidas?
Como Usar LTX-2.3 para Texto-Vídeo
Crie vídeos AI impressionantes com áudio sincronizado em três passos simples
Navegue até a página de geração de vídeo e selecione o modelo texto-vídeo LTX-2.3. Escolha sua resolução preferida (480p a 1080p), proporção (16:9 paisagem ou 9:16 retrato), taxa de quadros (24 ou 48 FPS) e duração do vídeo (5-20 segundos). Opcionalmente anexe até 3 adaptadores LoRA para estilos personalizados.
Como Usar LTX-2.3 para Imagem-Vídeo
Transforme imagens estáticas em vídeos dinâmicos com movimento aprimorado em três passos simples
Navegue até a página de geração de vídeo e selecione o modelo imagem-vídeo LTX-2.3. Carregue uma imagem estática de alta qualidade (formato JPG, PNG ou WEBP). Escolha resolução (480p a 1080p), proporção (16:9 ou 9:16 retrato), taxa de quadros (24 ou 48 FPS) e duração (5-20 segundos). Opcionalmente anexe adaptadores LoRA para estilos personalizados.
Preços
Escolha o plano certo para você. Sem taxas ocultas, sem surpresas.
Faturação anual com 50% de desconto