Introducing LTX-2.3 Our most production-ready model yet. The fastest 4K video generation in the world with built-in native dialogue. Here’s what’s new 🧵 1/9
LTX-2.3 AI動画生成器
Lightricks LTX-2.3は、より鮮明なテクスチャ、顔、髪、テキストレンダリングのために再構築されたVAEを備えた220億パラメータのDiT音声動画基盤モデルです。プロンプト遵守のための4倍大きなテキストコネクタ、最大1080x1920のネイティブ9:16縦型モード、最大3つのカスタムLoRAアダプター、HiFi-GANボコーダーによるクリーンなオーディオを搭載。480pから1080p、5〜20秒の同期音声動画を生成します。
LTX-2.3 テキストから動画の例
LTX-2.3で次世代のAI動画制作を体験しましょう。詳細なテキストプロンプトから、驚くほどの映像品質と自然な動きを持つ映画級の高忠実度動画を生成します。
ゴールデンアワーの熱帯雨林
ゴールデンアワーに密林上空を緩やかに滑空する空撮ショット。霧が樹冠から立ち上り、滝が深緑のプールに注ぎ込みます。
“A wide aerial shot slowly drifts over a dense rainforest at golden hour. Thick mist rises from the canopy as shafts of warm orange light pierce through the trees. A winding river reflects the fading sky below. The camera tilts down gradually, revealing a waterfall cascading into a dark green pool. Ambient sounds of water and distant birds fill the scene.”
LTX-2.3 画像から動画の例
LTX-2.3で静止画像をダイナミックな高品質動画に変換しましょう。リアルな動き、表現豊かなキャラクター、映画的なカメラワークで写真がどのように生き生きと動き出すかをご覧ください。

A side-tracking shot follows a competitive cyclist in a red, white and blue racing kit powering along a wet road at full speed. He is crouched low over the handlebars in an aggressive aero position, legs driving the pedals in a fast, powerful cadence. The camera tracks him at pace from the left, keeping him centered in frame. Trees and guardrails blur into streaks of green and grey behind him. Rain mist rises off the road surface. His jersey ripples in the wind. The sound of spinning wheels, fast breathing, and wet road noise fill the audio. The camera slowly pushes in toward his focused expression as he accelerates.
LTX-2.3 YouTube動画
220億パラメータのオープンソース音声動画基盤モデルLTX-2.3のデモとチュートリアルをご覧ください
- Introducing LTX Desktop: An Open Source Video Editor Powered by LTX-2.3 - LTX-2
- Run LTX 2.3 Video Generation AI Model Locally with ComfyUI - Easy Guide - Fahd Mirza
- LTX 2.3 in Comfy UI — Text to Video & Image to Video - AI Ninja
- LTX-2.3 In ComfyUI = AI Video Generation At 0 Credits Per Run - Nerdy Rodent
- LTX-2.3 ComfyUI Workflow Tutorial | Text-to-Video, Image-to-Video, Talking Avatar & Audio Generation - Vantage with AI
- LTX 2.3 Released - ComfyUI Workflow & A New Tool I Built To Run AI😃😃😃 - Benji’s AI Playground
LTX-2.3 YouTube動画
220億パラメータのオープンソース音声動画基盤モデルLTX-2.3のデモとチュートリアルをご覧ください
X上のLTX-2.3人気レビュー
220億パラメータのオープンソース音声動画基盤モデルLTX-2.3について、AIコミュニティが何を言っているかご覧ください
Keyframes and structured control are now more deeply integrated. LTX-2.3 is trained with multi-task objectives from the pretraining stage, including image-to-video, retake, keyframes, and more. This makes transitions, controlled scene evolution, and multi-shot workflows more Show more
🚀 Today we’re releasing LTX-2.3 with open weights + training code, alongside the API, LTX Studio, and LTX-Desktop - a full-featured video editing app that runs on your local GPU. Audio+video generation just leveled up: quality + capabilities + tooling - all open-source. 🧵👇
Acaban de liberar LTX-2.3. Un modelo de video con IA que genera 4K + audio + lip-sync. 100% gratis y open-source. Puedes crear clips de hasta 20s desde tu propio PC. Te dejo el enlace en el comentario: (Si no, prueba lo último de Kling) x.com/ivnways/status…
Kling 3.0 Motion Control se actualiza por completo. Basado en la versión 2.6, ahora ofrece: - Consistencia facial impecable - Estabilidad desde múltiples ángulos - Eidelidad en secuencias largas - Reproducción fiel de emociones complejas
LTX 2.3 seems to be coming out soon. No models on Hugging Faces just yet, but soon I'm sure ~ ltx.io/model/ltx-2-3
LTX-2.3 releasing soon 😊 LTX-2.3 brings four major improvements over LTX-2. A redesigned VAE produces sharper fine details, more realistic textures, and cleaner edges. A new gated attention text connector means prompts are followed more closely – descriptions of timing, Show more
LTX-2.3 officially released! Wait, unreleased. 404. ComfyUI team: “Nah, we already support it.” github.com/Comfy-Org/Comf…
LTX-2.3とは?
再構築されたVAEとオープンソースの重みを持つLightricksの220億パラメータDiT音声動画基盤モデル
Apache 2.0ライセンスの下、よりシャープなディテール、より優れたプロンプト遵守、ネイティブ縦型動画、よりクリーンな同期オーディオを提供する次世代オープンソースモデル。
LTX-2.3とは?
再構築されたVAEとオープンソースの重みを持つLightricksの220億パラメータDiT音声動画基盤モデル
Apache 2.0ライセンスの下、よりシャープなディテール、より優れたプロンプト遵守、ネイティブ縦型動画、よりクリーンな同期オーディオを提供する次世代オープンソースモデル。
LTX-2.3機能
次世代ビデオ制作のためのLightricks LTX-2.3の強力な機能を発見してください
再構築VAEエンジン
完全に再構築された変分オートエンコーダが、テクスチャ、顔、髪の毛、テキストオーバーレイ、鮮明なエッジを含む劇的にシャープな微細ディテールを提供します。プロフェッショナル品質の出力のためのLTX-2からの根本的なアップグレード。
強化されたプロンプト遵守
4倍大きなテキストコネクタにより、LTX-2.3は大幅に高い精度でプロンプトに従います。複雑なシーン記述、特定のアクション、詳細な視覚的指示が生成されたビデオで忠実にレンダリングされます。
ネイティブ縦型ビデオ
TikTok、Instagram Reels、YouTube Shorts向けに設計された、最大1080x1920解像度の一流の9:16縦型ビデオサポート。横向き専用モデルからのクロップやレターボックスは不要です。
同期オーディオ-ビデオ
新しいHiFi-GANボコーダーによる、よりクリーンで高忠実度のオーディオ生成。視覚コンテンツと自然に同期するコンテキストに適した効果音、環境オーディオ、ダイアログを生成します。
カスタムLoRAアダプター
最大3つの同時LoRAアダプターを適用して、スタイル、キャラクターの一貫性、またはモーションパターンをカスタマイズ。ブランド固有の美学や専門的なクリエイティブワークフロー向けに出力を微調整。
マルチ解像度出力
高速ドラフト用の480pから本番対応出力用の1080pまでの柔軟な解像度、4Kまでのアップスケーリングサポート付き。プロジェクト要件に合わせて24または48 FPSを選択。
改良された画像からビデオ
ケンバーンズ効果と静的フリーズアーティファクトを大幅に削減。画像は本物のモーションとダイナミックなカメラワークでアニメーション化され、静止画像に命を吹き込む自然な動きを生み出します。
オープンソース基盤
完全なモデル重みとトレーニングコードが利用可能なApache 2.0ライセンスでリリース。カスタムアプリケーションの構築、特定のユースケース向けの微調整、またはプロダクションパイプラインへの直接統合が可能です。
よくある質問
LTX-2.3でテキストからビデオを作成する方法
3つの簡単なステップで同期オーディオ付きの見事なAIビデオを作成
ビデオ生成ページに移動し、LTX-2.3テキスト-ビデオモデルを選択します。好みの解像度(480pから1080p)、アスペクト比(16:9横向きまたは9:16縦向き)、フレームレート(24または48 FPS)、ビデオ長(5-20秒)を選択します。オプションでカスタムスタイル用に最大3つのLoRAアダプターを添付。
LTX-2.3で画像からビデオを作成する方法
3つの簡単なステップで静止画像を改善されたモーションの動的ビデオに変換
ビデオ生成ページに移動し、LTX-2.3画像-ビデオモデルを選択します。高品質の静止画像(JPG、PNG、またはWEBP形式)をアップロードします。解像度(480pから1080p)、アスペクト比(16:9または9:16縦向き)、フレームレート(24または48 FPS)、期間(5-20秒)を選択します。オプションでカスタムスタイル用にLoRAアダプターを添付。