Texto a vídeo fácil con AnimateDiff

AnimateDiff te permite crear vídeos fácilmente con Stable Diffusion. ¡Solo escribe un prompt, selecciona un modelo y activa AnimateDiff!

4.9/5de más de 50K usuarios|

10M+vídeos generados|

500+creadores confían en él

Texto a vídeoImagen a vídeoPrompt TravelMotion LoRAControlNetBucle

AnimateDiff es un recurso educativo y una demo en línea del módulo de movimiento de código abierto AnimateDiff. No está afiliado con los autores del artículo original de AnimateDiff ni con Stability AI.

Mira lo que crea AnimateDiff

Generado con el modelo ToonYou

Generado con el modelo Realistic Vision

Generado con el modelo Counterfeit V3.0

Generado con el modelo majicMIX Realistic

Generado con el modelo RCNZ Cartoon 3D

Generado con el modelo GHIBLI Background

Ejemplo de estilo anime de AnimateDiff

Ejemplo de estilo realista de AnimateDiff

Ejemplo de estilo cartoon 3D de AnimateDiff

Ejemplo de estilo Ghibli de AnimateDiff

Ejemplo de estilo tinta de AnimateDiff

Ejemplo de estilo cinematográfico de AnimateDiff

Cómo el generador crea clips cortos

Generación de texto a vídeo

Con AnimateDiff, puedes proporcionar un prompt de texto que describa una escena, personaje o concepto, y generará un clip corto animando esa descripción. Esto permite crear animaciones conceptuales o visualizaciones de historias directamente desde texto.

Generación de imagen a vídeo

AnimateDiff admite la generación de imagen a vídeo donde proporcionas una imagen estática, y la anima añadiendo movimiento basado en los priors de movimiento aprendidos. Esto puede dar vida a imágenes fijas u obras de arte.

Animaciones en bucle

Además de clips cortos, AnimateDiff puede generar animaciones en bucle sin costuras a partir de entradas de texto o imagen. Pueden usarse como fondos animados, salvapantallas u obras de arte animadas creativas.

Edición/manipulación de vídeo

La implementación video2video de AnimateDiff utiliza ControlNet para permitir la edición de vídeos existentes mediante prompts de texto. Podrías eliminar, añadir o manipular elementos en un vídeo guiados por tus descripciones de texto.

Animaciones personalizadas

Combinado con técnicas como DreamBooth o LoRA, AnimateDiff permite animar sujetos, personajes u objetos personalizados entrenados con imágenes/conjuntos de datos específicos.

Flujos de trabajo creativos

Los artistas y creadores pueden integrar AnimateDiff en sus flujos de trabajo creativos, usándolo para visualizar rápidamente conceptos animados, storyboards o animáticas a partir de entradas de texto e imagen durante la fase de ideación.

Aunque no es una herramienta de edición de vídeo completa, AnimateDiff ofrece una forma única de generar nuevo contenido de vídeo a partir de entradas de texto e imagen aprovechando el poder de los modelos de difusión y los priors de movimiento aprendidos. Sus salidas pueden usarse como punto de partida para más edición y posprocesamiento de vídeo.

AnimateDiff: un creador de texto a vídeo que aporta movimiento a los modelos de difusión

AnimateDiff permite la generación de texto a vídeo, dejándote crear clips cortos o animaciones directamente desde prompts de texto. Así funciona el proceso:

Prompt de texto: Proporcionas una descripción de texto de la escena, personajes, acciones o conceptos que quieres ver animados.

Modelo base de texto a imagen: AnimateDiff utiliza un modelo de difusión de texto a imagen preentrenado como Stable Diffusion como columna vertebral para generar los fotogramas iniciales según tu prompt de texto. El modelo base controla el estilo, la identidad del personaje y el detalle del sujeto; usa modelos checkpoint como ToonYou o Realistic Vision antes de aplicar el módulo.

Módulo de movimiento: En el núcleo de AnimateDiff hay un módulo de movimiento entrenado con vídeos del mundo real para aprender patrones generales de movimiento y dinámica. Este módulo es independiente del modelo de difusión base.

Animación de fotogramas: AnimateDiff combina el modelo de difusión base y el módulo de movimiento. Primero genera fotogramas clave a partir de tu prompt de texto usando el modelo de difusión. Luego el módulo interpola fotogramas intermedios entre estas claves, aplicando los priors de movimiento aprendidos para animar la escena.

Salida de vídeo: La salida resultante es un clip corto que representa los conceptos descritos en tu prompt de texto, con los elementos animados mostrando movimiento natural aprendido de vídeos reales.

Algunas ventajas clave de AnimateDiff para la generación de texto a vídeo son

Plug-and-Play

Puede animar cualquier modelo de texto a imagen sin reentrenamiento o ajuste extenso específico para vídeo.

Controlable

Puedes guiar la animación mediante el prompt de texto que describe acciones, movimientos de cámara, etc.

Eficiente

Más rápido que entrenar modelos monolíticos de texto a vídeo desde cero.

Sin embargo, las animaciones no siempre son perfectas y pueden mostrar artefactos, especialmente en movimientos complejos. Pero AnimateDiff ofrece una forma poderosa de visualizar directamente descripciones de texto como animaciones aprovechando modelos de difusión preentrenados.

AnimateDiff: un creador de imagen a vídeo que da vida a los visuales estáticos

AnimateDiff también puede usarse para la generación de imagen a vídeo, dejándote animar imágenes estáticas existentes añadiendo movimiento y dinámica. Así funciona:

Imagen de entrada: Proporcionas una imagen estática que quieres animar. Puede ser una fotografía, una obra de arte digital o una salida de modelo de difusión.

Modelo base de imagen a imagen: AnimateDiff utiliza un modelo de difusión de imagen a imagen preentrenado como la capacidad img2img de Stable Diffusion como columna vertebral.

Módulo de movimiento: Se usa el mismo módulo de movimiento entrenado con vídeos del mundo real para aprender patrones generales de movimiento.

Animación desde la entrada: AnimateDiff toma la imagen de entrada y usa el modelo de difusión de imagen a imagen para generar ligeras variaciones que sirven como fotogramas clave.

Aplicación del movimiento: El módulo de movimiento interpola fotogramas intermedios entre estos fotogramas clave, aplicando la dinámica de animación aprendida para animar los elementos de la imagen de entrada.

Salida de vídeo: El resultado final es un clip de vídeo donde la imagen estática original ha cobrado vida con movimiento y animación naturales.

Algunas ventajas clave de AnimateDiff para la generación de imagen a vídeo son:

Puede animar cualquier imagen de entrada, incluidos modelos personalizados u obras de arte.

El movimiento se infiere automáticamente de la entrada sin guía adicional.

El nivel de movimiento puede controlarse ajustando la configuración.

Las instancias simples funcionan mejor que las escenas muy complejas.

Aunque no es tan controlable como el caso de texto a vídeo, la imagen a vídeo con AnimateDiff ofrece una forma fácil de añadir dinámica a imágenes fijas existentes aprovechando el poder de los modelos de difusión y los priors de movimiento aprendidos.

Funciona con tus estilos favoritos

Estos son solo estilos de ejemplo: AnimateDiff no es una herramienta de un solo aspecto. Aporta movimiento a las estéticas distintivas de tus modelos Stable Diffusion preferidos.

Anime

Realista

Cartoon 3D

Ghibli

Tinta

Película

Retrato

Cinematográfico

qué es AnimateDiff

AnimateDiff es una herramienta de IA que puede convertir una imagen estática o un prompt de texto en un vídeo animado generando una secuencia de imágenes que transicionan suavemente. Funciona utilizando modelos Stable Diffusion junto con módulos de movimiento separados para predecir el movimiento entre fotogramas. AnimateDiff permite a los usuarios crear fácilmente clips animados cortos sin necesidad de crear manualmente cada fotograma.

Cómo hacer un vídeo con AnimateDiff en 4 pasos

Elige un modelo / estilo base

Elige el aspecto que quieres — anime, realista, cartoon, tinta — de los modelos Stable Diffusion compatibles.

Escribe tu prompt

Describe la escena, sujeto, acción y movimiento de cámara que quieres animar.

Establece duración y FPS

Elige el número de fotogramas y la tasa de fotogramas para controlar la duración y la fluidez del clip.

Genera y descarga

Ejecuta AnimateDiff, previsualiza el resultado en bucle y exporta tu animación.

Las capacidades de AnimateDiff de un vistazo

Característica	Qué hace	Cuándo usar
Módulos de movimiento v1/v2/v3/SDXL	Diferentes priors de movimiento entrenados para variar calidad y resolución	Adapta el módulo a tu modelo base y resolución objetivo
Prompt Travel	Transición suave entre prompts a través de fotogramas	Crea escenas en evolución o sujetos en transformación
Motion LoRA	Añade movimientos de cámara específicos como zoom/paneo/giro	Dirige movimiento de cámara cinematográfico
ControlNet	Guía el movimiento y la estructura con entradas de referencia	Mantén pose/composición consistente
Bucle cerrado	Haz que la animación se repita sin costuras	Clips en bucle perfectos estilo GIF
Interpolación de fotogramas	Inserta fotogramas intermedios para un movimiento más suave	Aumenta los FPS percibidos sin regenerar
Hi-Res fix	Escala preservando el detalle del movimiento	Salida más nítida y de mayor resolución
Aceleración LCM / SDXL Turbo	Menos pasos para una generación más rápida	Iteración rápida y vistas previas

¿Listo para animar tu idea?

Empieza hoy a convertir tus textos e imágenes en vídeos cautivadores con AnimateDiff.

Probar AnimateDiff gratis