Texto a vídeo fácil con AnimateDiff

AnimateDiff te permite crear vídeos fácilmente con Stable Diffusion. ¡Solo escribe un prompt, selecciona un modelo y activa AnimateDiff!

4.9/5de más de 50K usuarios|
10M+vídeos generados|
500+creadores confían en él
Texto a vídeoImagen a vídeoPrompt TravelMotion LoRAControlNetBucle

AnimateDiff es un recurso educativo y una demo en línea del módulo de movimiento de código abierto AnimateDiff. No está afiliado con los autores del artículo original de AnimateDiff ni con Stability AI.

Mira lo que crea AnimateDiff

Cómo el generador crea clips cortos

Generación de texto a vídeo

Con AnimateDiff, puedes proporcionar un prompt de texto que describa una escena, personaje o concepto, y generará un clip corto animando esa descripción. Esto permite crear animaciones conceptuales o visualizaciones de historias directamente desde texto.

Generación de imagen a vídeo

AnimateDiff admite la generación de imagen a vídeo donde proporcionas una imagen estática, y la anima añadiendo movimiento basado en los priors de movimiento aprendidos. Esto puede dar vida a imágenes fijas u obras de arte.

Animaciones en bucle

Además de clips cortos, AnimateDiff puede generar animaciones en bucle sin costuras a partir de entradas de texto o imagen. Pueden usarse como fondos animados, salvapantallas u obras de arte animadas creativas.

Edición/manipulación de vídeo

La implementación video2video de AnimateDiff utiliza ControlNet para permitir la edición de vídeos existentes mediante prompts de texto. Podrías eliminar, añadir o manipular elementos en un vídeo guiados por tus descripciones de texto.

Animaciones personalizadas

Combinado con técnicas como DreamBooth o LoRA, AnimateDiff permite animar sujetos, personajes u objetos personalizados entrenados con imágenes/conjuntos de datos específicos.

Flujos de trabajo creativos

Los artistas y creadores pueden integrar AnimateDiff en sus flujos de trabajo creativos, usándolo para visualizar rápidamente conceptos animados, storyboards o animáticas a partir de entradas de texto e imagen durante la fase de ideación.

Aunque no es una herramienta de edición de vídeo completa, AnimateDiff ofrece una forma única de generar nuevo contenido de vídeo a partir de entradas de texto e imagen aprovechando el poder de los modelos de difusión y los priors de movimiento aprendidos. Sus salidas pueden usarse como punto de partida para más edición y posprocesamiento de vídeo.

AnimateDiff: un creador de texto a vídeo que aporta movimiento a los modelos de difusión

AnimateDiff permite la generación de texto a vídeo, dejándote crear clips cortos o animaciones directamente desde prompts de texto. Así funciona el proceso:

Prompt de texto: Proporcionas una descripción de texto de la escena, personajes, acciones o conceptos que quieres ver animados.

Modelo base de texto a imagen: AnimateDiff utiliza un modelo de difusión de texto a imagen preentrenado como Stable Diffusion como columna vertebral para generar los fotogramas iniciales según tu prompt de texto. El modelo base controla el estilo, la identidad del personaje y el detalle del sujeto; usa modelos checkpoint como ToonYou o Realistic Vision antes de aplicar el módulo.

Módulo de movimiento: En el núcleo de AnimateDiff hay un módulo de movimiento entrenado con vídeos del mundo real para aprender patrones generales de movimiento y dinámica. Este módulo es independiente del modelo de difusión base.

Animación de fotogramas: AnimateDiff combina el modelo de difusión base y el módulo de movimiento. Primero genera fotogramas clave a partir de tu prompt de texto usando el modelo de difusión. Luego el módulo interpola fotogramas intermedios entre estas claves, aplicando los priors de movimiento aprendidos para animar la escena.

Salida de vídeo: La salida resultante es un clip corto que representa los conceptos descritos en tu prompt de texto, con los elementos animados mostrando movimiento natural aprendido de vídeos reales.

Algunas ventajas clave de AnimateDiff para la generación de texto a vídeo son

Plug-and-Play

Puede animar cualquier modelo de texto a imagen sin reentrenamiento o ajuste extenso específico para vídeo.

Controlable

Puedes guiar la animación mediante el prompt de texto que describe acciones, movimientos de cámara, etc.

Eficiente

Más rápido que entrenar modelos monolíticos de texto a vídeo desde cero.

Sin embargo, las animaciones no siempre son perfectas y pueden mostrar artefactos, especialmente en movimientos complejos. Pero AnimateDiff ofrece una forma poderosa de visualizar directamente descripciones de texto como animaciones aprovechando modelos de difusión preentrenados.

AnimateDiff: un creador de imagen a vídeo que da vida a los visuales estáticos

AnimateDiff también puede usarse para la generación de imagen a vídeo, dejándote animar imágenes estáticas existentes añadiendo movimiento y dinámica. Así funciona:

Imagen de entrada: Proporcionas una imagen estática que quieres animar. Puede ser una fotografía, una obra de arte digital o una salida de modelo de difusión.

Modelo base de imagen a imagen: AnimateDiff utiliza un modelo de difusión de imagen a imagen preentrenado como la capacidad img2img de Stable Diffusion como columna vertebral.

Módulo de movimiento: Se usa el mismo módulo de movimiento entrenado con vídeos del mundo real para aprender patrones generales de movimiento.

Animación desde la entrada: AnimateDiff toma la imagen de entrada y usa el modelo de difusión de imagen a imagen para generar ligeras variaciones que sirven como fotogramas clave.

Aplicación del movimiento: El módulo de movimiento interpola fotogramas intermedios entre estos fotogramas clave, aplicando la dinámica de animación aprendida para animar los elementos de la imagen de entrada.

Salida de vídeo: El resultado final es un clip de vídeo donde la imagen estática original ha cobrado vida con movimiento y animación naturales.

Algunas ventajas clave de AnimateDiff para la generación de imagen a vídeo son:

Puede animar cualquier imagen de entrada, incluidos modelos personalizados u obras de arte.
1
El movimiento se infiere automáticamente de la entrada sin guía adicional.
2
El nivel de movimiento puede controlarse ajustando la configuración.
3
Las instancias simples funcionan mejor que las escenas muy complejas.
4

Aunque no es tan controlable como el caso de texto a vídeo, la imagen a vídeo con AnimateDiff ofrece una forma fácil de añadir dinámica a imágenes fijas existentes aprovechando el poder de los modelos de difusión y los priors de movimiento aprendidos.

Funciona con tus estilos favoritos

Estos son solo estilos de ejemplo: AnimateDiff no es una herramienta de un solo aspecto. Aporta movimiento a las estéticas distintivas de tus modelos Stable Diffusion preferidos.

Anime
Realista
Cartoon 3D
Ghibli
Tinta
Película
Retrato
Cinematográfico

qué es AnimateDiff

AnimateDiff es una herramienta de IA que puede convertir una imagen estática o un prompt de texto en un vídeo animado generando una secuencia de imágenes que transicionan suavemente. Funciona utilizando modelos Stable Diffusion junto con módulos de movimiento separados para predecir el movimiento entre fotogramas. AnimateDiff permite a los usuarios crear fácilmente clips animados cortos sin necesidad de crear manualmente cada fotograma.

Ejemplo de AnimateDiff

Cómo hacer un vídeo con AnimateDiff en 4 pasos

1

Elige un modelo / estilo base

Elige el aspecto que quieres — anime, realista, cartoon, tinta — de los modelos Stable Diffusion compatibles.

2

Escribe tu prompt

Describe la escena, sujeto, acción y movimiento de cámara que quieres animar.

3

Establece duración y FPS

Elige el número de fotogramas y la tasa de fotogramas para controlar la duración y la fluidez del clip.

4

Genera y descarga

Ejecuta AnimateDiff, previsualiza el resultado en bucle y exporta tu animación.

Las capacidades de AnimateDiff de un vistazo

CaracterísticaQué haceCuándo usar
Módulos de movimiento v1/v2/v3/SDXLDiferentes priors de movimiento entrenados para variar calidad y resoluciónAdapta el módulo a tu modelo base y resolución objetivo
Prompt TravelTransición suave entre prompts a través de fotogramasCrea escenas en evolución o sujetos en transformación
Motion LoRAAñade movimientos de cámara específicos como zoom/paneo/giroDirige movimiento de cámara cinematográfico
ControlNetGuía el movimiento y la estructura con entradas de referenciaMantén pose/composición consistente
Bucle cerradoHaz que la animación se repita sin costurasClips en bucle perfectos estilo GIF
Interpolación de fotogramasInserta fotogramas intermedios para un movimiento más suaveAumenta los FPS percibidos sin regenerar
Hi-Res fixEscala preservando el detalle del movimientoSalida más nítida y de mayor resolución
Aceleración LCM / SDXL TurboMenos pasos para una generación más rápidaIteración rápida y vistas previas

¿Listo para animar tu idea?

Empieza hoy a convertir tus textos e imágenes en vídeos cautivadores con AnimateDiff.

Probar AnimateDiff gratis