Texto para vídeo fácil com AnimateDiff

O AnimateDiff permite criar vídeos facilmente com Stable Diffusion. Basta escrever um prompt, selecionar um modelo e ativar o AnimateDiff!

4.9/5de mais de 50 mil usuários|
10M+vídeos gerados|
500+criadores confiam nele
Texto para vídeoImagem para vídeoPrompt TravelMotion LoRAControlNetLoop

AnimateDiff é um recurso educacional e uma demonstração online do módulo de movimento de código aberto AnimateDiff. Não é afiliado aos autores do artigo original do AnimateDiff nem à Stability AI.

Veja o que o AnimateDiff cria

Como o gerador cria clipes curtos

Geração de texto para vídeo

Com o AnimateDiff, você pode fornecer um prompt de texto descrevendo uma cena, personagem ou conceito, e ele gerará um clipe curto animando essa descrição. Isso permite criar animações conceituais ou visualizações de histórias diretamente do texto.

Geração de imagem para vídeo

O AnimateDiff oferece suporte à geração de imagem para vídeo, onde você fornece uma imagem estática, e ele a anima adicionando movimento com base nos priors de movimento aprendidos. Isso pode dar vida a imagens fixas ou obras de arte.

Animações em loop

Além de clipes curtos, o AnimateDiff pode gerar animações em loop perfeitas a partir de entradas de texto ou imagem. Elas podem ser usadas como planos de fundo animados, protetores de tela ou obras de arte animadas criativas.

Edição/manipulação de vídeo

A implementação video2video do AnimateDiff utiliza o ControlNet para permitir a edição de vídeos existentes por meio de prompts de texto. Você poderia remover, adicionar ou manipular elementos em um vídeo guiados por suas descrições de texto.

Animações personalizadas

Combinado com técnicas como DreamBooth ou LoRA, o AnimateDiff permite animar sujeitos, personagens ou objetos personalizados treinados em imagens/conjuntos de dados específicos.

Fluxos de trabalho criativos

Artistas e criadores podem integrar o AnimateDiff em seus fluxos de trabalho criativos, usando-o para visualizar rapidamente conceitos animados, storyboards ou animatics a partir de entradas de texto e imagem durante a fase de ideação.

Embora não seja uma ferramenta completa de edição de vídeo, o AnimateDiff oferece uma forma única de gerar novo conteúdo de vídeo a partir de entradas de texto e imagem, aproveitando o poder dos modelos de difusão e dos priors de movimento aprendidos. Suas saídas podem ser usadas como ponto de partida para mais edição e pós-processamento de vídeo.

AnimateDiff: um criador de texto para vídeo que traz movimento aos modelos de difusão

O AnimateDiff permite a geração de texto para vídeo, deixando você criar clipes curtos ou animações diretamente de prompts de texto. Veja como o processo funciona:

Prompt de texto: Você fornece uma descrição de texto da cena, personagens, ações ou conceitos que deseja ver animados.

Modelo base de texto para imagem: O AnimateDiff utiliza um modelo de difusão de texto para imagem pré-treinado como o Stable Diffusion como espinha dorsal para gerar os quadros de imagem iniciais com base no seu prompt de texto. O modelo base controla o estilo, a identidade do personagem e o detalhe do sujeito; use modelos checkpoint como ToonYou ou Realistic Vision antes de aplicar o módulo.

Módulo de movimento: No núcleo do AnimateDiff há um módulo de movimento treinado em vídeos do mundo real para aprender padrões gerais de movimento e dinâmica. Este módulo é independente do modelo de difusão base.

Animando quadros: O AnimateDiff combina o modelo de difusão base e o módulo de movimento. Primeiro gera quadros-chave a partir do seu prompt de texto usando o modelo de difusão. Em seguida, o módulo interpola quadros intermediários entre essas chaves, aplicando os priors de movimento aprendidos para animar a cena.

Saída de vídeo: A saída resultante é um clipe curto retratando os conceitos descritos no seu prompt de texto, com os elementos animados exibindo movimento natural aprendido de vídeos reais.

Algumas vantagens importantes do AnimateDiff para geração de texto para vídeo são

Plug-and-Play

Pode animar qualquer modelo de texto para imagem sem retreinamento ou ajuste extensivo específico para vídeo.

Controlável

Você pode guiar a animação por meio do prompt de texto descrevendo ações, movimentos de câmera etc.

Eficiente

Mais rápido do que treinar modelos monolíticos de texto para vídeo do zero.

No entanto, as animações nem sempre são perfeitas e podem apresentar artefatos, especialmente em movimentos complexos. Mas o AnimateDiff oferece uma forma poderosa de visualizar diretamente descrições de texto como animações, aproveitando modelos de difusão pré-treinados.

AnimateDiff: um criador de imagem para vídeo que dá vida aos visuais estáticos

O AnimateDiff também pode ser usado para geração de imagem para vídeo, deixando você animar imagens estáticas existentes adicionando movimento e dinâmica. Veja como funciona:

Imagem de entrada: Você fornece uma imagem estática que deseja animar. Pode ser uma fotografia, uma obra de arte digital ou uma saída de modelo de difusão.

Modelo base de imagem para imagem: O AnimateDiff utiliza um modelo de difusão de imagem para imagem pré-treinado como a capacidade img2img do Stable Diffusion como espinha dorsal.

Módulo de movimento: O mesmo módulo de movimento treinado em vídeos do mundo real para aprender padrões gerais de movimento é usado.

Animando a partir da entrada: O AnimateDiff pega a imagem de entrada e usa o modelo de difusão de imagem para imagem para gerar leves variações que servem como quadros-chave.

Aplicando movimento: O módulo de movimento então interpola quadros intermediários entre esses quadros-chave, aplicando a dinâmica de animação aprendida para animar os elementos da imagem de entrada.

Saída de vídeo: O resultado final é um clipe de vídeo onde a imagem estática original ganhou vida com movimento e animação naturais.

Algumas vantagens importantes do AnimateDiff para geração de imagem para vídeo são:

Pode animar qualquer imagem de entrada, incluindo modelos personalizados ou obras de arte.
1
O movimento é inferido automaticamente da entrada sem orientação extra.
2
O nível de movimento pode ser controlado ajustando as configurações.
3
Instâncias simples funcionam melhor do que cenas muito complexas.
4

Embora não seja tão controlável quanto o caso de texto para vídeo, a imagem para vídeo com o AnimateDiff oferece uma forma fácil de adicionar dinâmica a imagens fixas existentes, aproveitando o poder dos modelos de difusão e dos priors de movimento aprendidos.

Funciona com seus estilos favoritos

Estes são apenas estilos de exemplo — o AnimateDiff não é uma ferramenta de visual único. Ele traz movimento às estéticas distintas dos seus modelos Stable Diffusion preferidos.

Anime
Realista
Cartoon 3D
Ghibli
Tinta
Filme
Retrato
Cinematográfico

o que é AnimateDiff

O AnimateDiff é uma ferramenta de IA que pode transformar uma imagem estática ou um prompt de texto em um vídeo animado, gerando uma sequência de imagens que transitam suavemente. Funciona utilizando modelos Stable Diffusion junto com módulos de movimento separados para prever o movimento entre quadros. O AnimateDiff permite que os usuários criem facilmente clipes animados curtos sem precisar criar manualmente cada quadro.

Exemplo do AnimateDiff

Como fazer um vídeo com o AnimateDiff em 4 passos

1

Escolha um modelo / estilo base

Escolha o visual que deseja — anime, realista, cartoon, tinta — dos modelos Stable Diffusion compatíveis.

2

Escreva seu prompt

Descreva a cena, o sujeito, a ação e o movimento de câmera que deseja animar.

3

Defina duração e FPS

Escolha o número de quadros e a taxa de quadros para controlar a duração e a suavidade do clipe.

4

Gere e baixe

Execute o AnimateDiff, visualize o resultado em loop e exporte sua animação.

As capacidades do AnimateDiff em um relance

RecursoO que fazQuando usar
Módulos de movimento v1/v2/v3/SDXLDiferentes priors de movimento treinados para variar qualidade e resoluçãoCombine o módulo ao seu modelo base e resolução alvo
Prompt TravelTransição suave entre prompts ao longo dos quadrosCrie cenas em evolução ou sujeitos em transformação
Motion LoRAAdicione movimentos de câmera específicos como zoom/pan/giroDirecione o movimento de câmera cinematográfico
ControlNetGuie o movimento e a estrutura com entradas de referênciaMantenha pose/composição consistente
Loop fechadoFaça a animação repetir sem emendasClipes em loop perfeitos no estilo GIF
Interpolação de quadrosInsira quadros intermediários para movimento mais suaveAumente o FPS percebido sem regerar
Hi-Res fixAumente a escala preservando o detalhe do movimentoSaída mais nítida e de maior resolução
Aceleração LCM / SDXL TurboMenos etapas para geração mais rápidaIteração rápida e pré-visualizações

Pronto para animar sua ideia?

Comece hoje a transformar seus textos e imagens em vídeos cativantes com o AnimateDiff.

Experimente o AnimateDiff grátis