Publicidade

Sora da OpenAI revoluciona a criação de vídeo com inteligência artificial

Por Carlos Schuabb
Foto: Dall-e 3

A OpenAI, renomada empresa de inteligência artificial, revelou seu mais recente modelo de geração de vídeo, Sora, que tem deixado os usuários das redes sociais impressionados com seu realismo.

CONTINUA APÓS A PUBLICIDADE

Apresentado em 15 de fevereiro, Sora é capaz de criar vídeos detalhados a partir de simples prompts de texto, continuar vídeos existentes e até gerar cenas baseadas em uma imagem estática.

Segundo a OpenAI, Sora pode gerar cenas semelhantes a filmes em resoluções de até 1080p, incluindo múltiplos personagens, tipos específicos de movimento e detalhes precisos do assunto e do fundo.

Como funciona o Sora

Operando com um modelo de difusão, semelhante ao predecessor baseado em imagem Dall-E 3 da OpenAI, Sora cria sua saída gerando inicialmente um vídeo ou uma imagem que se assemelha mais a ‘ruído estático’ e, gradualmente, o transforma ao ‘remover o ruído’ ao longo de várias etapas.

CONTINUA APÓS A PUBLICIDADE

A OpenAI afirma que Sora foi construído com base em pesquisas anteriores dos modelos ChatGPT e Dall-E 3, o que torna o modelo melhor em representar fielmente as entradas dos usuários.

No entanto, a empresa admite que Sora ainda contém várias fraquezas e pode ter dificuldade em simular a física de uma cena complexa com precisão.

CONTINUA APÓS A PUBLICIDADE

Desafios e potencial futuro

Apesar do avanço significativo, Sora ainda enfrenta desafios, como confundir os ‘detalhes espaciais’ de um prompt, misturando esquerdas e direitas ou falhando em seguir descrições precisas de direções.

Atualmente, o modelo está disponível apenas para ‘red teamers’, termo técnico para pesquisadores de segurança cibernética, para avaliar ‘áreas críticas para danos ou riscos’, além de designers selecionados, artistas visuais e cineastas, para coletar feedback sobre como avançar o modelo.

A capacidade de Sora de gerar movimentos fisicamente implausíveis e a preocupação ética e legal levantada por ferramentas de geração de imagem alimentadas por IA destacam a complexidade e os desafios contínuos no desenvolvimento de modelos de IA avançados.

CONTINUA APÓS A PUBLICIDADE
Compartilhe este artigo
Siga:
Carlos Schuabb, conhecido como Papa no mercado, é redator do Bitnoticias desde julho de 2023, mas ele não começou assim: Iniciando no mercado cripto em 2018, no evento Bitconf, com o tempo se estabeleceu como um entusiasta dedicado, especialmente no que diz respeito ao universo cripto. Ele tem sido uma figura confirmada na organização de todas as edições do BITSAMPA, um evento de prestígio no cenário cripto em São Paulo.
Sair da versão mobile