A OpenAI anunciou uma nova tecnologia que transforma frases de texto em vídeos realísticos a partir de bancos de imagens online. Em poucos minutos, cria novos mundos de poucos segundos.
Corpo do artigo
A criadora do ChatGPT volta a agitar. A OpenAI anunciou um sistema de Inteligência Artificial (IA) que cria vídeos de computador a partir de pedidos escritos inseridos pelos utilizadores. Entre os exemplos apresentados para demonstrar a tecnologia, a empresa liderada por Sam Altman mostra um “clip” curto de mamutes a caminhar na neve de uma forma dramática, a lembrar cenas grandiosas em filmes de Hollywood, por exemplo.
O excerto, de 8 segundos, diz a OpenAI foi gerado por um computador em resposta ao seguinte pedido: "Vários mamutes gigantes aproximam-se caminhando por um prado coberto de neve, o longo pelo lanoso agita-se levemente ao vento enquanto caminham, árvores cobertas de neve e dramáticas montanhas cobertas de neve ao longe, a luz do meio da tarde com nuvens finas e um sol alto ao longe cria um brilho quente, a visão da câmara baixa é impressionante capturando o grande mamífero peludo com uma bela fotografia, profundidade de campo".
O sistema, batizado de Sora, recorre a vídeos e bancos de imagens disponíveis online para transformar palavras em imagens em movimento. Segundo a OpenAI, os “clips” de segundos, foram criados em minutos.
Esta tecnologia é um exemplo, bastante vívido, do que se chama IA generativa. Um modelo computacional que cria texto, imagens, sons e agora vídeos. Como todos estes tipos de sistemas, o Sora aprende analisando dados digitais, no caso vídeos e as descrições do que contêm essas imagens em movimento.
Questionada pelo jornal norte americano “The New York Times” (NYT), a empresa escusou-se a dizer quantos vídeos foram usados para treinar o sistema. Revelou, apenas, que o treino do Sora incluiu vídeos disponíveis publicamente e outros que foram licenciados pelos autores ou detentores dos direitos.
O nome Sora, que significa céu em japonês, foi escolhido porque "evoca a ideia de potencial criativo sem limite", explicou ao NYT um dos criadores deste sistema, Tim Brooks. Numa entrevista, disse que a empresa não vai libertar já o sistema para o público, porque ainda está a tentar entender os perigos que pode encerrar.
A OpenAI partilha a tecnologia com um pequeno grupo de académicos e outros investigadores externos à empresa, que vão identificar "alertas vermelhos", tentando perceber de que formas este sistema pode ser usado para o mal. "A intenção aqui é dar uma antevisão do que está no horizonte, para que as pessoas possam ver as capacidades desta tecnologia - e para que possamos obter feedback", explicou Tim Brooks.
No X, antigo Twitter, a OpenAI apresenta mais exemplos da tecnologia, bem diversos. Um dos mais impressionantes, porque simula um movimento de câmara realístico foi obtido através do seguinte pedido: "Trailer de um filme com as aventuras do homem do espaço de 30 anos que usa um capacete de motociclista de malha de lã vermelha, céu azul, deserto de sal, estilo cinematográfico, filmado em película de 35 mm, cores vivas."
Outro exemplo, para fazer jus à escolha de um nome japonês, junta as cerejeiras em flor, famosas da capital japonesa, numa Tóquio ainda coberta de neve. O texto apresentado, segundo a OpenAI foi o seguinte: “A bela cidade de Tóquio coberta de neve. A câmara move-se através da movimentada rua da cidade, seguindo várias pessoas que desfrutam do belo tempo de neve e fazem compras nas bancas próximas. Lindas pétalas de flor de cerejeira voam ao vento juntamente com flocos de neve”