Imagem deepfake

A imagem deepfake tem origem na “depth image”. Nessas imagens, a produção de uma superfície bidimensional de uma fotografia é composta por metadados referentes a diferentes aspectos da imagem, extraídos de banco de dados de corpos humanos, gerados por não-humanos: os robôs das inteligências artificiais. O processo de construção de uma imagem não é mais linear pois a imagem final é uma reinterpretação algorítmica, uma junção dos feedbacks constantes que a máquina gera (visão computacional), no qual ela vai aprimorando a interpretação do que é lido.

Segundo Hito Steyerl (2014), 50% do que é produzido por smartphones é considerado “noise” (sujeira) pelos mecanismos de interpretação de imagens devido ao tamanho pequeno e à qualidade ótica empobrecida. Essa operação de “limpeza dos ruídos” é baseada em outras imagens similares que estão na memória da câmera. Esse processo encadeia o “feedback loop”, sistema de interpretação de imagens que caracteriza os processos de aprendizagem profunda da visão computacional, possibilitando, assim, a construção de imagens completamente construídas. São os verdadeiros Frankenstein do século 21, segundo a pesquisadora e curadora Yael Van Essen (2020). Esta imagem já vem com padrões algoritmos pré-estabelecidos, tornando-a um objeto de recontextualização constante.

Gabriel Menotti (2019) aponta o perigo a respeito dos apagamentos e invisibilidades produzidos pelas imagens deepfake, pois a classificação de imagens sem a interferência humana não é neutra. A realidade de suas aplicações demonstra que não há um viés de percepção e linguagem e a seleção desses componentes de corpos humanos podem estar reproduzindo misoginia e racismo estrutural, o que deixa aparente que a interpretação da máquina depende do seu treinamento, feito por humanos. Ver imagem interpretada.