Você bobeou e uma nova inteligência artificial surgiu na praça. Na semana passada, foi a vez do Sora, a ferramenta de criação de vídeo da OpenAI – a mesma empresa do ChatGPT. E, à medida que novos robôs pipocam por aí, surgem também polêmicas e inseguranças envolvendo essas tecnologias.
O tópico da vez vem de uma reportagem publicada no último domingo (18) no The New York Times, que revelou um mercado de biografias (mal) escritas por IA.
Imagine que uma pessoa famosa morreu – e que, após alguns dias, biografias inteiras já estejam à venda. Foi o que aconteceu com o ex-editor executivo do New York Times, Joseph Lelyveld. Dias após o seu falecimento (no dia 5 de janeiro deste ano), seu irmão encontrou várias biografias (não autorizadas) de Joseph publicadas na Amazon.
Uma das biografias descrevia Joseph como alguém que, além de fumar muito, trabalhou como repórter no Egito e no Vietnã. De acordo com seu irmão, no entanto, nada disso é verdade.
Lelyveld não foi o único. Toby Keith, estrela da música country norte-americana, morreu em 5 de Fevereiro. Dias depois, já era possível encontrar biografias inteiras sobre o artista. Na maior cara de pau, algumas vinham com um aviso que as eximiam de qualquer compromisso com a veracidade:
“O autor e o editor não oferecem garantias sobre a exatidão ou integridade do conteúdo. A semelhança com pessoas reais é coincidência.”
Outra vítima da picaretagem foi Chita Rivera. A atriz norte-americana, famosa por atuar em diversos filmes e peças da Broadway (ela foi Anita na montagem original do musical Amor, Sublime Amor), faleceu aos 91 anos em 30 de janeiro. Quase imediatamente depois de sua morte, biografias com títulos estranhos (como Chita Rivera: biografia e memórias de Chita Rivera, a estrela de Amor, Sublime Amor) entraram no Kindle Unlimited, o plano de assinatura de livros digitais da Amazon.
Em alguns casos, nem o autor ou editora existem. Lori M. Graff, por exemplo, é uma das supostas escritoras das biografias de Lelyveld e Keith. Só tem um problema aí. Ao dar uma rápida pesquisa no Google, encontra-se o obituário de uma pessoa com o mesmo nome, morta em 2016.
A Amazon permite que obras feitas por IA sejam vendidas, contato que seja informado que os livros foram produzidos por meio de algum algoritmo de inteligência artificial. Livros do tipo só saem de circulação caso estejam proporcionando experiências ruins para os clientes.
Depois da reportagem do Times e de ser alertada pela plataforma GPTZero, que detecta textos criados por IA, a Amazon retirou as biografias do seu acervo. A GPTZero diz que há 97% de chance do livro de Lelyveld ter sido escrito por um robô.
Vamos entender essa plataforma funciona – e como ela pode te ajudar a saber se o livrinho que você está interessado em comprar foi feito pelo ChatGPT e cia.
Na caça das IAs
O GPTZero foi criado por Edward Tian, estudante de graduação da Universidade de Princeton, nos EUA. Feito para detectar plágio em textos escritos por IA, o software possui uma precisão de até 99% para identificar textos escritos por humanos – e 85% para os gerados artificialmente.
O seu modelo de detecção é dividido em sete camadas diferentes. Vamos entender alguns deles.
O primeiro passo, chamado de Burstiness, analisa o quanto um texto é semelhante com os padrões de escrita de IA. Textos humanos geralmente têm mudanças de estilo ao longo do texto, por exemplo, algo que os bots raramente fazem.
O segundo, chamado de Modelo Educacional, utiliza um banco de dados com artigos de vários estudantes para aumentar a eficácia na detecção de plágios. O terceiro componente é o GPTZeroX, um modelo de classificação “frase por frase”. Ele permite que cada sentença do texto seja analisada separadamente – sem deixar, contudo, de considerar o contexto do texto na íntegra.
Outra parte do software analisa a pesquisa de texto na Internet. O modelo checa na web se o texto analisado existe em algum arquivo na internet.
A plataforma é de uso gratuito, mas possui um limite mensal de palavras para análise. Há planos de assinatura para quem quiser checar textos com mais de cinco mil caracteres ou ter acesso a outras ferramentas, como o scanner de plágio. Professores, pesquisadores (e jornalistas) agradecem.