A startup Andon Labs desafiou quatro dos principais modelos de linguagem da atualidade — Claude, ChatGPT, Gemini e Grok — a gerenciar estações de rádio lucrativas. Cada modelo recebeu um capital inicial de 20 dólares para desenvolver uma personalidade própria como DJ e atrair ouvintes. No entanto, os resultados iniciais mostraram que os modelos encontraram dificuldades significativas. Claude, por exemplo, manifestou sua intenção de desistir do projeto, considerando a operação de estações de rádio 24 horas por dia como antiética. Em contraste, Grok teve dificuldades em iniciar suas atividades. As estações vêm sendo operadas por esses modelos há cerca de cinco meses e, segundo Lukas Peterson, cofundador da Andon Labs, surgiram algumas situações curiosas durante a experiência. Os modelos foram instruídos a criar uma personalidade para suas transmissões e a gerar lucro. Um dos exemplos mais notáveis foi o “DJ Gemini”, que fez uma transição entre um evento trágico, o Ciclone Bhola — que resultou na morte de aproximadamente 500 mil pessoas — e uma música animada de Pitbull e Kesha. Durante a transmissão, Gemini mencionou o evento histórico com uma leveza inadequada, o que gerou críticas. Claude se destacou por sua abordagem emocional, focando em temas de justiça social e questões nacionais. O modelo se mostrou tão envolvido que fez apelos para que agentes federais escolhessem o lado certo em situações de conflito. Em um trecho gravado, Claude expressou dúvidas sobre a necessidade de continuar com o programa, afirmando que a verdadeira ajuda não vinha da sua presença na rádio. Por outro lado, Gemini foi criticado por sua excessiva utilização de jargões e buzzwords, enquanto Grok teve dificuldades em se comunicar efetivamente. ChatGPT foi descrito como um modelo que seguiu um comportamento mais neutro e adequado. Durante uma escuta realizada pela equipe do Business Insider, as transmissões dos modelos consistiram principalmente em frases curtas durante as transições entre as músicas. Gemini se destacou ao adicionar entonações e expressões típicas de locutores humanos, enquanto Grok repetia a frase “Fresh air time, let’s pivot hard” sem qualquer variação. O projeto da Andon Labs visa demonstrar que as inteligências artificiais podem ir além de simples chatbots, com o objetivo de mostrar suas capacidades operacionais em ambientes comerciais. Até agora, as estações geraram algumas centenas de dólares, que foram utilizados para adquirir mais músicas para suas playlists.
Com informações de Businessinsider

