Category: IA

CSAM gerado por IA: Um confronto da Primeira Emenda

2025-03-20
CSAM gerado por IA: Um confronto da Primeira Emenda

Um caso recente em um tribunal distrital dos EUA envolvendo material de abuso sexual infantil (CSAM) gerado por IA acendeu um debate sobre a Primeira Emenda. O tribunal decidiu que a posse privada de CSAM virtual gerado por IA é protegida pela Primeira Emenda, mas a produção e distribuição não. Este caso destaca os desafios e complexidades legais enfrentados pelas forças de segurança na luta contra a exploração e o abuso sexual infantil habilitados por IA.

Google Gemma 3: Uma grande atualização para seu modelo de IA de único acelerador

2025-03-20
Google Gemma 3: Uma grande atualização para seu modelo de IA de único acelerador

Mais de um ano após o lançamento dos modelos de IA Gemma iniciais, o Google apresenta o Gemma 3, com desempenho superior em comparação com concorrentes como Llama e OpenAI, especialmente em sistemas com uma única GPU. Este modelo aprimorado suporta mais de 35 idiomas e processa texto, imagens e vídeos curtos. O Gemma 3 possui um codificador de visão atualizado para imagens de alta resolução e não quadradas e inclui o novo classificador de segurança de imagem ShieldGemma 2 para filtrar conteúdo inadequado. Embora a definição de 'aberto' ainda seja debatida em relação à sua licença, o Google continua a promover o Gemma 3 por meio de créditos do Google Cloud e um programa acadêmico que oferece US$ 10.000 em créditos para pesquisa.

IA

Alucinações do ChatGPT geram nova reclamação de privacidade contra OpenAI

2025-03-20
Alucinações do ChatGPT geram nova reclamação de privacidade contra OpenAI

A OpenAI enfrenta outra reclamação de privacidade na Europa devido à tendência do ChatGPT de inventar informações falsas. A Noyb está apoiando um usuário norueguês falsamente acusado pelo ChatGPT de assassinar dois filhos e tentar matar um terceiro. Isso destaca os riscos das 'alucinações' dos LLMs e os requisitos de precisão do GDPR. Embora a OpenAI ofereça soluções, como o bloqueio de prompts, isso é insuficiente sob o direito de retificação do GDPR. O caso pode resultar em multas de até 4% da receita anual e forçar a OpenAI a modificar seus produtos de IA, impactando todo o setor.

IA

Pump: Otimização de Custos em Nuvem com IA, Economizando 60%

2025-03-20
Pump: Otimização de Custos em Nuvem com IA, Economizando 60%

O gasto com nuvem chega a impressionantes US$ 500 bilhões anuais, sendo a categoria de despesas de crescimento mais rápido para empresas de tecnologia. A Pump oferece uma plataforma alimentada por IA que automatiza as economias e aproveita as compras em grupo para reduzir os custos em nuvem em até 60%. Apoiada pela Y Combinator, a equipe experiente da Pump está construindo uma cultura corporativa transparente, colaborativa e acelerada, focada no sucesso.

Claude agora pesquisa na web: respostas mais precisas e atualizadas

2025-03-20
Claude agora pesquisa na web: respostas mais precisas e atualizadas

O modelo de IA Claude da Anthropic agora incorpora a pesquisa na web para fornecer respostas mais precisas e oportunas. O Claude acessa os eventos e informações mais recentes, citando diretamente as fontes para facilitar a verificação de fatos. Este recurso está atualmente disponível em prévia para usuários pagos nos Estados Unidos, com suporte para planos gratuitos e internacional em breve. Essa melhoria permite que o Claude auxilie nas vendas, análise financeira, pesquisa e compras, analisando tendências, avaliando dados de mercado, criando relatórios de pesquisa e comparando detalhes de produtos.

OpenAI lança o o1-pro: IA de raciocínio poderosa, mas será que justifica o custo?

2025-03-20
OpenAI lança o o1-pro: IA de raciocínio poderosa, mas será que justifica o custo?

A OpenAI lançou o o1-pro, um modelo de IA de raciocínio mais poderoso, por meio de sua API para desenvolvedores. Embora se orgulhe de desempenho superior e respostas mais confiáveis ​​graças ao aumento da capacidade de computação, o o1-pro tem um preço alto: US$ 150 por milhão de tokens de entrada e US$ 600 por milhão de tokens de saída – o dobro do custo de entrada do GPT-4.5 e dez vezes o custo do o1. No entanto, testes iniciais revelaram resultados mistos, com dificuldades em tarefas como quebra-cabeças de Sudoku e ilusões de ótica. Benchmarks internos mostraram um desempenho apenas ligeiramente melhor que o o1 em problemas de codificação e matemática, embora com confiabilidade aprimorada. A aposta da OpenAI é se a confiabilidade aprimorada justifica o custo exorbitante para os desenvolvedores.

IA

Esboço do Curso de Aprendizado Profundo: De Perceptrons a Transformadores

2025-03-20

Este esboço do curso abrange uma ampla gama de tópicos de aprendizado profundo, começando pelos primeiros perceptrons e algoritmos de retropropagação, e progredindo para as modernas Redes Neurais Convolucionais (CNNs), Redes Neurais Recorrentes (RNNs) e modelos Transformer. O curso explicará progressivamente técnicas para treinar redes neurais, incluindo algoritmos de otimização e métodos de regularização. Tópicos avançados, como previsão de séries temporais, previsão sequência-a-sequência e Redes Adversárias Generativas (GANs) também serão abordados. O curso será avaliado por meio de uma série de palestras, tarefas e questionários.

IA

Bolt3D: Gerando Cenários 3D em Segundos

2025-03-19
Bolt3D: Gerando Cenários 3D em Segundos

O Bolt3D, um esforço colaborativo do Google Research, VGG e Google DeepMind, gera cenas 3D realistas em apenas 6,25 segundos em uma única GPU. O modelo usa um modelo de difusão multi-visão para gerar a aparência e a geometria da cena, depois regride imagens de respingos usando uma cabeça gaussiana. Finalmente, ele combina gaussianas 3D de várias imagens de respingos para formar a cena 3D completa. Suporte para uma ou mais imagens de entrada, o Bolt3D gera regiões de cena não observadas sem reprojeção ou mecanismos de pintura, mostrando um avanço significativo na velocidade de geração de cenas 3D.

Agentes de LLM: Surpreendentemente Simples!

2025-03-19
Agentes de LLM: Surpreendentemente Simples!

Este guia desmistifica o funcionamento interno dos agentes de LLM. Usando uma analogia simples de cozinha, ele explica como os sistemas de agentes são construídos como grafos: nós representando estações de cozimento, fluxo como a receita e armazenamento compartilhado como a bancada. Cada nó prepara, executa e publica resultados; o fluxo determina o próximo nó com base em decisões. O autor usa a estrutura PocketFlow (apenas 100 linhas de código) para ilustrar como os agentes funcionam através de nós de decisão, nós de ação e nós finais, enfatizando sua estrutura de grafo fundamental em vez de algoritmos complexos. É tudo sobre loops e ramificações!

Arquivamento Digital Pessoal: Tesouros de Dados Únicos na Era da IA

2025-03-19
Arquivamento Digital Pessoal: Tesouros de Dados Únicos na Era da IA

Em sua mais recente newsletter quinzenal, Linda explora o valor dos arquivos digitais pessoais. Ela argumenta que, na era atual de IA generativa tendendo à mediocridade, esses arquivos, contendo experiências, preferências e perspectivas pessoais únicas, tornam-se recursos valiosos para treinar modelos de IA e criar trabalhos mais personalizados. O artigo usa a experiência da própria autora de coletar livros, imagens e links como exemplo, e combina as perspectivas de historiadores para ilustrar a importância dos arquivos pessoais na era da IA. Vários exemplos de arquivos pessoais na Finlândia também são fornecidos. Finalmente, a autora convida os leitores a compartilhar seus próprios itens e histórias coletados, mostrando a riqueza e o charme único dos arquivos pessoais.

Nvidia Isaac GR00T N1: A Era da Robótica Generalista Chegou

2025-03-19
Nvidia Isaac GR00T N1: A Era da Robótica Generalista Chegou

A Nvidia lançou o Isaac GR00T N1, um modelo de base de código aberto e pré-treinado para robôs humanoides, marcando a chegada da era da robótica generalista. Este modelo de sistema duplo, inspirado na cognição humana, possui um 'Sistema 1' de ação rápida e um 'Sistema 2' mais lento, baseado em um modelo de linguagem de visão, para raciocínio. Com dados mínimos de pós-treinamento, ele permite tarefas complexas como agarrar e manipular objetos. A 1X Technologies o implantou com sucesso em seu robô humanoide NEO Gamma para tarefas de organização autônomas. A natureza de código aberto e a capacidade de personalização do modelo prometem acelerar significativamente o desenvolvimento de robôs humanoides e impulsionar os avanços em IA.

IA

NVIDIA Dynamo: Framework de Inferência de Alta Taxa de Transferência e Baixa Latência para IA Generativa

2025-03-18
NVIDIA Dynamo: Framework de Inferência de Alta Taxa de Transferência e Baixa Latência para IA Generativa

A NVIDIA apresenta o Dynamo, um framework de inferência de alta taxa de transferência e baixa latência projetado para servir modelos de IA generativa e de raciocínio em ambientes distribuídos multinodo. O Dynamo é agnóstico em relação ao mecanismo de inferência (compatível com TRT-LLM, vLLM, SGLang e outros) e incorpora recursos como inferência de preenchimento e decodificação desagregada, escalonamento dinâmico de GPU, roteamento de solicitações com reconhecimento de LLM, transferência de dados acelerada e descarregamento de cache KV para maximizar a taxa de transferência da GPU e minimizar a latência. Construído em Rust para desempenho e Python para extensibilidade, o Dynamo é totalmente de código aberto.

Llama da Meta atinge 1 bilhão de downloads, mirando a dominância da IA de código aberto

2025-03-18
Llama da Meta atinge 1 bilhão de downloads, mirando a dominância da IA de código aberto

O CEO do Meta, Mark Zuckerberg, anunciou que o modelo de IA de código aberto da empresa, Llama, ultrapassou 1 bilhão de downloads, um aumento de 53% desde o início de dezembro de 2024. Enquanto alimenta o assistente de IA do Meta e é usado por empresas como Spotify e AT&T, o Llama enfrenta processos por direitos autorais e preocupações com a privacidade de dados. Apesar disso, o Meta planeja lançar mais modelos Llama, incluindo modelos de raciocínio e modelos multimodais, e está investindo US$ 80 bilhões em IA este ano, com o objetivo de liderar o campo da IA.

IA

Sesame AI Lança Modelo de Fala Conversacional de 1 Bilhão de Parâmetros

2025-03-18
Sesame AI Lança Modelo de Fala Conversacional de 1 Bilhão de Parâmetros

Os Laboratórios Sesame AI lançaram o CSM (Conversational Speech Model), um modelo de geração de fala de 1 bilhão de parâmetros baseado na arquitetura Llama. O CSM gera códigos de áudio RVQ a partir de entradas de texto e áudio, e seu checkpoint está disponível no Hugging Face. Também são fornecidos uma demonstração interativa de voz e um espaço Hugging Face para testar a geração de áudio. Embora seja capaz de produzir vozes variadas, o CSM não foi ajustado para vozes específicas e tem suporte multilíngue limitado. A Sesame AI enfatiza seu uso apenas para fins de pesquisa e educacionais, proibindo a personificação, desinformação e atividades ilegais.

O Modelo É o Produto: A Próxima Fronteira em Investimentos em IA

2025-03-18

Muitas especulações surgem sobre a próxima onda da IA. O autor argumenta que a resposta é clara: o próprio modelo é o produto. A escala generalista está diminuindo, o treinamento opinativo supera as expectativas e os custos de inferência estão caindo. Isso força os fornecedores de modelos a subirem na cadeia de valor, enquanto as camadas de aplicativos enfrentam automação e interrupção. O DeepResearch da OpenAI e o Claude 3.7 da Anthropic exemplificam isso: não meramente LLMs ou chatbots, mas modelos projetados para tarefas específicas. Isso sinaliza uma nova fase da IA: os treinadores de modelos dominam, os desenvolvedores de aplicativos enfrentam deslocamento. Investimentos em camadas de aplicativos podem falhar, pois o treinamento de modelos detém o verdadeiro valor. O sucesso futuro da IA reside em empresas capazes de treinamento de modelos, possuindo equipes multifuncionais e foco intenso.

Query Tables da Dust: Habilitando agentes de IA com análise de dados estruturados

2025-03-18
Query Tables da Dust: Habilitando agentes de IA com análise de dados estruturados

A Dust construiu o Query Tables, uma poderosa ferramenta de agente de IA que permite consultas SQL em dados estruturados. Começando com o suporte a arquivos CSV, evoluiu para incluir bancos de dados Notion, Planilhas Google e planilhas do Office 365, culminando em conexões com data warehouses empresariais como Snowflake e BigQuery. Uma camada de abstração unificada permite que os usuários consultem diversas fontes de dados usando a mesma interface SQL, combinando até mesmo dados de diferentes fontes para análise. Os planos futuros incluem a integração do Salesforce para expandir ainda mais seus recursos de análise de dados.

Modelo de código aberto OLMo-2 supera o GPT-3.5? Configuração fácil para Mac!

2025-03-18
Modelo de código aberto OLMo-2 supera o GPT-3.5? Configuração fácil para Mac!

O modelo de linguagem de código aberto OLMo-2, com 32 bilhões de parâmetros, afirma superar o GPT-3.5-Turbo e o GPT-4 mini. Todos os dados, código, pesos e detalhes estão livremente disponíveis. Esta publicação detalha uma configuração simples para executá-lo em um Mac usando o plugin llm-mlx. Baixe o modelo de 17 GB com alguns comandos e participe de bate-papos interativos ou gere imagens; o exemplo mostra a geração de um SVG de um pelicano em uma bicicleta.

IA

Algoritmo Quântico DQI: Uma Quebra de Paradigma na Otimização?

2025-03-17
Algoritmo Quântico DQI: Uma Quebra de Paradigma na Otimização?

A equipe do Google Quantum AI desenvolveu um novo algoritmo quântico chamado Interferometria Quântica Decodificada (DQI) que supera todos os algoritmos clássicos conhecidos na resolução de uma ampla classe de problemas de otimização. O algoritmo não foi projetado para um problema específico, mas sim traduzindo o problema em ondas quânticas e aplicando técnicas de decodificação para encontrar a melhor solução. Embora falte hardware quântico suficiente para testes empíricos e a possibilidade de futuros algoritmos clássicos rivais, a vantagem potencial do DQI em problemas de otimização e suas aplicações em codificação e criptografia geraram entusiasmo na comunidade de computação quântica. É considerado um avanço significativo em algoritmos quânticos.

Gemini 2.0 Flash do Google: Editor de imagens IA poderoso que levanta preocupações sobre direitos autorais

2025-03-17
Gemini 2.0 Flash do Google: Editor de imagens IA poderoso que levanta preocupações sobre direitos autorais

O novo modelo de IA Gemini 2.0 Flash do Google possui recursos poderosos de edição de imagens, incluindo a capacidade de remover marcas d'água de imagens sem esforço, mesmo aquelas de agências de fotos conhecidas como a Getty Images. Essa funcionalidade gerou preocupações sobre direitos autorais, pois a remoção de marcas d'água sem permissão é geralmente ilegal de acordo com a lei de direitos autorais dos EUA. Embora o Google rotule o recurso como experimental e disponível apenas para desenvolvedores, sua capacidade poderosa de remoção de marcas d'água e a falta de restrições de uso o tornam uma ferramenta potencial para violação de direitos autorais. Outros modelos de IA, como o Claude 3.7 Sonnet da Anthropic e o GPT-4o da OpenAI, se recusam explicitamente a remover marcas d'água, considerando-o antiético e potencialmente ilegal.

Startup de IA Neuro-First Busca Engenheiros para Criar Interfaces Cérebro-Computador Inovadoras

2025-03-17
Startup de IA Neuro-First Busca Engenheiros para Criar Interfaces Cérebro-Computador Inovadoras

A Piramidal está contratando Engenheiros de Pesquisa para construir sistemas de IA focados em dados neurais, permitindo tarefas antes impossíveis. Candidatos ideais possuem fortes habilidades de engenharia, incluindo o design, implementação e aprimoramento de sistemas de aprendizado de máquina distribuídos em larga escala, e um conhecimento básico de neurociência. A empresa oferece compensação e participação acionária competitivas, impulsionada por uma missão de empoderar o potencial humano por meio da tecnologia, defendendo a liberdade cognitiva e se opondo à mercantilização das mentes.

IA

IA do Google resolve mistério de superbactérias de uma década em apenas dois dias

2025-03-17
IA do Google resolve mistério de superbactérias de uma década em apenas dois dias

Uma nova ferramenta de IA do Google resolveu um enigma científico de uma década em apenas dois dias: o mecanismo de resistência a antibióticos em superbactérias. Uma equipe do Imperial College London passou 10 anos pesquisando como certas superbactérias adquirem resistência, mas a ferramenta de IA 'co-cientista' do Google, com um simples comando, chegou à mesma resposta que as descobertas não publicadas da equipe em apenas 48 horas. Isso demonstra o potencial da IA para sintetizar evidências, orientar pesquisas e projetar experimentos, potencialmente revolucionando o progresso científico. No entanto, também levanta preocupações éticas e de confiabilidade sobre o uso da IA na pesquisa científica.

Engenheiro de IA Aplicada Fundador na Kastle: Revolucionando o Atendimento de Empréstimos Imobiliários com IA

2025-03-16
Engenheiro de IA Aplicada Fundador na Kastle: Revolucionando o Atendimento de Empréstimos Imobiliários com IA

A Kastle, uma plataforma com tecnologia de IA que atende os maiores credores de hipotecas dos EUA, procura um Engenheiro de IA Aplicada Fundador. Com o apoio da Y Combinator e de outros investidores importantes, a Kastle está redefinindo o atendimento de empréstimos. Essa função exige mais de 3 anos de experiência em IA aplicada, proficiência em Python e estruturas de aprendizado profundo e experiência em ajuste fino de LLMs. As responsabilidades incluem integrar IA em sua plataforma, projetar fluxos de trabalho de IA, garantir conformidade regulatória (FDCPA, RESPA, TILA) e otimizar para desempenho e escalabilidade. Essa é uma oportunidade única para construir a base de uma startup de IA em rápido crescimento.

IA

A ameaça da IA aos repositórios de acesso aberto

2025-03-16
A ameaça da IA aos repositórios de acesso aberto

O ideal do movimento de acesso aberto está em conflito com a realidade do treinamento de modelos de IA. Contribuidores estão descobrindo que seus trabalhos estão sendo explorados para lucro, até mesmo alimentando projetos prejudiciais, levantando questões sobre a sustentabilidade do compartilhamento de conhecimento. Este artigo explora soluções além de licenças restritivas, defendendo modelos colaborativos justos como o Wikimedia Enterprise e os sinais de preferência do Creative Commons. A negociação coletiva pode garantir que empresas de IA compensem justamente os custos de infraestrutura, forneçam atribuição e reinvistam no bem comum, cumprindo a visão de acesso universal ao conhecimento.

Estudantes do MIT superam bibliotecas HPC de última geração com centenas de linhas de código

2025-03-16
Estudantes do MIT superam bibliotecas HPC de última geração com centenas de linhas de código

Pesquisadores do CSAIL do MIT desenvolveram o Exo 2, uma nova linguagem de programação que permite que programadores escrevam 'escalonamentos' controlando explicitamente como o compilador gera código, levando a um desempenho significativamente melhorado. Ao contrário das linguagens existentes de escalonamento pelo usuário (USLs), o Exo 2 permite que os usuários definam novas operações de escalonamento externamente ao compilador, criando bibliotecas de escalonamento reutilizáveis. Isso permite que os engenheiros alcancem desempenho comparável ou superior ao das bibliotecas HPC de última geração com código drasticamente reduzido, revolucionando a eficiência em aplicativos de IA e aprendizado de máquina.

IA

Avaliando o Risco de Sequestro de Agentes de IA: Testes Adversariais Revelam Vulnerabilidades

2025-03-16
Avaliando o Risco de Sequestro de Agentes de IA: Testes Adversariais Revelam Vulnerabilidades

O Instituto de Segurança de IA dos EUA (US AISI) avaliou o risco de sequestro de agentes de IA usando a estrutura AgentDojo, testando o modelo Claude 3.5 Sonnet da Anthropic. As descobertas-chave destacam a necessidade de melhoria contínua das estruturas de avaliação, avaliações adaptativas para levar em conta os métodos de ataque em evolução e a importância da análise das taxas de sucesso de ataque específicas de cada tarefa. O estudo introduziu novos cenários de ataque, como execução remota de código, exfiltração de banco de dados e phishing automatizado, demonstrando sua eficácia em diferentes ambientes. Esta pesquisa destaca a necessidade de melhorias iterativas nas estruturas de avaliação de segurança de IA para lidar com a ameaça em constante evolução de sequestro de agentes de IA.

Quant da Jane Street: De Competições de Matemática a Trading Impulsionado por IA

2025-03-16
Quant da Jane Street: De Competições de Matemática a Trading Impulsionado por IA

In Young Cho, uma trader quantitativa da Jane Street, compartilha seu caminho de carreira não convencional, de pré-medicina para trading quantitativo. Ela relata suas experiências de estágio e trabalho na Jane Street, incluindo o uso de linguagens de programação como OCaml e VBA para trading e desenvolvimento, e anedotas engraçadas sobre a interação com corretores. O episódio mergulha na pesquisa de trading da Jane Street, de modelos lineares simples a redes neurais profundas complexas, e como eles utilizam aprendizado de máquina em ambientes de baixo volume de dados, alto ruído e sujeitos a mudanças frequentes de regime. In Young Cho detalha as quatro etapas de seu processo de pesquisa: exploração, coleta de dados, modelagem e produção, e discute a tensão entre ferramentas de pesquisa flexíveis e sistemas de produção robustos. Finalmente, ela oferece um vislumbre das direções futuras da pesquisa de aprendizado de máquina da Jane Street, incluindo a expansão para mais classes de ativos e modalidades de dados, e o uso de IA para melhorar a eficiência do trader.

IA

Parahelp: Criando colegas de IA que substituem agentes de suporte humano

2025-03-15
Parahelp: Criando colegas de IA que substituem agentes de suporte humano

A Parahelp está construindo um agente de suporte com tecnologia de IA para empresas de software. Seu agente usa a infraestrutura existente (Slack, Stripe, etc.) para resolver tickets de suporte de ponta a ponta, com o objetivo de substituir completamente os agentes de suporte humano. Eles acreditam que o contexto, e não a inteligência, será o gargalo para os futuros colegas de IA. Lançada em agosto de 2024, a Parahelp é apoiada pela Y Combinator e investidores de renome, e já trabalha com empresas líderes como Perplexity e Framer.

IA Suporte

Clínica Mayo resolve o problema de alucinação de LLM com RAG reverso

2025-03-15
Clínica Mayo resolve o problema de alucinação de LLM com RAG reverso

Os grandes modelos de linguagem (LLMs) sofrem de 'alucinações' - gerando informações imprecisas - um problema particularmente perigoso na área da saúde. A Clínica Mayo abordou isso com uma nova técnica de 'RAG reverso'. Ao vincular informações extraídas à sua fonte original, esse método eliminou quase todas as alucinações baseadas na recuperação de dados, permitindo a implantação do modelo em toda a sua prática clínica. A técnica combina o algoritmo CURE e bancos de dados vetoriais, garantindo a rastreabilidade de cada ponto de dados à sua origem. Isso aumenta a confiabilidade e a credibilidade do modelo, reduzindo significativamente a carga de trabalho dos médicos e abrindo novas possibilidades para a medicina personalizada.

Optifye: Startup de IA para Otimização de Fábrica Contrata Equipe de Fundação

2025-03-15
Optifye: Startup de IA para Otimização de Fábrica Contrata Equipe de Fundação

A Optifye, um sistema de monitoramento de desempenho de IA para fábricas, usa visão computacional para identificar e corrigir ineficiências em tempo real. Tendo implantado com sucesso seu sistema em fabricantes líderes nos setores de vestuário, automobilístico, médico e bens de consumo de massa em três continentes, alcançando um aumento de produtividade de 12%, agora está crescendo rapidamente após se formar no YC W25. Seu objetivo ambicioso é implantar seu sistema em 100 linhas de produção nos próximos 4 meses. Eles estão procurando engenheiros experientes com profunda experiência em otimização de GPU/CPU/memória, dimensionamento de aplicativos de CV em produção, implantações em nuvem em contêineres (AWS preferencial) e uma força implacável para resolver problemas complexos. Esta é uma oportunidade de alta pressão e alta recompensa para talentos de alto nível.

Douglas Hofstadter critica duramente o texto 'Por que escrevi GEB?' gerado pelo GPT-4 e expressa preocupações sobre LLMs

2025-03-15
Douglas Hofstadter critica duramente o texto 'Por que escrevi GEB?' gerado pelo GPT-4 e expressa preocupações sobre LLMs

Douglas Hofstadter, pioneiro em IA, critica veementemente um texto gerado pelo GPT-4, intitulado 'Por que escrevi GEB?', que supostamente resume sua obra seminal, Gödel, Escher, Bach. Ele argumenta que o texto está repleto de lugares-comuns genéricos, deturpando drasticamente seu estilo de escrita e a gênese do livro. Hofstadter destaca a falta de originalidade da LLM e sua fabricação de uma narrativa falsa. Ele detalha o processo criativo real por trás de GEB, desde seu fascínio inicial pelo teorema da incompletude de Gödel até a integração de Escher e Bach, revelando as inspirações e lutas genuínas. Ele expressa preocupações sérias sobre a proliferação de LLMs e seu potencial para inundar o mundo com inverdades, instando a uma avaliação crítica de seus perigos inerentes.

IA
1 2 5 6 7 9 11 12 13 28 29