Aprendizado por Reforço: Impulsionando a Ascensão da IA Agencial em 2025

2025-06-28
Aprendizado por Reforço: Impulsionando a Ascensão da IA Agencial em 2025

Tentativas iniciais de agentes de IA como BabyAGI e AutoGPT em 2023, embora inicialmente divulgadas, falharam devido à dificuldade dos grandes modelos de linguagem (LLMs) em lidar com raciocínio de múltiplas etapas. No entanto, em meados de 2024, houve uma reviravolta. Avanços no aprendizado por reforço permitiram uma nova geração de agentes de IA capazes de concluir consistentemente tarefas complexas de múltiplas etapas, exemplificadas por ferramentas de geração de código como Bolt.new e o Claude 3.5 Sonnet da Anthropic. O aprendizado por reforço, por meio do treinamento de tentativa e erro, supera o problema de erros compostos inerente ao aprendizado por imitação, permitindo que os modelos permaneçam robustos mesmo com dados não vistos. Técnicas como RLHF da OpenAI e IA Constitucional da Anthropic automatizam o feedback, aumentando ainda mais a eficiência do aprendizado por reforço. O modelo R1 da DeepSeek mostrou o notável potencial de modelos "autodidatas" de raciocínio por meio do aprendizado por reforço. Em resumo, os avanços no aprendizado por reforço são o principal motor por trás do aumento da IA ​​agencial em 2025.

Leia mais
IA

Modelo Llama 3.1 do Meta memoriza partes significativas de livros protegidos por direitos autorais

2025-06-15
Modelo Llama 3.1 do Meta memoriza partes significativas de livros protegidos por direitos autorais

Uma nova pesquisa revela que o modelo de linguagem grande Llama 3.1 70B do Meta memorizou surpreendentemente grandes partes de livros protegidos por direitos autorais, memorizando 42% de Harry Potter e a Pedra Filosofal. Isso é significativamente maior do que seu predecessor, Llama 1 65B, levantando sérias preocupações sobre direitos autorais. Os pesquisadores avaliaram de forma eficiente a 'memorização' do modelo calculando a probabilidade de gerar sequências de texto específicas, em vez de gerar um grande volume de texto. Essa descoberta pode impactar significativamente os processos judiciais sobre direitos autorais contra o Meta e pode levar os tribunais a revisitar os limites do uso justo no treinamento de modelos de IA. Embora o modelo tenha memorizado menos livros obscuros, a memorização excessiva de livros populares destaca os desafios dos modelos de linguagem grandes em relação a questões de direitos autorais.

Leia mais
IA

O Hype da IA na Ciência: A Desilusão de um Físico

2025-05-20
O Hype da IA na Ciência: A Desilusão de um Físico

Nick McGreivy, um físico com doutorado em Princeton, compartilha sua experiência ao aplicar IA à pesquisa em física. Inicialmente otimista sobre o potencial da IA para acelerar a pesquisa, ele descobriu que os métodos de IA tinham um desempenho muito inferior ao anunciado. Muitos artigos exageraram as vantagens da IA, com problemas como vazamento de dados sendo prevalentes. Ele argumenta que o rápido crescimento da IA na ciência decorre mais dos benefícios para os cientistas (salários mais altos, prestígio) do que de melhorias genuínas na eficiência da pesquisa. Ele pede métodos de avaliação de IA mais rigorosos e alerta contra vieses otimistas na pesquisa de IA.

Leia mais

Análise de Acidentes de Veículos Autônomos da Waymo: Os Humanos São os Verdadeiros Culpados?

2025-03-26
Análise de Acidentes de Veículos Autônomos da Waymo: Os Humanos São os Verdadeiros Culpados?

Este artigo analisa 38 acidentes graves envolvendo carros autônomos da Waymo entre julho de 2024 e fevereiro de 2025. Surpreendentemente, a grande maioria desses acidentes não foi causada pelos próprios veículos da Waymo, mas sim por outros veículos dirigindo imprudentemente, como excesso de velocidade e avanço de sinal vermelho. Os dados da Waymo mostram que seus veículos autônomos têm uma taxa de acidentes muito menor do que os motoristas humanos. Mesmo que todos os acidentes fossem atribuídos à Waymo, seu histórico de segurança ainda é significativamente melhor do que o de motoristas humanos. Em comparação com a direção humana, a Waymo fez progressos significativos na redução de acidentes, especialmente aqueles que resultam em ferimentos.

Leia mais
IA