Aprimorando o Fine-tuning de LLMs por meio da Curadoria Iterativa de Dados

2025-08-08
Aprimorando o Fine-tuning de LLMs por meio da Curadoria Iterativa de Dados

Pesquisadores melhoraram significativamente o desempenho de modelos de linguagem grandes (LLMs) por meio da curadoria iterativa de seus dados de treinamento. Os experimentos envolveram dois LLMs de tamanhos diferentes (Gemini Nano-1 e Nano-2) em tarefas de diferentes complexidades, usando ~100.000 anotações de crowdsourcing, inicialmente sofrendo de um desequilíbrio severo de classes (95% benignas). Por meio da curadoria iterativa de especialistas e ajuste fino do modelo, o desempenho aumentou substancialmente. Os modelos atingiram aproximadamente 40% de exemplos positivos e um Kappa de Cohen de ~0,81 (complexidade inferior) e ~0,78 (complexidade superior), aproximando-se do desempenho de nível de especialista, destacando o papel crucial de dados de alta qualidade no treinamento de LLM.

Leia mais

Alerta de terremoto: o equilíbrio entre velocidade e precisão na estimativa de magnitude

2025-07-23
Alerta de terremoto: o equilíbrio entre velocidade e precisão na estimativa de magnitude

Um grande desafio nos sistemas de alerta precoce de terremotos (EEW) é a estimativa em tempo real da magnitude do terremoto. A magnitude determina a extensão da trepidação e quem precisa de alerta. Subestimar o risco leva a avisos perdidos, enquanto superestimar resulta em falsos alarmes e erosão da confiança pública. O desafio chave está em equilibrar velocidade e precisão; os dados iniciais são limitados, mas atrasar os alertas reduz o tempo de aviso. Nos últimos três anos, melhoramos significativamente a estimativa de magnitude, reduzindo o erro absoluto mediano de 0,50 para 0,25. Nossa precisão agora rivaliza, e em alguns casos supera, as redes sísmicas estabelecidas.

Leia mais

MUVERA: Recuperação Multi-Vetor Eficiente

2025-06-26
MUVERA: Recuperação Multi-Vetor Eficiente

A recuperação de informações moderna depende de modelos de embedding neural, mas embora os modelos multi-vetor ofereçam maior precisão, sua complexidade computacional leva à ineficiência. Os pesquisadores apresentam MUVERA, um novo algoritmo que transforma a recuperação multi-vetor complexa em uma pesquisa de produto interno máximo de vetor único (MIPS) mais simples, construindo codificações dimensionais fixas (FDEs). Isso melhora significativamente a eficiência sem sacrificar a precisão. A implementação de código aberto está disponível no GitHub.

Leia mais

Veo 3ª Geração: Generalizando a Geração de Vídeos

2025-05-16
Veo 3ª Geração: Generalizando a Geração de Vídeos

O último avanço do Google em geração de vídeo, Veo, agora possui uma terceira geração capaz de generalizar em diversas tarefas. Treinado em milhões de ativos sintéticos 3D de alta qualidade, o Veo se destaca na síntese de novas visualizações, transformando imagens de produtos em vídeos 360° consistentes. É importante destacar que essa abordagem se generaliza efetivamente em móveis, roupas, eletrônicos e muito mais, capturando com precisão interações complexas de iluminação e material — uma melhoria significativa em relação às gerações anteriores.

Leia mais
IA

Google aumenta a produtividade de desenvolvedores com preenchimento de código semântico híbrido de ML

2025-05-15
Google aumenta a produtividade de desenvolvedores com preenchimento de código semântico híbrido de ML

Pesquisadores do Google desenvolveram um novo sistema de preenchimento de código semântico híbrido baseado em Transformer que combina aprendizado de máquina (ML) e mecanismos semânticos baseados em regras (SEs) para melhorar significativamente a produtividade do desenvolvedor. O sistema integra ML e SEs de três maneiras: 1) reordenando sugestões de token único do SE usando ML; 2) aplicando preenchimentos de linha única e múltipla usando ML e verificando a correção com o SE; e 3) usando continuação de linha única e múltipla por ML de sugestões semânticas de token único. Um estudo de três meses com mais de 10.000 desenvolvedores internos do Google mostrou uma redução de 6% no tempo de iteração de codificação com preenchimento de ML de linha única. Atualmente, mais de 3% do novo código é gerado pela aceitação de sugestões de preenchimento de ML. O sistema suporta oito linguagens de programação e incorpora verificações semânticas para garantir a correção do código, aumentando significativamente a confiança e a eficiência do desenvolvedor.

Leia mais
Desenvolvimento

Embeddings do Whisper se alinham surpreendentemente com a atividade cerebral humana durante a fala

2025-03-26
Embeddings do Whisper se alinham surpreendentemente com a atividade cerebral humana durante a fala

Um estudo revela uma surpreendente alinhamento entre o modelo de reconhecimento de fala Whisper da OpenAI e a atividade neural no cérebro humano durante conversas naturais. Ao comparar as embeddings do Whisper com a atividade cerebral em regiões como o giro frontal inferior (IFG) e o giro temporal superior (STG), os pesquisadores descobriram que as embeddings de linguagem atingiram o pico antes das embeddings de fala durante a produção da fala, e vice-versa durante a compreensão. Isso sugere que o Whisper, apesar de não ter sido projetado com mecanismos cerebrais em mente, captura aspectos importantes do processamento da linguagem. As descobertas também destacam uma 'hierarquia suave' no processamento da linguagem cerebral: áreas de ordem superior, como o IFG, priorizam informações semânticas e sintáticas, mas também processam recursos auditivos de baixo nível, enquanto áreas de ordem inferior, como o STG, priorizam o processamento acústico e fonêmico, mas também capturam informações em nível de palavra.

Leia mais
IA

Pesquisa inovadora: A equipe por trás do sucesso

2025-03-03
Pesquisa inovadora: A equipe por trás do sucesso

Este artigo é o resultado de uma estreita colaboração com Asaf Aharoni, Avinatan Hassidim e Danny Vainstein. A equipe também estende sua gratidão a dezenas de indivíduos do Google Research, Google DeepMind e Google Search, incluindo YaGuang Li e Blake Hechtman, por suas revisões, discussões perspicazes, feedback valioso e suporte. Suas contribuições foram cruciais para a conclusão desta pesquisa.

Leia mais
IA

Avanço da IA do Google: Uma lista de agradecimentos revela um esforço de equipe gigante

2025-02-19
Avanço da IA do Google: Uma lista de agradecimentos revela um esforço de equipe gigante

Os agradecimentos deste artigo revelam um esforço colaborativo massivo envolvendo numerosos pesquisadores do Google Research, Google DeepMind e Google Cloud AI, juntamente com colaboradores da Fleming Initiative, Imperial College London, Houston Methodist Hospital, Sequome e Stanford University. A extensa lista destaca a natureza colaborativa da pesquisa e agradece a muitos cientistas que forneceram feedback técnico e especializado, bem como inúmeras equipes internas do Google que forneceram suporte em produtos, engenharia e gerenciamento. O tamanho da lista de agradecimentos sublinha o esforço de equipe massivo por trás de projetos de IA em grande escala.

Leia mais

Chocante! Quase todas as buscas binárias e ordenações por intercalação estão quebradas

2025-01-11
Chocante! Quase todas as buscas binárias e ordenações por intercalação estão quebradas

O engenheiro de software do Google, Joshua Bloch, revelou um bug de quase duas décadas escondido em algoritmos de busca binária, encontrado tanto no JDK quanto em 'Programming Pearls' de Jon Bentley! O bug origina-se da linha `int mid = (low + high) / 2;`, causando estouro de inteiro e exceções de índice de array fora dos limites quando a soma de `low` e `high` excede o valor máximo de inteiro positivo. Esse bug só se manifesta com conjuntos de dados massivos, tornando-o particularmente perigoso na era dos big data. O artigo explora várias correções e enfatiza que bugs podem persistir mesmo com testes e provas rigorosos, incentivando os programadores a permanecerem cautelosos e humildes.

Leia mais

Google expande a avaliação do potencial solar global usando imagens de satélite e aprendizado de máquina

2024-12-19
Google expande a avaliação do potencial solar global usando imagens de satélite e aprendizado de máquina

Pesquisadores do Google expandiram a cobertura da API Solar do Google Maps Platform no Sul Global aplicando modelos de aprendizado de máquina a imagens de satélite para gerar modelos de superfície digital de alta resolução e mapas de segmentação de telhados. Essa inovação supera as limitações dos métodos tradicionais de aquisição e processamento de dados, fornecendo dados de avaliação do potencial solar para 1,25 bilhão de edifícios em todo o mundo e acelerando a adoção de energia renovável globalmente. O projeto utiliza dados de satélite para aumentar a frequência de atualização de dados e reduzir custos, o que é particularmente benéfico em regiões com escassez de dados.

Leia mais