Webtagr - Sumário de Notícias de Tecnologia

Agradecimentos da equipe LearnLM: As mentes por trás do modelo

2025-09-19

A equipe Google Research LearnLM publicou uma postagem de agradecimentos, expressando gratidão a todos que contribuíram para seu trabalho. A postagem lista vários colaboradores, desde pesquisadores até patrocinadores executivos, destacando a natureza colaborativa do sucesso do projeto. O progresso alcançado no LearnLM é um testemunho do esforço coletivo desses indivíduos.

Leia mais

(research.google)

IA

Projeto Gemma: Agradecimentos e Contribuições da Equipe

2025-09-12

O sucesso do projeto Gemma é resultado do trabalho colaborativo das equipes Gemma e Google Privacidade. Agradecimentos especiais a Peter Kairouz, Brendan McMahan e Dan Ramage pelo feedback no post do blog; a Mark Simborg e Kimberly Schwede pela ajuda com as visualizações; e às equipes do Google que ajudaram no design do algoritmo, na implementação da infraestrutura e na manutenção da produção. A publicação também lista 20 indivíduos que contribuíram diretamente para o trabalho.

Leia mais

(research.google)

Tecnologia Projeto Gemma Privacidade Google

Aprimorando o Fine-tuning de LLMs por meio da Curadoria Iterativa de Dados

2025-08-08

Pesquisadores melhoraram significativamente o desempenho de modelos de linguagem grandes (LLMs) por meio da curadoria iterativa de seus dados de treinamento. Os experimentos envolveram dois LLMs de tamanhos diferentes (Gemini Nano-1 e Nano-2) em tarefas de diferentes complexidades, usando ~100.000 anotações de crowdsourcing, inicialmente sofrendo de um desequilíbrio severo de classes (95% benignas). Por meio da curadoria iterativa de especialistas e ajuste fino do modelo, o desempenho aumentou substancialmente. Os modelos atingiram aproximadamente 40% de exemplos positivos e um Kappa de Cohen de ~0,81 (complexidade inferior) e ~0,78 (complexidade superior), aproximando-se do desempenho de nível de especialista, destacando o papel crucial de dados de alta qualidade no treinamento de LLM.

Leia mais

(research.google)

IA Curadoria de Dados Ajuste Fino do Modelo

Alerta de terremoto: o equilíbrio entre velocidade e precisão na estimativa de magnitude

2025-07-23

Um grande desafio nos sistemas de alerta precoce de terremotos (EEW) é a estimativa em tempo real da magnitude do terremoto. A magnitude determina a extensão da trepidação e quem precisa de alerta. Subestimar o risco leva a avisos perdidos, enquanto superestimar resulta em falsos alarmes e erosão da confiança pública. O desafio chave está em equilibrar velocidade e precisão; os dados iniciais são limitados, mas atrasar os alertas reduz o tempo de aviso. Nos últimos três anos, melhoramos significativamente a estimativa de magnitude, reduzindo o erro absoluto mediano de 0,50 para 0,25. Nossa precisão agora rivaliza, e em alguns casos supera, as redes sísmicas estabelecidas.

Leia mais

(research.google)

Tecnologia Estimativa de magnitude Monitoramento em tempo real

MUVERA: Recuperação Multi-Vetor Eficiente

2025-06-26

A recuperação de informações moderna depende de modelos de embedding neural, mas embora os modelos multi-vetor ofereçam maior precisão, sua complexidade computacional leva à ineficiência. Os pesquisadores apresentam MUVERA, um novo algoritmo que transforma a recuperação multi-vetor complexa em uma pesquisa de produto interno máximo de vetor único (MIPS) mais simples, construindo codificações dimensionais fixas (FDEs). Isso melhora significativamente a eficiência sem sacrificar a precisão. A implementação de código aberto está disponível no GitHub.

Leia mais

(research.google)

IA recuperação multi-vetor

Veo 3ª Geração: Generalizando a Geração de Vídeos

2025-05-16

O último avanço do Google em geração de vídeo, Veo, agora possui uma terceira geração capaz de generalizar em diversas tarefas. Treinado em milhões de ativos sintéticos 3D de alta qualidade, o Veo se destaca na síntese de novas visualizações, transformando imagens de produtos em vídeos 360° consistentes. É importante destacar que essa abordagem se generaliza efetivamente em móveis, roupas, eletrônicos e muito mais, capturando com precisão interações complexas de iluminação e material — uma melhoria significativa em relação às gerações anteriores.

Leia mais

(research.google)

IA

Google aumenta a produtividade de desenvolvedores com preenchimento de código semântico híbrido de ML

2025-05-15

Pesquisadores do Google desenvolveram um novo sistema de preenchimento de código semântico híbrido baseado em Transformer que combina aprendizado de máquina (ML) e mecanismos semânticos baseados em regras (SEs) para melhorar significativamente a produtividade do desenvolvedor. O sistema integra ML e SEs de três maneiras: 1) reordenando sugestões de token único do SE usando ML; 2) aplicando preenchimentos de linha única e múltipla usando ML e verificando a correção com o SE; e 3) usando continuação de linha única e múltipla por ML de sugestões semânticas de token único. Um estudo de três meses com mais de 10.000 desenvolvedores internos do Google mostrou uma redução de 6% no tempo de iteração de codificação com preenchimento de ML de linha única. Atualmente, mais de 3% do novo código é gerado pela aceitação de sugestões de preenchimento de ML. O sistema suporta oito linguagens de programação e incorpora verificações semânticas para garantir a correção do código, aumentando significativamente a confiança e a eficiência do desenvolvedor.

Leia mais

(research.google)

Desenvolvimento

Embeddings do Whisper se alinham surpreendentemente com a atividade cerebral humana durante a fala

2025-03-26

Um estudo revela uma surpreendente alinhamento entre o modelo de reconhecimento de fala Whisper da OpenAI e a atividade neural no cérebro humano durante conversas naturais. Ao comparar as embeddings do Whisper com a atividade cerebral em regiões como o giro frontal inferior (IFG) e o giro temporal superior (STG), os pesquisadores descobriram que as embeddings de linguagem atingiram o pico antes das embeddings de fala durante a produção da fala, e vice-versa durante a compreensão. Isso sugere que o Whisper, apesar de não ter sido projetado com mecanismos cerebrais em mente, captura aspectos importantes do processamento da linguagem. As descobertas também destacam uma 'hierarquia suave' no processamento da linguagem cerebral: áreas de ordem superior, como o IFG, priorizam informações semânticas e sintáticas, mas também processam recursos auditivos de baixo nível, enquanto áreas de ordem inferior, como o STG, priorizam o processamento acústico e fonêmico, mas também capturam informações em nível de palavra.

Leia mais

(research.google)

IA

Pesquisa inovadora: A equipe por trás do sucesso

2025-03-03

Este artigo é o resultado de uma estreita colaboração com Asaf Aharoni, Avinatan Hassidim e Danny Vainstein. A equipe também estende sua gratidão a dezenas de indivíduos do Google Research, Google DeepMind e Google Search, incluindo YaGuang Li e Blake Hechtman, por suas revisões, discussões perspicazes, feedback valioso e suporte. Suas contribuições foram cruciais para a conclusão desta pesquisa.

Leia mais

(research.google)

IA

Avanço da IA do Google: Uma lista de agradecimentos revela um esforço de equipe gigante

2025-02-19

Os agradecimentos deste artigo revelam um esforço colaborativo massivo envolvendo numerosos pesquisadores do Google Research, Google DeepMind e Google Cloud AI, juntamente com colaboradores da Fleming Initiative, Imperial College London, Houston Methodist Hospital, Sequome e Stanford University. A extensa lista destaca a natureza colaborativa da pesquisa e agradece a muitos cientistas que forneceram feedback técnico e especializado, bem como inúmeras equipes internas do Google que forneceram suporte em produtos, engenharia e gerenciamento. O tamanho da lista de agradecimentos sublinha o esforço de equipe massivo por trás de projetos de IA em grande escala.

Leia mais

(research.google)

IA pesquisa em IA IA do Google

Chocante! Quase todas as buscas binárias e ordenações por intercalação estão quebradas

2025-01-11

O engenheiro de software do Google, Joshua Bloch, revelou um bug de quase duas décadas escondido em algoritmos de busca binária, encontrado tanto no JDK quanto em 'Programming Pearls' de Jon Bentley! O bug origina-se da linha `int mid = (low + high) / 2;`, causando estouro de inteiro e exceções de índice de array fora dos limites quando a soma de `low` e `high` excede o valor máximo de inteiro positivo. Esse bug só se manifesta com conjuntos de dados massivos, tornando-o particularmente perigoso na era dos big data. O artigo explora várias correções e enfatiza que bugs podem persistir mesmo com testes e provas rigorosos, incentivando os programadores a permanecerem cautelosos e humildes.

Leia mais

(research.google)

Desenvolvimento bug de algoritmo busca binária ordenação por intercalação

Google expande a avaliação do potencial solar global usando imagens de satélite e aprendizado de máquina

2024-12-19

Pesquisadores do Google expandiram a cobertura da API Solar do Google Maps Platform no Sul Global aplicando modelos de aprendizado de máquina a imagens de satélite para gerar modelos de superfície digital de alta resolução e mapas de segmentação de telhados. Essa inovação supera as limitações dos métodos tradicionais de aquisição e processamento de dados, fornecendo dados de avaliação do potencial solar para 1,25 bilhão de edifícios em todo o mundo e acelerando a adoção de energia renovável globalmente. O projeto utiliza dados de satélite para aumentar a frequência de atualização de dados e reduzir custos, o que é particularmente benéfico em regiões com escassez de dados.

Leia mais

(research.google)

Tecnologia energia solar imagens de satélite