Danksagung des LearnLM-Teams: Die Köpfe hinter dem Modell

2025-09-19
Danksagung des LearnLM-Teams: Die Köpfe hinter dem Modell

Das Google Research LearnLM-Team hat einen Dankesbeitrag veröffentlicht und seine Dankbarkeit gegenüber allen Beteiligten ausgedrückt. Der Beitrag listet zahlreiche Mitwirkende auf, von Forschern bis hin zu Führungskräften, und unterstreicht den kollaborativen Charakter des Projekterfolgs. Der Fortschritt bei LearnLM ist ein Beweis für die gemeinsame Anstrengung dieser Personen.

Mehr lesen
KI

Gemma-Projekt: Danksagung und Teambeiträge

2025-09-12
Gemma-Projekt: Danksagung und Teambeiträge

Der Erfolg des Gemma-Projekts ist der gemeinsamen Arbeit der Gemma- und Google-Datenschutzteams zu verdanken. Besonderer Dank gilt Peter Kairouz, Brendan McMahan und Dan Ramage für das Feedback zum Blogbeitrag, Mark Simborg und Kimberly Schwede für die Unterstützung bei der Visualisierung sowie den Google-Teams für Algorithmusdesign, Infrastruktur-Implementierung und Produktionswartung. Der Beitrag listet außerdem 20 Personen auf, die direkt zu der Arbeit beigetragen haben.

Mehr lesen

Verbesserung des Fein-Tunings von LLMs durch iterative Datenkuratierung

2025-08-08
Verbesserung des Fein-Tunings von LLMs durch iterative Datenkuratierung

Forscher haben die Leistung großer Sprachmodelle (LLMs) durch iterative Kuratierung ihrer Trainingsdaten deutlich verbessert. Experimente umfassten zwei LLMs unterschiedlicher Größe (Gemini Nano-1 und Nano-2) bei Aufgaben unterschiedlicher Komplexität, wobei ca. 100.000 Crowd-Annotationen verwendet wurden, die anfänglich unter einem starken Klassenungleichgewicht litten (95% gutartig). Durch iterative Expertenkuratierung und Modell-Feintuning stieg die Leistung deutlich an. Die Modelle erreichten etwa 40% positive Beispiele und einen Cohen's Kappa von ca. 0,81 (geringere Komplexität) und 0,78 (höhere Komplexität) und näherten sich so der Expertenleistung an. Dies unterstreicht die entscheidende Rolle hochwertiger Daten beim Training von LLMs.

Mehr lesen

Erdbebenfrühwarnung: Der Kompromiss zwischen Geschwindigkeit und Genauigkeit bei der Magnitudenschätzung

2025-07-23
Erdbebenfrühwarnung: Der Kompromiss zwischen Geschwindigkeit und Genauigkeit bei der Magnitudenschätzung

Eine große Herausforderung bei Erdbebenfrühwarnsystemen (EEW) ist die Echtzeit-Schätzung der Erdbebenmagnitude. Die Magnitude bestimmt das Ausmaß der Erschütterungen und wer gewarnt werden muss. Unterschätzung führt zu verpassten Warnungen, während Überschätzung zu Fehlalarmen und dem Verlust des öffentlichen Vertrauens führt. Die größte Herausforderung liegt im Ausgleich zwischen Geschwindigkeit und Genauigkeit; die anfänglichen Daten sind begrenzt, aber die Verzögerung von Warnungen verkürzt die Warnzeit. In den letzten drei Jahren haben wir die Magnitudenschätzung deutlich verbessert und den medianen absoluten Fehler von 0,50 auf 0,25 reduziert. Unsere Genauigkeit konkurriert jetzt mit und übertrifft in einigen Fällen etablierte seismische Netze.

Mehr lesen

MUVERA: Effiziente Multi-Vektor-Suche

2025-06-26
MUVERA: Effiziente Multi-Vektor-Suche

Moderne Informationsretriever verlassen sich auf neuronale Einbettungsmodelle, aber während Multi-Vektor-Modelle eine höhere Genauigkeit bieten, führt ihre Rechenkomplexität zu Ineffizienz. Forscher stellen MUVERA vor, einen neuen Algorithmus, der die komplexe Multi-Vektor-Suche in eine einfachere Suche nach dem maximalen inneren Produkt eines einzelnen Vektors (MIPS) umwandelt, indem er festdimensionale Kodierungen (FDEs) erstellt. Dies verbessert die Effizienz erheblich, ohne die Genauigkeit zu beeinträchtigen. Die Open-Source-Implementierung ist auf GitHub verfügbar.

Mehr lesen

Veo Generation 3: Generalisierung der Videogenerierung

2025-05-16
Veo Generation 3: Generalisierung der Videogenerierung

Googles jüngster Durchbruch in der Videogenerierung, Veo, verfügt nun über eine dritte Generation, die sich auf verschiedene Aufgaben verallgemeinern lässt. Trainiert mit Millionen von hochwertigen synthetischen 3D-Assets, zeichnet sich Veo durch die Synthese neuer Ansichten aus und verwandelt Produktbilder in konsistente 360°-Videos. Wichtig ist, dass dieser Ansatz effektiv auf Möbel, Kleidung, Elektronik usw. verallgemeinert werden kann und komplexe Licht- und Materialwechselwirkungen präzise erfasst – eine deutliche Verbesserung gegenüber früheren Generationen.

Mehr lesen
KI

Google steigert die Entwicklerproduktivität mit hybrider semantischer ML-Code-Completion

2025-05-15
Google steigert die Entwicklerproduktivität mit hybrider semantischer ML-Code-Completion

Forscher von Google haben ein neuartiges, Transformer-basiertes, hybrides semantisches ML-Code-Completion-System entwickelt, das maschinelles Lernen (ML) und regelbasierte semantische Engines (SEs) kombiniert, um die Entwicklerproduktivität deutlich zu steigern. Das System integriert ML und SEs auf drei Arten: 1) Neureihenfolge von SE-Einzeltoken-Vorschlägen mithilfe von ML; 2) Anwendung von Einzel- und Mehrzeilen-Vorschlägen mithilfe von ML und Überprüfung der Korrektheit mit SE; und 3) Verwendung von Einzel- und Mehrzeilen-Fortsetzungen durch ML von Einzeltoken-semantischen Vorschlägen. Eine dreimonatige Studie mit über 10.000 internen Google-Entwicklern zeigte eine 6%ige Reduzierung der Codierungsiterationszeit bei Einzelzeilen-ML-Vorschlägen. Derzeit werden über 3% des neuen Codes durch die Annahme von ML-Completion-Vorschlägen generiert. Das System unterstützt acht Programmiersprachen und beinhaltet semantische Prüfungen, um die Korrektheit des Codes zu gewährleisten, was das Vertrauen und die Effizienz der Entwickler deutlich steigert.

Mehr lesen
Entwicklung

Whisper-Einbettungen stimmen überraschend mit der menschlichen Gehirnaktivität während des Sprechens überein

2025-03-26
Whisper-Einbettungen stimmen überraschend mit der menschlichen Gehirnaktivität während des Sprechens überein

Eine Studie zeigt eine überraschende Übereinstimmung zwischen OpenAIs Whisper-Spracherkennungsmodell und der neuronalen Aktivität im menschlichen Gehirn während natürlicher Gespräche. Durch den Vergleich der Whisper-Einbettungen mit der Gehirnaktivität in Regionen wie dem inferioren frontalen Gyrus (IFG) und dem superioren temporalen Gyrus (STG) stellten die Forscher fest, dass die Spracheinbettungen während der Sprachproduktion vor den Spracheinbettungen ihren Höhepunkt erreichten und umgekehrt während des Sprachverständnisses. Dies deutet darauf hin, dass Whisper, obwohl es nicht unter Berücksichtigung von Gehirnmechanismen entwickelt wurde, wichtige Aspekte der Sprachverarbeitung erfasst. Die Ergebnisse heben auch eine „weiche Hierarchie“ in der Verarbeitung von Sprache im Gehirn hervor: höherwertige Bereiche wie der IFG priorisieren semantische und syntaktische Informationen, verarbeiten aber auch niederwertige Hörmerkmale, während niederwertige Bereiche wie der STG akustische und phonetische Verarbeitung priorisieren, aber auch Informationen auf Wortebene erfassen.

Mehr lesen
KI

Bahnbrechende Forschung: Das Team hinter dem Erfolg

2025-03-03
Bahnbrechende Forschung: Das Team hinter dem Erfolg

Dieser Artikel ist das Ergebnis einer engen Zusammenarbeit mit Asaf Aharoni, Avinatan Hassidim und Danny Vainstein. Das Team bedankt sich auch bei Dutzenden von Personen von Google Research, Google DeepMind und Google Search, darunter YaGuang Li und Blake Hechtman, für ihre Überprüfungen, aufschlussreichen Diskussionen, wertvolles Feedback und Unterstützung. Ihre Beiträge waren entscheidend für den Abschluss dieser Forschung.

Mehr lesen
KI

Google KI-Durchbruch: Eine riesige Teamleistung in den Danksagungen enthüllt

2025-02-19
Google KI-Durchbruch: Eine riesige Teamleistung in den Danksagungen enthüllt

Die Danksagungen in diesem Artikel zeigen eine massive, gemeinschaftliche Anstrengung, an der zahlreiche Forscher von Google Research, Google DeepMind und Google Cloud AI sowie Mitarbeiter von Fleming Initiative, Imperial College London, Houston Methodist Hospital, Sequome und Stanford University beteiligt waren. Die umfangreiche Liste unterstreicht den kollaborativen Charakter der Forschung und dankt vielen Wissenschaftlern, die technisches und fachkundiges Feedback gegeben haben, sowie zahlreichen internen Google-Teams, die Unterstützung in den Bereichen Produkt, Engineering und Management geleistet haben. Die schiere Länge der Danksagungen unterstreicht den enormen Teamaufwand hinter großen KI-Projekten.

Mehr lesen
KI

Schock! Fast alle binären Such- und Mergesorts sind fehlerhaft

2025-01-11
Schock! Fast alle binären Such- und Mergesorts sind fehlerhaft

Der Google-Softwareentwickler Joshua Bloch enthüllte einen fast zwei Jahrzehnte alten Bug, der in binären Suchalgorithmen lauert, sowohl im JDK als auch in Jon Bentleys "Programming Pearls"! Der Bug stammt von der Zeile `int mid = (low + high) / 2;`, die einen Integer-Überlauf und ArrayIndexOutOfBoundsException verursacht, wenn die Summe von `low` und `high` den maximalen positiven Integerwert überschreitet. Dieser Bug manifestiert sich nur bei riesigen Datensätzen und ist daher in der heutigen Big-Data-Welt besonders gefährlich. Der Artikel untersucht verschiedene Lösungsansätze und betont, dass Bugs auch bei gründlichen Tests und Beweisen bestehen bleiben können, und mahnt Programmierer zu Vorsicht und Bescheidenheit.

Mehr lesen

Google erweitert die Bewertung des globalen Solarpotenzials durch Satellitenbilder und maschinelles Lernen

2024-12-19
Google erweitert die Bewertung des globalen Solarpotenzials durch Satellitenbilder und maschinelles Lernen

Google-Forscher haben die Abdeckung der Google Maps Platform Solar API im globalen Süden erweitert, indem sie Machine-Learning-Modelle auf Satellitenbilder angewendet haben, um hochauflösende digitale Oberflächenmodelle und Dachsegmentierungs-Karten zu generieren. Diese Innovation überwindet die Grenzen traditioneller Methoden der Datenerfassung und -verarbeitung und liefert Daten zur Bewertung des Solarpotenzials für 1,25 Milliarden Gebäude weltweit, wodurch die weltweite Einführung erneuerbarer Energien beschleunigt wird. Das Projekt nutzt Satellitendaten, um die Häufigkeit von Datenaktualisierungen zu erhöhen und die Kosten zu senken, was besonders in datenarmen Regionen von Vorteil ist.

Mehr lesen