Webtagr - Technologienummer

Danksagung des LearnLM-Teams: Die Köpfe hinter dem Modell

2025-09-19

Das Google Research LearnLM-Team hat einen Dankesbeitrag veröffentlicht und seine Dankbarkeit gegenüber allen Beteiligten ausgedrückt. Der Beitrag listet zahlreiche Mitwirkende auf, von Forschern bis hin zu Führungskräften, und unterstreicht den kollaborativen Charakter des Projekterfolgs. Der Fortschritt bei LearnLM ist ein Beweis für die gemeinsame Anstrengung dieser Personen.

(research.google)

KI

Gemma-Projekt: Danksagung und Teambeiträge

2025-09-12

Der Erfolg des Gemma-Projekts ist der gemeinsamen Arbeit der Gemma- und Google-Datenschutzteams zu verdanken. Besonderer Dank gilt Peter Kairouz, Brendan McMahan und Dan Ramage für das Feedback zum Blogbeitrag, Mark Simborg und Kimberly Schwede für die Unterstützung bei der Visualisierung sowie den Google-Teams für Algorithmusdesign, Infrastruktur-Implementierung und Produktionswartung. Der Beitrag listet außerdem 20 Personen auf, die direkt zu der Arbeit beigetragen haben.

(research.google)

Technologie Gemma-Projekt Google Datenschutz

Verbesserung des Fein-Tunings von LLMs durch iterative Datenkuratierung

2025-08-08

Forscher haben die Leistung großer Sprachmodelle (LLMs) durch iterative Kuratierung ihrer Trainingsdaten deutlich verbessert. Experimente umfassten zwei LLMs unterschiedlicher Größe (Gemini Nano-1 und Nano-2) bei Aufgaben unterschiedlicher Komplexität, wobei ca. 100.000 Crowd-Annotationen verwendet wurden, die anfänglich unter einem starken Klassenungleichgewicht litten (95% gutartig). Durch iterative Expertenkuratierung und Modell-Feintuning stieg die Leistung deutlich an. Die Modelle erreichten etwa 40% positive Beispiele und einen Cohen's Kappa von ca. 0,81 (geringere Komplexität) und 0,78 (höhere Komplexität) und näherten sich so der Expertenleistung an. Dies unterstreicht die entscheidende Rolle hochwertiger Daten beim Training von LLMs.

(research.google)

KI Datenkuratierung

Erdbebenfrühwarnung: Der Kompromiss zwischen Geschwindigkeit und Genauigkeit bei der Magnitudenschätzung

2025-07-23

Eine große Herausforderung bei Erdbebenfrühwarnsystemen (EEW) ist die Echtzeit-Schätzung der Erdbebenmagnitude. Die Magnitude bestimmt das Ausmaß der Erschütterungen und wer gewarnt werden muss. Unterschätzung führt zu verpassten Warnungen, während Überschätzung zu Fehlalarmen und dem Verlust des öffentlichen Vertrauens führt. Die größte Herausforderung liegt im Ausgleich zwischen Geschwindigkeit und Genauigkeit; die anfänglichen Daten sind begrenzt, aber die Verzögerung von Warnungen verkürzt die Warnzeit. In den letzten drei Jahren haben wir die Magnitudenschätzung deutlich verbessert und den medianen absoluten Fehler von 0,50 auf 0,25 reduziert. Unsere Genauigkeit konkurriert jetzt mit und übertrifft in einigen Fällen etablierte seismische Netze.

(research.google)

Technologie Erdbebenfrühwarnung Magnitudenschätzung Echtzeitüberwachung

MUVERA: Effiziente Multi-Vektor-Suche

2025-06-26

Moderne Informationsretriever verlassen sich auf neuronale Einbettungsmodelle, aber während Multi-Vektor-Modelle eine höhere Genauigkeit bieten, führt ihre Rechenkomplexität zu Ineffizienz. Forscher stellen MUVERA vor, einen neuen Algorithmus, der die komplexe Multi-Vektor-Suche in eine einfachere Suche nach dem maximalen inneren Produkt eines einzelnen Vektors (MIPS) umwandelt, indem er festdimensionale Kodierungen (FDEs) erstellt. Dies verbessert die Effizienz erheblich, ohne die Genauigkeit zu beeinträchtigen. Die Open-Source-Implementierung ist auf GitHub verfügbar.

(research.google)

KI Multi-Vektor-Suche

Veo Generation 3: Generalisierung der Videogenerierung

2025-05-16

Googles jüngster Durchbruch in der Videogenerierung, Veo, verfügt nun über eine dritte Generation, die sich auf verschiedene Aufgaben verallgemeinern lässt. Trainiert mit Millionen von hochwertigen synthetischen 3D-Assets, zeichnet sich Veo durch die Synthese neuer Ansichten aus und verwandelt Produktbilder in konsistente 360°-Videos. Wichtig ist, dass dieser Ansatz effektiv auf Möbel, Kleidung, Elektronik usw. verallgemeinert werden kann und komplexe Licht- und Materialwechselwirkungen präzise erfasst – eine deutliche Verbesserung gegenüber früheren Generationen.

(research.google)

KI

Google steigert die Entwicklerproduktivität mit hybrider semantischer ML-Code-Completion

2025-05-15

Forscher von Google haben ein neuartiges, Transformer-basiertes, hybrides semantisches ML-Code-Completion-System entwickelt, das maschinelles Lernen (ML) und regelbasierte semantische Engines (SEs) kombiniert, um die Entwicklerproduktivität deutlich zu steigern. Das System integriert ML und SEs auf drei Arten: 1) Neureihenfolge von SE-Einzeltoken-Vorschlägen mithilfe von ML; 2) Anwendung von Einzel- und Mehrzeilen-Vorschlägen mithilfe von ML und Überprüfung der Korrektheit mit SE; und 3) Verwendung von Einzel- und Mehrzeilen-Fortsetzungen durch ML von Einzeltoken-semantischen Vorschlägen. Eine dreimonatige Studie mit über 10.000 internen Google-Entwicklern zeigte eine 6%ige Reduzierung der Codierungsiterationszeit bei Einzelzeilen-ML-Vorschlägen. Derzeit werden über 3% des neuen Codes durch die Annahme von ML-Completion-Vorschlägen generiert. Das System unterstützt acht Programmiersprachen und beinhaltet semantische Prüfungen, um die Korrektheit des Codes zu gewährleisten, was das Vertrauen und die Effizienz der Entwickler deutlich steigert.

(research.google)

Entwicklung

Whisper-Einbettungen stimmen überraschend mit der menschlichen Gehirnaktivität während des Sprechens überein

2025-03-26

Eine Studie zeigt eine überraschende Übereinstimmung zwischen OpenAIs Whisper-Spracherkennungsmodell und der neuronalen Aktivität im menschlichen Gehirn während natürlicher Gespräche. Durch den Vergleich der Whisper-Einbettungen mit der Gehirnaktivität in Regionen wie dem inferioren frontalen Gyrus (IFG) und dem superioren temporalen Gyrus (STG) stellten die Forscher fest, dass die Spracheinbettungen während der Sprachproduktion vor den Spracheinbettungen ihren Höhepunkt erreichten und umgekehrt während des Sprachverständnisses. Dies deutet darauf hin, dass Whisper, obwohl es nicht unter Berücksichtigung von Gehirnmechanismen entwickelt wurde, wichtige Aspekte der Sprachverarbeitung erfasst. Die Ergebnisse heben auch eine „weiche Hierarchie“ in der Verarbeitung von Sprache im Gehirn hervor: höherwertige Bereiche wie der IFG priorisieren semantische und syntaktische Informationen, verarbeiten aber auch niederwertige Hörmerkmale, während niederwertige Bereiche wie der STG akustische und phonetische Verarbeitung priorisieren, aber auch Informationen auf Wortebene erfassen.

(research.google)

KI

Bahnbrechende Forschung: Das Team hinter dem Erfolg

2025-03-03

Dieser Artikel ist das Ergebnis einer engen Zusammenarbeit mit Asaf Aharoni, Avinatan Hassidim und Danny Vainstein. Das Team bedankt sich auch bei Dutzenden von Personen von Google Research, Google DeepMind und Google Search, darunter YaGuang Li und Blake Hechtman, für ihre Überprüfungen, aufschlussreichen Diskussionen, wertvolles Feedback und Unterstützung. Ihre Beiträge waren entscheidend für den Abschluss dieser Forschung.

(research.google)

KI

Google KI-Durchbruch: Eine riesige Teamleistung in den Danksagungen enthüllt

2025-02-19

Die Danksagungen in diesem Artikel zeigen eine massive, gemeinschaftliche Anstrengung, an der zahlreiche Forscher von Google Research, Google DeepMind und Google Cloud AI sowie Mitarbeiter von Fleming Initiative, Imperial College London, Houston Methodist Hospital, Sequome und Stanford University beteiligt waren. Die umfangreiche Liste unterstreicht den kollaborativen Charakter der Forschung und dankt vielen Wissenschaftlern, die technisches und fachkundiges Feedback gegeben haben, sowie zahlreichen internen Google-Teams, die Unterstützung in den Bereichen Produkt, Engineering und Management geleistet haben. Die schiere Länge der Danksagungen unterstreicht den enormen Teamaufwand hinter großen KI-Projekten.

(research.google)

KI

Schock! Fast alle binären Such- und Mergesorts sind fehlerhaft

2025-01-11

Der Google-Softwareentwickler Joshua Bloch enthüllte einen fast zwei Jahrzehnte alten Bug, der in binären Suchalgorithmen lauert, sowohl im JDK als auch in Jon Bentleys "Programming Pearls"! Der Bug stammt von der Zeile `int mid = (low + high) / 2;`, die einen Integer-Überlauf und ArrayIndexOutOfBoundsException verursacht, wenn die Summe von `low` und `high` den maximalen positiven Integerwert überschreitet. Dieser Bug manifestiert sich nur bei riesigen Datensätzen und ist daher in der heutigen Big-Data-Welt besonders gefährlich. Der Artikel untersucht verschiedene Lösungsansätze und betont, dass Bugs auch bei gründlichen Tests und Beweisen bestehen bleiben können, und mahnt Programmierer zu Vorsicht und Bescheidenheit.

(research.google)

Entwicklung Algorithmus-Fehler Binäre Suche Mergesort

Google erweitert die Bewertung des globalen Solarpotenzials durch Satellitenbilder und maschinelles Lernen

2024-12-19

Google-Forscher haben die Abdeckung der Google Maps Platform Solar API im globalen Süden erweitert, indem sie Machine-Learning-Modelle auf Satellitenbilder angewendet haben, um hochauflösende digitale Oberflächenmodelle und Dachsegmentierungs-Karten zu generieren. Diese Innovation überwindet die Grenzen traditioneller Methoden der Datenerfassung und -verarbeitung und liefert Daten zur Bewertung des Solarpotenzials für 1,25 Milliarden Gebäude weltweit, wodurch die weltweite Einführung erneuerbarer Energien beschleunigt wird. Das Projekt nutzt Satellitendaten, um die Häufigkeit von Datenaktualisierungen zu erhöhen und die Kosten zu senken, was besonders in datenarmen Regionen von Vorteil ist.

(research.google)

Technologie Solarenergie Satellitenbilder