Webtagr - Technologienummer

KI-Chatbots und Einsamkeit: Eine Gratwanderung

2025-03-25

Zwei neue Studien zeigen eine mögliche Schattenseite der intensiven Nutzung von KI-Chatbots: zunehmende Einsamkeit und emotionale Abhängigkeit, besonders bei Vielnutzern. Die Forscher stellten fest, dass einsame Menschen eher emotionale Bindungen zu KI suchen, was frühere Forschungsergebnisse zu sozialen Medien widerspiegelt. Obwohl KI-Chatbots emotionale Unterstützung bieten können, müssen Plattformen das Wohlbefinden der Nutzer priorisieren, übermäßige Nutzung und emotionale Ausbeutung verhindern und Maßnahmen ergreifen, um ungesunde Nutzungsmuster zu identifizieren und zu intervenieren. Gesetzgeber sollten dieses aufkommende Problem ebenfalls angehen und entsprechende Regulierungen entwickeln.

(www.platformer.news)

KI

Newtons Methode erhält ein modernes Upgrade: Ein schnellerer und umfassenderer Optimierungsalgorithmus

2025-03-25

Vor über 300 Jahren entwickelte Isaac Newton einen Algorithmus zur Suche nach den Minimalwerten von Funktionen. Nun haben Amir Ali Ahmadi von der Princeton University und seine Studenten diesen Algorithmus verbessert, um effizienter mit einer breiteren Klasse von Funktionen umzugehen. Dieser Durchbruch nutzt Ableitungen höherer Ordnung und transformiert die Taylor-Entwicklung geschickt in eine konvexe Summe-von-Quadraten-Form, wodurch eine schnellere Konvergenz als bei der traditionellen Gradientenabstiegsmethode erreicht wird. Obwohl derzeit rechenintensiv, könnten zukünftige Fortschritte in der Computertechnologie es diesem Algorithmus ermöglichen, den Gradientenabstieg in Bereichen wie dem maschinellen Lernen zu übertreffen und ein leistungsstarkes Werkzeug für Optimierungsprobleme zu werden.

(www.quantamagazine.org)

KI Optimierungsalgorithmus Newtons Methode

Ant Group senkt KI-Trainingskosten um 20% mit chinesischen Chips

2025-03-25

Ant Group, unterstützt von Jack Ma, hat KI-Modelltrainingstechniken entwickelt, die inländische Halbleiter von Unternehmen wie Alibaba und Huawei verwenden und die Kosten um 20% senken. Obwohl weiterhin Nvidia-Chips eingesetzt werden, verlässt sich Ant hauptsächlich auf AMD- und chinesische Alternativen für seine neuesten Modelle, mit ähnlichen Ergebnissen wie der Nvidia H800. Dies unterstreicht Chinas Bemühungen, die Abhängigkeit von High-End-Nvidia-Chips zu reduzieren. Ants neue Sprachmodelle, Ling-Plus und Ling-Lite, übertrafen sogar Metas Llama in einigen Benchmarks. Diese Modelle, die für Anwendungen im Gesundheitswesen und im Finanzbereich bestimmt sind, stellen einen bedeutenden Fortschritt in der kostengünstigen KI-Entwicklung in China dar.

(au.finance.yahoo.com)

KI chinesische Chips Kostenreduzierung

ARC-AGI-2: Der AGI-Benchmark – einfacher für Menschen, schwerer für KI

2025-03-24

Der ARC Prize 2025 Wettbewerb kehrt zurück mit ARC-AGI-2, einem deutlich schwierigeren AGI-Benchmark für KI, der für Menschen aber relativ einfach bleibt. Der Fokus liegt auf Aufgaben, die für Menschen einfach, für KI jedoch schwer oder unmöglich sind. Dies soll Fähigkeitslücken aufzeigen, die nicht allein durch Skalierung behoben werden können. Mit einem Preisgeld von 1 Million Dollar fördert der Wettbewerb Open-Source-Innovationen für effiziente und allgemeine KI-Systeme mit dem Ziel, die Lücke zwischen Mensch und KI zu schließen und echte AGI zu erreichen.

(arcprize.org)

KI

Qwen2.5-VL-32B: Ein 32 Milliarden Parameter großes visuelles Sprachmodell, das besser auf menschliche Präferenzen abgestimmt ist

2025-03-24

Nach dem großen Erfolg der Qwen2.5-VL-Modellreihe haben wir das neue, 32 Milliarden Parameter umfassende visuelle Sprachmodell Qwen2.5-VL-32B-Instruct als Open Source veröffentlicht. Dieses Modell zeigt signifikante Verbesserungen im mathematischen Denken, im feingranularen Bildverständnis und in der Ausrichtung auf menschliche Präferenzen. Benchmarks zeigen seine Überlegenheit gegenüber vergleichbaren Modellen in multimodalen Aufgaben (wie MMMU, MMMU-Pro und MathVista), wobei es sogar das größere 72 Milliarden Parameter umfassende Qwen2-VL-72B-Instruct übertrifft. Es erreicht auch Spitzenergebnisse bei reinen Textfähigkeiten in seiner Größenordnung.

(qwenlm.github.io)

KI visuelles Sprachmodell

AMD präsentiert Instella: Eine Familie vollständig offener Sprachmodelle mit 3 Milliarden Parametern

2025-03-24

AMD hat Instella vorgestellt, eine Familie hochmoderner, vollständig offener Sprachmodelle mit 3 Milliarden Parametern, die von Grund auf auf AMD Instinct™ MI300X GPUs trainiert wurden. Instella-Modelle übertreffen bestehende vollständig offene Modelle ähnlicher Größe und erreichen eine wettbewerbsfähige Leistung im Vergleich zu den neuesten Open-Weight-Modellen wie Llama-3.2-3B. AMD veröffentlicht alle Artefakte der Modelle als Open Source, einschließlich Gewichten, Trainingskonfigurationen, Datensätzen und Code, um Zusammenarbeit und Innovation in der KI-Community zu fördern. Die Modelle verwenden effiziente Trainingstechniken und eine mehrstufige Trainingspipeline.

(rocm.blogs.amd.com)

KI

GPT-4o mini TTS: Text-to-Speech leicht gemacht

2025-03-24

Dieses Tool nutzt die GPT-4o mini TTS API von OpenAI, um Text in natürlich klingende Sprache umzuwandeln. Der Prozess besteht aus drei einfachen Schritten: Geben Sie Ihren Text ein, passen Sie die Einstellungen an (sechs Stimmen und einstellbare Geschwindigkeit) und generieren Sie hochwertige Audiodaten. Das Audio wird direkt an Ihren Browser gestreamt und nicht auf unseren Servern gespeichert. Probieren Sie verschiedene Stimmen und Geschwindigkeiten aus, um die perfekte Kombination für Ihren Inhalt zu finden!

(hitts.cc)

KI

CUDA mit 18: Nvidias Geheimrezept und die Vorherrschaft der KI

2025-03-24

Nvidias CUDA-Plattform feiert ihren 18. Geburtstag. Sie ist weit mehr als nur eine Programmiersprache oder API, sondern das Herzstück von Nvidias Software-Ökosystem und treibt zahlreiche „leicht parallelisierbare“ Rechenaufgaben an, von KI bis zum Krypto-Mining. CUDAs Erfolg basiert auf Nvidias konsequenter langfristiger Investition und stetigen Updates, ein krasser Gegensatz zu Konkurrenten wie AMD. Der Erfolg von AlexNet unterstrich CUDAs frühen Einfluss im Deep Learning, und heute ist es der De-facto-Standard in der KI und bildet einen starken Wettbewerbsvorteil für Nvidia.

(thechipletter.substack.com)

KI

beeFormer: Überbrückung der Lücke zwischen semantischer und Interaktionsähnlichkeit in Empfehlungssystemen

2025-03-24

Das beeFormer-Projekt stellt einen neuartigen Ansatz für Empfehlungssysteme vor, der darauf abzielt, das Cold-Start-Problem zu lösen. Es nutzt Sprachmodelle, um Benutzerverhaltensmuster aus Interaktionsdaten zu lernen und dieses Wissen auf zuvor unsichtbare Artikel zu übertragen. Im Gegensatz zur traditionellen inhaltsbasierten Filterung, die auf Artikelattributen basiert, lernt beeFormer Benutzerinteraktionsmuster, um Artikel besser zu empfehlen, die mit den Interessen der Benutzer übereinstimmen, selbst ohne vorherige Interaktionsdaten. Experimente zeigen signifikante Leistungsverbesserungen. Das Projekt bietet detaillierte Trainingsschritte und vortrainierte Modelle und unterstützt Datensätze wie MovieLens, GoodBooks und Amazon Books.

(github.com)

KI

LangManus: Ein Open-Source-Framework für die KI-Automatisierung und Multi-Agenten-Kollaboration

2025-03-23

LangManus ist ein community-getriebenes Open-Source-Framework für die KI-Automatisierung, das Sprachmodelle mit Tools für Websuche, Crawling und Python-Codeausführung integriert. Entwickelt von ehemaligen Kollegen in ihrer Freizeit, zielt dieses Projekt darauf ab, die Bereiche Multi-Agenten und Deep Research zu erforschen und am GAIA-Leaderboard teilzunehmen. LangManus verwendet ein hierarchisches Multi-Agenten-System mit Rollen wie Koordinator, Planer, Supervisor, Researcher, Coder, Browser und Reporter und unterstützt verschiedene LLM-Integrationen, darunter Qwen und OpenAI-kompatible Modelle. Das Projekt ist unter der MIT-Lizenz Open Source und begrüßt Beiträge der Community.

(github.com)

KI KI-Automatisierung Multi-Agenten-System

Verbesserter Crosscoder enthüllt Geheimnisse des Feintunings von LLMs

2025-03-23

Forscher stellen eine neue Methode vor, den „gebundenen Crosscoder“, um die Basis- und die feinabgestimmten Chat-Modelle großer Sprachmodelle (LLMs) zu vergleichen. Im Gegensatz zu herkömmlichen Crosscodern ermöglicht der gebundene Crosscoder es denselben latenten Faktoren, zu unterschiedlichen Zeiten für das Basis- und das Chat-Modell zu feuern, was zu einer effizienteren Identifizierung neuer Merkmale im Chat-Modell führt. Experimente zeigen, dass dieser Ansatz klarere Erklärungen dafür liefert, wie sich das Chat-Verhalten aus den Fähigkeiten des Basismodells ergibt, und monosämantischere latente Faktoren erzeugt. Diese Forschung bietet neue Einblicke in den Feintuning-Prozess von LLMs und leitet zukünftige Modellverbesserungen.

(www.lesswrong.com)

KI Crosscoder Feintuning des Modells

Formale Verifikation von ML-Modellen in Lean 4

2025-03-23

Das Projekt `formal_verif_ml` bietet ein Lean 4 Framework zur formalen Verifikation von Eigenschaften (Robustheit, Fairness, Interpretierbarkeit) von Machine-Learning-Modellen. Es beinhaltet eine Lean-Bibliothek, einen Modell-Translator, eine Web-Oberfläche und eine CI/CD-Pipeline und unterstützt verschiedene Modelltypen. Ein interaktives Webportal ermöglicht es Benutzern, Modelle hochzuladen, den generierten Lean-Code anzuzeigen, die Beweisprüfung zu starten und die Modellarchitektur zu visualisieren.

(github.com)

KI

Rechenleistung siegt: Das neue Paradigma in der KI-Entwicklung

2025-03-23

Dieser Artikel untersucht einen neuen Trend in der KI-Entwicklung: die Überlegenheit der Rechenleistung. Der Autor verwendet persönliche Erfahrungen und Analogien, um zu veranschaulichen, dass überentwickelte KI-Systeme wie sorgfältig gepflegte Pflanzen sind, die Schwierigkeiten haben, sich an verändernde Umgebungen anzupassen, während KI-Systeme auf Basis von massenhafter Rechenleistung, wie natürlich wachsende Pflanzen, autonom lernen und sich anpassen können. Durch den Vergleich von regelbasierten, rechenleistungsgrenzenden und skalierbaren Ansätzen zum Aufbau von Kundendienst-Automatisierungssystemen zeigt der Autor die Überlegenheit der skalierbaren Lösung. Der Aufstieg des Reinforcement Learning (RL) bestätigt diesen Trend weiter, da es durch massive Rechenleistung mehrere Lösungen erforscht und Ergebnisse erzielt, die menschliches Design übertreffen. Zukünftig wird sich die Rolle von KI-Ingenieuren von der Entwicklung perfekter Algorithmen zur Entwicklung von Systemen verschieben, die massive Rechenressourcen effektiv nutzen können.

(ankitmaloo.com)

KI Rechenleistung

Programmierbare Embryomodelle mit CRISPR erstellt

2025-03-23

Wissenschaftler der UC Santa Cruz haben zellulare Modelle von Embryonen entwickelt, ohne echte Embryonen zu verwenden, und simulieren die ersten Tage nach der Befruchtung. Mit CRISPR-basierter Gen-Editierung brachten sie Maus-Stammzellen dazu, sich in selbstorganisierende Strukturen, sogenannte Embryoide, zu organisieren, die wichtige Phasen der frühen Embryonalentwicklung reproduzieren. Dies ermöglicht die Untersuchung der Genfunktion in der frühen Entwicklung und der Mechanismen von Entwicklungsstörungen. Veröffentlicht in Cell Stem Cell, bietet diese Forschung einen neuen Weg, um menschliche Infertilität zu verstehen und Fruchtbarkeitsbehandlungen zu verbessern.

(news.ucsc.edu)

KI Embryonalentwicklung

Nachteulen und Depression: Achtsamkeit könnte der Schlüssel sein

2025-03-23

Eine Studie mit jungen Erwachsenen zeigt einen starken Zusammenhang zwischen Abendtypen (Nachteulen) und höheren Raten an depressiven Symptomen. Die Forscher untersuchten Achtsamkeit, Grübeln, Alkoholkonsum und Schlafqualität als potenzielle Mediatoren. Die Ergebnisse zeigen, dass diese Faktoren die Beziehung signifikant vermitteln, wobei „achtsames Handeln“ – ein Aspekt der Achtsamkeit – einen besonderen Schutzeffekt gegen Depressionen bietet. Diese Forschung legt neue Interventionsstrategien zur Verbesserung der psychischen Gesundheit junger Erwachsener nahe.

(journals.plos.org)

KI Chronotyp

LLMs revolutionieren Empfehlungssysteme und Suchmaschinen: Eine umfassende Übersicht

2025-03-23

Dieser Artikel fasst aktuelle Forschung zusammen, die große Sprachmodelle (LLMs) auf Empfehlungssysteme und Suchmaschinen anwendet. Die Studien untersuchen verschiedene Ansätze, darunter LLM-erweiterte Modellarchitekturen (z. B. semantische IDs von YouTube und M3CSR von Kuaishou), die Verwendung von LLMs zur Datengenerierung und -analyse (z. B. Verbesserung der Empfehlungsqualität von Bing und erwartete schlechte Übereinstimmungen von Indeed) und die Anwendung von LLM-Trainingsmethoden (z. B. Skalierungsgesetze, Transferlernen und Wissensdestillation). Darüber hinaus konzentriert sich die Forschung auf einheitliche Architekturen für Empfehlungssysteme und Suchmaschinen, wie 360Brew von LinkedIn und UniCoRn von Netflix, um Effizienz und Leistung zu steigern. Insgesamt zeigen diese Studien das erhebliche Potenzial von LLMs bei der Verbesserung von Empfehlungssystemen und Suchmaschinen und liefern beachtliche Ergebnisse in der Praxis.

(eugeneyan.com)

KI

Wirtschaftsauswirkungen von KI: Automatisierung der Arbeit, nicht nur F&E?

2025-03-22

Eine weit verbreitete Ansicht besagt, dass die wichtigste wirtschaftliche Auswirkung von KI in der Automatisierung von Forschung und Entwicklung (F&E) liegt. Dieser Artikel bestreitet dies und argumentiert, dass der wirtschaftliche Wert von F&E überschätzt wird und weniger zum Produktivitätswachstum beiträgt als allgemein angenommen. Die Autoren behaupten, dass der wirtschaftliche Wert von KI hauptsächlich aus der breiten Automatisierung von Arbeitsplätzen resultiert, was zu einem erheblichen Anstieg von Produktivität und Output führt, nicht nur zu Fortschritten in F&E. Obwohl KI irgendwann F&E automatisieren wird, wird dies wahrscheinlich erst nach einer umfassenderen Automatisierung geschehen, sobald KI über die Fähigkeiten verfügt, ein breiteres Spektrum an Aufgaben zu bewältigen.

(epoch.ai)

KI

Die sechs Wellen des Vibe-Codings und die Zukunft der Programmierung

2025-03-22

Dieser Artikel untersucht die Entwicklung des KI-basierten Codings, von traditionellem Coding über Code-Completion und Chat-basiertes Coding bis hin zu Coding-Agents, Agent-Clustern und schließlich Agent-Flotten. Der Autor prognostiziert, dass Coding-Agents die Entwicklungseffizienz drastisch steigern, aber auch hohe Kosten verursachen werden. Die zukünftige Rolle von Programmierern wird sich auf die Verwaltung und Koordination von KI-Agents verlagern. Der Artikel hebt hervor, dass jüngere Programmierer KI schneller annehmen als erfahrene Entwickler, was die Talentstruktur der Softwareentwicklungsbranche umgestaltet. Der Autor schlussfolgert, dass das Erlernen der effektiven Nutzung von Coding-Agents für den zukünftigen Erfolg im Bereich unerlässlich ist.

(sourcegraph.com)

KI Coding-Agents Zukunft der Programmierung

Standardisierung von KI-Präferenzen: Urheberrechtsbedenken bei KI-Trainingsdaten angehen

2025-03-22

Um Bedenken hinsichtlich des Urheberrechts zu adressieren, die sich aus der Verwendung von Internetinhalten zum Trainieren von KI-Modellen ergeben, arbeitet die neu gegründete Arbeitsgruppe für KI-Präferenzen (AIPREF) der IETF an der Standardisierung von Bausteinen zur Ausdrucksweise von Präferenzen, wie Inhalte gesammelt und verarbeitet werden. Derzeit verwenden KI-Anbieter eine verwirrende Reihe von nicht standardisierten Signalen (wie robots.txt), um ihre Crawling- und Trainingsentscheidungen zu leiten, was zu mangelndem Vertrauen bei Autoren und Verlegern führt, dass ihre Präferenzen eingehalten werden. AIPREF wird ein gemeinsames Vokabular definieren, um die Präferenzen von Autoren und Verlegern auszudrücken, Methoden zum Anfügen dieses Vokabulars an Internetinhalte und einen Standardmechanismus zur Abstimmung mehrerer Präferenzäußerungen. Das erste Treffen der Arbeitsgruppe findet während der IETF 122 in Bangkok statt.

(www.ietf.org)

KI

Die Grenzen des Skalierens in der KI: Erreicht Brute Force sein Ende?

2025-03-22

Eine Umfrage unter 475 KI-Forschern zeigt, dass das reine Hochskalieren der aktuellen KI-Ansätze wahrscheinlich nicht zu Künstlicher Allgemeiner Intelligenz (AGI) führen wird. Trotz massiver Investitionen in Rechenzentren durch Tech-Giganten sind abnehmende Renditen offensichtlich. Das neueste GPT-Modell von OpenAI zeigt nur geringe Verbesserungen, während DeepSeek eine vergleichbare KI-Leistung zu einem Bruchteil der Kosten und des Energieverbrauchs erzielt. Dies deutet darauf hin, dass günstigere und effizientere Methoden, wie OpenAIs Testzeit-Computing und DeepSeeks „Mixture of Experts“-Ansatz, die Zukunft sind. Große Unternehmen bevorzugen jedoch weiterhin das Skalieren mit roher Gewalt, so dass kleinere Startups wirtschaftlichere Alternativen erkunden müssen.

(futurism.com)

KI

KI-Teamkollege: Feldexperiment zeigt, wie generative KI Teamwork und Expertise verändert

2025-03-22

Ein randomisierter kontrollierter Versuch bei Procter & Gamble zeigt, dass generative KI die Produktivität von Teams und die Qualität der Lösungen deutlich verbessert. Einzelpersonen mit KI schnitten genauso gut ab wie Teams ohne KI, während KI-gestützte Teams überragten und die Wahrscheinlichkeit für Top-Lösungen deutlich erhöhten. KI verbesserte nicht nur die Effizienz, sondern steigerte auch positive Emotionen, überbrückte Abteilungs-Silos und ermöglichte es weniger erfahrenen Mitarbeitern, die Leistungsfähigkeit erfahrener Teammitglieder zu erreichen. Diese Forschung legt nahe, dass KI nicht nur ein Produktivitätstool ist, sondern ein „Teamkollege“, der Teamwork und Organisationsstrukturen verändern kann.

(www.oneusefulthing.org)

KI

R1-Zero entschlüsselt: Effiziente LLM-Ausrichtung mit dem Oat-Framework

2025-03-22

Forscher haben einen Artikel, Modelle und einen Codebase veröffentlicht, die die Geheimnisse des R1-Zero-ähnlichen Trainings lüften. Sie entwickelten Oat, ein hochmodulares und effizientes LLM-Verstärkungslernframework, und nutzten es, um Modelle wie Qwen2.5 mit R1-Zero zu trainieren. Die Studie ergab, dass geeignete Basismodelle und ein verbesserter Verstärkungslern-Algorithmus (Dr. GRPO) entscheidend sind, um eine verzerrte Optimierung durch nicht übereinstimmende Vorlagen und Fragen zu vermeiden. Letztendlich erzielten sie mit nur 27 Stunden Rechenzeit auf 8 A100-GPUs Spitzenergebnisse.

(github.com)

KI

Meta und OpenAI beschuldigt, illegale Datenbank zum Trainieren von KI-Modellen verwendet zu haben

2025-03-22

Meta und OpenAI sind in eine Urheberrechtsstreitigkeit verwickelt, nachdem bekannt wurde, dass sie die illegale Buchdatenbank Library Genesis (LibGen) zum Trainieren ihrer KI-Modelle verwendet haben. Um das Training ihres Llama 3-Modells zu beschleunigen, umging Meta die teuren Lizenzierungsprozesse und lud direkt Millionen von Büchern und wissenschaftlichen Artikeln von LibGen herunter. Dies führte zu einer Klage von Autoren, wobei Gerichtsdokumente zeigen, dass Meta-Mitarbeiter die rechtlichen Risiken kannten und versuchten, ihre Aktivitäten zu verschleiern. OpenAI gab ebenfalls die frühere Verwendung von LibGen zu, behauptet aber, dass seine neuesten Modelle nicht mehr auf diesem Datensatz basieren. Der Vorfall beleuchtet die ethischen und rechtlichen Herausforderungen in Bezug auf die Herkunft von Trainingsdaten für KI-Modelle und den Schutz des geistigen Eigentums.

(www.theatlantic.com)

KI Datenpiraterie

FutureHouse: Entwicklung semi-autonomer KI-Wissenschaftler

2025-03-22

FutureHouse, eine Non-Profit-Organisation mit Sitz in San Francisco, hat es sich zur Aufgabe gemacht, die wissenschaftliche Entdeckung mithilfe von KI zu automatisieren. Sie haben eine Reihe von Werkzeugen mit dem Thema "Krähe" entwickelt, darunter ChemCrow für die Entwicklung chemischer Reaktionen, WikiCrow zur Zusammenfassung von Proteininformationen, ContraCrow zur Identifizierung von Widersprüchen in der Literatur und die PaperQA-Serie für zuverlässige PDF-Abfragen. FutureHouse zielt darauf ab, semi-autonome KI-Wissenschaftler zu entwickeln, von prädiktiven Modellen bis hin zu humanoiden Robotern, die eines Tages in der Lage sein werden, Experimente unabhängig durchzuführen, wodurch die wissenschaftliche Entdeckung letztendlich beschleunigt und Probleme wie die Schwierigkeit der Zusammenfassung und die mangelnde Zuverlässigkeit der biomedizinischen Literatur angegangen werden. Zu den Herausforderungen gehören der Aufbau von Infrastrukturen, der Zugriff auf Daten und die Bewältigung von technischen Problemen, aber KI-Modelle zeichnen sich durch die Generierung von Hypothesen und das Ziehen von Schlussfolgerungen aus. FutureHouse betont die Zuverlässigkeit von KI-Wissenschaftlern und engagiert sich für die Lösung von Problemen durch verbesserte Datenanalyse und Reproduzierbarkeit.

(www.asimov.press)

KI KI-Wissenschaft automatisierte wissenschaftliche Entdeckung biomedizinische Literatur

Tencents Hunyuan-T1: Neudefinition der Effizienz des logischen Schließens mit dem ersten Mamba-gestützten Ultralarge-Modell

2025-03-22

Tencent hat Hunyuan-T1 vorgestellt, die neueste Ergänzung seiner Hunyuan-Reihe großer Sprachmodelle. Basierend auf TurboS, dem weltweit ersten ultralangen Hybrid-Transformer-Mamba MoE-Modell, bietet Hunyuan-T1 nach umfangreichem Nachtraining deutlich verbesserte Fähigkeiten im logischen Schließen und eine bessere Ausrichtung auf menschliche Präferenzen. Im Vergleich zur Vorschauversion zeigt Hunyuan-T1 eine erhebliche Leistungssteigerung und verdoppelt seine Dekodiergeschwindigkeit. Es erzielt vergleichbare oder leicht bessere Ergebnisse als R1 bei verschiedenen öffentlichen Benchmarks und übertrifft R1 in internen menschlichen Bewertungen, insbesondere beim Folgen kultureller und kreativer Anweisungen, beim Textzusammenfassen und bei Agentenfähigkeiten. Diese Veröffentlichung markiert einen bedeutenden Fortschritt bei der Nutzung von Reinforcement Learning für die Nachtrainingsoptimierung großer Sprachmodelle.

(tencent.github.io)

KI Logisches Schließen

Werkzeug-KIs vs. Agenten-KIs: Ein Spiel aus Kontrolle und Fähigkeiten

2025-03-21

Dieser Artikel hinterfragt die Effektivität, KI auf rein informationelle Aufgaben (Werkzeug-KIs) zu beschränken, um Risiken zu mindern. Der Autor argumentiert, dass dieser Ansatz unrealistisch ist, da Agenten-KIs, die Aktionen ausführen können, sowohl wirtschaftliche als auch intellektuelle Vorteile besitzen. Agenten-KIs zeichnen sich durch Datenselektion, Lernoptimierung, Selbstdesign und die Nutzung externer Ressourcen aus, was zu höherer Intelligenz führt. Obwohl Reinforcement Learning nicht ideal ist, um komplexe Dinge von Grund auf zu lernen, ist es der beste Ansatz zur Steuerung komplexer Systeme – und die Welt ist voll davon, einschließlich KIs. Werkzeug-KIs werden letztendlich von Agenten-KIs abgelöst werden, da letztere die Marktbedürfnisse und praktischen Anwendungen besser erfüllen.

(gwern.net)

KI

Metas Jagged Flash Attention: Revolutioniert die Leistung von Empfehlungssystemen

2025-03-21

Meta stellt Jagged Flash Attention vor, eine Innovation, die die Leistung und Skalierbarkeit von großen Empfehlungssystemen revolutioniert. Traditionelle Methoden haben Schwierigkeiten mit kategorialen Merkmalen variabler Länge (wie der Benutzerinteraktionshistorie), die ein umfangreiches Padding erfordern. Jagged Flash Attention verarbeitet diese Merkmale effizient mithilfe von Jagged-Tensoren und eliminiert den Padding-Overhead. In Kombination mit der TorchRec-Bibliothek erzielt es bis zu 10-fache Performance-Verbesserungen in Metas Produktionsumgebung und unterstützt das Training von Modellen mit über 3 Billionen Parametern. Dieser Durchbruch verbessert personalisierte Empfehlungssysteme erheblich.

(www.shaped.ai)

KI Empfehlungssysteme

ChatGPT-Nutzung im Zusammenhang mit erhöhter Einsamkeit: Studie von OpenAI und MIT

2025-03-21

Eine neue Studie von OpenAI und dem MIT legt nahe, dass die verstärkte Nutzung von Chatbots wie ChatGPT mit erhöhter Einsamkeit und weniger sozialer Interaktion zusammenhängen könnte. Eine einmonatige Untersuchung von fast 1000 Nutzern ergab, dass diejenigen, die mehr Zeit mit ChatGPT verbrachten, über eine größere emotionale Abhängigkeit und Einsamkeit berichteten. Wenngleich nur wenige ChatGPT für emotionale Unterstützung nutzten, deutete die Studie darauf hin, dass Personen mit einer Veranlagung zu emotionaler Abhängigkeit eine verstärkte Einsamkeit erfahren könnten. Die Forscher betonen die Notwendigkeit weiterer Forschung zum Einfluss von KI auf das menschliche Wohlbefinden und zu verantwortungsvollem KI-Design.

(finance.yahoo.com)

KI

PocketFlow: Ein neues Framework zum Erstellen unternehmensfertiger KI-Systeme

2025-03-21

PocketFlow ist ein TypeScript-basiertes LLM-Framework, das eine verschachtelte gerichtete Graph-Struktur verwendet. Dies zerlegt komplexe KI-Aufgaben in wiederverwendbare LLM-Schritte und ermöglicht Verzweigungen und Rekursion für agentenähnliche Entscheidungsfindung. Das Framework ist einfach erweiterbar, integriert verschiedene LLMs und APIs ohne spezielle Wrapper und bietet visuelles Workflow-Debugging und Zustandspersistenz, wodurch die Erstellung unternehmensfähiger KI-Systeme beschleunigt wird.

(github.com)

KI Unternehmensklasse KI

Nullwissensprotokolle erklärt: Ein tiefer Einblick in das Video

2025-03-21

Der Autor hat ein Video veröffentlicht, das Nullwissensprotokolle erklärt, einen komplexen Algorithmus, dessen Erklärung überraschenderweise viel Arbeit erfordert. Obwohl das Video verschiedene Aspekte und Anwendungen abdeckt, wird die Notwendigkeit umfassenderer Ressourcen für ein vollständiges Verständnis anerkannt. Der Beitrag beschreibt außerdem die Reduktion von Erfüllbarkeitsproblemen auf 3-Färbung und diskutiert die Auswirkungen auf dezentrale Systeme wie vertrauenswürdige Abstimmungssysteme und Währungssysteme. Abschließend werden nicht-interaktive Beweise eingeführt, wobei gezeigt wird, wie kryptografische Hash-Funktionen einen zufälligen Beacon simulieren können, um sie zu erstellen, wodurch die Themen kürzlich veröffentlichter Videos effektiv zusammengefasst werden.

(vasekrozhon.wordpress.com)

KI Nullwissensprotokolle

Category: KI