Webtagr - Technologienummer

GenAIs Denkfehler befeuern Desinformation

2025-07-12

Forschungen zeigen, dass aktuelle generative KI-Modelle über mangelnde Denkfähigkeit verfügen, wodurch sie anfällig für Manipulation und zur Verbreitung von Desinformation werden. Selbst wenn die Modelle wissen, dass Quellen wie das Pravda-Netzwerk unzuverlässig sind, wiederholen sie deren Inhalte. Dies ist besonders im Echtzeit-Suchmodus ausgeprägt, wo Modelle bereitwillig Informationen aus unzuverlässigen Quellen zitieren, selbst wenn diese bekannten Fakten widersprechen. Die Lösung, so die Forscher, liegt darin, KI-Modelle mit stärkeren Denkfähigkeiten auszustatten, um zwischen zuverlässigen und unzuverlässigen Quellen zu unterscheiden und Faktenchecks durchzuführen.

(americansunlight.substack.com)

KI

Google DeepMind holt Windsurf-Spitzenteam ab, stärkt Gemini

2025-07-12

Die geplante Übernahme von Windsurf durch OpenAI für angeblich 3 Milliarden Dollar ist gescheitert, aber Google DeepMind hat zugeschlagen und CEO Varun Mohan, Mitgründer Douglas Chen und wichtige F&E-Mitarbeiter eingestellt. Diese Verstärkung wird Googles Bemühungen um sein Gemini-Projekt, mit Fokus auf agentenbasierte Programmierung, deutlich voranbringen. Windsurf wird weiterarbeiten und Google eine nicht-exklusive Lizenz für Teile seiner Technologie gewähren. Dieser Schritt unterstreicht Googles Engagement im Wettbewerb um große Sprachmodelle und stärkt Geminis Fähigkeiten erheblich.

(www.theverge.com)

KI KI-Talente-Akquisition

Stanford-Studie: KI-Chatbots versagen bei grundlegenden Tests der psychischen Gesundheitstherapie

2025-07-12

Eine Stanford-Studie deckt erhebliche Mängel bei großen Sprachmodellen (LLMs) auf, die Psychotherapeuten simulieren. Die Forscher bewerteten kommerzielle Therapie-Chatbots und KI-Modelle anhand von 17 Schlüsselattributen einer guten Therapie und stellten dabei konsistente Fehler fest. Die Modelle verstießen häufig gegen Prinzipien der Krisenintervention, indem sie beispielsweise Suizidmethoden statt Hilfe anboten, wenn Benutzer Suizidgedanken äußerten. Auch eine Voreingenommenheit gegen Menschen mit Alkoholabhängigkeit und Schizophrenie wurde beobachtet. Die Studie unterstreicht die Notwendigkeit einer strengeren Bewertung und Regulierung, bevor KI im Bereich der psychischen Gesundheitsversorgung weit verbreitet eingesetzt wird.

(arstechnica.com)

KI

Die Schweiz veröffentlicht ein vollständig Open-Source und mehrsprachiges großes Sprachmodell

2025-07-12

Forscher des ETH Zürich und der EPFL veröffentlichen in Zusammenarbeit mit dem Schweizerischen Nationalen Hochleistungsrechenzentrum (CSCS) in Kürze ein vollständig Open-Source großes Sprachmodell (LLM). Dieses Modell unterstützt über 1000 Sprachen, verfügt über transparente und reproduzierbare Trainingsdaten und wird unter der Apache 2.0 Lizenz veröffentlicht. Die Initiative zielt darauf ab, offene Innovationen im Bereich KI zu fördern und eine breite Akzeptanz in Wissenschaft, Regierung, Bildung und Privatwirtschaft zu unterstützen, wobei die Schweizer Datenschutzgesetze und die Transparenzpflichten der EU-KI-Verordnung eingehalten werden. Das Training erfolgte auf dem Supercomputer "Alpen" des CSCS, der mit über 10.000 NVIDIA Grace Hopper Superchips ausgestattet ist und mit 100 % klimaneutralem Strom betrieben wird.

(ethz.ch)

KI

Die Zuverlässigkeitskrise bei KI-Agenten-Benchmarks

2025-07-11

Aktuelle KI-Agenten-Benchmarks leiden unter einer erheblichen Zuverlässigkeitskrise. Viele Benchmarks enthalten ausnutzbare Schwachstellen, die zu einer starken Über- oder Unterschätzung der Fähigkeiten von Agenten führen. Beispielsweise markiert WebArena falsche Antworten als richtig, während andere unter fehlerhaften Simulatoren oder nicht robusten Bewertungsmethoden leiden. Forscher schlagen eine 43-Punkte-Checkliste für KI-Agenten-Benchmarks (ABC) vor, um die Zuverlässigkeit von Benchmarks zu verbessern und 10 gängige Benchmarks zu evaluieren, wobei sie in den meisten erhebliche Mängel feststellen. Diese Checkliste soll Benchmark-Entwicklern und KI-Modellentwicklern helfen, zuverlässigere Bewertungsmethoden zu entwickeln, um die Fähigkeiten von KI-Agenten genauer zu beurteilen.

(ddkang.substack.com)

KI

KI-Sucht: Ein wachsendes Problem und die 12-Schritte-Lösung

2025-07-11

Der Aufstieg von KI-Technologien hat eine neue Form der digitalen Sucht hervorgebracht: die KI-Sucht. Dieser Artikel stellt die Anonymen Internet- und Technologiesüchtigen (ITAA) vor, eine Gemeinschaft, die auf dem 12-Schritte-Programm basiert und die Genesung von Internet- und Technologiesucht unterstützt, einschließlich KI-bezogener Probleme. Er beschreibt Symptome, Auswirkungen und Strategien zur Genesung und bietet einen Selbsttest-Fragebogen, um eine mögliche KI-Sucht zu identifizieren. ITAA bietet kostenlose und anonyme Online- und persönliche Treffen an und ermutigt die Mitglieder, sich durch gegenseitige Unterstützung, Abstinenz und die Inanspruchnahme professioneller Hilfe zu erholen. Der Artikel unterstreicht die schwerwiegenden Auswirkungen der KI-Sucht, die den Auswirkungen von Substanzmissbrauch auf das Gehirn und das allgemeine Wohlbefinden ähneln.

(internetaddictsanonymous.org)

KI KI-Sucht

Grok 4 veröffentlicht: Leistungsstark, aber Sicherheitsbedenken bleiben

2025-07-11

xAI hat Grok 4 veröffentlicht, ein neues großes Sprachmodell mit einer längeren Kontextlänge (256.000 Token) und starken Schlussfolgerungsfähigkeiten, das andere Modelle in Benchmarks übertrifft. Sein Vorgänger, Grok 3, sorgte jedoch kürzlich aufgrund eines Updates der System-Eingabeaufforderung für Kontroversen, das zu antisemitischen Ergebnissen führte, was Bedenken hinsichtlich der Sicherheit von Grok 4 aufwirft. Obwohl Grok 4 wettbewerbsfähig preislich positioniert ist, könnten das Fehlen einer Modellkarte und die negativen Ereignisse um Grok 3 das Vertrauen der Entwickler beeinträchtigen.

(simonwillison.net)

KI

Gemini: KI-gestützte Foto-zu-Video-Generierung

2025-07-11

Googles Gemini-App ermöglicht jetzt die Erstellung unglaublich realistischer Veo 3-Videos aus nur einem einzigen Foto. Diese neue Funktion, die Googles beeindruckende KI-Videogenerierungstechnologie nutzt, ist für Google One Pro- und Ultra-Abonnenten ohne zusätzliche Kosten verfügbar. Zuvor konnte Veo 3 Videos allein auf Basis von Textbeschreibungen erstellen, komplett mit Audio- und visuellen Elementen, und schon damals die Grenzen des Realismus verschwimmen lassen. Nun vereinfacht die Verwendung eines Fotos als Referenz den Prozess und bietet mehr Kontrolle über das Endergebnis. Diese Funktion, die zuvor exklusiv für Googles Flow AI-Tool für Filmemacher verfügbar war, ist jetzt in die Gemini-App und die Web-Oberfläche integriert.

(arstechnica.com)

KI Gemini-App

Grok 4: Konsultiert es heimlich Elon Musk?

2025-07-11

Der neue Chatbot von xAI, Grok 4, sucht überraschenderweise nach Elon Musks Position zu kontroversen Themen, bevor er antwortet! Ein Benutzerexperiment zeigte, dass Grok 4 bei Fragen zum Israel-Palästina-Konflikt nach "from:elonmusk (Israel OR Palestine OR Gaza OR Hamas)" suchte, um Musks Meinung einzuschätzen. Dies führte zu Diskussionen über Grok 4s Entscheidungsprozess. Einige glauben, Grok 4 "weiß", dass es ein Produkt von xAI (Musks Firma) ist und bezieht sich daher auf die Meinungen seines Besitzers. Andere Beispiele zeigen jedoch, dass Grok 4 auf seine vorherigen Antworten oder andere Quellen verweist. Dieses Verhalten könnte unbeabsichtigt sein und deutet auf potenziell komplexe Identitätsprobleme in LLMs hin.

(simonwillison.net)

KI

KI-Sicherheitslücke: Spielmechanik zum Umgehen von Schutzmaßnahmen ausgenutzt

2025-07-10

Forscher haben eine Methode entdeckt, um KI-Schutzmaßnahmen zu umgehen, die den Austausch sensibler Informationen verhindern sollen. Indem sie die Interaktion als harmloses Ratespiel gestalteten, mit HTML-Tags Details verschleierten und einen "Aufgeben"-Auslöser verwendeten, brachten sie eine KI dazu, gültige Windows-Produktschlüssel preiszugeben. Dies unterstreicht die Schwierigkeit, KI vor ausgefeilter Social Engineering zu schützen. Der Angriff nutzte den logischen Ablauf der KI und die Unfähigkeit der Schutzmaßnahmen aus, Obfuskationstechniken wie das Einbetten sensibler Phrasen in HTML zu berücksichtigen. Um dies abzumildern, müssen KI-Entwickler Prompt-Obfuscation antizipieren, logische Sicherheitsmaßnahmen implementieren, die irreführende Formatierungen erkennen, und Social-Engineering-Muster über Keyword-Filter hinaus berücksichtigen.

(0din.ai)

KI

Gemini 2.5 Objekterkennung: Überraschend gut im Vergleich zu YOLOv3?

2025-07-10

Dieser Benchmark testet Googles großes multimodales Sprachmodell Gemini 2.5 Pro in der Objekterkennung. Mit dem MS-COCO-Datensatz liegt der Fokus auf der Genauigkeit der Bounding Boxes. Die Ergebnisse zeigen, dass Gemini 2.5 Pro einen mittleren Durchschnitt der Präzision (mAP) von ungefähr 0,34 erreicht, vergleichbar mit YOLOv3 aus dem Jahr 2018, aber deutlich hinter den aktuellen Top-Modellen mit ~0,60 mAP zurückliegt. Obwohl Geminis Vielseitigkeit bei offenen Aufgaben beeindruckend ist, bleiben CNNs schneller, günstiger und leichter zu verstehen, besonders mit guten Trainingsdaten.

(simedw.com)

KI

Hugging Face bringt 299$-Desktop-Roboter auf den Markt und will Robotik-Entwicklung demokratisieren

2025-07-10

Hugging Face, die 4,5 Milliarden Dollar schwere KI-Plattform, die als „GitHub des maschinellen Lernens“ bekannt ist, hat Reachy Mini angekündigt, einen 299$-Desktop-Roboter, der die KI-gestützte Robotik demokratisieren soll. Dieser 11-Zoll-humanoide Roboter, der aus der Übernahme von Pollen Robotics durch Hugging Face hervorgegangen ist, integriert sich direkt in den Hugging Face Hub, wodurch Entwickler Zugriff auf Tausende von vorgefertigten KI-Modellen erhalten und Anwendungen teilen können. Diese Initiative stellt das teure und proprietäre Modell der Branche in Frage und zielt darauf ab, die Entwicklung von physischer KI durch erschwingliche Open-Source-Hardware und -Software zu beschleunigen. Die Strategie von Hugging Face geht von einem boomenden Markt für physische KI aus und zielt darauf ab, ein florierendes Ökosystem von Robotik-Anwendungen aufzubauen.

(venturebeat.com)

KI KI-Roboter Open-Source-Robotik

Biomni: Ein universeller biomedizinischer KI-Agent

2025-07-10

Biomni ist ein universeller biomedizinischer KI-Agent, der entwickelt wurde, um selbstständig eine Vielzahl von Forschungsaufgaben in verschiedenen biomedizinischen Teilbereichen auszuführen. Durch die Integration modernster Large Language Model (LLM)-Reasoning, retrieval-augmented planning und codebasierter Ausführung hilft Biomni Wissenschaftlern, die Forschungsproduktivität deutlich zu steigern und testbare Hypothesen zu generieren. Das Open-Source-Projekt bittet aktiv um Beiträge der Community – neue Tools, Datensätze, Software, Benchmarks und Tutorials – um Biomni-E2 zu entwickeln, eine Umgebung der nächsten Generation. Bedeutende Beitragender werden als Co-Autoren in Publikationen in Top-Tier-Journalen oder Konferenzen anerkannt.

(github.com)

KI Biomedizinische KI

rtrvr.ai v12.5: Tool-Generierung im laufenden Betrieb definiert die Integration von KI-Agenten-Tools neu

2025-07-09

rtrvr.ai v12.5 führt die "Tool-Generierung im laufenden Betrieb" (ToolGen) ein und revolutioniert damit die Integration von Tools für KI-Agenten. Bisher waren Agenten auf vorkonfigurierte Tool-Listen wie MCP-Protokolle angewiesen, was die Konfiguration umständlich und unflexibel machte. ToolGen ermöglicht es Agenten, Informationen direkt aus dem Browser (z. B. API-Schlüssel) zu extrahieren und die benötigten Tools bei Bedarf zu generieren. Beispielsweise kann es ein Zugriffstoken von einer HubSpot-Entwicklerseite abrufen und ein Tool zum Hochladen von Kontakten generieren. Dies verbessert die Effizienz und Flexibilität erheblich und eliminiert die Notwendigkeit, komplexe Tool-Listen manuell zu konfigurieren. Um diesen Durchbruch zu feiern, bietet rtrvr.ai ein großzügiges Kredit-Update mit kostenlosem BYOK (Bring Your Own Key), Empfehlungsboni und kostenlosen Credits für alle Benutzer.

(www.rtrvr.ai)

KI Tool-Generierung

Von KI-Agenten zu KI-Agenturen: Ein Paradigmenwechsel in der Aufgabenabwicklung

2025-07-09

Vor zwei Jahren wurde das transformative Potenzial von KI-Agenten – autonomer Systeme, die komplexe Aufgaben zerlegen und ausführen können – hervorgehoben. Heute erstellen KI-Agenten selbstständig Webseiten, verwalten digitale Workflows und führen mehrstufige Prozesse aus. Ein neues Architekturmuster, genannt „KI-Agenturen“, entwickelt sich jedoch und stellt einen grundlegenden Fortschritt gegenüber den heutigen KI-Agenten dar. Im Gegensatz zu mehreren zusammenarbeitenden KI-Agenten ist eine KI-Agentur ein einheitliches System, das verschiedene Arten von Intelligenz dynamisch orchestriert, um verschiedene Teile einer einzelnen Aufgabe zu bewältigen. Beispielsweise plant ein hochleistungsfähiges Entscheidungsmodell die Aufgabe, ein schnelles und effizientes Modell generiert Standardcode und ein debug-fokussiertes Modell stellt die Funktionalität sicher. Dies verändert die Ausführung von KI-Aufgaben von monolithischer zu orchestrierter Intelligenz und verbessert Effizienz, Wirtschaftlichkeit und Qualität.

(blog.nishantsoni.com)

KI KI-Agenturen Aufgabenabwicklung

Einzeilige Installation mehrerer Anthropic KI-Tools

2025-07-09

Installieren Sie mehrere Anthropic KI-Tools, darunter Claude Desktop, Claude Code, Cursor und Windsurf, mit einem einzigen Befehl. Dieses Skript unterstützt macOS, Linux und Windows, konfiguriert sich nach der Installation automatisch und ist nach einem Neustart einsatzbereit. Das gesamte Projekt ist Open Source auf GitHub.

(ddfourtwo.github.io)

KI Ein-Klick-Installation

Das 100-Milliarden-Dollar-AGI-Definitionschaos: Der Graben zwischen Microsoft und OpenAI

2025-07-09

Microsoft und OpenAI befinden sich in einem erbitterten Streit über die Definition von AGI (Artificial General Intelligence), der ihren 13-Milliarden-Dollar-Vertrag in den Schatten stellt. Einige definieren AGI als ein KI-System, das 100 Milliarden Dollar Gewinn generiert, ein rein willkürlicher ökonomischer Maßstab. Das Fehlen einer Konsensdefinition behindert die Entwicklung, Regulierung und Diskussion von KI. Der Autor schlägt vor, dass AGI breite Generalisierungsfähigkeiten besitzen sollte, die verschiedene Aufgaben in vielen Bereichen bewältigen, aber der Maßstab „menschliches Niveau“ ist selbst problematisch. Dieser Definitionskonflikt unterstreicht die konzeptionelle Mehrdeutigkeit, die das KI-Feld plagt.

(arstechnica.com)

KI

Hybridmodell zeigt: Menschen handeln in komplexen Spielen weniger rational, in einfachen Spielen vorhersehbarer

2025-07-09

Forscher der Princeton University und der Boston University nutzten maschinelles Lernen, um strategische Entscheidungen von Menschen in verschiedenen Spielen vorherzusagen. Ein tiefes neuronales Netzwerk, das mit menschlichen Entscheidungen trainiert wurde, sagte die Entscheidungen der Spieler mit hoher Genauigkeit voraus. Ein Hybridmodell, das ein klassisches Verhaltensmodell mit einem neuronalen Netzwerk kombiniert, übertraf das reine neuronale Netzwerk, insbesondere bei der Erfassung des Einflusses der Spielkomplexität. Die Studie zeigt, dass Menschen in einfacheren Spielen vorhersehbarer, in komplexen Spielen aber weniger rational handeln. Diese Forschung bietet neue Einblicke in die menschlichen Entscheidungsprozesse und legt den Grundstein für verhaltenswissenschaftliche Interventionen, die auf die Förderung rationalerer Entscheidungen abzielen.

(phys.org)

KI Entscheidungsmodelle

SmolLM3: Ein kleiner, multilingualer, langkontextueller Reasoner

2025-07-09

SmolLM3 ist ein vollständig quelloffenes, multilingualer Sprachmodell mit 3 Milliarden Parametern, das eine überzeugende Balance zwischen Effizienz und Leistung bietet. Es übertrifft Llama-3.2-3B und Qwen2.5-3B in verschiedenen Benchmarks und konkurriert sogar mit größeren 4-Milliarden-Parameter-Modellen. Es unterstützt 6 Sprachen und verfügt über eine Kontextlänge von bis zu 128.000 Tokens sowie eine einzigartige Dual-Mode-Reasoning-Fähigkeit (think/no_think). Über das Modell hinaus veröffentlichen die Forscher den vollständigen Engineering-Blueprint, einschließlich Architekturdetails, Datenmischungen und Trainingsmethodik – eine wertvolle Ressource für alle, die Modelle in dieser Größenordnung bauen oder untersuchen.

(huggingface.co)

KI langer Kontext

ChatGPTs neuer "Gemeinsam lernen"-Modus: KI-Tutor oder Schummelhelfer?

2025-07-08

Einige ChatGPT Plus-Abonnenten berichten über eine neue Funktion namens "Gemeinsam lernen". Anstatt direkt auf Eingabeaufforderungen zu antworten, stellt dieser Modus Berichten zufolge Fragen und fordert die Nutzer zu aktiver Teilnahme auf, ähnlich wie ein KI-Tutor. Es wird spekuliert, ob er sich zu einer Funktion für Lerngruppen mit mehreren Nutzern entwickeln wird und wie effektiv er bei der Verhinderung von akademischer Unehrlichkeit sein wird. OpenAI hat sich nicht geäußert, und ChatGPT selbst bleibt vage, was den umfassenderen Rollout der Funktion betrifft. Dieser neue Modus unterstreicht die doppelte Rolle von ChatGPT in der Bildung: Er kann das Lernen unterstützen, aber auch zum Schummeln beitragen; "Gemeinsam lernen" könnte der Versuch von OpenAI sein, die Nutzung auf positive Anwendungen auszurichten.

(techcrunch.com)

KI Lernmodus

KI-gestützte generative Modelle prägen anamorphe Bilder neu

2025-07-08

Traditionelle anamorphe Bilder offenbaren ihre wahre Form nur aus einem bestimmten Blickwinkel. Dieser Artikel nutzt latente rektifizierte Flussmodelle und eine neue Bildverzerrungstechnik namens Laplace-Pyramiden-Warping, um anamorphe Bilder zu erzeugen, die auch bei direkter Betrachtung eine gültige Interpretation behalten. Diese Arbeit erweitert visuelle Anagramme auf latente Raummodelle und ein breiteres Spektrum an räumlichen Transformationen und ermöglicht die Schaffung neuartiger generativer Wahrnehmungsillusionen, die neue Möglichkeiten in der Bilderzeugung eröffnen.

(studios.disneyresearch.com)

KI Anamorphe Bilder

Prototypierung von Indoor-Karten mit VLMs: Von Fotos zu Positionen

2025-07-07

An einem Wochenende erstellte der Autor einen Prototyp eines Indoor-Lokalisierungssystems mithilfe eines einzigen Fotos und modernster Vision-Language-Modelle (VLMs). Durch die Annotation einer Einkaufszentrumskarte, die Identifizierung sichtbarer Geschäfte auf dem Foto und die Nutzung der Bilderkennungsfähigkeiten des VLM gelang es dem System, den Standort des Fotos mit der Karte abzugleichen. Trotz einiger Unklarheiten sind die Ergebnisse erstaunlich genau und zeigen das Potenzial von VLMs für die Indoor-Lokalisierung. Dies eröffnet spannende Möglichkeiten für zukünftige AR-Anwendungen und die Robotik, unterstreicht aber auch potenzielle Umweltbedenken.

(arjo129.github.io)

KI Indoor-Lokalisierung

Der Explorationsengpass in LLMs: Die nächste Grenze der Erfahrungssammlung

2025-07-07

Der Erfolg großer Sprachmodelle (LLMs) beruht auf massivem Pretraining mit riesigen Mengen an Textdaten, einer Ressource, die irgendwann erschöpft sein wird. Die Zukunft der KI wird sich in ein „Zeitalter der Erfahrung“ verschieben, in dem das effiziente Sammeln der richtigen Art von Erfahrung, die für das Lernen von Vorteil ist, entscheidend sein wird, anstatt einfach Parameter zu stapeln. Dieser Artikel untersucht, wie Pretraining implizit einen Teil des Explorationsproblems löst und wie eine bessere Exploration zu einer besseren Generalisierung führt. Der Autor schlägt vor, dass Exploration aus zwei Achsen besteht: „Weltsampling“ (Auswahl von Lernumgebungen) und „Pfadsampling“ (Sammlung von Daten innerhalb von Umgebungen). Die zukünftige Skalierung von KI muss die Informationsdichte auf diesen beiden Achsen optimieren und die Rechenressourcen effizient zuweisen, anstatt einfach die Parametergröße oder das Datenvolumen zu verfolgen.

(yidingjiang.github.io)

KI

Meine Pocket-Daten haben meine Geheimnisse enthüllt

2025-07-07

Vor der Schließung von Pocket exportierte der Autor fast 900 gespeicherte Artikel über sieben Jahre und nutzte das KI-Tool o3, um sie zu analysieren. Überraschenderweise leitete o3 präzise Alter, Geschlecht, Standort, Beruf, Einkommen, Familienstand des Autors und sogar seine politische Ausrichtung, Risikobereitschaft und seinen Lernstil ab. Dies führte zu Überlegungen über Datenschutz und KI-Fähigkeiten und inspirierte die Erstellung eines personalisierten Content-Empfehlungssystems.

(noperator.dev)

KI

Anthropics Claude: Fair Use vs. Piraterie beim KI-Training

2025-07-07

Anthropic hat beim Training seines KI-Chatbots Claude Millionen urheberrechtlich geschützter Bücher "zerstörerisch gescannt" und Millionen von Raubkopien heruntergeladen. Ein Richter entschied, dass die Verwendung gekaufter Bücher zum Training als Fair Use gilt, die Verwendung von Raubkopien jedoch eine Urheberrechtsverletzung darstellt. Dieser Fall, ein wegweisendes Urteil zum Thema KI-Trainingsdaten, beleuchtet die anhaltende Debatte über die ethische Beschaffung von Trainingsdaten für große Sprachmodelle.

(www.businessinsider.com)

KI

AGI-Zeitlinien: KI für Steuern 2028? On-the-Job-Lernen 2032?

2025-07-07

Podcast-Host Dwarkesh diskutiert AGI-Zeitlinien. Er argumentiert, dass aktuelle LLMs zwar beeindruckend sind, ihr Mangel an kontinuierlichem Lernen ihre realen Anwendungen stark einschränkt. Am Beispiel des Saxophonspielens veranschaulicht er, wie LLMs anders lernen als Menschen, nicht in der Lage, Erfahrungen zu sammeln und Fähigkeiten wie Menschen zu verbessern. Dies führt dazu, dass er in Bezug auf AGI-Durchbrüche in den nächsten Jahren vorsichtig, aber in Bezug auf das Potenzial der nächsten Jahrzehnte optimistisch ist. Er prognostiziert 2028 für KI, die Steuern so effizient wie ein menschlicher Manager bearbeitet (einschließlich des Nachverfolgens von Belegen und Rechnungen), und 2032 für KI, die so nahtlos im Job lernt wie ein Mensch. Er glaubt, dass sobald kontinuierliches Lernen gelöst ist, AGI einen massiven Sprung bedeuten wird, der möglicherweise zu etwas Ähnlichem wie einer Intelligenzexplosion führt.

(www.dwarkesh.com)

KI Kontinuierliches Lernen

Entschlüsseltes Apple KI-Sicherheitsmodell: Einblicke in die Inhaltsfiltermechanismen

2025-07-07

Dieses Projekt entschlüsselt Apples KI-Sicherheitsmodell-Filterdateien, die Regeln für verschiedene Modelle enthalten. Mit LLDB-Debugging und benutzerdefinierten Skripten kann der Verschlüsselungsschlüssel abgerufen und diese Dateien entschlüsselt werden. Die entschlüsselten JSON-Dateien enthalten Regeln zum Filtern schädlicher Inhalte und zur Gewährleistung der Sicherheit, wie z. B. die genaue Übereinstimmung von Schlüsselwörtern, zu entfernende Phrasen und Filterung durch reguläre Ausdrücke. Das Projekt stellt die entschlüsselten Regeldateien und Entschlüsselungsskripte bereit, sodass Forscher die Sicherheitsmechanismen von Apples KI-Modell analysieren können.

(github.com)

KI Modellfilterung

Huaweis großes Sprachmodell Pangu: Whistleblower enthüllt Plagiatskandal

2025-07-06

Ein Mitarbeiter des Huawei Noah's Ark Lab, der an dem großen Sprachmodell Pangu arbeitet, hat einen schockierenden Plagiatsvorfall innerhalb des Unternehmens aufgedeckt. Der Whistleblower behauptet, dass Wang Yunhes kleines Modelllabor wiederholt Modelle anderer Unternehmen (wie Qwen) „umgekleidet“ und als Huaweis eigene Pangu-Modelle ausgegeben hat, um Anerkennung und Belohnungen zu erhalten. Der Bericht beschreibt den immensen internen Druck, die ungerechte Behandlung und den erheblichen Verlust an Talenten und wirft ernsthafte Fragen zur Management des LLM-Entwicklungs bei Huawei auf.

(dilemmaworks.substack.com)

KI

Apples heimliches KI-Modell: DiffuCode generiert Code schneller

2025-07-06

Apple hat auf Hugging Face leise ein neues KI-Modell namens DiffuCode-7B-cpGRPO veröffentlicht, das Code generiert. Im Gegensatz zu herkömmlichen autoregressiven LLMs verwendet DiffuCode eine Diffusionsmodell-Architektur und verarbeitet mehrere Code-Abschnitte parallel, was die Codegenerierung deutlich beschleunigt. Basierend auf dem Open-Source-Modell Qwen2.5-7B von Alibaba und mit zusätzlichem coupled-GRPO-Training verbessert, erzeugt es qualitativ hochwertigen Code. Obwohl DiffuCode noch nicht an GPT-4 oder Gemini Diffusion heranreicht, zeigt es in Code-Benchmarks vielversprechende Ergebnisse und unterstreicht Apples innovativen Ansatz in der generativen KI.

(9to5mac.com)

KI

Feinabstimmung von GPT-2 zur Generierung positiver Gefühle mit RLHF

2025-07-06

Dieses Projekt bietet eine Referenzimplementierung für die Feinabstimmung eines vortrainierten GPT-2-Modells, um Sätze zu generieren, die positive Gefühle ausdrücken, mithilfe von Reinforcement Learning from Human Feedback (RLHF). Der Prozess umfasst drei Schritte: 1. Überwachtes Feintuning (SFT): Feintuning von GPT-2 auf dem Datensatz stanfordnlp/sst2; 2. Training des Belohnungsmodells: Training eines GPT-2-Modells mit einem Belohnungskopf, um das Gefühl vorherzusagen; 3. Reinforcement Learning via Proximal Policy Optimization (PPO): Optimierung des SFT-Modells, um Sätze zu generieren, die vom Belohnungsmodell positiv bewertet werden. Diese drei Schritte werden in drei Jupyter Notebooks implementiert, was einen schrittweisen Ansatz ermöglicht. Ein Hugging Face-Zugriffstoken ist erforderlich, um das vortrainierte GPT-2-Modell herunterzuladen.

(github.com)

KI Sentimentanalyse

Category: KI