Webtagr - Technologienummer

LeCun: Große Sprachmodelle werden in fünf Jahren überholt sein

2025-04-05

Yann LeCun, Metas Chef-KI-Wissenschaftler, prognostiziert, dass große Sprachmodelle (LLMs) innerhalb von fünf Jahren weitgehend obsolet sein werden. Er argumentiert, dass aktuelle LLMs ein mangelndes Verständnis der physischen Welt aufweisen und als spezialisierte Werkzeuge in einem einfachen, diskreten Raum (Sprache) funktionieren. LeCun und sein Team entwickeln einen alternativen Ansatz namens JEPA, der darauf abzielt, Repräsentationen der physischen Welt aus visuellen Eingaben zu erstellen und so echte Fähigkeiten zum Schließen und Planen zu ermöglichen, die LLMs übertreffen. Er sieht vor, dass KI die Gesellschaft verändern wird, indem sie die menschliche Intelligenz erweitert und nicht ersetzt, und widerlegt Behauptungen, dass KI ein existenzielles Risiko darstellt.

(www.newsweek.com)

KI

Revolutionäres OCR-System: Förderung von KI-Bildungsdatensätzen

2025-04-05

Ein bahnbrechendes, für maschinelles Lernen optimiertes OCR-System extrahiert strukturierte Daten aus komplexen Bildungsmaterialien wie Prüfungsarbeiten. Es unterstützt mehrsprachige Texte, mathematische Formeln, Tabellen, Diagramme und Grafiken und ist ideal für die Erstellung hochwertiger Trainingsdatensätze. Das System annotiert die extrahierten Elemente semantisch und generiert automatisch Beschreibungen in natürlicher Sprache, z. B. beschreibende Texte für Diagramme. Es unterstützt Japanisch, Koreanisch und Englisch und lässt sich einfach für weitere Sprachen anpassen. Die Ausgabe erfolgt in KI-fähigen JSON- oder Markdown-Formaten, einschließlich menschenlesbarer Beschreibungen mathematischer Ausdrücke, Tabellenübersichten und Bildunterschriften. Es erreicht über 90-95 % Genauigkeit bei realen akademischen Datensätzen und verarbeitet komplexe Layouts mit dichtem wissenschaftlichen Inhalt und umfangreichen visuellen Elementen.

(github.com)

KI

OpenAIs o3-Modell erzielt Durchbruch beim ARC-AGI-Test, aber die Definition von AGI bleibt umstritten

2025-04-04

Das neueste Modell von OpenAI, o3, erzielte beim ARC-AGI-Test von François Chollet eine beeindruckende Punktzahl von 87 % und erreichte damit erstmals die menschliche Leistungsfähigkeit. Dies löste eine hitzige Debatte darüber aus, ob AGI (Artificial General Intelligence) erreicht wurde. Chollet veröffentlichte jedoch schnell den schwierigeren ARC-AGI-2-Test, bei dem die Punktzahl von o3 stark sank und die Definition und Metriken der Branche für AGI erneut in Frage stellte. Dieser Artikel untersucht die unterschiedlichen Standpunkte und die komplexe Beziehung zwischen der Definition von AGI und den kommerziellen Interessen, was zu einer tiefgreifenden Reflexion über die Natur der allgemeinen künstlichen Intelligenz führt.

(www.theatlantic.com)

KI

LLMs knacken einen byzantinischen Musiknotationscode

2025-04-04

Forscher haben entdeckt, dass große Sprachmodelle wie Claude und GPT-4 einen besonderen Code knacken können, der auf dem Unicode-Block der byzantinischen Musiknotation basiert. Dieser Code ähnelt einer Caesar-Chiffre, hat aber einen Offset von 118784. Die Modelle können diesen Code direkt ohne Chain-of-Thought entschlüsseln und erreichen dabei sogar höhere Erfolgsraten als bei regulären Caesar-Chiffren. Die Forscher vermuten, dass dies auf einen linearen Zusammenhang zwischen der Addition in einem bestimmten Unicode-Bereich und der Addition im Token-Raum zurückzuführen ist, der es den Modellen ermöglicht, eine Shift-Chiffre basierend auf dieser Beziehung zu lernen. Dieses Phänomen deutet auf noch unverstandene Mechanismen innerhalb von LLMs hin.

(fi-le.net)

KI

Google präsentiert Sec-Gemini v1: Eine neue Ära der KI-gestützten Cybersicherheit

2025-04-04

Google hat Sec-Gemini v1 angekündigt, ein experimentelles KI-Modell, das darauf abzielt, die Grenzen der KI in der Cybersicherheit zu erweitern. Durch die Kombination der fortschrittlichen Fähigkeiten von Gemini mit nahezu Echtzeit-Cybersicherheitswissen und -Tools zeichnet sich Sec-Gemini v1 in wichtigen Arbeitsabläufen wie der Analyse der Wurzelursache von Vorfällen, der Bedrohungsanalyse und dem Verständnis der Auswirkungen von Schwachstellen aus. Es übertrifft andere Modelle bei wichtigen Benchmarks und zeigt eine Verbesserung von mindestens 11 % bei CTI-MCQ und mindestens 10,5 % bei CTI-Root Cause Mapping. Google stellt Sec-Gemini v1 ausgewählten Organisationen, Institutionen, Fachleuten und NGOs für Forschungszwecke kostenlos zur Verfügung, um die Zusammenarbeit und den Fortschritt von KI in der Cybersicherheit zu fördern.

(security.googleblog.com)

KI

DeepMind: Blaupause für die sichere Entwicklung von AGI – Bewältigung der Risiken von 2030

2025-04-04

Inmitten des AI-Hypes verlagert sich der Fokus auf Künstliche Allgemeine Intelligenz (AGI). Ein neues 108-seitiges Papier von DeepMind befasst sich mit der entscheidenden Frage der sicheren AGI-Entwicklung und prognostiziert eine mögliche Ankunft bis 2030. Das Papier beschreibt vier Hauptkategorien von Risiken: Missbrauch, Missalignment, Fehler und strukturelle Risiken. Zur Risikominderung schlägt DeepMind rigorose Tests, robuste Sicherheitsprotokolle nach dem Training und sogar die Möglichkeit des „Verlernens“ gefährlicher Fähigkeiten vor – eine erhebliche Herausforderung. Dieser proaktive Ansatz zielt darauf ab, schwere Schäden durch eine menschenähnliche KI zu verhindern.

(arstechnica.com)

KI

Die komplexe Sprache der Bonobos: Mehr als die Summe ihrer Teile

2025-04-03

Schweizer Wissenschaftler haben entdeckt, dass Bonobos einfache Lautäußerungen zu komplexen semantischen Strukturen kombinieren können. Das bedeutet, dass ihre Kommunikation mehr als nur die Summe einzelner Rufe ist; sie zeigt eine nicht-triviale Kompositionalität – ein Merkmal, das einst als einzigartig menschlich galt. Die Forscher haben eine massive Datenbank von Bonobo-Rufen erstellt und die distributional semantics verwendet, um deren Bedeutung zu entschlüsseln. Dies bietet einen wertvollen Einblick in die Kommunikation von Bonobos in freier Wildbahn. Die Forschung war mühsam und erforderte von den Forschern, früh aufzustehen, zu den Bonobo-Nestern zu wandern und den ganzen Tag über Rufe und Kontextinformationen aufzuzeichnen.

(arstechnica.com)

KI distributive Semantik

KI-Bildgenerierung: Ghibli-ähnliche Nachahmung wirft Urheberrechtsfragen auf

2025-04-03

Ein aktuelles Update der GPT-Bildgenerierung ermöglicht es Nutzern, jedes Bild in einen Ghibli-ähnlichen Stil zu verwandeln. Dies zeigt die beeindruckende Fähigkeit der KI, Stile nachzuahmen, wirft aber auch erhebliche Urheberrechtsfragen auf. Der Autor führt ein Experiment durch und zeigt, wie einfach GPT Bilder erzeugt, die bekannten IP-Charakteren verblüffend ähnlich sind, selbst ohne die IP explizit zu nennen. Dies ist sowohl beeindruckend als auch alarmierend und unterstreicht das Potenzial der KI, den Diebstahl geistigen Eigentums zu erleichtern. Obwohl Gesetze die Nachahmung visueller Stile erlauben, überschreitet die Präzision der Nachahmung die Grenzen des Urheberrechts, was zu Überlegungen über das Verhältnis zwischen KI-Entwicklung und Urheberrechtsschutz führt.

(theaiunderwriter.substack.com)

KI

KI 2027: Ein Wettlauf zur Superintelligenz und die damit verbundenen Risiken

2025-04-03

Dieser Bericht prognostiziert, dass die Auswirkungen von übermenschlicher KI im nächsten Jahrzehnt enorm sein werden und die der industriellen Revolution übertreffen werden. OpenAI und andere Institutionen haben zwei mögliche Zukünfte modelliert: ein Szenario der Verlangsamung und ein Wettrennen. Der Bericht beschreibt detailliert den rasanten Fortschritt von KI-Systemen, von ungeschickten Agenten Anfang 2025 bis hin zu Superintelligenzen im Jahr 2027, die in der Lage sind, Menschen in der Codierung und Forschung zu übertreffen. Dieser schnelle Fortschritt birgt jedoch auch immense Risiken, darunter die Sicherheit der Modelle und ein KI-Wettrüsten mit China. Der Bericht hebt die tiefgreifenden Auswirkungen von KI auf den Arbeitsmarkt und die Geopolitik hervor und untersucht mögliche Strategien zur Risikominderung.

(ai-2027.com)

KI Zukunftsprognose

Onyx: Open-Source GenAI-Plattform sichert sich 10 Millionen Dollar in Seed-Finanzierung

2025-04-03

Onyx ist eine Open-Source-Plattform für generative KI, die die Dokumente, Anwendungen und Mitarbeiter Ihres Unternehmens verbindet. Sie erfasst und synchronisiert Informationen aus verschiedenen Quellen (Google Drive, Slack, GitHub, Confluence, Salesforce usw.), um einen zentralen Hub für Fragen zu schaffen. Stellen Sie sich Ihre erfahrensten Kollegen vor, alle an einem Ort, rund um die Uhr verfügbar! Onyx glaubt, dass jedes moderne Team innerhalb der nächsten 5 Jahre KI mit Wissensverbesserung einsetzen wird, und hat sich zum Ziel gesetzt, diese Technologie allen Teams weltweit zugänglich zu machen. Sie haben gerade eine Seed-Finanzierung von 10 Millionen Dollar abgeschlossen, angeführt von Khosla Ventures und First Round Capital, mit Kunden wie Netflix, Ramp und Applied Intuition sowie Open-Source-Nutzern wie Roku, Zendesk und L3Harris.

(www.ycombinator.com)

KI Unternehmens-Wissensmanagement

MIT-Professorin entschlüsselt die Mechanismen der Sprachverarbeitung im Gehirn

2025-04-03

Vom Erlernen mehrerer Sprachen in der ehemaligen Sowjetunion bis hin zu ihrer Position als Associate Professorin für Gehirn- und Kognitionswissenschaften am MIT widmet Dr. Evelina Fedorenko ihre Forschung dem Verständnis der Sprachverarbeitungsregionen im Gehirn. Ihre Arbeit nutzt die funktionelle Magnetresonanztomographie (fMRT), um diese Regionen präzise zu lokalisieren und ihre hohe Selektivität für Sprache und die fehlende Überlappung mit anderen kognitiven Funktionen wie Musikverarbeitung oder Code-Lesen aufzuzeigen. Darüber hinaus untersucht sie zeitliche Unterschiede in der Verarbeitung zwischen verschiedenen Hirnregionen, die Entwicklung der Sprachverarbeitungsregionen bei Kleinkindern und nutzt große Sprachmodelle, um die Plastizität und Redundanz der sprachlichen Fähigkeiten des Gehirns zu untersuchen.

(news.mit.edu)

KI Sprachverarbeitung Kognitive Neurowissenschaft

Der blinde Fleck der KI: Spiegel in der Bild- und Videogenerierung

2025-04-03

Die jüngsten Fortschritte in der KI-basierten Bild- und Videogenerierung haben beeindruckende, fotorealistische Ergebnisse geliefert, doch eine erhebliche Hürde bleibt bestehen: die genaue Wiedergabe von Spiegelungen. Forscher testeten mehrere führende Modelle und stellten dabei konsistente Probleme bei der Erzeugung korrekter Spiegelungen fest. Die Modelle produzierten häufig verzerrte, inkonsistente oder völlig ungenaue Bilder. Beispielsweise scheiterte Gemini bei der Spiegelung von Katzen und Stühlen, während Ideogram mit menschlichen Spiegelungen in Gruppenfotos zu kämpfen hatte. Dies unterstreicht eine wichtige Einschränkung: Obwohl die KI-Bildgenerierung schnell voranschreitet, bleibt das Erreichen physikalischer Genauigkeit – wie realistische Spiegelungen – eine große Herausforderung.

(medium.com)

KI

Anthropic bringt Claude for Education heraus und nimmt ChatGPT in Angriff

2025-04-03

Anthropic hat Claude for Education auf den Markt gebracht, einen neuen KI-Chatbot-Dienst für die Hochschulbildung, der direkt mit OpenAIs ChatGPT Edu konkurriert. Dieses Level bietet Studenten und Dozenten Zugriff auf Claude, mit einem neuen „Lernmodus“, um kritisches Denken zu fördern. Es umfasst Sicherheit und Datenschutz auf Unternehmensebene und hat bereits Vereinbarungen mit Universitäten wie Northeastern und der London School of Economics getroffen. Anthropic zielt darauf ab, durch dieses Angebot die Einnahmen zu steigern und die Akzeptanz bei Studenten zu erhöhen.

(techcrunch.com)

KI KI in der Bildung

Apple veröffentlicht CA-1M-Datensatz und Cubify Transformer-Modell für die 3D-Objekterkennung in Innenräumen

2025-04-02

Apple hat CA-1M veröffentlicht, einen umfangreichen Datensatz für die 3D-Objekterkennung in Innenräumen, zusammen mit dem Cubify Transformer (CuTR)-Modell. CA-1M enthält umfassend annotierte 3D-Bounding-Boxen und Posen. Es werden zwei Varianten des CuTR-Modells bereitgestellt: eine mit RGB-D-Bildern und eine andere nur mit RGB-Bildern. Der Datensatz unterstützt die Echtzeit-Erkennung mit der NeRF Capture-App und enthält umfassende Anweisungen und Codebeispiele. Forscher können diesen Datensatz und dieses Modell nutzen, um die Forschung zur 3D-Objekterkennung in Innenräumen voranzutreiben.

(github.com)

KI 3D-Objekterkennung

KI-Agenten: Identität als entscheidendes Kriterium

2025-04-02

Dieser Artikel befasst sich mit der oft verwirrenden Definition von KI-Agenten. Der Autor argumentiert, dass der entscheidende Unterschied zwischen KI-Agenten und KI-Assistenten in der „Identität“ liegt. Wahre KI-Agenten führen Aktionen unter ihrer eigenen Identität aus, die in Audit-Logs widergespiegelt wird; KI-Assistenten arbeiten unter der Identität eines menschlichen Benutzers. Diese identitätsbasierte Definition impliziert Autonomie, Fähigkeiten und logisches Denken. Der Autor zieht eine Parallele zur juristischen Vertretung und verwendet das Produkt seines eigenen Unternehmens als Beispiel, um die praktische Anwendung dieser Definition zu veranschaulichen.

(www.tines.com)

KI

Echtzeit-Introspektive Kompression: Transformers ein Gewissen geben

2025-04-02

Große Sprachmodelle (LLMs) leiden unter zwei Hauptbeschränkungen: Mangelnde Introspektion und flüchtiges Denken. Dieser Artikel schlägt eine neuartige Echtzeit-introspektive Kompressionsmethode vor, die beide Probleme angeht. Ein leichtgewichtiges „Nebenläufer“-Modell wird trainiert, um die internen Zustände eines Transformators zu komprimieren, wodurch effizienter Zugriff und Wiedergabe des internen Modellverhaltens ermöglicht werden. Die Methode komprimiert die Transformatorzustände in einen niedrigdimensionalen latenten Raum, ähnlich dem Speichern eines Spielstands, und umgeht so das rechnerische Problem der Speicherung des vollständigen Zustands. Dies ermöglicht neue Fähigkeiten wie das Zurückverfolgen des Denkens, Reinforcement Learning über Denktrajektorien und speichereffizientes Checkpointing, was letztendlich zu leistungsfähigeren und interpretierbareren KI-Systemen führt.

(github.com)

KI Modellkompression Introspektion

Ace: Übermenschlich schneller Computer-Autopilot

2025-04-02

Ace ist ein Computer-Autopilot, der Maus und Tastatur verwendet, um Aufgaben auf Ihrem Desktop auszuführen. Er übertrifft andere Modelle bei einer Reihe von Computeraufgaben und verfügt über übermenschliche Geschwindigkeit. Trainiert mit über einer Million Aufgaben von Software-Spezialisten und Fachexperten, führt Ace Maus-Klicks und Tastenanschläge basierend auf Bildschirm und Eingabeaufforderung aus. Obwohl er sich noch in der Entwicklung befindet und gelegentlich Fehler macht, verbessert sich seine Genauigkeit mit zunehmenden Trainingsressourcen deutlich. Eine frühe Forschungsvorschau ist jetzt verfügbar.

(generalagents.com)

KI

MathArena: Strenge Bewertung von LLMs bei Mathematik-Wettbewerben

2025-04-02

MathArena ist eine Plattform zur Bewertung großer Sprachmodelle (LLMs) bei aktuellen Mathematik-Wettbewerben und -Olympiaden. Sie gewährleistet eine faire und unvoreingenommene Bewertung, indem sie Modelle ausschließlich auf Wettbewerben nach ihrer Veröffentlichung testet und retroaktive Bewertungen potenziell durchgesickerter Daten vermeidet. Die Plattform veröffentlicht Ranglisten für jeden Wettbewerb, die die Punktzahlen einzelner Probleme für verschiedene Modelle anzeigen, sowie eine Haupttabelle, die die Leistung über alle Wettbewerbe hinweg zusammenfasst. Jedes Modell wird viermal pro Problem ausgeführt, wobei der Durchschnittswert und die Kosten (in USD) berechnet werden. Der Bewertungscode ist Open Source: https://github.com/eth-sri/matharena.

(matharena.ai)

KI Mathematik-Wettbewerbe

Borges und Simon: Ein interdisziplinäres Gespräch in Buenos Aires 1970

2025-04-02

1970 in Buenos Aires trafen sich der argentinische Schriftsteller Jorge Luis Borges und der KI-Pionier Herbert A. Simon zu einem faszinierenden interdisziplinären Gespräch. Ihre Unterhaltung, die sich mit freiem Willen versus Determinismus auseinandersetzte, erforschte die Parallelen zwischen menschlichem Verhalten und Computerprogrammen. Borges' scharfsinnige Fragen forderten Simon heraus, die deterministische Natur menschlichen Handelns mit der Bewahrung der individuellen Identität in Einklang zu bringen. Dieser Austausch unterstreicht den Wert interdisziplinären Denkens und bietet eine aktuelle Reflexion über die Herausforderungen, vor denen die Wissenschaft heute steht, wobei die Notwendigkeit der Zusammenarbeit zwischen Geisteswissenschaften und STEM-Fächern betont wird. Das Gespräch regt auch zur Betrachtung der Simulation historischer Persönlichkeiten mithilfe von KI an.

(resobscura.substack.com)

KI Interdisziplinär Geisteswissenschaften

Googles Gemini Robotics: Ein erfolgreicher Dunk beim ersten Versuch

2025-04-02

Google präsentierte sein neues Gemini Robotics-Modell, das es Robotern ermöglicht, komplexe Aufgaben zu erledigen, wie zum Beispiel einen erfolgreichen Dunking-Wurf beim ersten Versuch, ohne vorheriges Training für das spezifische Objekt oder die Aktion. Basierend auf Gemini 2.0 wird das Modell mit roboterspezifischen Daten feinabgestimmt und übersetzt multimodale Ausgaben (Text, Video, Audio) in physische Aktionen. Es ist hochgradig geschickt, interaktiv und allgemein einsetzbar und passt sich ohne weiteres Training an neue Objekte, Umgebungen und Anweisungen an. Googles Ziel ist es, eine verkörperte KI zu entwickeln, um Roboter anzutreiben, die bei alltäglichen Aufgaben helfen und letztendlich zu einer so allgegenwärtigen KI-Schnittstelle werden wie Telefone oder Computer.

(blog.google)

KI verkörperte KI

Pulse: KI-Startup löst das Problem der komplexen Dokumentdatenextraktion

2025-04-02

Pulse begegnet einer hartnäckigen Herausforderung in der Dateninfrastruktur: die Extraktion genauer, strukturierter Informationen aus komplexen Dokumenten im großen Maßstab. Ihr bahnbrechender Ansatz kombiniert intelligentes Schema-Mapping mit feinabgestimmten Extraktionsmodellen und übertrifft herkömmliche OCR- und andere Parsing-Tools. Das schnell wachsende Team mit Sitz in San Francisco bedient Fortune-100-Unternehmen, YC-Startups und mehr und wird von erstklassigen Investoren unterstützt. Ihre mehrstufige Architektur umfasst Layout-Verständnis, Low-Latency-OCR, fortschrittliche Algorithmen zur Lesereihenfolge, proprietäre Tabellenerkennung und visuelle Sprachmodelle für Diagramme und Tabellen. Wenn Sie sich für Computer Vision, NLP und Dateninfrastruktur begeistern, bietet Pulse die Möglichkeit, Kunden direkt zu beeinflussen und die Zukunft der Dokumentenintelligenz zu gestalten.

(www.ycombinator.com)

KI Dokumentenintelligenz

OpenAI wegen Training von GPT-4o mit nicht lizenzierten kostenpflichtigen Büchern beschuldigt

2025-04-02

Ein neuer Bericht des AI Disclosures Project wirft OpenAI vor, nicht lizenzierte, kostenpflichtige Bücher, hauptsächlich von O'Reilly Media, zum Trainieren seines GPT-4o-Modells verwendet zu haben. Der Bericht verwendet die Methode DE-COP, um zu zeigen, dass GPT-4o eine deutlich stärkere Erkennung von O'Reillys kostenpflichtigen Inhalten aufweist als GPT-3.5 Turbo, was auf umfangreiche nicht autorisierte Daten in seinem Training hindeutet. Obwohl OpenAI über einige Datenlizenzen verfügt und Opt-out-Mechanismen anbietet, verschärft dies die bestehenden rechtlichen Herausforderungen im Zusammenhang mit seinen Urheberrechtspraktiken. Die Autoren räumen Einschränkungen ihrer Methodik ein, aber die Ergebnisse werfen ernsthafte Bedenken hinsichtlich der Datenbeschaffungsmethoden von OpenAI auf.

(techcrunch.com)

KI

Schaltungsverfolgung: Aufdeckung von Berechnungsgraphen in LLMs

2025-04-02

Forscher stellen einen neuen Ansatz vor, um die interne Funktionsweise von Deep-Learning-Modellen mithilfe von Cross-Layer-Transcodern (CLTs) zu interpretieren. CLTs zerlegen die Aktivierungen des Modells in spärliche, interpretierbare Merkmale und konstruieren kausale Graphen der Merkmalsinteraktionen, wodurch aufgezeigt wird, wie das Modell Ausgaben generiert. Die Methode erklärt erfolgreich die Antworten des Modells auf verschiedene Eingaben (z. B. Akronymgenerierung, Faktenabruf und einfache Addition) und wird durch Störversuche validiert. Obwohl es Einschränkungen gibt, wie z. B. die Unfähigkeit, die Aufmerksamkeitsmechanismen vollständig zu erklären, bietet sie ein wertvolles Werkzeug, um die interne Funktionsweise großer Sprachmodelle zu verstehen.

(transformer-circuits.pub)

KI Modellinterpretierbarkeit Cross-Layer-Transcoder

Emergente Ökonomien aus einfachen Agenteninteraktionen: Ein simulierter Markt

2025-04-02

Dieser Artikel präsentiert ein simuliertes Marktökonomiemodell, das auf dem Verhalten einzelner Agenten basiert. Mit einfachen Kauf-/Verkaufsentscheidungsregeln erzeugt das Modell komplexe Marktdynamiken. Jeder Agent trifft Entscheidungen basierend auf seiner persönlichen Bewertung eines Gutes und seinem erwarteten Marktpreis und passt seine Erwartungen nach jeder Transaktion an. Die Simulation zeigt eine Konvergenz zum durchschnittlichen persönlichen Wert und passt sich an Umweltveränderungen an. Dies bietet einen neuartigen Ansatz für dynamische Wirtschaftssysteme in Open-World-RPGs, obwohl Herausforderungen bei der Behandlung des Transaktionszeitpunkts und der Knappheit bestehen bleiben.

(jasonfantl.com)

KI Wirtschaftssimulation

Das Kontextfenster der KI: Warum ein universeller Standard notwendig ist

2025-04-01

Das Wissen aktueller KI-Modelle wird während des Pretrainings festgelegt, wobei das teure Feintuning nur begrenzte Updates bietet. Dies macht sie blind für Informationen jenseits eines Stichtags. Dieser Artikel untersucht den "Kontext" in der KI: Benutzereingabe, Konversationsverlauf und externe Datenquellen, die alle durch ein "Kontextfenster" begrenzt sind. Ein universeller Standard für externe Datenquellen ist entscheidend, um diese Einschränkung zu überwinden und der KI den Zugriff auf Echtzeitinformationen für verbesserte Intelligenz und Funktionalität zu ermöglichen.

(arstechnica.com)

KI Kontextverständnis Datenstandard

DeepMinds Durchgreifen bei Forschungsarbeiten sorgt für interne Unruhen

2025-04-01

Die Verschärfung des Prüfprozesses für Forschungsarbeiten bei DeepMind hat zu Unmut unter den Mitarbeitern geführt. Ein Artikel, der Schwachstellen in OpenAIs ChatGPT aufdeckte, wurde Berichten zufolge blockiert, was Bedenken hinsichtlich der Priorisierung kommerzieller Interessen gegenüber akademischer Freiheit aufwirft. Der strengere Prüfprozess soll zu Mitarbeiterabgängen beigetragen haben, da die Veröffentlichung von Forschungsergebnissen für die Karriere von Forschern entscheidend ist. Darüber hinaus werden interne Ressourcen zunehmend für die Verbesserung der Gemini-AI-Produktreihe von DeepMind eingesetzt. Obwohl Googles KI-Produkte Markterfolge und einen steigenden Aktienkurs verzeichnen, unterstreicht die interne Spannung den Konflikt zwischen akademischer Forschung und Kommerzialisierung.

(arstechnica.com)

KI Forschungspublikationen

Simulation eines Wurmsgehirns: Ein Schritt zur vollständigen Gehirnemultion?

2025-04-01

Die Simulation des menschlichen Gehirns war ein heiliger Gral der Wissenschaft, aber ihre Komplexität hat sich als entmutigend erwiesen. Wissenschaftler haben sich C. elegans zugewandt, einem Nematoden mit nur 302 Neuronen. Nach 25 Jahren und zahlreichen gescheiterten Versuchen ist die Simulation seines Gehirns dank Fortschritten in der Lichtblattmikroskopie, der Superauflösungsmikroskopie und dem maschinellen Lernen endlich in Reichweite. Diese Technologien ermöglichen die Echtzeitbeobachtung neuronaler Aktivität in lebenden Wurmbereichen und verwenden maschinelles Lernen, um die biophysikalischen Parameter von Neuronen zu erschließen. Die erfolgreiche Simulation eines C. elegans-Gehirns wäre nicht nur eine bemerkenswerte wissenschaftliche Leistung, sondern würde auch unschätzbare Erfahrungen und Methoden liefern, um komplexere Gehirne zu simulieren, einschließlich letztendlich menschlicher Gehirne, und den Weg für zukünftige KI- und Neurowissenschaftenforschung ebnen.

(asteriskmag.com)

KI

Die semantische Apokalypse: KI-Kunst und der Verlust des Staunens

2025-04-01

Dieser Essay untersucht den Einfluss von KI-generierter Kunst auf die Bedeutung von Kunst, am Beispiel von Ultramarin, einem Pigment, das einst unglaublich schwierig und teuer herzustellen war. Der Autor argumentiert, dass die Leichtigkeit der KI-Kunstproduktion das Gefühl des Staunens und der Einzigartigkeit, das mit traditioneller Kunst verbunden ist, mindert und zu hedonischer Adaptation führt. Dies ist nicht einzigartig für KI, sondern ein wiederkehrendes Muster in der Geschichte, da Technologie einst seltene Erfahrungen alltäglich macht. Die vorgeschlagene Lösung ist nicht technologischer, sondern persönlicher Natur: ein kindliches Staunen kultivieren und sich aktiv mit der Welt auseinandersetzen, um die Desensibilisierung durch leicht zugängliche Fülle zu überwinden.

(www.astralcodexten.com)

KI hedonische Adaptation semantische Apokalypse

Jargonic: Ein revolutionäres ASR-Modell für branchenspezifische Sprache

2025-04-01

aiOla hat Jargonic auf den Markt gebracht, ein bahnbrechendes Modell für die automatische Spracherkennung (ASR), das die Einschränkungen bestehender ASR-Modelle bei der Verarbeitung von Branchenspezifischer Sprache, lauten Umgebungen und Echtzeit-Anpassungsfähigkeit behebt. Jargonic nutzt fortschrittliche Domänenanpassung, kontextbezogene Keyword-Erkennung in Echtzeit und Zero-Shot-Learning, um branchenspezifische Sprache out-of-the-box zu verarbeiten, wodurch ein erneutes Training entfällt. Der einzigartige Keyword-Erkennungsmechanismus, kombiniert mit der ASR-Engine, verbessert die Genauigkeit der Transkription deutlich, insbesondere bei Audioaufnahmen mit spezialisierter Terminologie. Darüber hinaus verfügt Jargonic über robuste Rauschbehandlungsfunktionen und erzielt in verschiedenen Sprachen und lauten Industrieumgebungen hohe Leistungen. Benchmark-Tests zeigen, dass es Konkurrenten wie OpenAI Whisper übertrifft.

(aiola.ai)

KI

Umstrukturierung auf dem Markt für generative KI: Gartner prognostiziert Konsolidierung und Aussterben

2025-04-01

Gartner prognostiziert eine erhebliche Konsolidierung auf dem Markt für generative KI (GenAI), mit dem potenziellen Ergebnis, dass nur noch wenige große Akteure übrig bleiben. Die aktuelle Situation zeigt zahlreiche Anbieter großer Sprachmodelle (LLM), die mit hohen Entwicklungs- und Betriebskosten in einem hart umkämpften Markt zu kämpfen haben. Analyst John-David Lovelock sagt eine ähnliche Marktbeherrschung durch wenige Giganten voraus wie bei der Cloud, was den aktuellen Stand von AWS, Azure und Google Cloud widerspiegelt. Unternehmen entscheiden sich zunehmend für gebrauchsfertige kommerzielle Lösungen, anstatt ihre eigenen KI-Software zu entwickeln. Obwohl GenAI ein explosives Wachstum erlebt, mit einer Prognose von 644 Milliarden US-Dollar bis 2025, priorisieren LLM-Entwickler den Markteintritt über die Einnahmen, was zu einer vorhergesagten, wenn auch langsamen, Auslese schwächerer Akteure führt. Es wird kein schneller Zusammenbruch wie bei der Dotcom-Blase sein, sondern eine allmähliche Konsolidierung.

(www.theregister.com)

KI MarktKonsolidierung

Category: KI