Category: KI

Sesame AI veröffentlicht 1-Milliarden-Parameter-Konversations-Sprachmodell

2025-03-18
Sesame AI veröffentlicht 1-Milliarden-Parameter-Konversations-Sprachmodell

Die Sesame AI Labs haben CSM (Conversational Speech Model) veröffentlicht, ein Sprachgenerierungsmodell mit 1 Milliarde Parametern, das auf der Llama-Architektur basiert. CSM generiert RVQ-Audiocodes aus Text- und Audioeingaben, und sein Checkpoint ist auf Hugging Face verfügbar. Eine interaktive Sprachdemo und ein Hugging Face Space zum Testen der Audiogenerierung werden ebenfalls bereitgestellt. Obwohl es in der Lage ist, verschiedene Stimmen zu erzeugen, wurde CSM nicht auf bestimmte Stimmen feinabgestimmt und hat eine begrenzte mehrsprachige Unterstützung. Sesame AI betont die Verwendung nur für Forschungs- und Bildungszwecke und verbietet die Nachahmung, Falschinformationen und illegale Aktivitäten.

Das Modell ist das Produkt: Die nächste Grenze bei KI-Investitionen

2025-03-18

Es gibt viele Spekulationen über die nächste Welle der KI. Der Autor argumentiert, dass die Antwort klar ist: Das Modell selbst ist das Produkt. Die Skalierung von Generalisten verlangsamt sich, das gerichtete Training übertrifft die Erwartungen und die Inferenzkosten sinken. Dies zwingt die Modellanbieter, in der Wertschöpfungskette nach oben zu steigen, während Anwendungsschichten mit Automatisierung und Störungen konfrontiert sind. OpenAIs DeepResearch und Anthropics Claude 3.7 veranschaulichen dies: Nicht nur LLMs oder Chatbots, sondern Modelle, die für spezifische Aufgaben entwickelt wurden. Dies signalisiert eine neue Phase der KI: Modelltrainer dominieren, Anwendungsentwickler werden möglicherweise verdrängt. Investitionen in Anwendungsschichten könnten scheitern, da das Modelltraining den wahren Wert darstellt. Der zukünftige Erfolg in der KI liegt bei Unternehmen, die Modelle trainieren können und über fachübergreifende Teams und einen intensiven Fokus verfügen.

Dusts Query Tables: KI-Agenten mit strukturierter Datenanalyse ausstatten

2025-03-18
Dusts Query Tables: KI-Agenten mit strukturierter Datenanalyse ausstatten

Dust hat Query Tables entwickelt, ein leistungsstarkes KI-Agenten-Tool, das SQL-Abfragen für strukturierte Daten ermöglicht. Beginnend mit der Unterstützung von CSV-Dateien, wurde es um Notion-Datenbanken, Google Tabellen und Office 365-Tabellen erweitert und schließlich um Verbindungen zu Unternehmensdatenlagern wie Snowflake und BigQuery. Eine einheitliche Abstraktionsschicht ermöglicht es Benutzern, verschiedene Datenquellen über dieselbe SQL-Schnittstelle abzufragen und sogar Daten aus verschiedenen Quellen für die Analyse zu kombinieren. Zukünftige Pläne umfassen die Integration von Salesforce, um die Datenanalysefunktionen weiter zu erweitern.

Open-Source-Modell OLMo-2 übertrifft GPT-3.5? Einfache Einrichtung für Mac!

2025-03-18
Open-Source-Modell OLMo-2 übertrifft GPT-3.5? Einfache Einrichtung für Mac!

Das Open-Source-Sprachmodell OLMo-2 mit 32 Milliarden Parametern behauptet, GPT-3.5-Turbo und GPT-4 mini zu übertreffen. Alle Daten, der Code, die Gewichte und Details sind frei verfügbar. Dieser Beitrag beschreibt eine einfache Einrichtung für die Ausführung auf einem Mac mit dem llm-mlx-Plugin. Laden Sie das 17 GB große Modell mit wenigen Befehlen herunter und führen Sie interaktive Chats oder generieren Sie Bilder. Das Beispiel zeigt die Generierung eines SVG-Bildes eines Pelikans auf einem Fahrrad.

KI

Quantenalgorithmus DQI: Ein Durchbruch in der Optimierung?

2025-03-17
Quantenalgorithmus DQI: Ein Durchbruch in der Optimierung?

Das Team von Google Quantum AI hat einen neuen Quantenalgorithmus namens Decodierte Quanteninterferometrie (DQI) entwickelt, der alle bekannten klassischen Algorithmen bei der Lösung einer breiten Klasse von Optimierungsproblemen übertrifft. Der Algorithmus wurde nicht für ein spezifisches Problem entwickelt, sondern übersetzt das Problem in Quantenwellen und wendet Decodierungstechniken an, um die beste Lösung zu finden. Obwohl es an ausreichender Quantenhardware für empirische Tests mangelt und die Möglichkeit zukünftiger klassischer Konkurrenzalgorithmen besteht, hat der potenzielle Vorteil von DQI bei Optimierungsproblemen und seine Anwendungen in der Codierung und Kryptographie die Quantencomputer-Community begeistert. Er gilt als bedeutender Durchbruch bei Quantenalgorithmen.

Googles Gemini 2.0 Flash: Ein leistungsstarker KI-Bildbearbeiter, der Urheberrechtsbedenken aufwirft

2025-03-17
Googles Gemini 2.0 Flash: Ein leistungsstarker KI-Bildbearbeiter, der Urheberrechtsbedenken aufwirft

Googles neues KI-Modell Gemini 2.0 Flash verfügt über leistungsstarke Bildbearbeitungsfunktionen, darunter die Möglichkeit, Wasserzeichen mühelos aus Bildern zu entfernen, sogar aus Bildern von bekannten Bildagenturen wie Getty Images. Diese Funktionalität hat Bedenken hinsichtlich des Urheberrechts aufgeworfen, da das Entfernen von Wasserzeichen ohne Erlaubnis nach US-amerikanischem Urheberrecht in der Regel illegal ist. Obwohl Google die Funktion als experimentell und nur für Entwickler verfügbar kennzeichnet, machen seine leistungsstarken Wasserzeichenentfernungsfunktionen und die fehlenden Nutzungsbeschränkungen es zu einem potenziellen Werkzeug für Urheberrechtsverletzungen. Andere KI-Modelle wie Anthropic's Claude 3.7 Sonnet und OpenAIs GPT-4o weigern sich explizit, Wasserzeichen zu entfernen, da sie dies als unethisch und potenziell illegal betrachten.

Neuro-First KI-Startup sucht Ingenieure für bahnbrechende Gehirn-Computer-Schnittstellen

2025-03-17
Neuro-First KI-Startup sucht Ingenieure für bahnbrechende Gehirn-Computer-Schnittstellen

Piramidal sucht Forschungsingenieure zum Bau von KI-Systemen, die auf neuronalen Daten basieren und bisher unmögliche Aufgaben ermöglichen. Ideale Kandidaten verfügen über starke Engineering-Fähigkeiten, einschließlich der Entwicklung, Implementierung und Verbesserung von großen verteilten Machine-Learning-Systemen sowie über grundlegende Kenntnisse der Neurowissenschaften. Das Unternehmen bietet eine wettbewerbsfähige Vergütung und Aktienoptionen an, angetrieben von der Mission, das menschliche Potenzial durch Technologie zu stärken, die kognitive Freiheit zu verteidigen und sich gegen die Kommerzialisierung von Geistern zu stellen.

KI

Googles KI knackt jahrzehntealtes Superbug-Rätsel in nur zwei Tagen

2025-03-17
Googles KI knackt jahrzehntealtes Superbug-Rätsel in nur zwei Tagen

Ein neues KI-Tool von Google hat ein jahrzehntealtes wissenschaftliches Rätsel in nur zwei Tagen gelöst: den Mechanismus der Antibiotikaresistenz bei Superbugs. Ein Team des Imperial College London verbrachte 10 Jahre damit, zu erforschen, wie bestimmte Superbugs Resistenz entwickeln, aber Googles KI-„Co-Wissenschaftler“, mit einer einfachen Aufforderung, kam in nur 48 Stunden zu derselben Antwort wie die unveröffentlichten Ergebnisse des Teams. Dies zeigt das Potenzial von KI, Beweise zu synthetisieren, die Forschung zu leiten und Experimente zu entwerfen und könnte den wissenschaftlichen Fortschritt revolutionieren. Es wirft jedoch auch ethische und Zuverlässigkeitsprobleme hinsichtlich des Einsatzes von KI in der wissenschaftlichen Forschung auf.

Gründer: Anwendungsorientierter KI-Ingenieur bei Kastle: Revolutionierung der Hypothekenabwicklung mit KI

2025-03-16
Gründer: Anwendungsorientierter KI-Ingenieur bei Kastle: Revolutionierung der Hypothekenabwicklung mit KI

Kastle, eine KI-gestützte Plattform für die größten Hypothekengeber der USA, sucht einen Gründer für die Stelle des Anwendungsorientierten KI-Ingenieurs. Mit der Unterstützung von Y Combinator und anderen führenden Investoren definiert Kastle die Hypothekenabwicklung neu. Diese Rolle erfordert mehr als 3 Jahre Erfahrung in der angewandten KI, Kenntnisse in Python und Deep-Learning-Frameworks sowie Erfahrung im Feintuning von LLMs. Zu den Aufgaben gehören die Integration von KI in die Plattform, die Gestaltung von KI-Workflows, die Sicherstellung der Einhaltung der Vorschriften (FDCPA, RESPA, TILA) und die Optimierung von Leistung und Skalierbarkeit. Dies ist eine einzigartige Gelegenheit, das Fundament eines schnell wachsenden KI-Startups aufzubauen.

KI

Die Bedrohung von Open-Access-Repositories durch KI

2025-03-16
Die Bedrohung von Open-Access-Repositories durch KI

Das Ideal der Open-Access-Bewegung kollidiert mit der Realität des KI-Modelltrainings. Beitragenden stellen fest, dass ihre Werke für Profitzwecke genutzt werden, sogar schädliche Projekte fördern, was Fragen zur Nachhaltigkeit des Wissensteilens aufwirft. Dieser Artikel erforscht Lösungen jenseits restriktiver Lizenzen und plädiert für faire kollaborative Modelle wie Wikimedia Enterprise und die Präferenzsignale von Creative Commons. Kollektive Verhandlungen können sicherstellen, dass KI-Unternehmen die Infrastrukturkosten fair vergüten, Attribution liefern und in das Gemeinwohl reinvestieren, wodurch die Vision des universellen Wissenszugangs verwirklicht wird.

KI

MIT-Studenten übertreffen modernste HPC-Bibliotheken mit Hunderten von Codezeilen

2025-03-16
MIT-Studenten übertreffen modernste HPC-Bibliotheken mit Hunderten von Codezeilen

Forscher am MIT CSAIL haben Exo 2 entwickelt, eine neue Programmiersprache, die es Programmierern ermöglicht, „Schedules“ zu schreiben, die explizit steuern, wie der Compiler Code generiert, was zu deutlich verbesserter Leistung führt. Im Gegensatz zu bestehenden User-Schedulable Languages (USLs) ermöglicht Exo 2 Benutzern, neue Scheduling-Operationen extern zum Compiler zu definieren und so wiederverwendbare Scheduling-Bibliotheken zu erstellen. Dies ermöglicht es Ingenieuren, mit drastisch reduziertem Code eine Leistung zu erzielen, die mit modernsten HPC-Bibliotheken vergleichbar ist oder diese sogar übertrifft, was die Effizienz in KI- und Machine-Learning-Anwendungen revolutioniert.

KI

Bewertung des Risikos der KI-Agenten-Übernahme: Adversarielle Tests enthüllen Schwachstellen

2025-03-16
Bewertung des Risikos der KI-Agenten-Übernahme: Adversarielle Tests enthüllen Schwachstellen

Das US AI Safety Institute (US AISI) hat das Risiko der Übernahme von KI-Agenten mithilfe des AgentDojo-Frameworks bewertet und dabei das Modell Claude 3.5 Sonnet von Anthropic getestet. Die wichtigsten Ergebnisse unterstreichen die Notwendigkeit einer kontinuierlichen Verbesserung der Bewertungsrahmen, adaptiver Bewertungen, um die sich entwickelnden Angriffsmethoden zu berücksichtigen, und die Bedeutung der Analyse der aufgabenspezifischen Erfolgsraten von Angriffen. Die Studie führte neue Angriffsszenarien ein, wie z. B. Remote Code Execution, Datenexfiltration aus Datenbanken und automatisiertes Phishing, und zeigte deren Wirksamkeit in verschiedenen Umgebungen. Diese Forschung unterstreicht die Notwendigkeit iterativer Verbesserungen der KI-Sicherheitsbewertungsrahmen, um der sich ständig entwickelnden Bedrohung durch die Übernahme von KI-Agenten zu begegnen.

Jane Street Quant: Von Mathematik-Wettbewerben zum KI-gesteuerten Trading

2025-03-16
Jane Street Quant: Von Mathematik-Wettbewerben zum KI-gesteuerten Trading

In Young Cho, eine quantitative Traderin bei Jane Street, teilt ihren ungewöhnlichen Karriereweg vom Medizinstudium zum quantitativen Trading. Sie berichtet über ihre Erfahrungen als Praktikantin und Angestellte bei Jane Street, einschließlich der Verwendung von Programmiersprachen wie OCaml und VBA für den Handel und die Entwicklung, sowie humorvolle Anekdoten über die Interaktion mit Brokern. Die Folge geht tief in die Handelsforschung von Jane Street ein, von einfachen linearen Modellen bis hin zu komplexen Deep-Neural-Networks, und wie sie Machine Learning in Umgebungen mit wenig Daten, viel Rauschen und häufigen Regimewechseln einsetzen. In Young Cho beschreibt detailliert die vier Phasen ihres Forschungsprozesses: Exploration, Datensammlung, Modellierung und Produktion, und diskutiert die Spannung zwischen flexiblen Forschungstools und robusten Produktionssystemen. Schließlich gibt sie einen Ausblick auf die zukünftigen Richtungen der Machine-Learning-Forschung bei Jane Street, einschließlich der Erweiterung auf mehr Anlageklassen und Datenmodalitäten, und den Einsatz von KI zur Steigerung der Effizienz von Tradern.

KI

Parahelp: KI-Mitarbeiter, die menschliche Supportagenten ersetzen

2025-03-15
Parahelp: KI-Mitarbeiter, die menschliche Supportagenten ersetzen

Parahelp entwickelt einen KI-basierten Supportagenten für Softwareunternehmen. Der Agent nutzt die bestehende Infrastruktur (Slack, Stripe usw.), um Supporttickets von Anfang bis Ende zu bearbeiten, mit dem Ziel, menschliche Supportagenten vollständig zu ersetzen. Sie glauben, dass der Kontext, nicht die Intelligenz, der Engpass für zukünftige KI-Mitarbeiter sein wird. Im August 2024 gestartet, wird Parahelp von Y Combinator und namhaften Investoren unterstützt und arbeitet bereits mit führenden Unternehmen wie Perplexity und Framer zusammen.

KI

Mayo-Klinik löst Halluzinationsproblem von LLMs mit umgekehrtem RAG

2025-03-15
Mayo-Klinik löst Halluzinationsproblem von LLMs mit umgekehrtem RAG

Große Sprachmodelle (LLMs) leiden unter „Halluzinationen“ – der Erzeugung ungenauer Informationen – ein besonders gefährliches Problem im Gesundheitswesen. Die Mayo-Klinik hat dies mit einer neuartigen „umgekehrten RAG“-Technik angegangen. Durch die Verknüpfung extrahierter Informationen mit ihrer ursprünglichen Quelle eliminierte diese Methode fast alle datenretrievalbasierten Halluzinationen und ermöglichte den Einsatz des Modells in der gesamten klinischen Praxis. Die Technik kombiniert den CURE-Algorithmus und Vektor-Datenbanken und gewährleistet die Rückverfolgbarkeit jedes Datenpunkts zu seinem Ursprung. Dies erhöht die Zuverlässigkeit und Glaubwürdigkeit des Modells, reduziert die Arbeitsbelastung der Ärzte erheblich und eröffnet neue Wege für die personalisierte Medizin.

Optifye: KI-gestütztes Fabrikoptimierungs-Startup sucht Gründungsteam

2025-03-15
Optifye: KI-gestütztes Fabrikoptimierungs-Startup sucht Gründungsteam

Optifye, ein KI-basiertes Performance-Monitoring-System für Fabriken, nutzt Computer Vision, um Ineffizienzen in Echtzeit zu identifizieren und zu beheben. Das System wurde bereits erfolgreich bei führenden Herstellern in der Bekleidungs-, Automobil-, Medizin- und FMCG-Industrie auf drei Kontinenten eingesetzt und erzielte eine Produktivitätssteigerung von 12 %. Nach dem Abschluss des YC W25-Programms befindet sich das Unternehmen nun in einer Phase starken Wachstums und plant, sein System in den nächsten 4 Monaten auf 100 Produktionslinien zu implementieren. Gesucht werden erfahrene Ingenieure mit fundierten Kenntnissen in der GPU/CPU/Speicheroptimierung, der Skalierung von CV-Anwendungen in der Produktion, der containerisierten Cloud-Bereitstellung (AWS bevorzugt) und einem unermüdlichen Willen, komplexe Probleme zu lösen. Dies ist eine anspruchsvolle, aber auch hoch lukrative Gelegenheit für Top-Talente.

Douglas Hofstadter verurteilt GPT-4s „Warum ich GEB geschrieben habe“ als Fälschung und äußert Bedenken hinsichtlich LLMs

2025-03-15
Douglas Hofstadter verurteilt GPT-4s „Warum ich GEB geschrieben habe“ als Fälschung und äußert Bedenken hinsichtlich LLMs

Douglas Hofstadter, ein Pionier der KI, verurteilt scharf einen von GPT-4 generierten Text mit dem Titel „Warum ich GEB geschrieben habe“, der angeblich sein Hauptwerk Gödel, Escher, Bach zusammenfasst. Er argumentiert, dass der Text mit allgemeinen Plattitüden gefüllt ist und seinen Schreibstil und die Entstehung des Buches stark verfälscht. Hofstadter betont den Mangel an Originalität des LLMs und die Konstruktion einer falschen Erzählung. Er beschreibt den tatsächlichen kreativen Prozess hinter GEB, von seiner anfänglichen Faszination für Gödels Unvollständigkeitssatz bis zur Integration von Escher und Bach, und enthüllt die echten Inspirationen und Herausforderungen. Er äußert ernsthafte Bedenken hinsichtlich der Verbreitung von LLMs und deren Potenzial, die Welt mit Falschinformationen zu überschwemmen, und fordert eine kritische Bewertung ihrer inhärenten Gefahren.

KI

Verzögerung beim Siri KI-Update: Interne Probleme und Druck bei Apple

2025-03-15
Verzögerung beim Siri KI-Update: Interne Probleme und Druck bei Apple

Ein internes Meeting des Siri-Teams von Apple hat ergeben, dass das im Juni letzten Jahres angekündigte KI-Update für Siri auf unbestimmte Zeit verschoben wurde. Diese Entscheidung hat im Team zu Unruhe und Druck geführt und Apples Rückstand im KI-Wettbewerb offengelegt. Das Meeting offenbarte, dass die Verzögerung auf interne Ressourcenumverteilung und mangelnde Kommunikation mit der Marketingabteilung zurückzuführen ist, die zu übertriebenen Versprechungen geführt hat. Obwohl Apple-Manager die Verantwortung für die Verzögerung übernommen haben, steht Siri weiterhin vor zahlreichen Herausforderungen, darunter technische Probleme und die Bewältigung der Nutzererwartungen.

KI

Google Assistant wird durch Gemini ersetzt: Der Aufstieg der generativen KI

2025-03-14
Google Assistant wird durch Gemini ersetzt: Der Aufstieg der generativen KI

Über ein Jahr nach seinem Start hat Google angekündigt, dass sein KI-Assistent Gemini den Google Assistant auf Android-Handys Ende 2025 ersetzen wird. Dies ist ein wichtiger Schritt hin zur weitverbreiteten Einführung generativer KI auf Mobilgeräten. Obwohl die erste Version von Gemini nur eingeschränkte Funktionen hatte, hat Google dies durch kontinuierliche Updates und die Erweiterung auf Wearables, Autos, Tablets und Kopfhörer behoben. Google behauptet, Millionen von Nutzern seien bereits auf Gemini umgestiegen und hebt die personalisierten, weltbewussten und produktivitätssteigernden Funktionen hervor. Dieser Austausch zeigt auch eine Dekade der Entwicklung der Verarbeitung natürlicher Sprache, von einfachen Sprachassistenten bis hin zur heutigen generativen KI, und verdeutlicht den rasanten technologischen Fortschritt.

KI

Open-Source Multi-Agent-Framework OWL führt GAIA-Benchmark an

2025-03-14
Open-Source Multi-Agent-Framework OWL führt GAIA-Benchmark an

OWL, ein hochmodernes Multi-Agent-Kollaborationsframework, das auf dem CAMEL-AI-Framework aufbaut, erreichte mit einem Durchschnittswert von 58,18 den ersten Platz im GAIA-Benchmark! Es ermöglicht eine natürlichere, effizientere und robustere Aufgabenautomatisierung in verschiedenen Bereichen durch dynamische Agenteninteraktionen. OWL ist Open Source, unterstützt verschiedene Installationsmethoden und Modelle (einschließlich OpenAI, Qwen und DeepSeek) und bietet einen umfangreichen Satz von Toolkits wie Browserautomatisierung, multimodale Verarbeitung und Dokumentenanalyse. Eine benutzerfreundliche Weboberfläche wird ebenfalls bereitgestellt. Das OWL-Team sucht aktiv nach Beiträgen der Community zu Anwendungsfällen und verbessert das Framework kontinuierlich.

Von den Anden zur Evolutionspsychologie: Eine zufällige wissenschaftliche Reise

2025-03-14
Von den Anden zur Evolutionspsychologie: Eine zufällige wissenschaftliche Reise

Eine zufällige Begegnung mit einer peruanischen Ureinwohnerin, die seiner Mutter auffällig ähnlich sah, begann die Reise des Autors in die Evolutionspsychologie. Dies führte zu einer Untersuchung der Ähnlichkeiten zwischen Ostasiaten und amerikanischen Ureinwohnern und ihrer gemeinsamen sibirischen Abstammung. Nach Überwindung der ideologischen Zensur und der Finanzierungsprobleme in der Wissenschaft führte er unabhängig Forschung durch und veröffentlichte einen Artikel über die Auswirkungen extremer Klimate auf die menschliche Psychologie. Seine Arbeit verspricht Lösungen für langjährige soziokulturelle Probleme, die ostasiatische und tropische Gesellschaften betreffen.

KI-Agenten: Hype oder Zukunft der Arbeit?

2025-03-14
KI-Agenten: Hype oder Zukunft der Arbeit?

Das Silicon Valley setzt stark auf KI-Agenten, aber es herrscht keine Einigkeit darüber, was genau einen KI-Agenten ausmacht. Unternehmen wie OpenAI, Microsoft und Salesforce sehen sie als die Zukunft der Arbeit, doch ihre Funktionen und Implementierungen variieren stark. Die Definitionen reichen von vollautomatisierten Systemen bis hin zu Werkzeugen, die vordefinierten Arbeitsabläufen folgen, was selbst unter Branchenexperten Verwirrung stiftet. Diese Mehrdeutigkeit resultiert aus dem rasanten technologischen Fortschritt und dem Marketing-Hype, wodurch sowohl Innovationsmöglichkeiten als auch das Potenzial für nicht übereinstimmende Erwartungen und unsichere Renditen entstehen. Ob KI-Agenten die Welt tatsächlich revolutionieren werden, hängt letztendlich davon ab, ob sich die Branche auf eine einheitliche Definition einigen kann.

Probabilistische Zeitreihenvorhersage: Ein Paradigmenwechsel in der prädiktiven Analytik

2025-03-14
Probabilistische Zeitreihenvorhersage: Ein Paradigmenwechsel in der prädiktiven Analytik

Vergessen Sie Punktvorhersagen! Die probabilistische Zeitreihenvorhersage revolutioniert die prädiktive Analytik, indem sie vollständige Wahrscheinlichkeitsverteilungen möglicher Ergebnisse liefert, nicht nur einzelne Werte. Dies ermöglicht fundiertere und zuverlässigere Entscheidungen. Studien zeigen signifikante Verbesserungen in der Vorhersagegenauigkeit, Fehlerreduzierung und insbesondere bei der Vorhersage extremer Ereignisse. Verschiedene Sektoren, darunter Finanzwesen, Gesundheitswesen und Fertigung, profitieren von verbesserter Risikobewertung, Ressourcenallokation und Lagerverwaltung. Dieser umfassende Leitfaden befasst sich mit den Prinzipien, Methoden (Bayes'sche Methoden, Gauß-Prozesse, tiefe probabilistische Modelle) und Anwendungen der probabilistischen Vorhersage in verschiedenen Bereichen. Er behandelt auch wichtige Techniken wie Datenvorverarbeitung, Modellselektion und Unsicherheitskalibrierung.

OpenAI setzt auf Trumps KI-Aktionsplan zur Beilegung von Urheberrechtsstreitigkeiten

2025-03-14
OpenAI setzt auf Trumps KI-Aktionsplan zur Beilegung von Urheberrechtsstreitigkeiten

OpenAI hofft, dass Donald Trumps KI-Aktionsplan, der im Juli erscheinen soll, das Training von KI als Fair Use deklariert und so Urheberrechtsdebatten beendet und KI-Unternehmen uneingeschränkten Zugriff auf Trainingsdaten gewährt. OpenAI argumentiert, dass dies entscheidend ist, um das KI-Rennen gegen China zu gewinnen. Gerichte debattieren derzeit darüber, ob KI-Training als Fair Use gilt, wobei Rechteinhaber behaupten, dass KI-Modelle ihre Marktposition bedrohen und die allgemeine menschliche Kreativität mindern. OpenAI ist in Dutzende von Prozessen verwickelt und argumentiert, dass KI urheberrechtlich geschützte Werke verändert und dass KI-Outputs keine Ersatz für Originalwerke sind. OpenAI hofft, dass Trumps Plan Urteile wie dasjenige verhindert, das Rechteinhaber begünstigte und KI-Training nicht als Fair Use einstufte, weil es eine juristische Forschungsfirma zu ersetzen drohte. OpenAI schlägt vor, dass die USA die „Freiheit zu lernen“ der KI-Industrie priorisieren sollten, um zu verhindern, dass China einen Vorteil erlangt, indem es auf urheberrechtlich geschützte Daten zugreift, auf die US-Unternehmen keinen Zugriff haben.

Googles Gemini 2.0: Leistungsstarke KI-Funktionen jetzt kostenlos, aber mit welchem Preis?

2025-03-13
Googles Gemini 2.0: Leistungsstarke KI-Funktionen jetzt kostenlos, aber mit welchem Preis?

Google bemüht sich intensiv darum, Gemini bekannt zu machen, und veröffentlicht umfassende Updates für Gemini 2.0. Wichtige Verbesserungen, darunter erweiterte Funktionen wie die verbesserte Deep Research und ein auf dem Suchverlauf basierendes Schlussfolgerungsmodell, sind jetzt kostenlos verfügbar. Dieses verbesserte Modell bietet ein Kontextfenster mit 1 Million Token, Dateiuploads, schnellere Verarbeitung und Integrationen mit Google-Apps wie Kalender und Fotos. Obwohl Google die Benutzerkontrolle und die Möglichkeit betont, den Zugriff auf den Suchverlauf zu deaktivieren, bleiben Bedenken hinsichtlich des Datenschutzes bestehen.

KI

KI und Mathematik: Ein Kulturkonflikt und ein Aufruf zur Zusammenarbeit

2025-03-13

Das Joint Mathematics Meeting 2025 hob die wachsende Schnittstelle zwischen KI und Mathematik hervor und offenbarte einen kulturellen Graben zwischen akademischen Mathematikern und KI-Forschern in der Industrie. Mathematiker priorisieren das Verständnis, während KI-Forscher oft die Ergebnisse in den Vordergrund stellen. Dieser Unterschied zeigt sich in gegensätzlichen Ansätzen in Bezug auf Offenheit, Transparenz und die Natur des Beweises selbst. Der Artikel untersucht das Wesen der Mathematik, ihre Kultur und Werte und erforscht das Potenzial von KI in der Literaturverwaltung, der Theoremverifikation und anderen Bereichen. Der Autor argumentiert, dass KI die menschlichen mathematischen Fähigkeiten erweitern sollte, nicht menschliche Mathematiker ersetzen, und betont die Notwendigkeit von gegenseitigem Respekt und Zusammenarbeit, um das Feld voranzubringen.

Anthropic-CEO warnt vor chinesischer Spionage, die US-KI-Geheimnisse ins Visier nimmt

2025-03-13
Anthropic-CEO warnt vor chinesischer Spionage, die US-KI-Geheimnisse ins Visier nimmt

Anthropic-CEO Dario Amodei warnte davor, dass chinesische Spione wahrscheinlich wertvolle "algorithmische Geheimnisse" von führenden US-KI-Unternehmen stehlen und forderte staatliche Interventionen. Er hob Chinas Geschichte der Industriespionage und den hohen Wert – potenziell Hunderte Millionen Dollar – von scheinbar einfachen Code-Schnipseln hervor. Amodei plädiert für eine verstärkte Zusammenarbeit zwischen der US-Regierung und KI-Unternehmen, um die Sicherheit in führenden KI-Laboren zu verbessern, möglicherweise unter Einbeziehung US-amerikanischer Geheimdienste und Verbündeter. Diese Besorgnis steht im Einklang mit Amodeis zuvor geäußerten Bedenken hinsichtlich des Einsatzes von KI durch China für autoritäre und militärische Zwecke und seinen Aufrufen zu strengeren Exportkontrollen für KI-Chips nach China. Seine Haltung hat Kritik von einigen ausgelöst, die glauben, dass eine US-chinesische Zusammenarbeit im Bereich KI notwendig ist, um ein unkontrollierbares KI-Wettrüsten zu verhindern.

Google DeepMind präsentiert Gemini Robotics: KI für präzise Roboterkontrolle

2025-03-12
Google DeepMind präsentiert Gemini Robotics: KI für präzise Roboterkontrolle

Google DeepMind hat zwei neue KI-Modelle vorgestellt, die für die präzise Steuerung von Robotern entwickelt wurden: Gemini Robotics und Gemini Robotics-ER. Diese Modelle basieren auf dem großen Sprachmodell Gemini 2.0 und verfügen über Vision-Language-Action (VLA)-Fähigkeiten und verbessertes räumliches Verständnis. Gemini Robotics ermöglicht es Robotern, komplexe Befehle wie "Nimm die Banane und lege sie in den Korb" zu verstehen und auszuführen, während Gemini Robotics-ER sich auf die nahtlose Integration in bestehende Roboterkontrollsysteme konzentriert. Dies stellt einen bedeutenden Fortschritt in der Robotik dar, insbesondere bei der Bewältigung komplexer physikalischer Manipulationen und der Demonstration starker Generalisierungsfähigkeiten. Google arbeitet mit Apptronik zusammen, um die nächste Generation von humanoiden Robotern mit Gemini 2.0 zu entwickeln, was das Potenzial für eine breite Anwendung zeigt. Google betont jedoch auch die Sicherheit und veröffentlicht den Datensatz "ASIMOV", um Forschern zu helfen, die Sicherheitsaspekte von Roboteraktionen zu bewerten.

KI

Gemini 2.0 Flash: Googles natives Bildgenerierungsmodell für Entwickler im Experimentierstadium

2025-03-12
Gemini 2.0 Flash: Googles natives Bildgenerierungsmodell für Entwickler im Experimentierstadium

Googles Gemini 2.0 Flash, ein multimodales KI-Modell mit verbesserter Argumentation und natürlichem Sprachverständnis, steht nun Entwicklern zum Experimentieren zur Verfügung. Es generiert Bilder aus Text, erstellt illustrierte Geschichten, ermöglicht die interaktive Bildbearbeitung im Dialog und zeichnet sich durch die präzise Wiedergabe langer Textsequenzen aus. Über Google AI Studio und die Gemini API zugänglich, bietet Gemini 2.0 Flash spannende Möglichkeiten für die Entwicklung von KI-Agenten und visuell ansprechenden Anwendungen.

KI

Google DeepMind präsentiert Gemini Robotics: Die nächste Generation von Robotern

2025-03-12
Google DeepMind präsentiert Gemini Robotics: Die nächste Generation von Robotern

Google DeepMind hat zwei neue KI-Modelle auf Basis von Gemini 2.0 vorgestellt: Gemini Robotics und Gemini Robotics-ER, die es Robotern ermöglichen, eine größere Bandbreite an realen Aufgaben zu bewältigen. Gemini Robotics ist ein fortschrittliches Vision-Language-Action-Modell, das Roboter direkt steuert; Gemini Robotics-ER verfügt über ein erweitertes räumliches Verständnis, das es Robotikern erlaubt, ihre eigenen Programme mit Geminis Fähigkeiten zum verkörperten Denken (Embodied Reasoning) auszuführen. Beide Modelle zeichnen sich durch ihre Generalität, Interaktivität und Geschicklichkeit aus, können verschiedene Aufgaben und Umgebungen bewältigen und besser mit Menschen zusammenarbeiten. DeepMind hat außerdem einen neuen Datensatz, ASIMOV, veröffentlicht, um die semantische Sicherheit in verkörperter KI und Robotik zu bewerten und zu verbessern, und arbeitet mit Unternehmen wie Apptronik zusammen, um die nächste Generation von humanoiden Robotern zu entwickeln.

1 2 29 30 31 33 35 36 37 51 52