ChemBench: Ein Benchmark für LLMs in der Chemie

Beliebte Tags：

Kosmos Virtualisierung DNS-Sicherheit formale Verifikation Erreichbarkeitsanalyse KI Compilerfehler Makrokonflikt Web-Erweiterung Entwicklungsframework Alle Tags

ChemBench: Ein Benchmark für LLMs in der Chemie

2025-06-16

ChemBench ist ein neuer Benchmark-Datensatz zur Bewertung der Leistung großer Sprachmodelle (LLMs) in der Chemie. Er enthält eine Vielzahl von Chemiefragen aus verschiedenen Teilgebieten, die nach Schwierigkeit kategorisiert sind. Die Ergebnisse zeigen, dass führende LLMs die menschliche Expertenleistung insgesamt übertreffen, aber Einschränkungen bei wissensintensiven Fragen und chemischem Denken bestehen bleiben. ChemBench zielt darauf ab, chemische LLMs voranzutreiben und Werkzeuge für eine robustere Modellbewertung bereitzustellen.

(www.nature.com)

DARPA bricht Rekorde mit drahtloser Energieübertragung über große Distanzen

KI-Coding-Agents: Von hilfreichen Assistenten zu unverzichtbaren Partnern