LLM-Benchmark: Pelikan auf dem Fahrrad

2024-12-16

Simon Willison hat einen einzigartigen LLM-Benchmark entwickelt: die Generierung einer SVG-Grafik eines Pelikans, der Fahrrad fährt. Dieser ungewöhnliche Prompt zielte darauf ab, die kreativen Fähigkeiten der Modelle zu testen, ohne auf bereits vorhandene Trainingsdaten zurückzugreifen. Er testete 16 Modelle von OpenAI, Anthropic, Google Gemini und Meta (Llama auf Cerebras) und stellte dabei erhebliche Unterschiede in der Qualität der generierten SVGs fest. Einige Modelle lieferten überraschend gute Ergebnisse, während andere Schwierigkeiten hatten.

Mehr lesen

Speicherung von Zeiten für menschliche Ereignisse: Best Practices und Herausforderungen

2024-12-12

Dieser Blogbeitrag befasst sich mit Best Practices für die Speicherung von Ereigniszeiten auf Event-Websites. Der Autor argumentiert, dass die direkte Speicherung der UTC-Zeit wichtige Informationen verliert, wie die ursprüngliche Absicht des Benutzers und den Standort. Ein besserer Ansatz besteht darin, die vom Benutzer beabsichtigte Zeit und den Ereignisort zu speichern und dann die UTC-Zeit abzuleiten. Beispiele wie Benutzerfehler, internationale Zeitzonenanpassungen und das DST-Update von Microsoft Exchange 2007 veranschaulichen die Bedeutung der Speicherung der vom Benutzer beabsichtigten Zeit. Der Autor empfiehlt, eine klare und benutzerfreundliche Benutzeroberfläche zu entwerfen, um Benutzern zu helfen, die Zeiten und Orte von Ereignissen präzise festzulegen, und betont die Bedeutung der Beibehaltung der ursprünglichen Absicht des Benutzers, um Fehler zu vermeiden, die durch Zeitzonenänderungen verursacht werden.

Mehr lesen