Benchmark de LLM: Pelícano en Bicicleta

2024-12-16

Simon Willison creó un benchmark único de LLM: generar una imagen SVG de un pelícano montando una bicicleta. Este prompt inusual tenía como objetivo probar las habilidades creativas de los modelos sin depender de datos de entrenamiento preexistentes. Probó 16 modelos de OpenAI, Anthropic, Google Gemini y Meta (Llama en Cerebras), revelando variaciones significativas en la calidad de los SVG generados. Algunos modelos produjeron resultados sorprendentemente buenos, mientras que otros tuvieron dificultades.

Leer más

Almacenamiento de horas para eventos humanos: mejores prácticas y desafíos

2024-12-12

Esta entrada de blog analiza las mejores prácticas para almacenar las horas de los eventos en sitios web de eventos. El autor argumenta que almacenar directamente la hora UTC pierde información crucial, como la intención original del usuario y la ubicación. Un mejor enfoque consiste en almacenar la hora prevista por el usuario y la ubicación del evento, y luego derivar la hora UTC. Ejemplos como el error del usuario, los ajustes de zona horaria internacional y la actualización del horario de verano de Microsoft Exchange de 2007 ilustran la importancia de almacenar la hora prevista por el usuario. El autor recomienda diseñar una interfaz de usuario clara e intuitiva para ayudar a los usuarios a establecer con precisión las horas y ubicaciones de los eventos, haciendo hincapié en la importancia de mantener la intención original del usuario para evitar errores causados por los cambios de zona horaria.

Leer más