Los LLM fracasan en Set, los modelos de razonamiento triunfan

2025-02-19
Los LLM fracasan en Set, los modelos de razonamiento triunfan

Un experimento probó las capacidades de razonamiento de los Modelos de Lenguaje Grandes (LLM) en el juego de cartas Set. Set requiere identificar conjuntos de tres cartas de una disposición de doce, basándose en reglas específicas sobre forma, color, número y sombreado. Los LLM como GPT-4o, Sonnet-3.5 y Mistral no lograron identificar consistentemente conjuntos correctos, a menudo sugiriendo combinaciones inválidas o afirmando que no existían conjuntos. Sin embargo, los modelos de razonamiento más nuevos, DeepThink-R1 y o3-mini, resolvieron con éxito el problema, demostrando habilidades superiores de razonamiento lógico. Esto destaca una limitación de los LLM en tareas lógicas complejas, incluso mientras destacan en el procesamiento del lenguaje natural, mientras que los modelos de razonamiento especializados muestran una clara ventaja.

Leer más

Cómo los programadores deberían pensar sobre el tiempo

2025-06-25
Cómo los programadores deberían pensar sobre el tiempo

Este artículo profundiza en las complejidades del manejo del tiempo en la programación. Explica los conceptos de tiempo absoluto (basado en épocas y duraciones) y tiempo civil (calendario gregoriano y zonas horarias), aclarando la mecánica de los segundos bisiestos y las transiciones de zona horaria y sus desafíos inherentes. Se destaca la importancia de la base de datos de zonas horarias IANA, que proporciona reglas históricas y futuras para las zonas horarias para un manejo preciso del tiempo. Tres estudios de caso: un foro de chat, un sitio web de planificación de eventos y un proyecto personal, ilustran diferentes estrategias de manejo del tiempo, enfatizando que 'simplemente usar UTC' no es una solución universal.

Leer más

¿Seguros de IA: Un Mercado Sobrevalorado?

2025-05-17
¿Seguros de IA: Un Mercado Sobrevalorado?

Con la adopción generalizada de la IA, el seguro de riesgo de IA ha surgido para abordar las posibles pérdidas masivas debido a errores de IA. Sin embargo, el autor argumenta que este mercado puede estar sobrevalorado. Históricamente, los errores de software siempre han existido, pero el mercado de seguros de Errores y Omisiones de Tecnología (Tech E&O) sigue siendo pequeño. El seguro de IA enfrenta desafíos similares al Tech E&O: dificultad para evaluar riesgos, asimetría de información y concentración de riesgos. El autor sugiere que las aseguradoras de IA necesitan tener capacidades superiores de evaluación de riesgos en comparación con sus clientes y deben diversificar los riesgos para sobrevivir. Actualmente, la gestión del riesgo de IA se centra más en el control de riesgos de aplicaciones individuales que en los seguros.

Leer más

Tecnología Antigua: Descubriendo los Secretos de la Iluminación del Partenón

2025-05-22
Tecnología Antigua: Descubriendo los Secretos de la Iluminación del Partenón

Un estudio de cuatro años dirigido por la Universidad de Oxford ha revelado cómo se iluminaba el Partenón en la antigua Grecia. Utilizando evidencia arqueológica, tecnología 3D y física óptica, los investigadores recrearon el sistema de iluminación del templo, mostrando cómo estaba diseñado para inspirar asombro. Los arquitectos y el escultor Fidias utilizaron estratégicamente aberturas en el techo, cuencas de agua, ventanas y las propiedades reflectantes del mármol para manipular la luz. Durante el Festival Panatenaico, el sol naciente iluminaba dramáticamente la estatua de Atenea, creando un espectáculo impresionante. Esta investigación, que pronto estará disponible como una experiencia inmersiva de RV, muestra el poder de la tecnología para desentrañar misterios antiguos.

Leer más
Tecnología Grecia Antigua

Actualización de OpenRA de diciembre de 2024: Clásicos RTS renacidos

2025-01-25
Actualización de OpenRA de diciembre de 2024: Clásicos RTS renacidos

OpenRA, la reimaginación de código abierto de juegos RTS clásicos como Alerta Roja, Command & Conquer y Dune 2000, ha lanzado una importante actualización en diciembre de 2024. Esta actualización incluye numerosas correcciones de errores y nuevas funciones, como un editor de mapas mejorado, descripciones de unidades mejoradas, soporte para activos de alta definición y progreso hacia una mejor compatibilidad multilingüe. También se incluye una prueba de juego de Tiberian Dawn HD. Los jugadores de Windows, macOS y Linux pueden disfrutar de una jugabilidad modernizada con ataque-movimiento, veteranía de unidades y niebla de guerra.

Leer más
Juegos

Quantus: Plataforma de Trading Cuantitativo Revolucionaria

2024-12-12

Quantus es una plataforma de trading cuantitativo avanzada, diseñada para proporcionar soluciones de trading eficientes y fiables a traders profesionales e inversores institucionales. Integra potentes herramientas de análisis de datos, capacidades de backtesting flexibles y un sistema de ejecución de baja latencia, permitiendo a los usuarios aprovechar mejor las oportunidades del mercado y mejorar los retornos de inversión. Con su robusta tecnología e interfaz fácil de usar, Quantus se está convirtiendo rápidamente en una estrella en ascenso en el panorama de las fintech.

Leer más
Tecnología trading cuantitativo

Hackeando el Yamaha DX9 para imitar el DX7

2025-01-19

Un entusiasta de sintetizadores vintage realizó ingeniería inversa y reescribió la ROM del firmware del Yamaha DX9, mejorando significativamente su funcionalidad para emular al DX7. Superando hábilmente las limitaciones del hardware y restaurando funciones faltantes, como dos operadores adicionales, el hacker permitió que el DX9 cargara y reprodujera parches del DX7. Las correcciones incluyeron una mejora en el manejo de MIDI y un generador de envolvente de tono. El código fuente del proyecto está disponible públicamente, mostrando una impresionante habilidad técnica y pasión por los sintetizadores vintage, a pesar de que el público objetivo sea pequeño. Esta hazaña inesperada deleitó a la comunidad de sintetizadores retro.

Leer más

Desafíos visuales únicos para los astronautas en el polo sur lunar

2024-12-29
Desafíos visuales únicos para los astronautas en el polo sur lunar

El programa Artemis de la NASA, que tiene como objetivo establecer una base lunar permanente en el Polo Sur, enfrenta un desafío único: el duro entorno de iluminación. El bajo ángulo de elevación solar crea variaciones extremas de luz y sombra, afectando gravemente la visión y el rendimiento de las tareas de los astronautas. A diferencia de las misiones anteriores en las que el diseño del casco era suficiente, Artemis requiere sistemas innovadores de apoyo a la visión. Estos sistemas, que incluyen cascos, ventanas e iluminación, deben garantizar una visión clara en diversas condiciones de iluminación, protegiendo los ojos de los astronautas de lesiones. La NASA está desarrollando diversas técnicas de simulación para abordar este desafío, allanando el camino para una exploración lunar exitosa.

Leer más

Nueva vulnerabilidad en LLMs explota las habilidades de evaluación de los modelos

2025-01-12
Nueva vulnerabilidad en LLMs explota las habilidades de evaluación de los modelos

Investigadores han descubierto una nueva técnica de evasión para LLMs, llamada "Bad Likert Judge". Este método aprovecha la capacidad de los LLMs para identificar contenido dañino, pidiéndoles que califiquen dicho contenido y luego soliciten ejemplos, generando así salidas relacionadas con malware, actividades ilegales, acoso y más. Probada en seis modelos de vanguardia en 1440 casos, la tasa de éxito promedio fue del 71,6%, llegando hasta el 87,6%. Los investigadores recomiendan que los mantenedores de aplicaciones LLM utilicen filtros de contenido para mitigar tales ataques.

Leer más
Tecnología seguridad LLM evasión

Fellowry: Una base de conocimiento GTM colaborativa que resuelve los desafíos de ventas

2025-01-04

Fellowry es una base de conocimiento Go-to-Market (GTM) colaborativa con más de 200 estrategias de ventas. Es un tesoro de ideas de profesionales de ventas, que abarca correos electrónicos en frío, llamadas en frío, marketing en LinkedIn y mucho más. Los usuarios comparten consejos sobre cómo crear correos electrónicos en frío efectivos, aumentar las tasas de éxito de las llamadas en frío y aprovechar LinkedIn para la divulgación dirigida. Tanto si eres un novato en ventas como un profesional experimentado, Fellowry ofrece perspectivas valiosas para superar los obstáculos de ventas y mejorar el rendimiento.

Leer más

Desentrañando el PPG Wave 2.2 & 2.3: El misterio del DAC de 8 bits vs. 12 bits

2024-12-15

Este artículo profundiza en las diferencias sutiles pero significativas entre los sintetizadores PPG Wave 2.2 y 2.3. Si bien el 2.3 utiliza DAC de 12 bits, la reproducción de wavetables sigue siendo de 8 bits; solo las muestras importadas a través de dispositivos externos aprovechan completamente la precisión de 12 bits. Las mediciones con osciloscopio revelan un método de procesamiento de audio único: dos osciladores envían datos entrelazados, lo que resulta en una frecuencia de salida del DAC el doble de la frecuencia de muestreo de un solo oscilador. Esto crea un timbre distintivo y aliasing de alta frecuencia más allá del rango auditivo humano. El artículo también observa la velocidad de actualización de CV relativamente lenta, pero el sonido conserva su carácter.

Leer más
Hardware audio digital

Cloudflare previene conflictos DNS con verificación formal

2025-01-07
Cloudflare previene conflictos DNS con verificación formal

Cloudflare utiliza Topaz, un sistema que verifica formalmente la corrección de su comportamiento de direccionamiento DNS interno. Topaz codifica los objetivos de negocio de DNS como programas declarativos, cada uno con una función de coincidencia, una función de respuesta y una configuración. Antes del despliegue, un verificador de modelo personalizado verifica estos programas para detectar conflictos y errores, asegurando una configuración DNS fiable y consistente. Esto mejora la fiabilidad de Internet, evitando inconsistencias en la resolución de direcciones IP.

Leer más
Tecnología Verificación Formal

28 Horas al Día: Un Experimento de un Año

2025-01-09

El autor comparte su experiencia viviendo en una rutina de 28 horas al día durante un año. Descubrió que fue la segunda mejor cosa que hizo para su salud, después del ejercicio regular. La adaptación tomó dos meses, involucrando superar el sueño y los desafíos de comunicación con su pareja. Las siestas estratégicas se convirtieron en la clave para administrar su horario, y se volvió hábil en alternar entre ciclos de 28 y 24 horas. Si bien la agenda no convencional complica las interacciones sociales, el autor informa beneficios significativos: mejor consistencia del sueño, más tiempo libre, ejercicios más frecuentes y un entorno más silencioso y menos concurrido para los entrenamientos. A pesar de los ajustes sociales, los beneficios se consideran mucho mayores que los inconvenientes.

Leer más

PuzzleZilla: Se lanza el creador de rompecabezas online

2024-12-15

PuzzleZilla es una nueva plataforma online que permite a los usuarios crear rompecabezas personalizados a partir de cualquier imagen subida desde su dispositivo o internet. El sitio ofrece una amplia variedad de rompecabezas precategorizados, incluyendo coches, bebés, ciudades, animales, flores, naturaleza, chicas, paisajes, dinosaurios, castillos, películas, anime, gatos, perros, pinturas, comida y temas de fantasía. Los usuarios pueden crear y jugar sus rompecabezas online fácilmente.

Leer más

Prolog: La elegancia de la programación declarativa

2025-01-26

Este artículo profundiza en la simplicidad y el poder de Prolog, un lenguaje de programación lógica. A diferencia de los populares lenguajes imperativos (como Python, Java), Prolog emplea un paradigma declarativo, centrándose en describir el problema en lugar de especificar los pasos de la solución. El autor demuestra las ventajas de Prolog en concisión y adaptabilidad comparando implementaciones en Prolog y Kotlin de un sistema de autorización. El código Prolog es significativamente más compacto, y las modificaciones son más fáciles cuando cambian los requisitos (por ejemplo, añadiendo una dimensión de tiempo). Aunque Prolog tiene una curva de aprendizaje más pronunciada, dominarlo amplía las perspectivas de programación y ayuda a mantener la simplicidad del sistema.

Leer más

El Problema Zombocom: De 'Cualquier Cosa' a 'Algo Específico' en el Desarrollo de Software

2024-12-29
El Problema Zombocom: De 'Cualquier Cosa' a 'Algo Específico' en el Desarrollo de Software

Este artículo explora el 'Problema Zombocom' – el fracaso de muchas plataformas low-code/no-code, súper aplicaciones, etc., debido a su incapacidad para satisfacer las necesidades específicas del usuario. El autor argumenta que el éxito depende de resolver un problema específico para un usuario específico, encontrando el ajuste perfecto entre producto y mercado. La historia de éxito de Amazon ilustra esto: comenzó como una librería online, expandiéndose gradualmente a otras áreas. De la misma manera, Excel tuvo éxito porque inicialmente apuntaba a propietarios de pequeñas empresas y contadores. El autor enfatiza que las plataformas deben surgir de productos, no al revés; cree primero productos excelentes y autónomos, luego considere la plataforma. En última instancia, el autor concluye que la clave del éxito radica en combinar el pensamiento sistémico y el pensamiento de producto — comprender las oportunidades a nivel de sistema, mientras se identifica el primer mejor cliente, transformando así un 'producto de un solo propósito' en una 'plataforma'.

Leer más

Jagged Flash Attention de Meta: Revolución en el Rendimiento de los Sistemas de Recomendación

2025-03-21
Jagged Flash Attention de Meta: Revolución en el Rendimiento de los Sistemas de Recomendación

Meta presenta Jagged Flash Attention, una innovación que transforma el rendimiento y la escalabilidad de los sistemas de recomendación a gran escala. Los métodos tradicionales tienen dificultades con las características categóricas de longitud variable (como el historial de interacción del usuario), requiriendo un relleno excesivo. Jagged Flash Attention maneja eficientemente estas características utilizando tensores irregulares, eliminando la sobrecarga de relleno. Combinado con la biblioteca TorchRec, ofrece mejoras de rendimiento de hasta 10 veces en el entorno de producción de Meta y admite el entrenamiento de modelos con más de 3 billones de parámetros. Esta innovación avanza significativamente los sistemas de recomendación personalizados.

Leer más

Violación de datos de Coinbase genera temores de secuestros y muertes

2025-05-20
Violación de datos de Coinbase genera temores de secuestros y muertes

El fundador de TechCrunch, Michael Arrington, afirma que una reciente violación de datos de Coinbase, que expuso datos confidenciales de usuarios como direcciones y saldos, provocará muertes debido a un aumento en los intentos de secuestro dirigidos a titulares de criptomonedas de alto valor neto. Arrington pide una reevaluación de las regulaciones KYC y el encarcelamiento de ejecutivos que no protegen los datos de los clientes. El ex CTO de Coinbase, Balaji Srinivasan, argumenta que el problema proviene de la recopilación de datos KYC obligatoria por parte del gobierno. El incidente destaca las graves preocupaciones de seguridad y privacidad en el espacio de las criptomonedas y genera un debate sobre los méritos del KYC.

Leer más
Tecnología Seguridad Cripto

Lenguajes de programación: Equilibrio entre seguridad y potencia

2024-12-15

Este artículo explora la compensación entre seguridad y potencia en los lenguajes de programación. La visión tradicional es que los lenguajes potentes, como C con su gestión manual de memoria, son inherentemente inseguros. Sin embargo, el autor argumenta que esto está desactualizado. La investigación moderna en lenguajes de programación muestra que una mayor expresividad permite tanto seguridad como potencia. La evolución de las macros en Lisp, Scheme y Racket ejemplifica esto, demostrando cómo un diseño mejorado puede mejorar las capacidades de las macros manteniendo la seguridad. El sistema de macros de Racket se presenta como una mejor práctica, combinando código higiénico con capacidades de manipulación potentes. El artículo concluye que los sistemas seguros y fiables construyen software más potente y fiable, y recomienda recursos para seguir aprendiendo sobre macros de Racket.

Leer más

Smartwatch DIY para Diabetes Tipo 1: La Historia de un Padre

2025-01-29
Smartwatch DIY para Diabetes Tipo 1: La Historia de un Padre

Un padre ingeniero de software se embarcó en un viaje de seis meses para construir un smartwatch simple para su hijo con diabetes tipo 1. El reloj muestra datos de CGM de forma fiable y proporciona retroalimentación háptica para niveles críticos de glucosa en sangre. Superó desafíos como la conectividad BLE, el diseño de PCB personalizado, la selección del motor háptico, la elección de la pantalla, la impermeabilización y la duración de la batería. Aunque no se fabricó en masa, el proyecto proporcionó una valiosa experiencia de I+D de hardware y está previsto que sea de código abierto para beneficio de la comunidad.

Leer más

Pinturas de aviones de combate estadounidenses en una escuela rusa causan controversia

2024-12-14
Pinturas de aviones de combate estadounidenses en una escuela rusa causan controversia

Una nueva escuela en la ciudad fronteriza rusa de Pechenga provocó controversia después de que se pintaran imágenes de aviones de combate F-16 en sus paredes. Las imágenes fueron rápidamente retiradas y reemplazadas por aviones rusos Su-57. La escuela explicó que los dibujos originales eran de Su-27, pero la ambigüedad llevó al cambio. El incidente, cerca de la frontera con Noruega y Finlandia, miembros de la OTAN, destaca las tensiones regionales. Un incidente similar ocurrió en una base naval en Gadzhievo, donde se pintó un submarino estadounidense de clase Los Ángeles en un edificio antes de ser reemplazado por un submarino ruso.

Leer más
Varios Rusia

Complemento de mejora de interfaz para Walkman: renueva tu experiencia musical

2025-02-27
Complemento de mejora de interfaz para Walkman: renueva tu experiencia musical

Un nuevo complemento llamado Walkman One mejora la interfaz y agrega funciones a los reproductores Walkman de Sony de las series NW-A50, ZX300, WM1A y WM1Z. Ofrece soporte para skins de Winamp 2, skins de casete personalizadas, cambio de skins sobre la marcha, un editor de tabla de volumen, opciones de audio por canción y acceso a todos los filtros de audio. Las funciones adicionales incluyen un reloj, una carátula más grande, una skin de reloj digital, un módulo DAC USB de baja latencia y radio FM (en modelos compatibles). Si bien admite muchos modelos Walkman, algunos modelos más antiguos requieren el firmware Walkman One. La instalación es sencilla: descargue y ejecute el instalador y seleccione su modelo y versión de firmware.

Leer más

Digitalización de Alta Resolución Abre la Colección de Mapas Raros de Newberry

2025-05-05
Digitalización de Alta Resolución Abre la Colección de Mapas Raros de Newberry

La Newberry Library y The Digital Archive Group se han asociado para digitalizar la colección de mapas Novacco, superando los desafíos que planteaba el gran tamaño de los mapas. Utilizando cámaras y lentes especializadas, crearon imágenes de alta definición que permiten a los investigadores de todo el mundo estudiar estos mapas con un detalle sin precedentes. Este proyecto amplía significativamente la colección digital de la biblioteca, haciendo que estos renombrados documentos de archivo sean accesibles a un público mundial y contribuyendo al objetivo más amplio de Newberry de aumentar la accesibilidad de la colección. Las imágenes de alta resolución están disponibles gratuitamente para su reutilización pública.

Leer más

FreeBASIC: Un potente compilador BASIC de código abierto

2025-05-17

FreeBASIC es un compilador BASIC gratuito y de código abierto (GPL) para Windows, DOS y Linux. Altamente compatible con QuickBASIC, muchos programas de QuickBASIC se compilan y ejecutan con mínimos cambios en el modo 'QB' de FreeBASIC. Sin embargo, el modo predeterminado de FreeBASIC ofrece funciones mejoradas y admite paradigmas de programación procedural, orientada a objetos y metaprogramación. Genera ejecutables de consola y GUI, bibliotecas dinámicas y estáticas, y ofrece compatibilidad con bibliotecas C y C++ parciales. Su velocidad rivaliza con herramientas convencionales como GCC.

Leer más
Desarrollo

Detección de bordes de imágenes a la velocidad de la luz

2025-01-30
Detección de bordes de imágenes a la velocidad de la luz

Físicos de la Universidad de Ámsterdam han desarrollado un nuevo método para la detección de bordes de imágenes utilizando la computación analógica óptica. Esta técnica es extremadamente rápida y eficiente en cuanto a energía, empleando una pila simple de películas delgadas para detectar bordes de hasta 1 micrómetro. Compatible con varias fuentes de luz, esta innovación promete avances en la microscopía de alta resolución, el análisis de muestras biológicas e incluso en vehículos autónomos, revolucionando la eficiencia energética y la velocidad de computación.

Leer más

¿Es seguro almacenar códigos de autenticación de dos factores en el gestor de contraseñas?

2025-01-01
¿Es seguro almacenar códigos de autenticación de dos factores en el gestor de contraseñas?

Este artículo explora las implicaciones de seguridad de almacenar códigos de autenticación de dos factores (2FA) en los gestores de contraseñas. Los expertos en seguridad argumentan que, si bien almacenar códigos 2FA junto con nombres de usuario y contraseñas en un gestor de contraseñas como 1Password no es ideal (aumenta el riesgo de compromiso), la conveniencia supera el riesgo. El beneficio principal del 2FA es prevenir ataques de phishing; incluso si el gestor de contraseñas se ve comprometido, un atacante aún necesita el código 2FA. Para la mayoría de los usuarios, almacenar códigos 2FA en un gestor de contraseñas se considera aceptable, pero se recomienda usar un gestor de contraseñas confiable e implementar medidas de seguridad adicionales, como usar una YubiKey o almacenar algunos códigos de recuperación sin conexión.

Leer más

Introducción al Emulador Chip-8: Construyendo una Consola de Juegos Retro en Código

2025-01-06

Este artículo presenta Chip-8, un sistema de consola de videojuegos virtual simple, y explica cómo construir su emulador. Explica claramente binario, hexadecimal y cómo funcionan las instrucciones de Chip-8, proporcionando el conocimiento fundamental para construir un emulador. El autor guía al lector paso a paso, desde instrucciones simples hasta instrucciones más complejas, explicando el funcionamiento interno de Chip-8, convirtiéndolo en un excelente recurso para quienes estén interesados en consolas de juegos retro y tecnología de emuladores.

Leer más
Desarrollo

uBlock Origin: Un bloqueador de contenido eficiente

2024-12-23
uBlock Origin: Un bloqueador de contenido eficiente

uBlock Origin (uBO) es un bloqueador de contenido eficiente y ligero para navegadores Chromium y Firefox. Bloquea anuncios, rastreadores, mineros de criptomonedas y malware de forma predeterminada, utilizando listas de filtros como EasyList y EasyPrivacy. Los usuarios pueden personalizar las reglas de bloqueo y elegir entre una interfaz simple o avanzada. Es importante tener en cuenta que usar un bloqueador no es robo, sino una forma de proteger la privacidad del usuario. El proyecto es de código abierto y depende de listas de filtros mantenidas por la comunidad.

Leer más

¡Bash tiene Hashmaps?!

2025-01-11

Esta publicación de blog revela una joya escondida en la programación bash: ¡soporte integrado para hashmaps (matrices asociativas)! El autor, mientras trabajaba en un proyecto que involucraba la gestión de instancias de GPU, descubrió esta función y comparte cómo usarla. La publicación detalla cómo declarar, asignar valores a, leer, iterar sobre y eliminar pares clave-valor dentro de un hashmap bash, mostrando dos métodos de declaración: adición dinámica y pares clave-valor predefinidos. Esta es una técnica valiosa para manejar eficientemente datos clave-valor dentro de scripts bash.

Leer más
Desarrollo

EIP de Señalización de Actualización On-Chain de Ethereum: El Consenso de la Comunidad Impulsa las Actualizaciones

2024-12-22
EIP de Señalización de Actualización On-Chain de Ethereum: El Consenso de la Comunidad Impulsa las Actualizaciones

Esta propuesta introduce un mecanismo on-chain que permite a los clientes de Ethereum señalar su disposición para actualizaciones de protocolo mediante la incorporación de un indicador de "voto" en el campo extraData de los bloques recién minados. Los futuros bloques de activación de bifurcación solo ocurrirán si suficientes bloques dentro de una ventana específica señalan "a favor" de la actualización. Esto traslada las decisiones de actualización de la Fundación Ethereum a los participantes de la red, aumentando la descentralización y mitigando los riesgos de centralización.

Leer más
1 2 574 575 576 578 580 581 582 595 596