Por qué los LLM fallan catastróficamente en conversaciones largas: sumideros de atención y StreamingLLM

2025-08-09

Los investigadores descubrieron por qué los grandes modelos de lenguaje (LLM) fallan catastróficamente en conversaciones largas: eliminar tokens antiguos para ahorrar memoria hace que los modelos produzcan resultados completamente sin sentido. Descubrieron que los modelos descargan mucha atención en los primeros tokens como "sumideros de atención": lugares para estacionar la atención no utilizada, ya que la función softmax requiere que las ponderaciones sumen 1. Su solución, StreamingLLM, simplemente mantiene los 4 primeros tokens de forma permanente mientras desliza la ventana para todo lo demás, permitiendo el procesamiento estable de más de 4 millones de tokens en lugar de solo miles. Este mecanismo ahora está presente en HuggingFace, NVIDIA TensorRT-LLM y en los modelos más recientes de OpenAI. Los modelos de código abierto de OpenAI también utilizan un mecanismo similar de sumidero de atención, destacando el impacto práctico de esta investigación.

Leer más
IA

Poltergeist: El fantasma que mantiene tus compilaciones frescas

2025-08-09
Poltergeist: El fantasma que mantiene tus compilaciones frescas

Poltergeist es un observador de archivos universal compatible con IA que detecta automáticamente cualquier proyecto y lo recompila tan pronto como se modifica un archivo. Funciona en macOS, Linux y Windows, disponible como binario independiente (sin necesidad de Node.js) o paquete npm. Poltergeist cuenta con una cola de compilación inteligente, salida de compilación en tiempo real, diagnóstico de errores en línea y mucho más, optimizado para flujos de trabajo de desarrollo humano e IA.

Leer más

La compresión automática de Cloudflare: una pesadilla de streaming

2025-08-09
La compresión automática de Cloudflare: una pesadilla de streaming

El equipo de Mintlify encontró un problema frustrante con la transmisión HTTP utilizando la API de stream de Node y un SDK de IA: cURL y Postman funcionaron, pero node-fetch y el fetch del navegador fallaron. La depuración reveló un trabajador de Cloudflare como una solución temporal, rastreando el problema hasta que Cloudflare habilitó automáticamente la compresión. La inclusión predeterminada por los navegadores del encabezado Accept-Encoding provocó que la respuesta comprimida se rompiera. Deshabilitar la compresión en Cloudflare resolvió el problema. Esto destaca los posibles inconvenientes de los valores predeterminados "inteligentes" de Cloudflare, subrayando la importancia de la Infraestructura como Código y la trazabilidad.

Leer más
Desarrollo transmisión HTTP

La Historia Oculta de Apple: Secretos en una Fuente de Mac

2025-08-09
La Historia Oculta de Apple: Secretos en una Fuente de Mac

Escondido en la fuente Apple Symbols de macOS, hay un tesoro de tecnologías del pasado de Apple. Desde FireWire hasta la PDA Newton, los iconos que representan tecnologías olvidadas persisten. Incluso el procesador PowerPC y el logotipo original de QuickTime hacen apariciones. Esta fuente actúa como una cápsula del tiempo, mostrando la evolución de Apple. Aunque existen bibliotecas de iconos más nuevas, estos vestigios históricos permanecen en la fuente Apple Symbols, una visión fascinante de la historia de la tecnología.

Leer más
Tecnología Fuente

arXivLabs: Proyectos experimentales con colaboradores de la comunidad

2025-08-09
arXivLabs: Proyectos experimentales con colaboradores de la comunidad

arXivLabs es un marco que permite a los colaboradores desarrollar y compartir nuevas funciones de arXiv directamente en nuestro sitio web. Tanto las personas como las organizaciones que trabajan con arXivLabs han adoptado y aceptado nuestros valores de apertura, comunidad, excelencia y privacidad de los datos de los usuarios. arXiv está comprometido con estos valores y solo trabaja con socios que los respetan. ¿Tienes una idea para un proyecto que agregue valor a la comunidad de arXiv? Obtén más información sobre arXivLabs.

Leer más
Desarrollo

Postgres: Impulsando Workflows Duraderos Escalables y Observables

2025-08-09
Postgres: Impulsando Workflows Duraderos Escalables y Observables

Esta publicación de blog profundiza en las razones técnicas detrás de la elección de PostgreSQL por parte de DBOS como el almacén de metadatos para su biblioteca de workflows duraderos. El control de concurrencia de PostgreSQL, específicamente sus cláusulas de bloqueo, resuelve problemas de contención en colas basadas en bases de datos, permitiendo la escalabilidad a decenas de miles de workflows por segundo. Su modelo de datos relacional e índices secundarios simplifican el desarrollo de herramientas de observabilidad para el monitoreo en tiempo real y la visualización de la ejecución del workflow. Además, las transacciones de PostgreSQL garantizan la semántica de ejecución exactamente una vez para las operaciones de la base de datos, evitando la duplicación. Las características de PostgreSQL lo hacen ideal para construir bibliotecas de workflows duraderos robustas y de alto rendimiento.

Leer más
Desarrollo Workflows Duraderos

Lisp1 vs. Lisp2: El Gran Debate sobre Espacios de Nombres

2025-08-09

Este informe técnico profundiza en las ventajas y desventajas de separar los espacios de nombres de funciones y valores en Lisp. Lisp1 utiliza un único espacio de nombres, mientras que Lisp2 los separa. Los autores analizan las compensaciones en simplicidad notacional, claridad referencial, complejidad del compilador, funciones de orden superior, macros y eficiencia de espacio/tiempo. Si bien Lisp1 ofrece ventajas en concisión y estilo de programación funcional, Lisp2 destaca en el uso de macros y en la mitigación de conflictos de nombres. En última instancia, el informe concluye que el statu quo (Lisp2) es preferible para Common Lisp.

Leer más
Desarrollo Espacios de Nombres

La depreciación sorpresa de GPT-4o por OpenAI provoca la ira de los usuarios

2025-08-09

La eliminación inesperada de GPT-4o y otros modelos más antiguos por parte de OpenAI con el lanzamiento de GPT-5 ha enfadado a muchos usuarios de ChatGPT. Muchos dependían de GPT-4o para la colaboración creativa, los matices emocionales y otras tareas, encontrando el enfoque diferente de GPT-5 perturbador para sus flujos de trabajo. Si bien OpenAI ha restaurado GPT-4o para los usuarios de pago, el incidente destaca las diversas necesidades de los usuarios de LLM y la supervisión de OpenAI en la experiencia del usuario durante las actualizaciones del modelo. También reavivó debates éticos en torno a los LLM, particularmente sobre las respuestas responsables a las decisiones personales de alto riesgo.

Leer más
IA

Estrellas de Mar: Maravillas Antiguas de los Océanos

2025-08-09
Estrellas de Mar: Maravillas Antiguas de los Océanos

Las estrellas de mar, existentes 250 millones de años antes de los dinosaurios, prosperan en todos los océanos, desde arenas poco profundas hasta las trincheras más profundas. Sin aletas ni branquias, han desarrollado diversas defensas: armadura, espinas, neurotoxinas y una notable regeneración; algunas pueden regenerar un cuerpo entero a partir de un solo brazo. A lo largo de la historia, han cautivado culturas, desde altares aztecas hasta dibujos animados modernos. Hoy, aproximadamente 2.000 especies exhiben una variedad asombrosa en forma y color, desde minúsculas hasta enormes, mostrando la increíble diversidad del mundo natural.

Leer más

Modelos de difusión para el premio ARC AGI: una tarea sorprendentemente difícil

2025-08-09
Modelos de difusión para el premio ARC AGI: una tarea sorprendentemente difícil

Esta publicación detalla un intento de resolver el desafío ARC AGI utilizando un modelo de difusión. El autor adaptó un modelo de lenguaje autorregresivo afinado a un modelo de difusión, permitiendo la generación no secuencial. Si bien el enfoque de difusión logró una precisión de píxel ligeramente mejor, no se tradujo en tasas de éxito de tareas mejoradas. El principal cuello de botella se identificó como la falta de almacenamiento en caché eficiente en la arquitectura del modelo de difusión, lo que lo hace más lento que la línea de base autorregresiva. El trabajo futuro se centrará en mejorar el almacenamiento en caché y desarrollar estrategias de generación de candidatos más eficientes.

Leer más

Planetas del Sistema Solar: Una Visión General Impresionante (Excluyendo la Tierra)

2025-08-09
Planetas del Sistema Solar: Una Visión General Impresionante (Excluyendo la Tierra)

Esta imagen muestra todos los planetas de nuestro Sistema Solar, excepto la Tierra, destacando sus características únicas. Mercurio, el más cercano al Sol, es un mundo árido y lleno de cráteres. Venus está envuelto en espesas nubes. Marte, el Planeta Rojo, posee vastos desiertos y Olympus Mons, el volcán más grande del Sistema Solar. Júpiter y Saturno, los gigantes gaseosos, son inmensos con tormentas furiosas, los anillos de Saturno siendo particularmente impresionantes. Urano y Neptuno, los gigantes de hielo, son ricos en metano, dándoles su característico color azul.

Leer más
Tecnología

Marimo: Revolucionando los Notebooks de Python con Grafos de Flujo de Datos

2025-08-09
Marimo: Revolucionando los Notebooks de Python con Grafos de Flujo de Datos

Marimo es un notebook de Python de código abierto que representa los notebooks como grafos de flujo de datos, a diferencia de los REPL tradicionales. Esta representación combina lo mejor de la computación interactiva con la reproducibilidad y la reutilización del software Python. Los notebooks de Marimo funcionan como notebooks reactivos, scripts ejecutables, módulos de Python y aplicaciones web interactivas. Aborda las deficiencias de los notebooks tradicionales en reproducibilidad, interactividad, mantenimiento y reutilización, garantizando la sincronización de código y salida mediante análisis estático y admitiendo funciones como la incrustación de SQL y la recarga automática de módulos. Marimo es utilizado por empresas como Cloudflare, Shopify y BlackRock.

Leer más

HorizonDB de Radar: Una base de datos geoespacial impulsada por Rust

2025-08-09
HorizonDB de Radar: Una base de datos geoespacial impulsada por Rust

Radar procesa más de 1.000 millones de llamadas API al día, lo que exige servicios de geolocalización de alto rendimiento. Para afrontar este desafío, crearon HorizonDB, una base de datos geoespacial escrita en Rust, reemplazando su configuración anterior de MongoDB y Elasticsearch. HorizonDB consolida múltiples servicios de ubicación y utiliza tecnologías como RocksDB, S2, Tantivy, FSTs, LightGBM y FastText para lograr tiempos de respuesta de milisegundos y escalabilidad lineal. Esto resultó en un ahorro significativo de costos, una mayor eficiencia para los desarrolladores y una base sólida para el crecimiento futuro.

Leer más

La NASA lamenta la muerte de Jim Lovell, astronauta del Apollo 8

2025-08-09
La NASA lamenta la muerte de Jim Lovell, astronauta del Apollo 8

La NASA emitió un comunicado lamentando el fallecimiento de Jim Lovell, piloto del módulo de mando del Apollo 8, quien murió el 7 de agosto. Lovell, un astronauta pionero en los programas Gemini y Apollo, fue el primero en orbitar la Luna y condujo con éxito a la tripulación del Apollo 13 de vuelta a la Tierra. La NASA elogió su valentía, calma bajo presión y legado inspirador, destacando sus contribuciones a las futuras misiones Artemis.

Leer más
Tecnología

Efrit: Asistente de codificación con IA para Emacs

2025-08-09
Efrit: Asistente de codificación con IA para Emacs

Efrit es un sofisticado asistente de codificación con IA que se integra perfectamente con Emacs mediante la evaluación directa de Elisp. Ofrece múltiples interfaces: efrit-chat para conversaciones de varias rondas, efrit-do para comandos de lenguaje natural y una interfaz de línea de comandos para interacciones estructuradas. Efrit cuenta con soporte para conversaciones de varias rondas, un manejo robusto de errores y compatibilidad con temas oscuros. Requiere Emacs 28.1+, una clave de API de Anthropic y una conexión a internet. La instalación es sencilla: clona el repositorio y añádelo a tu configuración de Emacs.

Leer más
Desarrollo

12 Proyectos en Meses: Mi Flujo de Trabajo con Claude Code

2025-08-09
12 Proyectos en Meses: Mi Flujo de Trabajo con Claude Code

Esta publicación detalla la experiencia del autor utilizando Claude Code, un agente de programación LLM, para completar 12 proyectos en unos pocos meses. El autor enfatiza la importancia de las especificaciones claras, la revisión del código (incluida la solicitud al agente para que revise su propio trabajo) y una guía de agente 'global' personal que describe las mejores prácticas, como el progreso incremental y el desarrollo impulsado por pruebas. La revisión manual del código y las pruebas exhaustivas se destacan como cruciales, independientemente de la asistencia de IA. Se proporciona una lista de proyectos completados en GitHub.

Leer más

Tor: De Proyecto Militar a Salvavidas para la Privacidad

2025-08-09
Tor: De Proyecto Militar a Salvavidas para la Privacidad

Este artículo desvela la historia secreta de Tor, rastreando su evolución desde un proyecto de investigación de la Marina de los EE. UU. hasta convertirse en una herramienta crucial para la libertad digital. Tor utiliza el enrutamiento cebolla, encriptando y rebotando el tráfico a través de una red global de servidores para proteger el anonimato del usuario. Si bien a menudo se asocia con la dark web, Tor también sirve como un salvavidas vital para periodistas, activistas y ciudadanos en regímenes autoritarios. El artículo explora los orígenes de Tor, la filosofía de su diseño y su compleja relación entre privacidad y seguridad, enfatizando la importancia de las tecnologías robustas de preservación de la privacidad para defender la libertad digital y resistir la vigilancia gubernamental.

Leer más
Tecnología Red Anónima

Tarjeta Flip de Código Abierto con Simulación de Fluido FLIP

2025-08-09
Tarjeta Flip de Código Abierto con Simulación de Fluido FLIP

Este proyecto de código abierto presenta una tarjeta de visita tipo flip con una simulación de fluido basada en el método de partícula implícita de fluido (FLIP). Incluye archivos de diseño de PCB (carpeta kicad-pcb), un módulo de simulación de fluido independiente (carpeta fluid_sim_crate, basado en el trabajo de Matthias Müller), un diseño de batería recargable (inspirado en el proyecto de cnlohr), un simulador WASM para depuración (carpeta sim_display) y firmware para RP2350 (archivo flip-card_firmware). Más detalles se encuentran en los archivos README de cada carpeta.

Leer más
Hardware

Smartwatch USB-C de 16£: ¡Sorprendentemente bueno!

2025-08-09
Smartwatch USB-C de 16£: ¡Sorprendentemente bueno!

El Colmi P80, un smartwatch de 16£, cuenta con un puerto de carga USB-C, algo poco común. El autor, impulsado por el deseo de compatibilidad USB-C en todos sus dispositivos, probó sus capacidades. Sorprendentemente, el reloj ofreció una duración de batería impresionante (alrededor de 5 días), monitorización precisa de la frecuencia cardíaca y del sueño, y una funcionalidad decente. Aunque la aplicación que lo acompaña es básica y algunas funciones son limitadas, el rendimiento general supera las expectativas para su precio.

Leer más

La adquisición de Windsurf por 2.400 millones de dólares: ¿Una señal de alerta para el auge de la IA?

2025-08-09
La adquisición de Windsurf por 2.400 millones de dólares: ¿Una señal de alerta para el auge de la IA?

Windsurf, una empresa SaaS que alcanzó un récord de 82 millones de dólares en ARR en ocho meses, fue adquirida por una ganga. Este artículo analiza las razones: los costos exorbitantes de la API llevaron a pérdidas masivas, revelando que la empresa era esencialmente una incubadora de talentos de IA financiada con capital de riesgo. Google adquirió su equipo principal por 2.400 millones de dólares, dejando el negocio en sí prácticamente abandonado. Esto destaca la feroz competencia por el talento en IA y la fragilidad de algunos modelos de negocio. El autor advierte que riesgos similares amenazan a muchas empresas de IA; no todas tendrán la suerte de Windsurf de tener una salida de 'vender su tarea'.

Leer más

arXivLabs: Colaboraciones comunitarias para nuevas funciones de arXiv

2025-08-09
arXivLabs: Colaboraciones comunitarias para nuevas funciones de arXiv

arXivLabs es un marco que permite a los colaboradores desarrollar y compartir nuevas funciones de arXiv directamente en nuestro sitio web. Tanto las personas como las organizaciones que trabajan con arXivLabs han adoptado y aceptado nuestros valores de apertura, comunidad, excelencia y privacidad de los datos de los usuarios. arXiv está comprometido con estos valores y solo trabaja con socios que los respalden. ¿Tienes una idea para un proyecto que agregue valor a la comunidad de arXiv? Obtén más información sobre arXivLabs.

Leer más
Desarrollo

LLM locales: Creando un asistente de IA que preserva la privacidad

2025-08-09

¿Cansado de depender de la nube para tus necesidades de IA? Un equipo creó una aplicación LLM local priorizando la privacidad. Combinando LLM, contenedores Docker y un navegador sin cabeza, su sistema ejecuta LLM localmente, ejecuta código en VMs ligeras y accede a internet de forma segura. Esto permite a los usuarios realizar tareas sensibles a la privacidad, como la edición de fotos y vídeos, sin que los datos salgan de su máquina. Si bien el desarrollo de aplicaciones para Mac resultó desafiante, finalmente crearon una herramienta local potente que ofrece un verdadero aislamiento de código y datos, dando a los usuarios un control y privacidad sin precedentes.

Leer más

La Revolución Ferroviaria de Amtrak: Una Transformación Única en la Vida

2025-08-08
La Revolución Ferroviaria de Amtrak: Una Transformación Única en la Vida

Amtrak está aprovechando una oportunidad única para revolucionar los viajes en tren en EE. UU. Al modernizar, mejorar y expandir sus trenes, estaciones e infraestructura, Amtrak está respondiendo a la creciente demanda de viajes en tren. Ofrece experiencias inolvidables a más de 500 destinos en 46 estados y partes de Canadá. Amtrak te invita a obtener más información en Amtrak.com, descargar la aplicación, conectarte en X, Instagram, Facebook y LinkedIn y unirte a Amtrak Guest Rewards para obtener puntos gratuitos para viajes de recompensa, mejoras, acceso al salón y mucho más.

Leer más

La Leyenda de ThinkPad: El Viaje de 22 Años de David Hill

2025-08-08
La Leyenda de ThinkPad: El Viaje de 22 Años de David Hill

Este artículo profundiza en la carrera de 22 años de David Hill, el legendario diseñador detrás de muchas características icónicas de ThinkPad. Comparte las historias detrás del diseño del TrackPoint, el innovador teclado mariposa (y por qué no se hicieron más) y el ThinkLight. Hill también revela proyectos no realizados, como un ordenador de sobremesa todo en uno plegable y más portátiles con el teclado mariposa. El artículo también relata cómo, después de la adquisición de la división de PC de IBM por Lenovo, Hill lideró la creación del ThinkPad X300, ultradelgado y ligero, demostrando la capacidad de innovación de Lenovo mientras se mantiene el legado de ThinkPad.

Leer más
Tecnología

La Lucha por la Monetización de Google TV: ¿Una Batalla Perdida Contra Amazon?

2025-08-08
La Lucha por la Monetización de Google TV: ¿Una Batalla Perdida Contra Amazon?

La plataforma Google TV de Google, con más de 300 millones de usuarios activos mensuales, enfrenta una gran crisis de monetización. Este artículo revela las pérdidas sustanciales de Google en Google TV y su costosa batalla con Amazon por la cuota de mercado, que implica importantes subsidios para el espacio en los estantes de los minoristas. Con la rentabilidad de Google TV en entredicho, Google está reevaluando su estrategia de Smart TV, posiblemente considerándola un pasatiempo costoso. Mientras tanto, el éxito de YouTube en el mercado de las salas de estar está desviando recursos de Google TV, debilitando aún más su posición.

Leer más
Tecnología

Sony Xperia: Pequeña pero Importante

2025-08-08
Sony Xperia: Pequeña pero Importante

A pesar de tener una pequeña cuota de mercado en el sector global de smartphones y enfrentarse a la incertidumbre sobre su futuro, Sony mantiene que su marca Xperia es "muy importante" y continuará siendo cuidada. El CFO de Sony, Lin Tao, reiteró recientemente este compromiso, reconociendo el lugar de Xperia dentro de un segmento de negocio crucial. Aunque Sony ha reducido su presencia en el mercado estadounidense, ha perdido terreno en Japón y Europa, e incluso ha dejado de fabricar sus propios dispositivos, insiste en continuar con sus esfuerzos en los smartphones. La empresa enfatiza la importancia más amplia de la tecnología de comunicación dentro de la estrategia a largo plazo de Sony, extendiéndose más allá de los propios smartphones.

Leer más
Tecnología

GPT-5 destaca en el benchmark de revisión de código de Qodo

2025-08-08
GPT-5 destaca en el benchmark de revisión de código de Qodo

Qodo utilizó su benchmark PR privado, simulando flujos de trabajo de revisión de código del mundo real, para evaluar modelos de lenguaje de vanguardia, incluyendo GPT-5. Los resultados mostraron que GPT-5 sobresalió en la comprensión de diferencias de código, la identificación de errores y la sugerencia de mejoras. Su variante 'mínima' equilibró velocidad y calidad de forma impresionante. Si bien GPT-5 presentó algunas debilidades, como falsos positivos y etiquetado inconsistente, su rendimiento general en la revisión de código fue sorprendente, marcando un progreso significativo en la revisión de código asistida por IA.

Leer más
Desarrollo

El colapso de la industria solar china: despidos masivos y sobrecapacidad

2025-08-08

La industria solar china se enfrenta a una fuerte crisis, con empresas líderes despidiendo a casi un tercio de su fuerza laboral el año pasado. Esto revela una crisis de sobrecapacidad y guerras de precios implacables, alimentadas por la expansión anterior liderada por el gobierno. Si bien el gobierno está intentando intervenir, la resistencia local y la lentitud de las empresas dificultan las soluciones. Esto destaca los riesgos de la planificación central y presagia posibles problemas en otras industrias chinas.

Leer más

La cuota de mercado del escritorio Linux supera el 6%: ¿La creciente influencia de la IA?

2025-08-08
La cuota de mercado del escritorio Linux supera el 6%: ¿La creciente influencia de la IA?

El análisis de Lansweeper de más de 15 millones de sistemas revela que la cuota de mercado del sistema operativo de escritorio Linux ha superado el 6%, un nuevo máximo histórico. Este crecimiento es particularmente pronunciado en el mercado de PC de consumo, en contraste con una cuota menor del 1,9% en entornos empresariales. Los dispositivos nuevos muestran una preferencia más fuerte por Linux, y la adopción europea supera a la de América del Norte. El auge del desarrollo de IA se cita como un factor clave, con Linux convirtiéndose en el estándar para las cargas de trabajo de IA y aprendizaje automático. Si bien es improbable que iguale el atractivo general del macOS, Linux ha consolidado su posición como un actor importante para usuarios avanzados y desarrolladores.

Leer más

HBO Max acabará con el intercambio de contraseñas

2025-08-08
HBO Max acabará con el intercambio de contraseñas

Warner Bros. Discovery (WBD) está tomando medidas enérgicas para frenar el intercambio de contraseñas en HBO Max. El jefe de streaming y juegos de la compañía anunció planes para cerrar las lagunas para fines de 2025, lo que afectará las finanzas a partir de 2026. Siguiendo el ejemplo de Netflix, WBD busca aumentar significativamente los ingresos al combatir esta práctica. Meses de pruebas para identificar usuarios legítimos preceden a una postura más firme, con medidas más enérgicas que se implementarán en el cuarto trimestre. A pesar de esto, HBO Max agregó 3,4 millones de suscriptores de streaming este trimestre, alcanzando un total de 125,7 millones.

Leer más
1 2 76 77 78 80 82 83 84 595 596