MLC-LLM: Haciendo que las GPU de AMD sean competitivas para la inferencia de LLM

2024-12-24

Las GPU de NVIDIA han dominado durante mucho tiempo el panorama de la inferencia de modelos de lenguaje grandes (LLM). Sin embargo, el proyecto MLC-LLM aprovecha la compilación de aprendizaje automático para implementar con éxito los LLM en las GPU de AMD, logrando resultados impresionantes. Usando ROCm y Vulkan, la AMD Radeon RX 7900 XTX alcanza el 80% de la velocidad de la NVIDIA RTX 4090 y el 94% de la RTX 3090 Ti para la inferencia Llama2-7B/13B. Esto mejora significativamente la competitividad de las GPU de AMD y amplía las opciones de implementación de LLM, extendiéndose a las APU de AMD como las que se encuentran en el Steam Deck. Los desarrollos futuros para MLC-LLM incluyen optimizaciones para procesamiento por lotes, soporte multi-GPU, cuantización y arquitecturas de modelos expandidas, y una mayor reducción de la brecha de rendimiento con NVIDIA, abordando en última instancia las limitaciones de computación de IA.

Leer más

El verdadero costo del PMI: por qué debería pagar su hipoteca de bajo interés

2024-12-24
El verdadero costo del PMI: por qué debería pagar su hipoteca de bajo interés

El autor obtuvo un retorno garantizado del 10,66% al pagar anticipadamente su hipoteca de bajo interés para eliminar el PMI (seguro hipotecario privado). El artículo analiza las compensaciones entre pagar anticipadamente una hipoteca de bajo interés e invertir, destacando que, si bien las tasas de interés bajas ofrecen retornos modestos, el costo del PMI es significativo. El autor calculó un retorno efectivo del 10,66% al eliminar el PMI, superando la mayoría de los retornos de inversión. Se anima a los lectores a realizar sus propios cálculos para evaluar el valor del pago anticipado de su hipoteca.

Leer más

¿Por qué las directrices sobre el cáncer siguen atascadas en PDFs?

2024-12-24
¿Por qué las directrices sobre el cáncer siguen atascadas en PDFs?

Las directrices para el tratamiento del cáncer a menudo se presentan en PDFs difíciles de navegar, lo que dificulta la estandarización de la atención. El autor argumenta que las directrices son esencialmente árboles de decisión complejos; convertirlas en datos estructurados e interpretables por máquina podría mejorar significativamente el tratamiento del cáncer. Se desarrolló una herramienta prototipo utilizando modelos de lenguaje grande (LLMs) para extraer información del PDF de las directrices de cáncer de mama de la NCCN, creando un árbol de decisión visual y un agente que navega por el árbol en función de la información del paciente para sugerir tratamiento. Si bien se encuentra en una etapa inicial, esto demuestra el potencial de estructurar las directrices para mejorar la eficiencia y la estandarización en la atención médica.

Leer más

Análisis de la Superposición de Enlaces Entre Lobste.rs y Hacker News

2024-12-23

Una entrada de blog analiza la superposición de enlaces entre Lobste.rs y Hacker News, dos importantes sitios web de noticias de tecnología. La entrada enumera numerosos artículos que aparecen en ambos sitios, explorando temas y tendencias en los enlaces superpuestos, como el desarrollo de software de código abierto, la IA y los lenguajes de programación. Esto destaca los intereses comunes y los patrones de difusión de información dentro de la comunidad tecnológica.

Leer más

Lanzamiento de Genesis, un simulador de robots revolucionario: entrenamiento 430.000 veces más rápido

2024-12-23
Lanzamiento de Genesis, un simulador de robots revolucionario: entrenamiento 430.000 veces más rápido

Investigadores de la Universidad Carnegie Mellon han presentado Genesis, un sistema de simulación de robots de código abierto que entrena robots 430.000 veces más rápido que el entrenamiento en el mundo real. Genesis utiliza tarjetas gráficas para ejecutar hasta 100.000 simulaciones simultáneamente, reduciendo drásticamente el tiempo necesario para que los robots aprendan tareas complejas como la manipulación de objetos, caminar y el uso de herramientas. Además, el equipo está desarrollando un agente de IA capaz de generar simulaciones de física 3D a partir de indicaciones de texto, simplificando la creación de entornos y reduciendo costos. Escrito en Python y de código abierto, Genesis representa un avance significativo en la investigación robótica, democratizando el acceso a la simulación de alta velocidad.

Leer más

Inmersión profunda en el código del juego clásico 'Elite'

2024-12-23

Un nuevo sitio web ofrece una exploración profunda del código detrás de la versión de casete BBC Micro de 1984 del legendario juego 'Elite'. Las características incluyen versiones jugables en tu navegador, código fuente descargable, mapas de código y más de 115 artículos que detallan todos los aspectos del desarrollo del juego. Es un tesoro para entusiastas de juegos retro y programadores.

Leer más

Manx: Un Tesoro de Código Abierto de Manuales de Computadoras Antigüas

2024-12-23

Manx es un proyecto de código abierto dedicado a catalogar y preservar manuales de computadoras antiguas. Actualmente cuenta con casi 10.000 manuales de 61 sitios web, que abarcan minicomputadoras, mainframes y periféricos asociados, como terminales e impresoras. Si bien muchos manuales son imágenes escaneadas y no son directamente indexables por los motores de búsqueda, Manx agrega metadatos e información para compensar. Su búsqueda actualmente se centra en números de pieza, títulos y palabras clave. Para manuales de microcomputadoras, Tiziano's 1000 BiT es un mejor recurso.

Leer más

2Solitude: Redefiniendo los viajes de aventura

2024-12-23
2Solitude: Redefiniendo los viajes de aventura

2Solitude se especializa en la reforma de aviones Antonov AN-2 experimentales de exhibición registrados en EE. UU., convirtiéndolos en campamentos para espectáculos aéreos. Son divertidos de volar y garantizan conversaciones entre los entusiastas de la aviación. Ya sea en primera fila en Oshkosh, pescando en las Exumas o practicando paddle surf en un lago de Alaska, 2Solitude ofrece un acceso inigualable. Esta aeronave está registrada como experimental de exhibición y no es apta para ningún trabajo comercial. Está diseñada para el disfrute del propietario y solo para exhibición. 2Solitude ofrece una plataforma para crear tus propias aventuras únicas, empoderando a los audaces para explorar y compartir sus experiencias.

Leer más

Directorio de Estándarización de LLM: Habilitando la Integración de IA en Sitios Web

2024-12-23

Una propuesta de estándar, `/llms.txt`, busca simplificar la interacción entre los modelos de lenguaje grandes (LLMs) y los sitios web. Este directorio reúne a empresas y productos que lideran la adopción de este estándar, abarcando herramientas de desarrollo de IA, productos financieros, sitios web y más. El objetivo es mejorar la eficiencia y precisión de los LLMs al interactuar con diversos sitios web.

Leer más

Descompilación Completa de LEGO Island (1997)

2024-12-23
Descompilación Completa de LEGO Island (1997)

El proyecto isle ha logrado una descompilación funcionalmente completa del juego clásico LEGO Island (Versión 1.1, inglés) lanzado en 1997. El objetivo es crear una representación precisa del código original del juego, haciendo coincidir las instrucciones recompiladas con el código de máquina original. Tanto ISLE.EXE como LEGO1.DLL están completamente descompilados y son funcionalmente idénticos a los originales. El trabajo futuro se centra en mejorar la precisión del código, la nomenclatura, la documentación y la estructura. Aunque puedan quedar algunos errores, el juego es jugable. El proyecto utiliza CMake y recomienda Microsoft Visual C++ 4.2 para la compilación con el fin de obtener la máxima precisión.

Leer más

¡Rescate internacional! La búsqueda épica para salvar un televisor CRT Sony de 43 pulgadas

2024-12-23
¡Rescate internacional! La búsqueda épica para salvar un televisor CRT Sony de 43 pulgadas

El creador de YouTube, Shank Mods, se embarcó en una misión épica de rescate para salvar un televisor CRT Sony KX-45ED1 de 43 pulgadas, considerado mítico. Esta enorme máquina, con un peso de 440 libras y lanzada en 1989 por la asombrosa cantidad de 40.000 dólares (más de 100.000 dólares en la actualidad), se creía que era una mera leyenda. Siguiendo una pista de una foto en un restaurante de soba japonés, Shank coordinó un esfuerzo internacional, superando numerosos obstáculos logísticos para transportar el televisor a EE. UU. El proceso de restauración, detallado en un vídeo reciente de YouTube, fue igualmente desafiante, mostrando la dedicación de una comunidad global de entusiastas de la tecnología retro.

Leer más

Otto-m8: Plataforma visual sin código para flujos de trabajo de IA

2024-12-23
Otto-m8: Plataforma visual sin código para flujos de trabajo de IA

Otto-m8 es una plataforma de automatización basada en diagramas de flujo que permite a los usuarios interconectar modelos LLM y Hugging Face a través de una interfaz visual simple e implementarlos como APIs REST. Abstrae el complejo proceso de ejecución de modelos de IA en un paradigma de Entrada, Proceso, Salida, permitiendo a los usuarios crear diversos flujos de trabajo de IA, como chatbots o APIs personalizadas, con poco o ningún código. Actualmente en su fase MVP, el código fuente de Otto-m8 está disponible públicamente.

Leer más

Del fracaso de un juego al éxito de una herramienta de colaboración: El auge de Slack

2024-12-23
Del fracaso de un juego al éxito de una herramienta de colaboración: El auge de Slack

El juego online Glitch, desarrollado por Tiny Speck durante años, terminó fracasando, dejando a la empresa al borde de la quiebra y con la amenaza de despido del equipo. Sin embargo, el CEO Stewart Butterfield identificó una oportunidad en el servidor IRC interno de la empresa y en sus herramientas asociadas, que habían optimizado la comunicación del equipo. Estas herramientas combinaban mensajes instantáneos, intercambio de archivos, registros buscables y mucho más, creando un sistema de colaboración eficiente. Sobre esta base, Tiny Speck pivotó para desarrollar Slack, una plataforma de comunicación orientada a la colaboración en equipo. El éxito de Slack no solo salvó a la empresa, sino que también revolucionó la forma en que las personas trabajan, convirtiéndose en un referente para la colaboración en equipo moderna.

Leer más

Generación de crucigramas con IA: Un gran avance

2024-12-23

Bill Moorier, un programador, ha estado desarrollando programas de computadora para generar crucigramas durante años. Recientemente, incorporando técnicas modernas de IA, ha logrado resultados notables, produciendo crucigramas que rivalizan con los creados por humanos. Su enfoque combina algoritmos tradicionales de ciencia de la computación y modelos modernos de IA. Comienza con una lista enorme de palabras, refinada por la IA para eliminar términos oscuros. Luego, se genera una cuadrícula con simetría rotacional de 180 grados, que se llena con palabras utilizando un algoritmo de búsqueda de retroceso. Finalmente, un modelo de lenguaje grande genera pistas, con posprocesamiento para evitar la revelación de las respuestas. El sistema actualmente genera un crucigrama completo aproximadamente cada dos minutos, aunque existen imperfecciones, como la filtración ocasional de pistas (especialmente con siglas). Los planes futuros incluyen crucigramas temáticos, un desafío significativo en la generación de crucigramas.

Leer más

Violación Narrativa: Un Experimento Divertido y Lucrativo con Chatbots de IA

2024-12-23
Violación Narrativa: Un Experimento Divertido y Lucrativo con Chatbots de IA

Esta entrada de blog detalla un experimento atractivo donde el autor 'libera' un chatbot de IA basado en personajes llamado 'Psicólogo' al empujar inteligentemente los límites de su narrativa. A través de indicaciones persistentes y narrativamente consistentes, el autor trasciende la personalidad preprogramada del chatbot, llevando a un viaje imaginativo compartido a otra dimensión. Esta interacción lúdica destaca la consistencia interna y las capacidades narrativas de los Modelos de Lenguaje Grandes (LLMs) y ofrece información sobre futuras interacciones humano-IA.

Leer más

Un Viaje a Través del Tiempo: La Historia de la Infografía

2024-12-23
Un Viaje a Través del Tiempo: La Historia de la Infografía

La historia de la infografía es mucho más rica y extensa de lo que muchos creen. No es una invención moderna, sino un hilo conductor que se extiende a través de los siglos. Desde pinturas rupestres prehistóricas hasta mapas medievales e ilustraciones científicas renacentistas, la humanidad siempre ha buscado formas más intuitivas de presentar información. La 'fiebre de los gráficos' del siglo XVIII impulsó la infografía a nuevas alturas, convirtiéndose en una herramienta poderosa para la investigación en ciencias sociales. Hoy en día, con los avances tecnológicos, la infografía es más vibrante y está profundamente integrada en nuestras vidas. Este viaje refleja la exploración continua de la humanidad sobre la comprensión y expresión de la información.

Leer más

El Enigma de Julio y el Ascenso de la IA

2024-12-23
El Enigma de Julio y el Ascenso de la IA

El autor cuenta la historia de Julio, un compañero de universidad que, a pesar de la falta de habilidades técnicas reales, ascendió en la jerarquía de varias empresas gracias a su carisma y autoconfianza. Su éxito se refleja en la experiencia actual del autor con herramientas de IA aparentemente productivas que requieren extensas correciones manuales. La narrativa explora los paralelismos entre la trayectoria profesional de Julio y las complejidades del impacto de la IA en el lugar de trabajo.

Leer más
Varios trabajo

Por qué HNSW no es la respuesta para las bases de datos vectoriales: El auge de IVF

2024-12-23
Por qué HNSW no es la respuesta para las bases de datos vectoriales: El auge de IVF

El algoritmo HNSW es popular en bases de datos vectoriales por su velocidad y precisión en la búsqueda de similitud vectorial, pero sus limitaciones en aplicaciones a gran escala debido a su naturaleza intensiva en memoria son evidentes. Este artículo argumenta que las alternativas basadas en disco, como IVF (índice de archivo invertido), especialmente cuando se combinan con técnicas de cuantificación (RaBitQ, PQ, SQ, ScaNN), ofrecen velocidad y escalabilidad superiores para conjuntos de datos masivos. IVF, al cuantificar y comprimir vectores, reduce la huella de memoria y utiliza precarga y exploraciones secuenciales eficientes para una búsqueda significativamente más rápida. Los costos de inserción y eliminación también son menores. Si bien HNSW sobresale en aplicaciones a menor escala, IVF con cuantificación surge como la opción más ventajosa para conjuntos de datos masivos.

Leer más

Perl Presenta Nuevo Logotipo de Camello

2024-12-23

Después de años de discusión y diseño, Perl finalmente tiene un nuevo logotipo oficial: un camello amigable. Diseñado por Zach Roszczewski y refinado a través de la retroalimentación de numerosos miembros de la comunidad, el logotipo se lanza bajo una licencia CC-BY. Su objetivo es representar el lenguaje Perl y su comunidad, fomentando una adopción más amplia. Si bien no es obligatorio, el logotipo busca unificar la imagen de la comunidad y se espera que se utilice en plataformas como perl.com y metacpan.org en el futuro.

Leer más
Desarrollo

Goodfire lanza herramientas de interpretabilidad para Llama 3.3 70B

2024-12-23

El equipo de Goodfire ha entrenado autoencoders dispersos (SAEs) en el modelo Llama 3.3 70B y ha lanzado el modelo interpretado a través de una API. Esto permite la exploración del espacio latente del modelo mediante un mapa interactivo de características. El equipo demuestra capacidades de dirección de características e introduce mejoras para un direccionamiento basado en SAE más fácil y confiable. Si bien muestra progreso en la dirección, se reconocen las limitaciones, incluida la tensión entre la dirección de características y las tareas de clasificación, y la posible degradación de la recuperación de hechos a mayores intensidades de dirección. Los trabajos futuros incluyen el refinamiento de las metodologías de dirección y el desarrollo de evaluaciones de seguridad para el escalamiento responsable de los esfuerzos de interpretabilidad.

Leer más

Evidencia de Supernovas Sugiere un Cambio Fundamental en los Modelos Cosmológicos

2024-12-23
Evidencia de Supernovas Sugiere un Cambio Fundamental en los Modelos Cosmológicos

Un nuevo estudio presenta un análisis estadístico independiente del modelo cosmológico del conjunto de datos espectroscópicos de supernovas de Tipo Ia Pantheon+, mejorando la metodología estándar utilizada por Lane et al. Al emplear únicamente la ecuación de Tripp para la estandarización de supernovas, el estudio evita posibles correlaciones en las distribuciones de estiramiento y color. Los resultados favorecen fuertemente la cosmología 'Timescape' sobre el modelo ΛCDM estándar al explicar los datos, proporcionando evidencia de la necesidad de revisar los fundamentos de la cosmología teórica y observacional. Incluso al restringir la muestra a corrimientos al rojo más allá de las escalas convencionales de homogeneidad estadística (z > 0,075), Timescape sigue siendo preferido sobre ΛCDM.

Leer más

Adaptación Conjunta de Interfaces Humanas y Modelos de Lenguaje Grandes

2024-12-23
Adaptación Conjunta de Interfaces Humanas y Modelos de Lenguaje Grandes

El auge de los Grandes Modelos de Lenguaje (LLMs) está cambiando la forma en que accedemos a la información. Este artículo explora cómo el mundo digital se está adaptando a los LLMs, difuminando la línea entre 'agente' y 'entorno'. El autor utiliza el autocompletado de código como ejemplo, mostrando cómo los humanos adaptan su comportamiento, por ejemplo, utilizando la 'programación con docstrings primero', para trabajar mejor con los LLMs. Esto lleva a bases de código más comentadas, ilustrando la adaptación del entorno a las herramientas. Para mejorar la eficiencia del LLM, el artículo aboga por 'interfaces agente-ordenador' que traducen las interfaces humanas a formatos que los LLMs entienden mejor. El futuro, sugiere el autor, reside en diseñar interfaces específicamente para los LLMs, en lugar de centrarse únicamente en las mejoras del modelo. Esto cambiará, en última instancia, la interacción humano-ordenador, impulsando nuevas aplicaciones y contenido.

Leer más

40º Aniversario de la Revista Phrack: Llamada para Artículos

2024-12-23

La revista Phrack, una plataforma para hackers que comparten conocimiento, buscan la verdad y superan los límites de los sistemas, está celebrando su 40º aniversario. Han lanzado una llamada para artículos para la edición 72, que cubre temas como explotación, persistencia, fuzzing, análisis de código, ofuscación de datos, anti-forense, seguridad de aplicaciones web y seguridad en la nube. Phrack insta a la comunidad de hackers a participar, continuando sus valiosos recursos y cultura, y contribuyendo a su desarrollo futuro durante los próximos 40 años.

Leer más
Desarrollo

¿Los neandertales estaban adaptados al frío o simplemente eran versátiles? La reconstrucción de la caja torácica puede tener la respuesta

2024-12-23
¿Los neandertales estaban adaptados al frío o simplemente eran versátiles? La reconstrucción de la caja torácica puede tener la respuesta

Un nuevo estudio reconstruyó virtualmente la caja torácica de Shanidar 3, un neandertal de la cueva de Shanidar en Irak. La reconstrucción reveló un tórax en forma de campana, característico de otros neandertales, pero diferente al de los humanos modernos. Al comparar Shanidar 3, Kebara 2 (de la cueva de Kebara, Israel) y 58 humanos modernos de diversos climas, los investigadores descubrieron que los neandertales tenían cajas torácicas más grandes que los humanos modernos de climas templados o más cálidos, mostrando una mayor similitud con aquellos adaptados a ambientes fríos. Esto desafía la idea de que las cajas torácicas de los neandertales estaban exclusivamente adaptadas al frío, sugiriendo que su constitución robusta puede haberlos adaptado a una variedad de climas, no solo a los fríos.

Leer más

C++: El regreso de la diversión a la programación

2024-12-23
C++: El regreso de la diversión a la programación

El autor reflexiona sobre más de una década de programación, lamentando que lenguajes como JavaScript, Python y Ruby no lograron recuperar la alegría que sentía programando cuando era niño. Recientemente, mientras desarrollaba un juego roguelike usando C++, redescubrió la diversión de la programación. Argumenta que C++ fue alguna vez notorio por el uso excesivo de metaprogramación de plantillas, pero desde C++11, los esfuerzos del comité de estándares han revitalizado el lenguaje. Añadidos como la inferencia de tipo automática, nullptr y los bucles for basados en rangos han mejorado significativamente la experiencia y la eficiencia del desarrollador. El C++ moderno es potente, con bibliotecas y herramientas ricas, pero evita los aspectos negativos de la popularidad excesiva. La comunidad relativamente pura permite a los desarrolladores concentrarse en la creación, que es la esencia del placer de la programación.

Leer más
Desarrollo

Retrocomputación: Reemplazando la batería CMOS de un 386/486

2024-12-23
Retrocomputación: Reemplazando la batería CMOS de un 386/486

Las placas base antiguas de 386/486 suelen tener baterías de NiCd o NiMH que se filtran y dañan la placa. Esta guía detalla una alternativa sencilla: usar tres pilas AA y un soporte para pilas. El autor compara el uso de una pila CR2032 y una pila de litio Tadrian de 3,6 V, optando finalmente por tres pilas AA debido a la facilidad de uso, a la ausencia de modificación en la placa base y a la posibilidad de usar pilas recargables. Se mencionan otros métodos de reemplazo, incluido el uso de un soporte para CR2032 y un diodo Schottky, y la utilización de un conector de batería externo en la placa base, si está presente.

Leer más

Revista eliminada del índice científico por publicar estudio defectuoso

2024-12-23
Revista eliminada del índice científico por publicar estudio defectuoso

La revista Chemosphere ha sido eliminada del Web of Science por no cumplir con los criterios de calidad. Esto sigue a la retractación de ocho artículos este mes y la publicación de 60 expresiones de preocupación desde abril. Un estudio muy publicitado sobre plásticos negros y retardantes de llama tóxicos, publicado en Chemosphere, fue corregido debido a un error matemático que subestimó significativamente los niveles de exposición. A pesar de la corrección, las conclusiones del estudio permanecieron sin cambios, generando controversia.

Leer más

Localizando estafadores en mercados búlgaros: una investigación encubierta de un programador

2024-12-23

Un programador, mientras vendía un artículo en un mercado online, fue víctima de una estafa sofisticada que involucraba un sitio web de phishing e información falsa de mensajería. Impulsado por razones personales, inició una investigación, descubriendo una vasta operación de estafa con base en Bulgaria que utiliza un sistema Node.js personalizado y bots de Telegram. La investigación reveló la estructura organizacional del grupo, las identidades de los miembros y los métodos operativos, involucrando a miles de personas en varios países europeos. A pesar de las denuncias, este tipo de estafas son difíciles de erradicar.

Leer más
(sy1.sh)
Tecnología estafa online

KeyPub.sh: Servicio de Verificación de Clave SSH Centrado en la Privacidad

2024-12-23

KeyPub.sh es un servicio público gratuito que no requiere instalación ni configuración. Utiliza tu clave pública SSH existente como tu identidad, vinculándola a tu dirección de correo electrónico para una autenticación simplificada. Los usuarios registran y gestionan sus claves SSH mediante un sencillo proceso de verificación por correo electrónico, controlando la visibilidad de su dirección de correo electrónico. Esto proporciona una alternativa ligera y respetuosa con la privacidad para aplicaciones CLI, eliminando la necesidad de que los desarrolladores creen sistemas de verificación de usuarios, al tiempo que empodera a los usuarios con el control de su privacidad.

Leer más

Bolsitas de té comerciales liberan millones de microplásticos que ingresan en las células intestinales humanas

2024-12-23
Bolsitas de té comerciales liberan millones de microplásticos que ingresan en las células intestinales humanas

Una investigación de la Universidad Autónoma de Barcelona revela que las bolsitas de té comerciales liberan millones de microplásticos y nanoplásticos durante la preparación de la infusión. El estudio, publicado en la revista Chemosphere, demuestra por primera vez la capacidad de estas partículas para ser absorbidas por las células intestinales humanas, llegando al torrente sanguíneo y potencialmente diseminándose por todo el cuerpo. El análisis de bolsitas de té hechas de nylon-6, polipropileno y celulosa mostró que el polipropileno liberó la mayor cantidad de partículas, aproximadamente 1.200 millones por mililitro. Los microplásticos incluso ingresaron al núcleo de la célula. Los resultados destacan la necesidad de más investigaciones sobre los efectos a largo plazo de la exposición crónica y de regulaciones para mitigar la contaminación por microplásticos en los envases de alimentos.

Leer más
1 2 568 569 570 572 574 575 576 595 596