Category: IA

Modelos de embriones programables creados usando CRISPR

2025-03-23
Modelos de embriones programables creados usando CRISPR

Científicos de la UC Santa Cruz han creado modelos celulares de embriones sin utilizar embriones reales, imitando los primeros días después de la fertilización. Utilizando edición genética basada en CRISPR, indujeron células madre de ratón a autoorganizarse en estructuras llamadas embrioides, replicando etapas clave del desarrollo embrionario temprano. Esto permite el estudio de la función génica en el desarrollo temprano y los mecanismos de los trastornos del desarrollo. Publicado en Cell Stem Cell, esta investigación ofrece una nueva vía para comprender la infertilidad humana y mejorar los tratamientos de fertilidad.

Búhos nocturnos y depresión: la atención plena puede ser la clave

2025-03-23
Búhos nocturnos y depresión: la atención plena puede ser la clave

Un estudio con adultos jóvenes revela una fuerte relación entre los cronotipos vespertinos (búhos nocturnos) y tasas más altas de síntomas depresivos. Los investigadores investigaron la atención plena, la rumia, el consumo de alcohol y la calidad del sueño como posibles mediadores. Los resultados muestran que estos factores median significativamente la relación, con 'actuar con consciencia' —un aspecto de la atención plena— ofreciendo efectos protectores particulares contra la depresión. Esta investigación sugiere nuevas estrategias de intervención para mejorar la salud mental de los adultos jóvenes.

Los LLM revolucionan los sistemas de recomendación y búsqueda: Un estudio exhaustivo

2025-03-23
Los LLM revolucionan los sistemas de recomendación y búsqueda: Un estudio exhaustivo

Este artículo analiza investigaciones recientes que aplican Modelos de Lenguaje Grandes (LLM) a sistemas de recomendación y motores de búsqueda. Los estudios exploran varios enfoques, incluyendo arquitecturas de modelos aumentadas por LLM (por ejemplo, Semantic IDs de YouTube y M3CSR de Kuaishou), el uso de LLM para la generación y el análisis de datos (por ejemplo, Mejora de la Calidad de Recomendación de Bing y Coincidencia Mala Esperada de Indeed), y la adopción de metodologías de entrenamiento de LLM (por ejemplo, leyes de escalamiento, aprendizaje por transferencia y destilación del conocimiento). Además, la investigación se centra en arquitecturas unificadas para sistemas de recomendación y motores de búsqueda, como 360Brew de LinkedIn y UniCoRn de Netflix, para mejorar la eficiencia y el rendimiento. En general, estos estudios demuestran el potencial significativo de los LLM para mejorar los sistemas de recomendación y los motores de búsqueda, produciendo resultados sustanciales en el mundo real.

IA

Impacto económico de la IA: ¿Automatización de la mano de obra, no solo I+D?

2025-03-22
Impacto económico de la IA: ¿Automatización de la mano de obra, no solo I+D?

Una opinión predominante afirma que el principal impacto económico de la IA será a través de la automatización de la I+D. Este artículo cuestiona esa idea, argumentando que el valor económico de la I+D está sobreestimado, contribuyendo mucho menos al crecimiento de la productividad de lo que comúnmente se cree. Los autores sostienen que el valor económico de la IA provendrá principalmente de la automatización generalizada de la mano de obra, lo que dará lugar a aumentos significativos en la productividad y la producción, no solo a avances en I+D. Si bien la IA eventualmente automatizará la I+D, es probable que esto ocurra después de una automatización más amplia, una vez que la IA posea las capacidades para manejar una gama más amplia de tareas.

IA

Las Seis Olas de la Codificación Vibe y el Futuro de la Programación

2025-03-22
Las Seis Olas de la Codificación Vibe y el Futuro de la Programación

Este artículo explora la evolución de la codificación con IA, desde la codificación tradicional hasta la finalización del código, la codificación basada en chat, los agentes de codificación, los clústeres de agentes y, finalmente, las flotas de agentes. El autor predice que los agentes de codificación aumentarán drásticamente la eficiencia del desarrollo, pero también traerán costos elevados. El papel futuro de los programadores cambiará para gestionar y coordinar agentes de IA. El artículo destaca que los programadores más jóvenes están adoptando la IA más fácilmente que los desarrolladores senior, remodelando la estructura de talento de la industria del desarrollo de software. El autor concluye que aprender a utilizar los agentes de codificación de manera eficaz es crucial para el éxito futuro en el campo.

Estandarizando las preferencias de IA: Abordando las preocupaciones sobre derechos de autor en los datos de entrenamiento de IA

2025-03-22
Estandarizando las preferencias de IA: Abordando las preocupaciones sobre derechos de autor en los datos de entrenamiento de IA

Para abordar las preocupaciones sobre derechos de autor que surgen del uso de contenido de internet para entrenar modelos de IA, el recién formado Grupo de Trabajo de Preferencias de IA (AIPREF) de la IETF está trabajando para estandarizar los bloques de construcción para expresar preferencias sobre cómo se recopila y procesa el contenido. Actualmente, los proveedores de IA utilizan una variedad confusa de señales no estándar (como robots.txt) para guiar las decisiones de rastreo y entrenamiento, lo que lleva a una falta de confianza entre los autores y editores de que se respetarán sus preferencias. El AIPREF definirá un vocabulario común para expresar las preferencias de los autores y editores, métodos para adjuntar este vocabulario al contenido de internet y un mecanismo estándar para conciliar múltiples expresiones de preferencias. La primera reunión del grupo de trabajo se llevará a cabo durante la IETF 122 en Bangkok.

IA

Los límites del escalamiento en IA: ¿Está llegando al final la fuerza bruta?

2025-03-22
Los límites del escalamiento en IA: ¿Está llegando al final la fuerza bruta?

Una encuesta a 475 investigadores de IA revela que simplemente escalar los enfoques actuales de IA probablemente no conducirá a la Inteligencia Artificial General (AGI). A pesar de las inversiones masivas en centros de datos por parte de los gigantes tecnológicos, los rendimientos decrecientes son evidentes. El último modelo GPT de OpenAI muestra mejoras limitadas, mientras que DeepSeek demuestra un rendimiento de IA comparable a una fracción del costo y el consumo de energía. Esto sugiere que los métodos más baratos y eficientes, como el cómputo en tiempo de prueba de OpenAI y el enfoque de 'mezcla de expertos' de DeepSeek, son el futuro. Sin embargo, las grandes empresas siguen favoreciendo el escalamiento por fuerza bruta, dejando a las nuevas empresas más pequeñas para explorar alternativas más económicas.

Compañero de IA: Experimento de campo muestra IA generativa remodelando el trabajo en equipo y la experiencia

2025-03-22
Compañero de IA: Experimento de campo muestra IA generativa remodelando el trabajo en equipo y la experiencia

Un ensayo controlado aleatorio en Procter & Gamble revela que la IA generativa aumenta significativamente la productividad del equipo y la calidad de la solución. Los individuos con IA tuvieron un desempeño tan bueno como los equipos sin IA, mientras que los equipos con IA sobresalieron, aumentando significativamente la probabilidad de soluciones de primer nivel. La IA no solo mejoró la eficiencia, sino que también aumentó las emociones positivas, superó los silos departamentales y permitió que los empleados menos experimentados alcanzaran los niveles de desempeño de los miembros experimentados del equipo. Esta investigación sugiere que la IA no es solo una herramienta de productividad, sino un 'compañero' capaz de remodelar el trabajo en equipo y las estructuras organizacionales.

Desentrañando R1-Zero: Alineación Eficiente de LLMs con el Framework Oat

2025-03-22
Desentrañando R1-Zero: Alineación Eficiente de LLMs con el Framework Oat

Investigadores publicaron un artículo, modelos y una base de código que desvelan los misterios del entrenamiento tipo R1-Zero. Desarrollaron Oat, un framework de aprendizaje por refuerzo LLM altamente modular y eficiente, y lo utilizaron para entrenar modelos tipo R1-Zero como Qwen2.5. El estudio descubrió que los modelos base adecuados y un algoritmo de aprendizaje por refuerzo mejorado (Dr. GRPO) son cruciales, evitando la optimización sesgada de plantillas y conjuntos de preguntas incompatibles. Finalmente, lograron un rendimiento de vanguardia con solo 27 horas de cómputo en 8 GPU A100.

IA

Meta y OpenAI acusadas de usar una base de datos pirata para entrenar modelos de IA

2025-03-22
Meta y OpenAI acusadas de usar una base de datos pirata para entrenar modelos de IA

Meta y OpenAI están envueltas en una controversia de derechos de autor después de que se revelara que usaron la base de datos de libros pirateada Library Genesis (LibGen) para entrenar sus modelos de IA. Para acelerar el entrenamiento de su modelo Llama 3, Meta eludió los costosos procesos de licencia y descargó directamente millones de libros y artículos académicos de LibGen. Esta acción llevó a una demanda de autores, con documentos judiciales que revelan que los empleados de Meta reconocieron los riesgos legales e intentaron encubrir sus acciones. OpenAI también admitió el uso pasado de LibGen, pero afirma que sus modelos más recientes ya no se basan en este conjunto de datos. El incidente destaca los desafíos éticos y legales en torno al origen de los datos de entrenamiento para modelos de IA y la protección de la propiedad intelectual.

FutureHouse: Construyendo Científicos de IA Semi-Autónomos

2025-03-22
FutureHouse: Construyendo Científicos de IA Semi-Autónomos

FutureHouse, una organización sin fines de lucro con sede en San Francisco, tiene la misión de automatizar el descubrimiento científico utilizando IA. Han desarrollado un conjunto de herramientas con tema de "cuervo", incluyendo ChemCrow para diseñar reacciones químicas, WikiCrow para resumir información de proteínas, ContraCrow para identificar contradicciones en la literatura y la serie PaperQA para consultas confiables de PDF. FutureHouse tiene como objetivo construir científicos de IA semi-autónomos, que van desde modelos predictivos hasta, eventualmente, robots humanoides capaces de realizar experimentos de forma independiente, acelerando en última instancia el descubrimiento científico y abordando problemas como la dificultad de resumir y la falta de fiabilidad de la literatura biomédica. Los desafíos incluyen la construcción de infraestructura, el acceso a datos y la resolución de problemas de ingeniería, pero los modelos de IA sobresalen en la generación de hipótesis y la extracción de conclusiones. FutureHouse enfatiza la fiabilidad de los científicos de IA y se dedica a abordar los problemas mediante el análisis de datos mejorado y la reproducibilidad.

Hunyuan-T1 de Tencent: Redefiniendo la eficiencia del razonamiento con el primer modelo ultralarge impulsado por Mamba

2025-03-22

Tencent presentó Hunyuan-T1, la última incorporación a su serie de modelos grandes Hunyuan. Construido sobre TurboS, el primer modelo grande híbrido Transformer-Mamba MoE a escala ultralarge del mundo, Hunyuan-T1 cuenta con capacidades de razonamiento significativamente mejoradas y una mejor alineación con las preferencias humanas después de un extenso entrenamiento posterior. En comparación con su versión de vista previa, Hunyuan-T1 muestra un aumento sustancial en el rendimiento, duplicando su velocidad de decodificación. Alcanza resultados comparables o ligeramente mejores que R1 en varios puntos de referencia públicos y supera a R1 en evaluaciones humanas internas, particularmente en el seguimiento de instrucciones culturales y creativas, el resumen de texto y las capacidades del agente. Este lanzamiento marca un avance significativo en el aprovechamiento del aprendizaje por refuerzo para la optimización de post-entrenamiento de los modelos de lenguaje grandes.

IA

IA de Herramientas vs. IA Agentes: Un Juego de Control y Capacidad

2025-03-21
IA de Herramientas vs. IA Agentes: Un Juego de Control y Capacidad

Este artículo cuestiona la eficacia de limitar la IA a tareas puramente informativas (IA de Herramientas) para mitigar riesgos. El autor argumenta que este enfoque es inviable porque las IA Agentes, capaces de tomar acciones, poseen ventajas económicas e intelectuales. Las IA Agentes sobresalen en la selección de datos, la optimización del aprendizaje, el autodiseño y la utilización de recursos externos, lo que lleva a una inteligencia superior. Si bien el aprendizaje por refuerzo no es ideal para aprender cosas complejas desde cero, es el mejor enfoque para controlar sistemas complejos, y el mundo está lleno de ellos, incluidas las IA. Las IA de Herramientas serán, en última instancia, reemplazadas por las IA Agentes porque estas últimas sirven mejor a las demandas del mercado y a las aplicaciones prácticas.

IA

Jagged Flash Attention de Meta: Revolución en el Rendimiento de los Sistemas de Recomendación

2025-03-21
Jagged Flash Attention de Meta: Revolución en el Rendimiento de los Sistemas de Recomendación

Meta presenta Jagged Flash Attention, una innovación que transforma el rendimiento y la escalabilidad de los sistemas de recomendación a gran escala. Los métodos tradicionales tienen dificultades con las características categóricas de longitud variable (como el historial de interacción del usuario), requiriendo un relleno excesivo. Jagged Flash Attention maneja eficientemente estas características utilizando tensores irregulares, eliminando la sobrecarga de relleno. Combinado con la biblioteca TorchRec, ofrece mejoras de rendimiento de hasta 10 veces en el entorno de producción de Meta y admite el entrenamiento de modelos con más de 3 billones de parámetros. Esta innovación avanza significativamente los sistemas de recomendación personalizados.

El uso de ChatGPT se relaciona con un aumento de la soledad: Estudio de OpenAI y MIT

2025-03-21
El uso de ChatGPT se relaciona con un aumento de la soledad: Estudio de OpenAI y MIT

Una nueva investigación de OpenAI y el MIT sugiere que el aumento del uso de chatbots como ChatGPT puede correlacionarse con una mayor soledad y menos interacción social. Un estudio que siguió a casi 1.000 usuarios durante un mes descubrió que quienes pasaban más tiempo con ChatGPT informaron una mayor dependencia emocional y soledad. Si bien pocos usaron ChatGPT para apoyo emocional, el estudio indicó que las personas predispuestas a la dependencia emocional podrían experimentar una soledad exacerbada. Los investigadores enfatizan la necesidad de más investigaciones sobre el impacto de la IA en el bienestar humano y el diseño responsable de la IA.

IA

PocketFlow: Un nuevo marco para construir sistemas de IA listos para empresas

2025-03-21
PocketFlow: Un nuevo marco para construir sistemas de IA listos para empresas

PocketFlow es un framework LLM basado en TypeScript que utiliza una estructura de gráfico dirigido anidado. Esto divide las tareas complejas de IA en pasos de LLM reutilizables, permitiendo la ramificación y la recursión para la toma de decisiones similar a la de un agente. El framework es fácilmente extensible, integrando varios LLMs y APIs sin wrappers especializados, y cuenta con depuración de flujo de trabajo visual y persistencia de estado, acelerando la construcción de sistemas de IA de nivel empresarial.

IA

Explicación de las pruebas de conocimiento cero: Una inmersión profunda en el vídeo

2025-03-21
Explicación de las pruebas de conocimiento cero: Una inmersión profunda en el vídeo

El autor publicó un vídeo que explica las pruebas de conocimiento cero, un algoritmo complejo que, sorprendentemente, requiere mucho trabajo para explicarlo con claridad. Si bien el vídeo cubre varios aspectos y aplicaciones, reconoce la necesidad de recursos más profundos para una comprensión completa. La publicación detalla además la reducción de los problemas de satisfacibilidad a la 3-coloración, discutiendo las implicaciones para los sistemas descentralizados como los sistemas de votación y moneda sin confianza. Finalmente, introduce las pruebas no interactivas, mostrando cómo las funciones hash criptográficas pueden simular un faro aleatorio para crearlas, unificando eficazmente los temas de vídeos recientes.

CSAM generado por IA: Un enfrentamiento de la Primera Enmienda

2025-03-20
CSAM generado por IA: Un enfrentamiento de la Primera Enmienda

Un caso reciente en un tribunal de distrito de EE. UU. que involucra material de abuso sexual infantil (CSAM) generado por IA ha encendido un debate sobre la Primera Enmienda. El tribunal dictaminó que la posesión privada de CSAM virtual generado por IA está protegida por la Primera Enmienda, pero la producción y distribución no. Este caso destaca los desafíos y las complejidades legales que enfrentan las fuerzas del orden en la lucha contra la explotación y el abuso sexual infantil habilitados por IA.

Google Gemma 3: Una gran actualización de su modelo de IA de un solo acelerador

2025-03-20
Google Gemma 3: Una gran actualización de su modelo de IA de un solo acelerador

Más de un año después del lanzamiento de los modelos de IA Gemma iniciales, Google presenta Gemma 3, con un rendimiento superior en comparación con competidores como Llama y OpenAI, especialmente en sistemas de GPU única. Este modelo mejorado admite más de 35 idiomas y procesa texto, imágenes y videos cortos. Gemma 3 cuenta con un codificador de visión actualizado para imágenes de alta resolución y no cuadradas, e incluye el nuevo clasificador de seguridad de imágenes ShieldGemma 2 para filtrar contenido inapropiado. Si bien la definición de 'abierto' sigue siendo debatida en relación con su licencia, Google continúa promocionando Gemma 3 a través de créditos de Google Cloud y un programa académico que ofrece US$ 10.000 en créditos para investigación.

IA

Las alucinaciones de ChatGPT provocan otra queja de privacidad contra OpenAI

2025-03-20
Las alucinaciones de ChatGPT provocan otra queja de privacidad contra OpenAI

OpenAI se enfrenta a otra denuncia de privacidad en Europa por la tendencia de ChatGPT a inventar información falsa. Noyb apoya a un usuario noruego falsamente acusado por ChatGPT de asesinar a dos hijos e intentar matar a un tercero. Esto destaca los riesgos de las 'alucinaciones' de los LLMs y los requisitos de precisión del RGPD. Si bien OpenAI ofrece soluciones, como bloquear prompts, esto es insuficiente bajo el derecho de rectificación del RGPD. El caso podría resultar en multas de hasta el 4% de la facturación anual y obligar a OpenAI a modificar sus productos de IA, impactando a todo el sector.

IA

Pump: Optimización de costos en la nube con IA, ahorrando un 60%

2025-03-20
Pump: Optimización de costos en la nube con IA, ahorrando un 60%

El gasto en la nube alcanza la asombrosa cifra de 500.000 millones de dólares anuales, siendo la categoría de gastos de más rápido crecimiento para las empresas de tecnología. Pump ofrece una plataforma impulsada por IA que automatiza el ahorro y aprovecha las compras grupales para reducir los costos en la nube hasta en un 60%. Respaldada por Y Combinator, el experimentado equipo de Pump está construyendo una cultura corporativa transparente, colaborativa y de ritmo rápido centrada en el éxito.

Claude ahora busca en la web: respuestas más precisas y actualizadas

2025-03-20
Claude ahora busca en la web: respuestas más precisas y actualizadas

El modelo de IA Claude de Anthropic ahora incorpora la búsqueda web para proporcionar respuestas más precisas y oportunas. Claude accede a los eventos e información más recientes, citando directamente las fuentes para facilitar la verificación de hechos. Esta función está actualmente disponible en vista previa para usuarios de pago en los Estados Unidos, con soporte para planes gratuitos e internacional próximamente. Esta mejora permite que Claude ayude en ventas, análisis financiero, investigación y compras, analizando tendencias, evaluando datos de mercado, creando informes de investigación y comparando detalles de productos.

El costoso o1-pro de OpenAI: IA de razonamiento potente, pero ¿justifica el precio?

2025-03-20
El costoso o1-pro de OpenAI: IA de razonamiento potente, pero ¿justifica el precio?

OpenAI ha lanzado o1-pro, un modelo de IA de razonamiento más potente, a través de su API para desarrolladores. Si bien se jacta de un rendimiento superior y respuestas más confiables gracias a una mayor potencia de cálculo, o1-pro tiene un precio elevado: 150 USD por millón de tokens de entrada y 600 USD por millón de tokens de salida, el doble del costo de entrada de GPT-4.5 y diez veces el de o1. Sin embargo, las pruebas iniciales revelaron resultados mixtos, con dificultades en tareas como rompecabezas de Sudoku e ilusiones ópticas. Los puntos de referencia internos mostraron un rendimiento solo ligeramente mejor que o1 en problemas de codificación y matemáticas, aunque con una confiabilidad mejorada. La apuesta de OpenAI es si la confiabilidad mejorada justifica el costo exorbitante para los desarrolladores.

IA

Esquema del Curso de Aprendizaje Profundo: De Perceptrones a Transformadores

2025-03-20

Este esquema del curso abarca una amplia gama de temas de aprendizaje profundo, comenzando por los primeros perceptrones y algoritmos de retropropagación, y avanzando hacia las modernas Redes Neuronales Convolucionales (CNN), Redes Neuronales Recurrentes (RNN) y modelos Transformer. El curso explicará progresivamente técnicas para entrenar redes neuronales, incluyendo algoritmos de optimización y métodos de regularización. También se tratarán temas avanzados como la predicción de series temporales, la predicción secuencia a secuencia y las Redes Generativas Adversarias (GAN). El curso se evaluará mediante una serie de conferencias, tareas y cuestionarios.

IA

Bolt3D: Generando Escenas 3D en Segundos

2025-03-19
Bolt3D: Generando Escenas 3D en Segundos

Bolt3D, un esfuerzo colaborativo de Google Research, VGG y Google DeepMind, genera escenas 3D realistas en solo 6,25 segundos en una sola GPU. El modelo utiliza un modelo de difusión multivista para generar la apariencia y la geometría de la escena, luego regresa imágenes de salpicadura utilizando una cabeza gaussiana. Finalmente, combina gaussianas 3D de múltiples imágenes de salpicadura para formar la escena 3D completa. Soporta una o más imágenes de entrada, Bolt3D genera regiones de escena no observadas sin reproyección o mecanismos de pintura, mostrando un salto significativo en la velocidad de generación de escenas 3D.

¡Agentes LLM: Sorprendentemente Simples!

2025-03-19
¡Agentes LLM: Sorprendentemente Simples!

Esta guía desmitifica el funcionamiento interno de los agentes LLM. Usando una analogia simple de cocina, explica cómo los sistemas de agentes se construyen como grafos: nodos que representan estaciones de cocina, flujo como la receta y almacenamiento compartido como la encimera. Cada nodo prepara, ejecuta y publica resultados; el flujo determina el siguiente nodo en función de las decisiones. El autor utiliza el framework PocketFlow (solo 100 líneas de código) para ilustrar cómo funcionan los agentes a través de nodos de decisión, nodos de acción y nodos finales, enfatizando su estructura de grafo fundamental en lugar de algoritmos complejos. ¡Todo se trata de bucles y ramificaciones!

Archivos Digitales Personales: Tesoros de Datos Únicos en la Era de la IA

2025-03-19
Archivos Digitales Personales: Tesoros de Datos Únicos en la Era de la IA

En su último boletín quincenal, Linda explora el valor de los archivos digitales personales. Argumenta que, en la era actual de la IA generativa que tiende a la mediocridad, estos archivos, que contienen experiencias, preferencias y perspectivas personales únicas, se convierten en recursos valiosos para entrenar modelos de IA y crear trabajos más personalizados. El artículo utiliza la propia experiencia de la autora de recopilar libros, imágenes y enlaces como ejemplo, y combina las perspectivas de los historiadores para ilustrar la importancia de los archivos personales en la era de la IA. También se proporcionan varios ejemplos de archivos personales en Finlandia. Finalmente, la autora invita a los lectores a compartir sus propios artículos e historias recopilados, mostrando la riqueza y el encanto único de los archivos personales.

Nvidia Isaac GR00T N1: La era de la robótica generalista ha llegado

2025-03-19
Nvidia Isaac GR00T N1: La era de la robótica generalista ha llegado

Nvidia ha lanzado Isaac GR00T N1, un modelo base de código abierto y preentrenado para robots humanoides, marcando la llegada de la era de la robótica generalista. Este modelo de sistema dual, inspirado en la cognición humana, cuenta con un 'Sistema 1' de acción rápida y un 'Sistema 2' más lento, basado en un modelo de lenguaje de visión, para el razonamiento. Con datos mínimos de post-entrenamiento, permite tareas complejas como agarrar y manipular objetos. 1X Technologies lo ha implementado con éxito en su robot humanoide NEO Gamma para tareas de limpieza autónomas. La naturaleza de código abierto y la capacidad de personalización del modelo prometen acelerar significativamente el desarrollo de robots humanoides e impulsar los avances en IA.

IA

NVIDIA Dynamo: Framework de Inferencia de Alto Rendimiento y Baja Latencia para IA Generativa

2025-03-18
NVIDIA Dynamo: Framework de Inferencia de Alto Rendimiento y Baja Latencia para IA Generativa

NVIDIA presenta Dynamo, un framework de inferencia de alto rendimiento y baja latencia diseñado para servir modelos de IA generativa y de razonamiento en entornos distribuidos multinodo. Dynamo es agnóstico con respecto al motor de inferencia (compatible con TRT-LLM, vLLM, SGLang y otros), e incorpora características como inferencia de prellenado y decodificación desagregada, programación dinámica de GPU, enrutamiento de solicitudes consciente de LLM, transferencia de datos acelerada y descarga de caché KV para maximizar el rendimiento de la GPU y minimizar la latencia. Construido en Rust para el rendimiento y en Python para la extensibilidad, Dynamo es completamente de código abierto.

Llama de Meta alcanza los 1000 millones de descargas, apuntando al dominio de la IA de código abierto

2025-03-18
Llama de Meta alcanza los 1000 millones de descargas, apuntando al dominio de la IA de código abierto

El CEO de Meta, Mark Zuckerberg, anunció que el modelo de IA de código abierto de la empresa, Llama, ha superado los 1000 millones de descargas, un aumento del 53% desde principios de diciembre de 2024. Si bien impulsa el asistente de IA de Meta y es utilizado por empresas como Spotify y AT&T, Llama enfrenta demandas por derechos de autor y preocupaciones sobre la privacidad de los datos. A pesar de ello, Meta planea lanzar más modelos Llama, incluidos modelos de razonamiento y modelos multimodales, y está invirtiendo 80.000 millones de dólares en IA este año, con el objetivo de liderar el campo de la IA.

IA
1 2 28 29 30 32 34 35 36 40 41