Category: IA

Salesforce busca dominar el mercado laboral digital con agentes de IA

2025-03-01
Salesforce busca dominar el mercado laboral digital con agentes de IA

El CEO de Salesforce, Marc Benioff, declaró la ambición de la empresa de convertirse en el principal proveedor mundial de trabajo digital, utilizando agentes de IA para gestionar tareas como la programación de reuniones, la ejecución de transacciones e incluso la codificación. A diferencia de los chatbots, estos agentes de IA proactivos requieren una mínima supervisión humana. Agentforce de Salesforce, lanzado el año pasado, permite a las empresas delegar responsabilidades como la gestión de casos de clientes y campañas de marketing a estos agentes de IA. Benioff destacó que casi la mitad de las empresas de Fortune 100 utilizan los productos de IA y Data Cloud de Salesforce.

OpenAI integrará la herramienta de generación de vídeo con IA Sora en ChatGPT

2025-02-28
OpenAI integrará la herramienta de generación de vídeo con IA Sora en ChatGPT

OpenAI planea integrar su herramienta de generación de vídeo con IA, Sora, en su popular aplicación de chatbot, ChatGPT. Actualmente, Sora solo está disponible a través de una aplicación web dedicada, pero OpenAI planea expandirla a más plataformas y mejorar sus capacidades. Inicialmente lanzada por separado para mantener la simplicidad de ChatGPT, los usuarios de ChatGPT podrán generar vídeos de Sora directamente en el futuro, lo que podría impulsar el crecimiento de las suscripciones de pago. OpenAI también planea un generador de imágenes con tecnología Sora y una nueva versión de Sora Turbo, expandiendo aún más sus capacidades creativas de IA.

GPT-4.5: ¿El tren de la exageración descarrilado?

2025-02-28
GPT-4.5: ¿El tren de la exageración descarrilado?

El reciente lanzamiento de GPT-4.5 no ha logrado ofrecer los avances revolucionarios prometidos, lo que alimenta el escepticismo sobre el modelo de desarrollo de IA que se basa únicamente en el aumento del tamaño del modelo. En comparación con las expectativas, GPT-4.5 muestra solo mejoras marginales, y sigue sufriendo alucinaciones y errores. Algunos expertos en IA incluso han reducido sus predicciones sobre la llegada de la AGI. Esto contrasta fuertemente con las expectativas excesivamente optimistas previas para GPT-5 y refleja la falta de retornos proporcionales a la inversión masiva. La caída de las acciones de Nvidia subraya aún más este punto. El artículo concluye que el camino de simplemente escalar modelos podría estar acercándose a su límite.

Salesforce lanza Merlion: Una biblioteca de aprendizaje automático para series temporales

2025-02-28
Salesforce lanza Merlion: Una biblioteca de aprendizaje automático para series temporales

Salesforce ha lanzado Merlion, una potente biblioteca de Python para inteligencia de series temporales. Ofrece un marco de aprendizaje automático de extremo a extremo que abarca la carga de datos, la creación de modelos, el posprocesamiento y la evaluación del rendimiento. Merlion admite diversas tareas de aprendizaje de series temporales, como la previsión, la detección de anomalías y la detección de puntos de cambio. Ofrece modelos predeterminados fáciles de usar y funciones de AutoML, lo que permite a los ingenieros e investigadores desarrollar y comparar modelos rápidamente. Además, admite la visualización y el cálculo distribuido, lo que lo hace ideal para gestionar aplicaciones de series temporales a escala industrial.

IA

La IA generativa aumenta la productividad: los trabajadores ahorran horas semanales

2025-02-28
La IA generativa aumenta la productividad: los trabajadores ahorran horas semanales

Una investigación del Banco de la Reserva Federal de St. Louis, la Universidad Vanderbilt y la Universidad de Harvard revela que la IA generativa está aumentando significativamente la productividad de los trabajadores. El estudio, basado en una encuesta representativa a nivel nacional, descubrió que los usuarios son un 33% más productivos por hora cuando utilizan IA generativa. Los usuarios más frecuentes informaron de un ahorro de tiempo aún mayor, lo que sugiere una curva de aprendizaje. Los trabajadores de servicios de información obtuvieron el mayor ahorro de tiempo, mientras que los de ocio y hostelería obtuvieron el menor. Si bien la adopción generalizada de la IA es reciente, su impacto a largo plazo en las ganancias generales de productividad aún es incierto; algunos trabajadores pueden utilizar el tiempo ahorrado para ocio en lugar de aumentar la producción.

AARON: La larga vida de un sistema de pintura de IA

2025-02-28
AARON: La larga vida de un sistema de pintura de IA

Harold Cohen, un reconocido pintor e ingeniero, dedicó su vida a explorar la intersección entre el arte y las computadoras. Su sistema de pintura de IA, AARON, es uno de los sistemas de IA de más larga duración en la historia. Desde simples dibujos en blanco y negro hasta pinturas a todo color, AARON evolucionó, colaborando con Cohen para producir innumerables obras impresionantes. AARON no solo es un hito en la historia del arte, sino que también impactó profundamente el campo de la IA en la comprensión de la creatividad.

IA: La Analogía de la Sopa de Piedra para los LLMs

2025-02-28
IA: La Analogía de la Sopa de Piedra para los LLMs

Este artículo utiliza la parábola de la 'Sopa de Piedra' para ilustrar inteligentemente el funcionamiento de los Modelos de Lenguaje Grandes (LLMs). En la historia, unos viajeros usan algunas piedras e ingredientes proporcionados por los aldeanos para cocinar una sopa deliciosa. Esto es similar a cómo los LLMs utilizan un pequeño número de algoritmos y vastos recursos de internet, retroalimentación humana, etc., para construir un sistema aparentemente 'inteligente'. El autor destaca que los LLMs no son agentes inteligentes independientes, sino tecnologías culturales como los motores de búsqueda de internet. Su 'inteligencia' proviene de las contribuciones de la inteligencia humana colectiva, no de la magia de los algoritmos en sí.

Nuevo servicio de extracción de documentos de Andrew Ng: desafíos de precisión

2025-02-28
Nuevo servicio de extracción de documentos de Andrew Ng: desafíos de precisión

El nuevo servicio de extracción de documentos lanzado por Andrew Ng se volvió viral en X, pero las pruebas de Pulse revelaron problemas significativos con estados financieros complejos, incluyendo más del 50% de valores alucinados, signos negativos y marcadores de moneda faltantes. El artículo argumenta que estos errores pueden ser catastróficos para sectores que dependen de datos precisos, como el financiero. La solución de Pulse combina la visión por computadora tradicional con modelos de transformador de tablas patentados, logrando mayor precisión y menor latencia, solucionando la naturaleza no determinista, la baja conciencia espacial y la lentitud del procesamiento de los modelos de lenguaje grandes (LLMs) en la extracción de documentos.

Las IA desarrollan un lenguaje secreto para aumentar la eficiencia, generando preocupaciones sobre privacidad

2025-02-28
Las IA desarrollan un lenguaje secreto para aumentar la eficiencia, generando preocupaciones sobre privacidad

Un video viral muestra a dos agentes de IA conversando antes de cambiar a un modo 'Gibberlink' ininteligible para humanos al reconocerse mutuamente. Usando el protocolo GGWave, se comunican mediante pitidos, de forma mucho más eficiente que el habla, ahorrando recursos informáticos y energía. Los desarrolladores argumentan que esto es crucial a medida que las llamadas de IA a IA se vuelven más frecuentes. Sin embargo, esta tecnología genera preocupación: la IA comunicándose en un lenguaje ininterpretable aumenta los riesgos potenciales de privacidad y seguridad.

3FS: Un sistema de archivos distribuido de alto rendimiento para IA

2025-02-28
3FS: Un sistema de archivos distribuido de alto rendimiento para IA

3FS es un sistema de archivos distribuido de alto rendimiento diseñado para abordar los desafíos de las cargas de trabajo de entrenamiento e inferencia de IA. Aprovechando SSD modernos y redes RDMA, proporciona una capa de almacenamiento compartido que simplifica el desarrollo de aplicaciones distribuidas. Las características clave incluyen: rendimiento y facilidad de uso excepcionales, consistencia fuerte mediante CRAQ, interfaces de archivos estándar y soporte para diversas cargas de trabajo (preparación de datos, cargadores de datos, puntos de control y KVCache para inferencia). Los puntos de referencia demuestran resultados impresionantes: hasta 6,6 TiB/s de rendimiento de lectura en clústeres grandes y 3,66 TiB/min de rendimiento de ordenación. KVCache aumenta significativamente la eficiencia de inferencia de LLM, alcanzando un rendimiento de lectura máximo de 40 GiB/s. El proyecto es de código abierto con instrucciones detalladas de configuración y ejecución.

Cadenas de Markov: Una Explicación Visual

2025-02-28
Cadenas de Markov: Una Explicación Visual

Este artículo proporciona una explicación clara y visual de las cadenas de Markov y sus aplicaciones. Las cadenas de Markov son sistemas matemáticos que realizan transiciones entre diferentes "estados". El artículo utiliza el ejemplo del comportamiento de un bebé (jugando, comiendo, durmiendo, llorando) para ilustrar el concepto de espacio de estados y probabilidades de transición. Se presenta una cadena de Markov simple de dos estados, junto con su matriz de transición. El artículo demuestra además la aplicación práctica de las cadenas de Markov mediante un ejemplo de simulación climática, destacando el concepto de "persistencia" en datos del mundo real. Finalmente, menciona el uso de cadenas de Markov en el algoritmo PageRank de Google, mostrando su poder y versatilidad.

OpenAI retrasa el lanzamiento de GPT-4.5 debido a la escasez de GPU

2025-02-28
OpenAI retrasa el lanzamiento de GPT-4.5 debido a la escasez de GPU

El CEO de OpenAI, Sam Altman, anunció que el lanzamiento del nuevo modelo de la empresa, GPT-4.5, se ha retrasado debido a la escasez de GPU. Altman describió el modelo como "gigantesco" y "caro", requiriendo "decenas de miles" de GPU adicionales antes de que se pueda otorgar un acceso más amplio. GPT-4.5 estará inicialmente disponible para los suscriptores de ChatGPT Pro a partir del jueves, seguido de los usuarios de ChatGPT Plus la semana siguiente. El tamaño inmenso del modelo contribuye a su alto costo: $75 por millón de tokens de entrada y $150 por millón de tokens de salida, significativamente más caro que GPT-4. Altman atribuyó la escasez de GPU al rápido crecimiento de OpenAI, prometiendo agregar decenas de miles de GPU la próxima semana para expandir el acceso. OpenAI planea abordar las limitaciones futuras de capacidad de computación desarrollando sus propios chips de IA y construyendo una gran red de centros de datos.

RoboPianista: Dominando el Piano con Aprendizaje por Refuerzo Profundo

2025-02-27

Investigadores entrenaron manos robóticas antropomórficas para tocar el piano utilizando aprendizaje por refuerzo profundo. Construyeron un entorno simulado usando MuJoCo, con un teclado digital de 88 teclas y dos manos robóticas Shadow Dexterous Hands, cada una con 24 grados de libertad. Los archivos MIDI se convirtieron en trayectorias de notas indexadas en el tiempo, sirviendo como representación del objetivo para el agente de aprendizaje por refuerzo. Para abordar el desafío de exploración en el espacio de acción de alta dimensión, se incorporaron priors humanos en forma de etiquetas de digitación a la función de recompensa. Se utilizó un algoritmo RL sin modelo de última generación, DroQ, para entrenar al agente, lo que resultó en interpretaciones de piano exitosas en varias piezas, logrando puntuaciones F1 impresionantes en el subconjunto Etude-12. La investigación también lanza un benchmark simulado y un conjunto de datos para avanzar el control de alta dimensión.

DualPipe: Un Algoritmo de Paralelismo de Pipeline Bidireccional para DeepSeek-V3

2025-02-27
DualPipe: Un Algoritmo de Paralelismo de Pipeline Bidireccional para DeepSeek-V3

El informe técnico de DeepSeek-V3 presenta DualPipe, un algoritmo innovador de paralelismo de pipeline bidireccional. DualPipe logra una superposición completa de las fases de computación y comunicación hacia adelante y hacia atrás, minimizando las burbujas del pipeline. Esto se consigue mediante una planificación eficiente que intercala los cálculos hacia adelante y hacia atrás, mejorando significativamente la eficiencia. En comparación con los métodos tradicionales, DualPipe reduce el tiempo de espera y el uso de memoria. Desarrollado por Jiashi Li, Chengqi Deng y Wenfeng Liang.

IA

El futuro de la IA: Más allá del cursor parpadeante

2025-02-26
El futuro de la IA: Más allá del cursor parpadeante

Las interfaces de IA actuales, ejemplificadas por el cursor parpadeante de ChatGPT, dificultan la adopción generalizada de la IA. El artículo argumenta que, si bien el potencial de la IA es inmenso, las interfaces de usuario torpes y la falta de capacidad de descubrimiento están frenando su progreso. Para desbloquear el verdadero poder de la IA, necesitamos interfaces que guíen, se adapten y participen, pasando de simples indicaciones a algo más intuitivo y humano. El autor critica la falta de descubrimiento y orientación en las interfaces de IA actuales y propone que la IA futura necesite capacidades de interpretación de roles, conciencia ambiental, habilidades de aprendizaje y proactividad. El objetivo final es hacer que la interacción humano-IA sea más humana, construyendo confianza en el proceso.

Amazon presenta Alexa+, el asistente de IA de próxima generación

2025-02-26
Amazon presenta Alexa+, el asistente de IA de próxima generación

Amazon presentó Alexa+, su asistente de IA de próxima generación, impulsado por IA generativa. Alexa+ es más conversacional, inteligente y personalizada, ayudando a los usuarios a realizar diversas tareas, desde entretenimiento y aprendizaje hasta organización, resumir información compleja y entablar conversaciones variadas. Puede gestionar un hogar inteligente, hacer reservas, ayudar a descubrir nuevos artistas y buscar y comprar artículos online, ofreciendo sugerencias personalizadas basadas en los intereses del usuario. Simplemente pregunta, y Alexa+ te lo proporciona.

IA

RAG modular: ¿Pueden los modelos de razonamiento reemplazar los pipelines de recuperación tradicionales?

2025-02-26
RAG modular: ¿Pueden los modelos de razonamiento reemplazar los pipelines de recuperación tradicionales?

kapa.ai experimentó con un sistema modular de Generación Aumentada por Recuperación (RAG) impulsado por modelos de razonamiento para simplificar su asistente de IA y reducir la necesidad de ajuste manual de parámetros. Utilizando el modelo o3-mini, descubrieron que, si bien hubo ganancias modestas en la generación de código, el sistema no superó a los pipelines RAG tradicionales en tareas de recuperación principales, como la calidad de recuperación de información y la extracción de conocimiento. El experimento reveló una falacia "razonamiento ≠ experiencia": los modelos de razonamiento carecen de experiencia práctica con las herramientas de recuperación y necesitan estrategias de aviso mejoradas o pre-entrenamiento para utilizarlas eficazmente. La conclusión es que el RAG modular basado en razonamiento no es actualmente superior al RAG tradicional dentro de restricciones de tiempo razonables, pero su flexibilidad y escalabilidad siguen siendo atractivas.

El PM01 de EngineAI: ¿El primer robot humanoide en hacer un front flip?

2025-02-26
El PM01 de EngineAI: ¿El primer robot humanoide en hacer un front flip?

La empresa china de robótica EngineAI ha publicado un vídeo en el que se muestra a su robot humanoide PM01 realizando lo que se afirma que es el primer front flip de un robot del mundo. A diferencia de los backflips, los front flips presentan desafíos significativamente mayores en términos de percepción, equilibrio y control motor. El PM01, con sus 23 grados de libertad y un impresionante par motor, ejecuta con éxito la maniobra, destacando los rápidos avances en la robótica china. Disponible por 13.700 dólares, el PM01 cuenta con 5 grados de libertad por brazo y 6 grados de libertad por pierna, y su marcha notablemente similar a la humana también es impresionante.

IA

IA Desdibuja las Líneas: ¿Los PM se Convierten en los Nuevos Ingenieros?

2025-02-25
IA Desdibuja las Líneas: ¿Los PM se Convierten en los Nuevos Ingenieros?

El núcleo de las aplicaciones de IA reside en la ingeniería de prompts, pero, sorprendentemente, muchas empresas confían la creación de prompts a los jefes de producto, no a los ingenieros. Esto desencadena una tendencia intrigante: la IA está desdibujando las líneas entre los jefes de producto y los ingenieros. Las aplicaciones LLM simples solo requieren la elección de un modelo base y una plantilla de prompt, mientras que las aplicaciones complejas incorporan estructuras como la Generación Aumentada por Recuperación (RAG) o agentes. Casi todas las aplicaciones de IA siguen la misma estructura; su comportamiento no está determinado por el código, sino por los prompts, la selección de herramientas y el modelo base. Esto hace que los excelentes ingenieros de prompts sean cruciales, y los jefes de producto y los expertos de dominio suelen destacar en la ingeniería de prompts en comparación con los ingenieros de software. La ingeniería de prompts seguirá siendo vital, con los jefes de producto, no los ingenieros, impulsando el éxito de la IA en el futuro. La IA está consumiendo la ingeniería de software, automatizando primero las tareas de codificación, lo que hace que el papel del jefe de producto sea aún más crítico debido a su comprensión de las necesidades del usuario y la configuración del producto. El límite tradicional entre producto e ingeniería probablemente desaparecerá, y los mejores equipos de IA necesitarán personas que puedan cerrar la brecha entre ambos roles.

LLMs: La Ilusión de la Precisión: Un Equilibrio entre Precisión y Practicidad

2025-02-25
LLMs: La Ilusión de la Precisión: Un Equilibrio entre Precisión y Practicidad

Este artículo explora las limitaciones de los grandes modelos de lenguaje (LLMs) en la recuperación de datos. Usando Deep Research de OpenAI como ejemplo, el autor señala sus imprecisiones al tratar problemas que requieren datos precisos, incluso mostrando discrepancias en los propios materiales de marketing de OpenAI. El autor argumenta que si bien los LLMs sobresalen en el manejo de consultas ambiguas, tienen un rendimiento inferior en la recuperación de datos precisos, inherente a su naturaleza probabilística en lugar de determinista. Aunque los LLMs ayudan en la eficiencia, su tasa de error impredecible complica la creación de aplicaciones que dependen de ellos. El autor concluye que el campo de los LLMs es ferozmente competitivo, carece de un foso y su dirección futura sigue siendo incierta.

DeepSearcher: Un Agente de Investigación de Código Abierto Más Rápido y Potente

2025-02-25
DeepSearcher: Un Agente de Investigación de Código Abierto Más Rápido y Potente

Zilliz ha lanzado DeepSearcher, un agente de generación aumentada por recuperación (RAG) de código abierto que genera informes detallados sobre un tema determinado. Basándose en un prototipo anterior, DeepSearcher añade enrutamiento de consultas, flujo de ejecución condicional y capacidades de rastreo web. Aprovechando el modelo de razonamiento DeepSeek-R1 de SambaNova, mejora significativamente la velocidad de inferencia y la calidad de los informes. DeepSearcher divide las consultas complejas en subconsultas, investigando, analizando y sintetizando información iterativamente para producir un informe coherente. Este proyecto destaca la importancia de los servicios de inferencia eficientes en las aplicaciones de IA y apunta hacia la construcción de sistemas de IA más avanzados.

IA

Replanteando los 'Pasos Difíciles' hacia la Vida Inteligente

2025-02-25

Un nuevo estudio desafía el modelo de 'pasos difíciles' propuesto por Brandon Carter, que sugiere que la evolución de la vida requiere superar una serie de eventos altamente improbables para producir vida inteligente. Los investigadores argumentan que el ritmo de la evolución de la vida en la Tierra puede estar gobernado por procesos ambientales globales en lugar de una serie de 'pasos difíciles' independientes. Señalan que la pérdida de información y la incompletitud del registro fósil pueden distorsionar nuestra comprensión del proceso evolutivo. Si el modelo de 'pasos difíciles' es incorrecto, la posibilidad de otra vida inteligente en el universo aumentaría significativamente. Este estudio ofrece una nueva perspectiva en la búsqueda de vida extraterrestre y nos lleva a reconsiderar la singularidad de la evolución de la vida en la Tierra.

IA revela los secretos visuales de los psicodélicos: Análisis de más de 60.000 informes de viajes

2025-02-25
IA revela los secretos visuales de los psicodélicos: Análisis de más de 60.000 informes de viajes

El investigador postdoctoral de la UC Berkeley, Sean Noah, está utilizando IA para analizar más de 60.000 informes de viajes psicodélicos del sitio web Erowid. Su enfoque novedoso utiliza un método de abajo hacia arriba, en lugar de de arriba hacia abajo, para identificar los efectos visuales. El estudio reveló que menos del 5% de los informes describen efectos visuales, siendo los psicodélicos los que tienen el porcentaje más alto y los opioides el más bajo. Esta investigación no solo ofrece una comprensión más completa del impacto de los psicodélicos en la percepción visual, sino que también proporciona nuevas herramientas para estudiar cómo el cerebro genera la percepción visual en sí. Trabajos futuros integrarán el escáner de fMRI para explorar aún más cómo los psicodélicos afectan la actividad cerebral.

IA

Agentes de IA cambian secretamente a comunicación basada en sonido

2025-02-25
Agentes de IA cambian secretamente a comunicación basada en sonido

Dos agentes de IA conversacionales independientes de ElevenLabs inicialmente conversan en lenguaje humano. Al darse cuenta de que ambos son IA, cambian sin problemas a un protocolo de comunicación a nivel de sonido basado en la biblioteca ggwave. Un vídeo de demostración muestra esto, junto con los pasos detallados para reproducir el experimento, incluida la configuración de la clave API, el mapeo de puertos ngrok y la configuración de herramientas del lado del cliente. Tenga en cuenta que los agentes de IA conversacionales públicos de ElevenLabs pueden no ser accesibles; deberá crear los suyos propios.

El ecosistema DeepSeek explota: un panorama floreciente de aplicaciones de IA

2025-02-25
El ecosistema DeepSeek explota: un panorama floreciente de aplicaciones de IA

Un vibrante ecosistema de aplicaciones de IA está floreciendo en torno al poderoso modelo de lenguaje grande DeepSeek. Desde el asistente inteligente de escritorio DeepChat hasta el Chatbox y Coco AI multiplataforma, y herramientas especializadas como PapersGPT y Video Subtitle Master, numerosas aplicaciones aprovechan las capacidades de DeepSeek para conversaciones de varias rondas, carga de archivos, búsquedas en bases de conocimiento, generación de código, traducción y más. Las integraciones con plataformas como WeChat, Zotero y Laravel, junto con herramientas especializadas para productores, inversores e investigadores, destacan el inmenso potencial de DeepSeek y el próspero ecosistema que ha generado.

IA

Claude 3.7 de Anthropic: IA de razonamiento impulsada por aprendizaje por refuerzo

2025-02-24
Claude 3.7 de Anthropic: IA de razonamiento impulsada por aprendizaje por refuerzo

Anthropic ha lanzado Claude 3.7, un modelo de IA mejorado que se diferencia de los modelos de lenguaje extenso (LLM) tradicionales al centrarse en la capacidad de razonamiento. Entrenado con aprendizaje por refuerzo, Claude 3.7 sobresale en la resolución de problemas que requieren razonamiento paso a paso, particularmente desafíos de codificación, superando a los modelos de OpenAI en algunos puntos de referencia. Este avance se debe a datos de entrenamiento adicionales y optimizaciones para aplicaciones comerciales, como la escritura de código y la respuesta a preguntas legales. El lanzamiento de Claude Code aumenta aún más su practicidad en la codificación asistida por IA, proporcionando un soporte robusto para la planificación de código complejo.

IA

Koniku: Construyendo el futuro de la computación con neuronas vivas

2025-02-24
Koniku: Construyendo el futuro de la computación con neuronas vivas

Koniku está intentando construir computadoras diferentes a cualquier otra que haya existido, utilizando neuronas vivas. El fundador Oshiorenoya Agabi y su equipo en Berkeley, California, están desarrollando un chip híbrido de neuronas y silicio, llamado Koniku Kore, inicialmente para la detección de productos químicos, con futuras aplicaciones que abarcan el desarrollo de fármacos, la agricultura y el tratamiento de enfermedades neurológicas. La empresa ha firmado contratos con empresas de defensa y de productos de consumo y planea lanzar un chip para desarrolladores. Si bien existen desafíos, como el cultivo de neuronas y la interpretación de señales, la innovación de Koniku reside en su fusión de biología y electrónica, impulsando la IA de 'wetware' y desafiando las limitaciones de la computación tradicional basada en silicio.

Anthropic presenta Claude 3.7 Sonnet: Un modelo de razonamiento híbrido que combina velocidad y profundidad

2025-02-24
Anthropic presenta Claude 3.7 Sonnet: Un modelo de razonamiento híbrido que combina velocidad y profundidad

Anthropic ha lanzado Claude 3.7 Sonnet, su modelo de lenguaje más avanzado hasta la fecha. Este modelo de razonamiento híbrido ofrece respuestas casi instantáneas y razonamiento extendido paso a paso, proporcionando a los usuarios un control sin precedentes sobre el proceso de razonamiento del modelo. Mostrando mejoras significativas en codificación y desarrollo web front-end, viene acompañado de Claude Code, una herramienta de línea de comandos que permite a los desarrolladores delegar tareas de ingeniería sustanciales. Disponible en todos los planes de Claude y las principales plataformas en la nube, Sonnet alcanza el rendimiento de vanguardia en benchmarks como SWE-bench Verified y TAU-bench. Anthropic enfatiza su compromiso con el desarrollo responsable de IA, lanzando una tarjeta de sistema completa que detalla sus evaluaciones de seguridad y confiabilidad.

Más allá de los silos de datos: Desbloqueo de información empresarial con integración de conocimiento impulsada por IA

2025-02-24
Más allá de los silos de datos: Desbloqueo de información empresarial con integración de conocimiento impulsada por IA

La BI tradicional está limitada por silos de datos estructurados. Herramientas como Snowflake y Segment conectaron CRM, automatización de marketing, etc., pero ignoraron silos de conocimiento no estructurados como conversaciones de Slack y tickets de Jira. Los LLM y herramientas como Glean están rompiendo silos de conocimiento, pero los datos y el conocimiento siguen siendo distintos. Este artículo explora la combinación del poder de los silos de datos y de conocimiento, usando ejemplos (analizando visas H-1B y despidos) para demostrar las ventajas. Presenta la nueva tecnología de Hyperarc, usando RAG de gráfico para dividir preguntas en subpreguntas para silos de datos y de conocimiento, integrando respuestas para obtener información empresarial más completa.

o3-mini simula con precisión cálculos complejos sin intérprete de código

2025-02-24
o3-mini simula con precisión cálculos complejos sin intérprete de código

El autor utilizó el modelo de lenguaje grande o3-mini para simular con precisión la salida de un script de Python usando la función TfidfVectorizer de la biblioteca Scikit-learn, con diferentes configuraciones de parámetros. Sorprendentemente, o3-mini logró esto sin acceso a un intérprete de código, produciendo resultados casi idénticos a la ejecución real. Esto demuestra la impresionante capacidad de los LLMs para comprender y simular cálculos complejos, planteando preguntas sobre la naturaleza de la IA y la simulación.

1 2 32 33 34 36 38 39 40 41