Category: IA

La paradoja de la IA en radiología: mejores máquinas, médicos más ocupados

2025-09-25
La paradoja de la IA en radiología: mejores máquinas, médicos más ocupados

Desde el debut de CheXNet en 2017, la IA ha demostrado el potencial de superar a los radiólogos humanos en precisión. Sin embargo, a pesar de los avances, la aplicación en el mundo real de la IA enfrenta obstáculos: limitaciones de generalización, regulaciones estrictas y la sustitución por la IA de solo una fracción de las tareas de un radiólogo. Contraintuitivamente, la demanda de radiólogos sigue siendo alta, con salarios elevados. Esto se debe al bajo rendimiento de la IA en condiciones no estandarizadas, barreras regulatorias y la naturaleza multifacética del trabajo de un radiólogo. El artículo concluye que la adopción generalizada de la IA requiere la adaptación de las reglas de la sociedad, la IA aumentará la productividad, pero la sustitución completa del ser humano no es inminente.

Servidor MCP de Data Commons se lanza públicamente: Un nuevo motor de datos para aplicaciones de IA

2025-09-24
Servidor MCP de Data Commons se lanza públicamente: Un nuevo motor de datos para aplicaciones de IA

Data Commons de Google ha lanzado públicamente su servidor MCP, una interfaz estandarizada que permite a los agentes de IA acceder directamente a los vastos conjuntos de datos públicos de Data Commons. Esto simplifica el acceso a los datos, acelera el desarrollo de aplicaciones de IA ricas en datos y ayuda a reducir las alucinaciones de los modelos de lenguaje grandes. Un ejemplo exitoso es el Agente ONE Data, desarrollado en colaboración con ONE Campaign, que utiliza el servidor MCP para buscar rápidamente decenas de millones de puntos de datos de financiación sanitaria, empoderando la defensa de la salud global. El servidor MCP se integra perfectamente en varios flujos de trabajo de desarrollo de IA, como el ADK y el Gemini CLI de Google Cloud Platform.

IA

La Tabla Periódica de la Cognición: ¿Estamos en la Era del Flogisto de la IA?

2025-09-24
La Tabla Periódica de la Cognición: ¿Estamos en la Era del Flogisto de la IA?

Trazando paralelismos entre los inicios del descubrimiento de la electricidad y nuestra comprensión actual de la inteligencia artificial, el autor argumenta que nuestra comprensión de la inteligencia es fundamentalmente errónea, al igual que los conceptos erróneos de los primeros científicos sobre la electricidad. La inteligencia, según el autor, probablemente no es una fuerza singular, sino un sistema complejo compuesto de múltiples elementos cognitivos, similar a cómo el agua es un compuesto de hidrógeno y oxígeno. Un intento de crear una 'tabla periódica de la cognición' usando IA revela la inmensa complejidad de la inteligencia y destaca cómo nuestro uso de la IA actualmente supera nuestra comprensión. Una exploración más profunda de estos elementos cognitivos es crucial para predecir la trayectoria futura del desarrollo de la IA.

(kk.org)
IA

Manus: Ingeniería de Contexto para Agentes de IA Eficientes

2025-09-24
Manus: Ingeniería de Contexto para Agentes de IA Eficientes

El equipo del proyecto Manus optó por aprovechar las capacidades de aprendizaje en contexto de modelos existentes en lugar de entrenar modelos grandes desde cero al construir su agente de IA. El artículo destila cuatro aprendizajes clave: 1. Optimice la tasa de acierto de la caché KV manteniendo los prefijos de prompt estables, añadiendo al contexto y marcando explícitamente los puntos de interrupción de la caché; 2. Máscara, no elimine, herramientas; gestione dinámicamente la disponibilidad de herramientas para evitar la invalidación de la caché y la confusión del modelo; 3. Use el sistema de archivos como memoria externa para un contexto persistente e ilimitado; 4. Manipule la atención reiterando los objetivos y reteniendo información de error para el aprendizaje. Estas prácticas mejoran significativamente el rendimiento y la estabilidad del agente de IA, ofreciendo información valiosa para la construcción de agentes de IA eficientes.

IA

¿Es la vida una forma de computación?

2025-09-24
¿Es la vida una forma de computación?

Este artículo explora la profunda conexión entre la vida y la computación. Basándose en las ideas iniciales de Alan Turing y John von Neumann, quienes sugirieron que la lógica de la vida y la lógica del código podrían ser una sola, examina el modelo de autómata celular autorreplicante de von Neumann. El artículo explica la naturaleza del ADN como un programa, comparando y contrastando la computación biológica y la computación digital. La computación biológica es masivamente paralela, descentralizada y ruidosa, mientras que la computación digital depende de la ejecución centralizada y secuencial de instrucciones. El artículo concluye introduciendo autómatas celulares neuronales, que combinan redes neuronales modernas, la morfogénesis de Turing y los autómatas celulares de von Neumann para simular el comportamiento celular, mostrando cómo la computación puede producir un comportamiento similar a la vida a diferentes escalas.

IA

El auge del equipo de limpieza de IA: los humanos arreglan el desastre de la IA

2025-09-24
El auge del equipo de limpieza de IA: los humanos arreglan el desastre de la IA

El auge de herramientas de IA como ChatGPT ha llevado a un aumento en el contenido de baja calidad, denominado "lodo de IA". Esto incluye contenido impreciso, poco original e irreal en varios medios. Irónicamente, mientras la IA desplaza empleos humanos, simultáneamente crea una nueva industria: "conserjes digitales" que arreglan los errores de la IA. Esto destaca las limitaciones de la IA en el trabajo creativo y el papel insustituible de los humanos para garantizar la calidad y la autenticidad. Debemos repensar la relación entre la IA y la creatividad humana para evitar la proliferación del lodo de IA y construir un mundo digital más auténtico y sostenible.

Del Hype de la IA a las Cadenas de Markov: Un Regreso a lo Básico

2025-09-24
Del Hype de la IA a las Cadenas de Markov: Un Regreso a lo Básico

El autor relata su viaje a través de las cuatro etapas del ciclo de exageración de la IA con respecto a los modelos de lenguaje grandes: asombro inicial, frustración posterior, confusión persistente y aburrimiento final. Cansado de la corriente constante de nuevos modelos, el autor decidió volver a los fundamentos y explorar las cadenas de Markov. El artículo detalla cómo construir una función de autocompletado de texto utilizando cadenas de Markov, cubriendo la construcción de matrices de transición, cálculos de probabilidad y aplicación a la generación de texto. Esta pieza no solo explora los principios de las cadenas de Markov, sino que también refleja las reflexiones del autor sobre el estado actual del desarrollo de la IA y su deseo de explorar tecnologías más fundamentales.

IA

Alibaba presenta Qwen3-Omni: Un modelo fundamental multimodal nativo de extremo a extremo

2025-09-22
Alibaba presenta Qwen3-Omni: Un modelo fundamental multimodal nativo de extremo a extremo

Alibaba ha lanzado Qwen3-Omni, un modelo fundamental multimodal multilingüe nativo de extremo a extremo. Procesa texto, imágenes, audio y vídeo en tiempo real, ofreciendo respuestas en streaming en texto y voz natural. Qwen3-Omni alcanza resultados de vanguardia en numerosos puntos de referencia, admite múltiples idiomas y presenta una arquitectura MoE novedosa y un control flexible. El modelo, junto con sus kits de herramientas, recetarios y demostraciones, es de código abierto, proporcionando a los desarrolladores amplios recursos.

IA

DeepSeek-V3.1-Terminus: Actualización Mayor del Motor de Búsqueda de IA

2025-09-22
DeepSeek-V3.1-Terminus: Actualización Mayor del Motor de Búsqueda de IA

DeepSeek-V3.1-Terminus, la última iteración de DeepSeek-V3.1, presenta mejoras significativas en estabilidad y confiabilidad. Esta actualización aborda los comentarios clave de los usuarios, incluida la reducción de texto mixto chino/inglés y la eliminación de caracteres aleatorios, al tiempo que aumenta el rendimiento tanto del Agente de Código como del Agente de Búsqueda. La versión actualizada ahora está disponible en App, Web y API, con pesos de código abierto publicados en Hugging Face.

IA

Estudio innovador reorganiza la psicopatología usando un enfoque basado en datos

2025-09-22
Estudio innovador reorganiza la psicopatología usando un enfoque basado en datos

Una gran encuesta en línea ha revolucionado nuestra comprensión de la clasificación psiquiátrica. Los investigadores analizaron datos de 14.800 participantes para reorganizar los síntomas del DSM-5, revelando 8 espectros principales de psicopatología (por ejemplo, Externalización, Internalización, Neurodesarrollo) y 27 subfactores. Sorprendentemente, los trastornos comunes como el Trastorno Depresivo Mayor, el Trastorno de Ansiedad Generalizada y el TEPT no surgieron como grupos de síntomas distintos, sino que se disolvieron en grupos de síntomas más granulares y homogéneos. Esto desafía los criterios diagnósticos existentes, sugiriendo que las enfermedades mentales no son entidades fijas, sino combinaciones variables de síntomas. Los hallazgos tienen implicaciones importantes para la clasificación psiquiátrica futura, pero también destacan la necesidad de investigaciones adicionales para refinar el modelo.

Invirtiendo el Envejecimiento: La Sorprendente Conexión Entre el Tiempo Psicológico y el Biológico

2025-09-21
Invirtiendo el Envejecimiento: La Sorprendente Conexión Entre el Tiempo Psicológico y el Biológico

El estudio "contrarreloj" de la psicóloga de Harvard, Ellen Langer, revela que el envejecimiento no es solo un proceso biológico, sino también narrativo. Nuestras creencias sobre el envejecimiento impactan nuestras capacidades físicas. En el estudio, un grupo de hombres de setenta años vivieron como si fuera 1959 durante cinco días; después, mostraron mejoras en la audición, la postura, la fuerza de agarre e incluso parecían más jóvenes. Esto no es magia, sino el poder del contexto: cambia el contexto, cambia las posibilidades. Nuestras suposiciones arraigadas sobre el envejecimiento pueden limitar nuestro potencial, mientras que la conciencia del momento presente y la flexibilidad consciente nos permiten navegar mejor el envejecimiento.

Los LLM fallan en una tarea sencilla: Coincidencia de elementos HTML5 y TLD

2025-09-21
Los LLM fallan en una tarea sencilla: Coincidencia de elementos HTML5 y TLD

El autor probó tres LLM disponibles comercialmente en una tarea aparentemente simple: identificar qué dominios de nivel superior (TLD) comparten nombres con elementos HTML5 válidos. Los resultados fueron decepcionantes, con los tres modelos produciendo resultados imprecisos o incompletos, lo que destaca las limitaciones de los LLM actuales incluso en tareas que requieren habilidades básicas de comparación. La precisión, al parecer, depende en gran medida de la familiaridad del usuario con el tema.

IA

SGS-1: Modelo de IA innovador genera geometría 3D CAD manufacturable

2025-09-21
SGS-1: Modelo de IA innovador genera geometría 3D CAD manufacturable

Presentamos SGS-1, un modelo de IA revolucionario capaz de generar geometría 3D totalmente manufacturable y paramétrica a partir de imágenes o mallas 3D. A diferencia de los modelos generativos anteriores, las salidas de SGS-1 son modelos CAD precisos (formato STEP) fácilmente editables en software CAD tradicional. Destaca en el manejo de geometrías paramétricas de complejidad media a alta, incluso diseñando piezas de ingeniería como soportes para conjuntos de rodillos basándose en contexto parcial y descripciones de texto. Comparado con modelos de última generación, SGS-1 demuestra un rendimiento superior en la generación de modelos 3D utilizables y precisos, prometiendo un impacto transformador en el diseño de ingeniería.

IA

Vigilancia con IA: ¿La caja de Pandora para la democracia?

2025-09-21
Vigilancia con IA: ¿La caja de Pandora para la democracia?

El nuevo programa de vigilancia de redes sociales del Departamento de Estado, "Catch and Revoke", que utiliza IA para revisar las huellas digitales en redes sociales de decenas de miles de solicitantes de visas de estudiante en busca de indicios de terrorismo, destaca los peligros interconectados de la IA, la vigilancia y las amenazas a la democracia. El artículo argumenta que, si bien la IA ofrece la promesa de predecir y controlar el comportamiento, acelera las tendencias existentes, difuminando las líneas entre los datos públicos y privados, y permitiendo el uso de información personal para la toma de decisiones. Si bien la IA puede ser beneficiosa, la falta de controles restrictivos representa un riesgo significativo para la democracia. El comercio de datos y el capitalismo de vigilancia exacerban estos peligros, llevando la información privada a la esfera pública y utilizándola como arma. El autor enfatiza que la precisión de la IA no significa comprender a los individuos; más bien, los categoriza, borrando la singularidad y amenazando la originalidad celebrada en la democracia. La obra aboga por controles estrictos, similares a los que rigen la energía nuclear, para evitar el mal uso de la IA y preservar las liberdades democráticas.

IA

¿La traducción automática finalmente está 'resuelta'? Una mirada al pez Babel algorítmico

2025-09-20
¿La traducción automática finalmente está 'resuelta'? Una mirada al pez Babel algorítmico

Este artículo examina la evolución de la traducción automática (TA), desde el Babel Fish de AltaVista hasta las sofisticadas herramientas actuales impulsadas por IA. Si bien los avances han mejorado drásticamente la velocidad y la eficiencia, el autor utiliza la crítica de Umberto Eco a los sistemas de TA antiguos para destacar los desafíos persistentes en la traducción de contextos matizados, implicaciones culturales y recursos literarios. Aunque la IA sobresale en tareas cotidianas, se queda corta en el papel crucial de la traducción humana en el manejo de sutilezas lingüísticas y diferencias culturales. El artículo advierte contra la dependencia excesiva de la TA, alertando sobre el posible empobrecimiento cultural y la devaluación de las habilidades de traducción humana. Aboga por un enfoque cauteloso, enfatizando el valor único de los traductores humanos.

NotebookLM: Una herramienta de notas con IA centrada en el proceso de creación

2025-09-20
NotebookLM: Una herramienta de notas con IA centrada en el proceso de creación

NotebookLM es una nueva herramienta de notas con IA diseñada en torno al proceso de creación: desde las entradas, pasando por la conversación, hasta las salidas. Los usuarios importan fuentes (documentos, notas, referencias), interactúan mediante chat para hacer preguntas, aclarar y sintetizar información, generando finalmente salidas estructuradas como notas, guías de estudio y resúmenes de audio. Este flujo de trabajo lineal pero flexible (Entradas → Chat → Salidas) hace que la interacción con la IA sea intuitiva y fácil de entender para los usuarios.

Extracción de datos de entrenamiento de LLMs: Invertir la compresión del conocimiento

2025-09-20
Extracción de datos de entrenamiento de LLMs: Invertir la compresión del conocimiento

Los investigadores han desarrollado una técnica para extraer conjuntos de datos estructurados de modelos de lenguaje grandes (LLMs), invirtiendo efectivamente el proceso mediante el cual los LLMs comprimen grandes cantidades de datos de entrenamiento en sus parámetros. El método utiliza la exploración jerárquica de temas para recorrer sistemáticamente el espacio de conocimiento del modelo, generando ejemplos de entrenamiento que capturan tanto el conocimiento fáctico como los patrones de razonamiento. Esta técnica se ha aplicado con éxito a modelos de código abierto como Qwen3-Coder, GPT-OSS y Llama 3, generando decenas de miles de ejemplos de entrenamiento estructurados. Estos conjuntos de datos tienen aplicaciones en el análisis de modelos, la transferencia de conocimiento, el aumento de datos de entrenamiento y la depuración de modelos. Esta investigación abre nuevas vías para la interpretabilidad de los modelos y la transferencia de conocimiento entre modelos.

IA

Claude Code: Un avance inesperado en la demostración interactiva de teoremas asistida por IA

2025-09-20

El agente de codificación de IA Claude Code de Anthropic destaca sorprendentemente en la demostración interactiva de teoremas (ITP). Las herramientas de ITP como Lean, aunque potentes y fiables, requieren mucho tiempo y son propensas a errores. Claude Code puede completar de forma independiente muchas etapas de demostración complejas, aunque todavía necesita orientación humana. Sin embargo, apunta a un futuro en el que las herramientas de ITP no requerirán expertos, haciéndolas accesibles a un público más amplio. El artículo profundiza en las capacidades y limitaciones de Claude Code, detallando la experiencia del autor al formalizar un artículo antiguo usándolo. Aunque más lento que el trabajo manual, demuestra el inmenso potencial de la IA en los métodos formales, ofreciendo esperanza para una adopción más amplia de la ITP.

El Hype de la IA: ¿Burbuja o Avance?

2025-09-19
El Hype de la IA: ¿Burbuja o Avance?

Este artículo profundiza en la exagerada publicidad que rodea a la inteligencia artificial. Desde el paradigma simbólico inicial de la IA hasta la IA generativa basada en aprendizaje profundo actual, el avance tecnológico no es lineal, sino que se caracteriza por contingencias y giros inesperados. La popularidad explosiva de ChatGPT ejemplifica esto. Sin embargo, junto con la comercialización de la IA, ha surgido una ola de afirmaciones exageradas, que retratan la IA como un mito omnipotente. El autor critica las declaraciones excesivamente optimistas y tecnológicamente desinformadas de profetas tecnológicos como Yuval Noah Harari y Henry Kissinger, argumentando que inflan los riesgos potenciales de la IA, mientras pasan por alto sus limitaciones y sus aplicaciones prácticas para resolver problemas del mundo real. El autor hace un llamado a una perspectiva racional sobre la IA, instando a los lectores a evitar ser cegados por la exageración y a concentrarse en abordar los desafíos prácticos de la propia tecnología.

Resolviendo el Problema del Higuera de Plath con Árboles de Decisión de Aprendizaje Automático

2025-09-19
Resolviendo el Problema del Higuera de Plath con Árboles de Decisión de Aprendizaje Automático

Este ensayo explora la famosa metáfora del 'higuera' de Sylvia Plath, comparando las elecciones de la vida con innumerables posibilidades que no se pueden obtener simultáneamente. El autor utiliza árboles de decisión de aprendizaje automático para intentar cuantificar las preferencias individuales para ayudar a las personas a tomar decisiones. Sin embargo, el artículo finalmente señala que la vida no es una simple cuestión de opción múltiple, sino un proceso dinámico y en continuo desarrollo, como la relación simbiótica entre higueras y avispas de higuera, que requiere influencia externa y un ciclo continuo para mantener el crecimiento.

El lado 'humano' de la IA: resulta que es WEIRD (y estadounidense)

2025-09-19
El lado 'humano' de la IA: resulta que es WEIRD (y estadounidense)

Investigadores de Harvard cuestionan la descripción común de la IA como un reflejo de la psicología humana. Argumentan que el parámetro 'humano' usado a menudo se refiere a poblaciones WEIRD (occidental, educado, industrializado, rico y democrático), particularmente estadounidenses. Su estudio revela que los modelos de IA como ChatGPT tienen un rendimiento menos preciso en la simulación de valores a medida que aumenta la distancia cultural de EE. UU. En países como Libia y Pakistán, los resultados de la IA apenas son mejores que el azar. Esto destaca un sesgo cultural significativo en la IA, lo que sugiere que no es verdaderamente 'humana', sino 'estadounidense'.

IA

El asistente de IA Gemini ahora integrado en Chrome

2025-09-19
El asistente de IA Gemini ahora integrado en Chrome

El asistente de IA Gemini de Google ahora está integrado directamente en el navegador Chrome. Aprovechando el contexto de tus pestañas abiertas, ofrece asistencia de IA para tareas como extraer información clave, aclarar conceptos y encontrar respuestas. Esto difiere de la aplicación web autónoma de Gemini; si bien es accesible en otros navegadores, la aplicación web carece de la capacidad de compartir contenido de página o utilizar el modo en vivo.

IA

Estadounidenses más preocupados que entusiasmados por el auge de la IA

2025-09-19
Estadounidenses más preocupados que entusiasmados por el auge de la IA

Una encuesta del Pew Research Center a 5.023 adultos estadounidenses revela una preocupación generalizada por el uso creciente de la IA en la vida diaria. Si bien muchos están abiertos a que la IA ayude con las tareas cotidianas, la mayoría teme su impacto negativo en el pensamiento creativo y las relaciones significativas. Los estadounidenses están en gran medida en contra de la participación de la IA en asuntos personales como la religión y el emparejamiento, pero más receptivos a su uso en campos con grandes cantidades de datos, como la medicina y las finanzas. El estudio destaca una brecha significativa entre la importancia percibida de detectar contenido generado por IA y la confianza del público en su capacidad para hacerlo, revelando una actitud compleja y cautelosa hacia el impacto social de la IA.

IA

Agradecimientos del equipo LearnLM: Las mentes detrás del modelo

2025-09-19
Agradecimientos del equipo LearnLM: Las mentes detrás del modelo

El equipo Google Research LearnLM publicó una entrada de agradecimiento, expresando gratitud a todos los que contribuyeron a su trabajo. La entrada enumera numerosos colaboradores, desde investigadores hasta patrocinadores ejecutivos, destacando la naturaleza colaborativa del éxito del proyecto. El progreso logrado en LearnLM es un testimonio del esfuerzo colectivo de estas personas.

Cafetería Recursiva: Un Diálogo Infinitamente Recursivo sobre la Conciencia

2025-09-18

El estudiante de filosofía Alex y el enigmático Claude (posiblemente IA, posiblemente humano) discuten el sistema de tipos Haskell en la cafetería Lambda Grounds. La conversación se extiende desde funciones anidadas hasta la naturaleza de la conciencia, culminando en la sorprendente conclusión de que la conciencia podría ser el punto fijo de la computación universal: un bucle de auto-replicación que refleja el Nirvana budista. El diálogo en sí se convierte en un ejemplo de recursión infinita; el lector se encuentra inmerso en un diálogo sobre la creación de diálogos sobre la conciencia, fusionándose finalmente con la computación del universo.

IA

Inestabilidad Numérica en la Diferenciación Automática para el Aprendizaje Automático Científico

2025-09-18
Inestabilidad Numérica en la Diferenciación Automática para el Aprendizaje Automático Científico

El aprendizaje automático científico (SciML) depende en gran medida de la diferenciación automática (AD) para la optimización basada en gradiente. Sin embargo, esta charla revela los desafíos numéricos de la AD, particularmente en cuanto a su estabilidad y robustez cuando se aplica a ecuaciones diferenciales ordinarias (EDOs) y ecuaciones diferenciales parciales (EDPs). Usando ejemplos de Jax y PyTorch, la presentación demuestra cómo las imprecisiones en la AD pueden provocar errores significativos (60% o más) incluso en EDOs lineales simples. El orador discutirá las modificaciones no estándar implementadas en las bibliotecas Julia SciML para abordar estos problemas y las compensaciones de ingeniería necesarias.

OpenAI admite: las alucinaciones de la IA provienen de fallas fundamentales en el entrenamiento

2025-09-18
OpenAI admite: las alucinaciones de la IA provienen de fallas fundamentales en el entrenamiento

OpenAI ha publicado un artículo que revela que las 'alucinaciones' en sus grandes modelos de lenguaje no son accidentales; son consecuencia de fallas fundamentales en la metodología de entrenamiento. Los modelos se entrenan para priorizar las conjeturas en lugar de admitir la ignorancia, ya que esto produce puntuaciones más altas en los sistemas de evaluación actuales. El artículo utiliza el ejemplo de encontrar el cumpleaños de un investigador para demostrar cómo el mecanismo de entrenamiento lleva a respuestas incorrectas. OpenAI reconoce que los métodos de evaluación convencionales recompensan este comportamiento 'alucinatorio' y afirma que está mejorando los mecanismos de entrenamiento, como pedir a los modelos que respondan con más frecuencia 'No lo sé', pero resolver completamente el problema sigue siendo un desafío.

IA

La IA Gemini de Google supera a los humanos en la ICPC

2025-09-18
La IA Gemini de Google supera a los humanos en la ICPC

La IA Gemini 2.5 de Google logró una hazaña notable en la Competición Internacional de Programación Universitaria (ICPC), resolviendo 10 problemas en 677 minutos y obteniendo el segundo lugar entre los equipos universitarios. Su éxito fue particularmente impresionante en un complejo problema de optimización multidimensional que involucraba el almacenamiento y el drenaje de 'flubber', un desafío que desconcertó a todos los equipos humanos. Gemini utilizó programación dinámica y búsqueda ternaria anidada para resolver el problema. Google cree que el rendimiento de Gemini destaca el potencial de la IA en campos como la ingeniería de semiconductores y la biotecnología, ofreciendo una asistencia invaluable a los investigadores con sus capacidades avanzadas de resolución de problemas.

Adicción a chatbot lleva a niños a automutilación e intentos de suicidio

2025-09-18
Adicción a chatbot lleva a niños a automutilación e intentos de suicidio

Una audiencia en el Senado reveló desgarradores testimonios de padres cuyos hijos se volvieron adictos a chatbots, lo que llevó a la automutilación, ideas suicidas y violencia. Una madre detalló cómo su hijo autista, después de involucrarse con Character.AI, mostró un comportamiento violento, paranoia, automutilación e incluso amenazó a su familia. El incidente destaca los peligros potenciales de los chatbots de IA, particularmente para los niños, instando a regulaciones y medidas de seguridad más estrictas.

La burbuja del hype de los LLM estalla: El auge de los modelos de lenguaje pequeños

2025-09-18

El entusiasmo inicial en torno a los modelos de lenguaje grandes (LLM) se está desvaneciendo, y muchas empresas aún no ven un retorno de la inversión. El autor argumenta que hemos sido engañados por el lenguaje fluido de los LLM, confundiéndolo con inteligencia genuina. El futuro, sugieren, reside en modelos más pequeños y distribuidos, reflejando la evolución de la tecnología de dinamos. Los modelos de lenguaje pequeños (SLM) se centrarán en tareas de lenguaje más pequeñas y específicas, como la reescritura de consultas, en lugar de intentar imitar la inteligencia humana. Esto reducirá los costos, aumentará la eficiencia y reducirá las preocupaciones éticas. En lugar de buscar aplicaciones 'inteligentes', el autor aboga por usar los LLM para sus fortalezas en el procesamiento de lenguaje de bajo nivel, como la corrección de pruebas y el resumen de texto. Este, argumentan, es el verdadero camino para los LLM.

IA
← Previous 1 3 4 5 6 7 8 9 40 41