Webtagr - Resumen de noticias de tecnología

Sesame AI lanza modelo de voz conversacional de 1 billón de parámetros

2025-03-18

Sesame AI Labs ha lanzado CSM (Conversational Speech Model), un modelo de generación de voz de 1 billón de parámetros basado en la arquitectura Llama. CSM genera códigos de audio RVQ a partir de entradas de texto y audio, y su punto de control está disponible en Hugging Face. También se proporciona una demostración interactiva de voz y un espacio Hugging Face para probar la generación de audio. Si bien es capaz de producir voces variadas, CSM no se ha ajustado a voces específicas y tiene un soporte multilingüe limitado. Sesame AI enfatiza su uso solo para fines de investigación y educativos, prohibiendo la suplantación de identidad, la desinformación y las actividades ilegales.

(github.com)

IA generación de voz

El Modelo Es el Producto: La Próxima Frontera en la Inversión en IA

2025-03-18

Abundan las especulaciones sobre la próxima ola de IA. El autor argumenta que la respuesta es clara: el propio modelo es el producto. La escala generalista se está desacelerando, el entrenamiento opinativo supera las expectativas y los costos de inferencia están cayendo. Esto obliga a los proveedores de modelos a subir en la cadena de valor, mientras que las capas de aplicaciones enfrentan la automatización y la interrupción. DeepResearch de OpenAI y Claude 3.7 de Anthropic ejemplifican esto: no simplemente LLMs o chatbots, sino modelos diseñados para tareas específicas. Esto indica una nueva fase de la IA: los entrenadores de modelos dominan, los desarrolladores de aplicaciones enfrentan el desplazamiento. Las inversiones en capas de aplicaciones pueden fallar, ya que el entrenamiento de modelos tiene el verdadero valor. El éxito futuro de la IA reside en empresas capaces de entrenar modelos, con equipos multifuncionales y un enfoque intenso.

(vintagedata.org)

IA tendencias de inversión

Query Tables de Dust: Capacitando a los agentes de IA con análisis de datos estructurados

2025-03-18

Dust creó Query Tables, una poderosa herramienta de agente de IA que permite consultas SQL en datos estructurados. Comenzando con el soporte para archivos CSV, evolucionó para incluir bases de datos de Notion, Hojas de cálculo de Google y hojas de cálculo de Office 365, culminando en conexiones con almacenes de datos empresariales como Snowflake y BigQuery. Una capa de abstracción unificada permite a los usuarios consultar diversas fuentes de datos utilizando la misma interfaz SQL, incluso combinando datos de diferentes fuentes para el análisis. Los planes futuros incluyen la integración de Salesforce para ampliar aún más sus capacidades de análisis de datos.

(blog.dust.tt)

IA datos estructurados

¿El modelo de código abierto OLMo-2 supera al GPT-3.5? ¡Configuración sencilla para Mac!

2025-03-18

El modelo de lenguaje de código abierto OLMo-2, con 32 mil millones de parámetros, afirma superar a GPT-3.5-Turbo y GPT-4 mini. Todos los datos, código, pesos y detalles están disponibles libremente. Esta publicación detalla una configuración sencilla para ejecutarlo en un Mac usando el plugin llm-mlx. Descarga el modelo de 17 GB con unos pocos comandos e interactúa en chats o genera imágenes; el ejemplo muestra la generación de un SVG de un pelícano en bicicleta.

(simonwillison.net)

IA

Algoritmo Cuántico DQI: ¿Un Avance en la Optimización?

2025-03-17

El equipo de Google Quantum AI ha desarrollado un nuevo algoritmo cuántico llamado Interferometría Cuántica Decodificada (DQI) que supera a todos los algoritmos clásicos conocidos en la resolución de una amplia clase de problemas de optimización. El algoritmo no fue diseñado para un problema específico, sino que traduce el problema a ondas cuánticas y aplica técnicas de decodificación para encontrar la mejor solución. Aunque falta hardware cuántico suficiente para pruebas empíricas y existe la posibilidad de futuros algoritmos clásicos rivales, la ventaja potencial del DQI en problemas de optimización y sus aplicaciones en codificación y criptografía han generado entusiasmo en la comunidad de computación cuántica. Se considera un avance significativo en algoritmos cuánticos.

(www.quantamagazine.org)

IA algoritmo cuántico problemas de optimización

Gemini 2.0 Flash de Google: Un potente editor de imágenes IA que genera preocupaciones sobre derechos de autor

2025-03-17

El nuevo modelo de IA Gemini 2.0 Flash de Google cuenta con potentes capacidades de edición de imágenes, incluida la capacidad de eliminar marcas de agua de las imágenes sin esfuerzo, incluso las de agencias de fotografía conocidas como Getty Images. Esta funcionalidad ha generado preocupaciones sobre derechos de autor, ya que eliminar marcas de agua sin permiso suele ser ilegal según la ley de derechos de autor de EE. UU. Si bien Google etiqueta la función como experimental y solo disponible para desarrolladores, su potente capacidad de eliminación de marcas de agua y la falta de restricciones de uso la convierten en una herramienta potencial para la infracción de derechos de autor. Otros modelos de IA, como el Claude 3.7 Sonnet de Anthropic y el GPT-4o de OpenAI, se niegan explícitamente a eliminar marcas de agua, considerándolo antiético y potencialmente ilegal.

(techcrunch.com)

IA Edición de Imágenes IA Preocupaciones sobre Derechos de Autor

Startup de IA Neuro-First Busca Ingenieros para Crear Interfaces Cerebro-Computadora Innovadoras

2025-03-17

Piramidal está contratando Ingenieros de Investigación para construir sistemas de IA centrados en datos neuronales, permitiendo tareas antes imposibles. Los candidatos ideales poseen fuertes habilidades de ingeniería, incluyendo el diseño, implementación y mejora de sistemas de aprendizaje automático distribuidos a gran escala, y un conocimiento básico de neurociencia. La empresa ofrece una compensación y participación accionaria competitivas, impulsada por una misión de empoderar el potencial humano a través de la tecnología, defendiendo la libertad cognitiva y oponiéndose a la mercantilización de las mentes.

(www.ycombinator.com)

IA

La IA de Google resuelve el misterio de las superbacterias de una década en solo dos días

2025-03-17

Una nueva herramienta de IA de Google resolvió un enigma científico de una década en solo dos días: el mecanismo de resistencia a los antibióticos en las superbacterias. Un equipo del Imperial College London pasó 10 años investigando cómo ciertas superbacterias adquieren resistencia, pero la herramienta de IA 'co-científica' de Google, con una simple indicación, llegó a la misma respuesta que los hallazgos no publicados del equipo en solo 48 horas. Esto demuestra el potencial de la IA para sintetizar evidencia, orientar la investigación y diseñar experimentos, potencialmente revolucionando el progreso científico. Sin embargo, también plantea preocupaciones éticas y de confiabilidad sobre el uso de la IA en la investigación científica.

(www.livescience.com)

IA superbacterias

Ingeniero de IA Aplicada Fundador en Kastle: Revolucionando el Servicio de Hipotecas con IA

2025-03-16

Kastle, una plataforma impulsada por IA que presta servicios a los principales prestamistas hipotecarios de EE. UU., busca un Ingeniero de IA Aplicada Fundador. Con el respaldo de Y Combinator y otros inversores importantes, Kastle está redefiniendo el servicio de préstamos. Este puesto requiere más de 3 años de experiencia en IA aplicada, dominio de Python y marcos de aprendizaje profundo, y experiencia en el ajuste fino de LLMs. Las responsabilidades incluyen la integración de IA en su plataforma, el diseño de flujos de trabajo de IA, la garantía del cumplimiento normativo (FDCPA, RESPA, TILA) y la optimización del rendimiento y la escalabilidad. Esta es una oportunidad única para construir la base de una startup de IA de rápido crecimiento.

(www.ycombinator.com)

IA

La amenaza de la IA a los repositorios de acceso abierto

2025-03-16

El ideal del movimiento de acceso abierto choca con la realidad del entrenamiento de modelos de IA. Los contribuyentes están descubriendo que sus trabajos se están explotando con fines de lucro, incluso alimentando proyectos dañinos, lo que genera dudas sobre la sostenibilidad del intercambio de conocimiento. Este artículo explora soluciones más allá de las licencias restrictivas, abogando por modelos colaborativos justos como Wikimedia Enterprise y las señales de preferencia de Creative Commons. La negociación colectiva puede garantizar que las empresas de IA compensen justamente los costos de infraestructura, proporcionen atribución y reinviertan en el bien común, cumpliendo la visión de acceso universal al conocimiento.

(www.citationneeded.news)

IA Acceso Abierto Bien Común

Estudiantes del MIT superan bibliotecas HPC de última generación con cientos de líneas de código

2025-03-16

Investigadores del CSAIL del MIT han desarrollado Exo 2, un nuevo lenguaje de programación que permite a los programadores escribir 'programaciones' que controlan explícitamente cómo el compilador genera código, lo que lleva a un rendimiento significativamente mejorado. A diferencia de los lenguajes de programación por el usuario (USLs) existentes, Exo 2 permite a los usuarios definir nuevas operaciones de programación externamente al compilador, creando bibliotecas de programación reutilizables. Esto permite a los ingenieros lograr un rendimiento comparable o superior al de las bibliotecas HPC de última generación con una cantidad de código drásticamente reducida, revolucionando la eficiencia en las aplicaciones de IA y aprendizaje automático.

(news.mit.edu)

IA

Evaluando el Riesgo de Secuestro de Agentes de IA: Las Pruebas Adversarias Revelan Vulnerabilidades

2025-03-16

El Instituto de Seguridad de IA de EE. UU. (US AISI) evaluó el riesgo de secuestro de agentes de IA utilizando el marco AgentDojo, probando el modelo Claude 3.5 Sonnet de Anthropic. Los hallazgos clave destacan la necesidad de una mejora continua de los marcos de evaluación, evaluaciones adaptativas para tener en cuenta los métodos de ataque en evolución y la importancia de analizar las tasas de éxito de ataque específicas de cada tarea. El estudio introdujo nuevos escenarios de ataque, como la ejecución remota de código, la exfiltración de bases de datos y el phishing automatizado, demostrando su eficacia en diferentes entornos. Esta investigación subraya la necesidad de mejoras iterativas en los marcos de evaluación de seguridad de IA para abordar la amenaza en constante evolución del secuestro de agentes de IA.

(www.nist.gov)

IA Secuestro de Agente

Cuantitativa de Jane Street: De las Competiciones de Matemáticas al Trading Impulsado por IA

2025-03-16

In Young Cho, una trader cuantitativa de Jane Street, comparte su trayectoria profesional poco convencional, desde pre-medicina hasta el trading cuantitativo. Relata sus experiencias como becaria y trabajadora en Jane Street, incluyendo el uso de lenguajes de programación como OCaml y VBA para el trading y el desarrollo, y anécdotas divertidas sobre la interacción con corredores. El episodio profundiza en la investigación de trading de Jane Street, desde modelos lineales simples hasta redes neuronales profundas complejas, y cómo aprovechan el aprendizaje automático en entornos de pocos datos, mucho ruido y sujetos a frecuentes cambios de régimen. In Young Cho detalla las cuatro etapas de su proceso de investigación: exploración, recopilación de datos, modelado y producción, y discute la tensión entre las herramientas de investigación flexibles y los sistemas de producción robustos. Finalmente, ofrece una visión de las futuras direcciones de la investigación de aprendizaje automático de Jane Street, incluyendo la expansión a más clases de activos y modalidades de datos, y el uso de la IA para mejorar la eficiencia del trader.

(signalsandthreads.com)

IA

Parahelp: Creando compañeros de IA que reemplazan a los agentes de soporte humano

2025-03-15

Parahelp está creando un agente de soporte impulsado por IA para empresas de software. Su agente utiliza la infraestructura existente (Slack, Stripe, etc.) para resolver tickets de soporte de extremo a extremo, con el objetivo de reemplazar completamente a los agentes de soporte humano. Creen que el contexto, no la inteligencia, será el cuello de botella para los futuros compañeros de IA. Lanzada en agosto de 2024, Parahelp cuenta con el respaldo de Y Combinator e inversores de renombre, y ya trabaja con empresas líderes como Perplexity y Framer.

(www.ycombinator.com)

IA Soporte

Clínica Mayo resuelve el problema de alucinaciones de LLM con RAG inverso

2025-03-15

Los grandes modelos de lenguaje (LLM) sufren de 'alucinaciones' – generando información imprecisa – un problema particularmente peligroso en el ámbito de la salud. La Clínica Mayo abordó esto con una novedosa técnica de 'RAG inverso'. Al vincular la información extraída a su fuente original, este método eliminó casi todas las alucinaciones basadas en la recuperación de datos, permitiendo el despliegue del modelo en toda su práctica clínica. La técnica combina el algoritmo CURE y bases de datos vectoriales, garantizando la trazabilidad de cada punto de datos a su origen. Esto aumenta la fiabilidad y la credibilidad del modelo, reduciendo significativamente la carga de trabajo de los médicos y abriendo nuevas vías para la medicina personalizada.

(venturebeat.com)

IA RAG inverso

Optifye: Startup de IA para Optimización de Fábrica Contrata Equipo Fundador

2025-03-15

Optifye, un sistema de monitorización del rendimiento de IA para fábricas, utiliza la visión por ordenador para identificar y solucionar ineficiencias en tiempo real. Tras implementar con éxito su sistema en fabricantes líderes de los sectores textil, automovilístico, médico y de bienes de consumo de alta rotación en tres continentes, logrando un aumento de la productividad del 12%, ahora está creciendo rápidamente después de graduarse en YC W25. Su ambicioso objetivo es implementar su sistema en 100 líneas de producción en los próximos 4 meses. Buscan ingenieros experimentados con profundos conocimientos en optimización de GPU/CPU/memoria, escalado de aplicaciones de CV en producción, implementaciones en la nube en contenedores (AWS preferible) y una determinación implacable para resolver problemas complejos. Esta es una oportunidad de alta presión y alta recompensa para talentos de primer nivel.

(www.ycombinator.com)

IA Optimización de Fábrica

Douglas Hofstadter critica duramente el texto '¿Por qué escribí GEB?' generado por GPT-4 y expresa preocupaciones sobre los LLM

2025-03-15

Douglas Hofstadter, pionero en IA, critica duramente un texto generado por GPT-4, titulado '¿Por qué escribí GEB?', que supuestamente resume su obra seminal, Gödel, Escher, Bach. Argumenta que el texto está repleto de lugares comunes genéricos, tergiversando drásticamente su estilo de escritura y la génesis del libro. Hofstadter destaca la falta de originalidad del LLM y su fabricación de una narrativa falsa. Detalla el proceso creativo real detrás de GEB, desde su fascinación inicial por el teorema de incompletitud de Gödel hasta la integración de Escher y Bach, revelando las inspiraciones y luchas genuinas. Expresa preocupaciones serias sobre la proliferación de los LLM y su potencial para inundar el mundo con falsedades, instando a una evaluación crítica de sus peligros inherentes.

(www.theatlantic.com)

IA

Retraso en la actualización de IA de Siri: luchas internas y presión en Apple

2025-03-15

Una reunión interna del equipo de Siri de Apple reveló que la actualización de IA de Siri, prometida originalmente el pasado junio, se ha retrasado indefinidamente. Esta decisión ha causado ansiedad y presión dentro del equipo, y también ha expuesto la posición rezagada de Apple en la carrera de la IA. La reunión reveló que el retraso se debe a la reasignación interna de recursos y a la falta de comunicación con el departamento de marketing, lo que ha provocado funciones prometidas en exceso. Aunque los ejecutivos de Apple han asumido la responsabilidad del retraso, el futuro de Siri todavía enfrenta numerosos desafíos, incluyendo problemas técnicos y la gestión de las expectativas de los usuarios.

(www.theverge.com)

IA

Google Assistant será reemplazado por Gemini: El auge de la IA generativa

2025-03-14

Más de un año después de su lanzamiento, Google anunció que su asistente de IA Gemini reemplazará a Google Assistant en teléfonos Android a finales de 2025. Esto representa un paso significativo hacia la adopción generalizada de la IA generativa en dispositivos móviles. Si bien la versión inicial de Gemini tenía funcionalidades limitadas, Google ha solucionado esto mediante actualizaciones continuas y expansión a dispositivos portátiles, automóviles, tabletas y auriculares. Google afirma que millones de personas ya han cambiado a Gemini, destacando sus funciones personalizadas, conscientes del mundo y que mejoran la productividad. Este reemplazo también representa una década de evolución en el procesamiento del lenguaje natural, desde los asistentes de voz básicos hasta la IA generativa actual, mostrando un rápido avance tecnológico.

(9to5google.com)

IA

El framework de colaboración multiagente de código abierto OWL encabeza el benchmark GAIA

2025-03-14

OWL, un framework de vanguardia para la colaboración multiagente construido sobre el framework CAMEL-AI, logró el puesto #1 en el benchmark GAIA con una puntuación media de 58,18. Permite una automatización de tareas más natural, eficiente y robusta en diversos dominios a través de interacciones dinámicas de agentes. OWL es de código abierto, admite varios métodos de instalación y modelos (incluidos OpenAI, Qwen y DeepSeek), y cuenta con un rico conjunto de kits de herramientas como automatización de navegador, procesamiento multimodal y análisis de documentos. También se proporciona una interfaz web fácil de usar. El equipo de OWL busca activamente contribuciones de la comunidad de casos de uso y mejora continuamente el framework.

(github.com)

IA colaboración multiagente automatización de tareas

De los Andes a la Psicología Evolucionista: Un Viaje Científico Accidental

2025-03-14

Un encuentro casual con una mujer nativa peruana que se parecía mucho a su madre impulsó el viaje del autor a la psicología evolucionista. Esto llevó a una investigación sobre las similitudes entre los asiáticos orientales y los nativos americanos, y su ascendencia siberiana compartida. Superando la censura ideológica y los desafíos de financiación en la academia, realizó investigaciones de forma independiente y publicó un artículo sobre el impacto de los climas extremos en la psicología humana. Su trabajo promete soluciones a problemas socioculturales de larga data que afectan a las sociedades asiáticas orientales y tropicales.

(davidsun.substack.com)

IA psicología evolucionista adaptación ambiental

Agentes de IA: ¿Exageración o el futuro del trabajo?

2025-03-14

Silicon Valley está apostando fuerte en los agentes de IA, pero existe una falta significativa de consenso sobre qué constituye exactamente un agente de IA. Empresas como OpenAI, Microsoft y Salesforce los ven como el futuro del trabajo, pero sus funcionalidades e implementaciones varían mucho. Las definiciones van desde sistemas totalmente autónomos hasta herramientas que siguen flujos de trabajo predefinidos, lo que genera confusión incluso entre los expertos del sector. Esta ambigüedad se debe a los rápidos avances tecnológicos y al bombo publicitario, creando tanto oportunidades de innovación como el potencial de expectativas desalineadas y un retorno de la inversión incierto. En última instancia, si los agentes de IA revolucionan realmente el mundo puede depender de la capacidad de la industria para establecer una definición unificada.

(techcrunch.com)

IA definiciones técnicas

Pronóstico Probabilístico de Series Temporales: Un Cambio de Paradigma en el Análisis Predictivo

2025-03-14

¡Adiós a las predicciones de un solo punto! El pronóstico probabilístico de series temporales revoluciona el análisis predictivo al proporcionar distribuciones de probabilidad completas de posibles resultados, no solo valores únicos. Esto permite una toma de decisiones más matizada y confiable. Los estudios muestran mejoras significativas en la precisión del pronóstico, la reducción de errores y, especialmente, en la predicción de eventos extremos. Varios sectores, incluidas las finanzas, la salud y la manufactura, se benefician de una mejor evaluación de riesgos, asignación de recursos y gestión de inventario. Esta guía completa profundiza en los principios, métodos (métodos bayesianos, procesos gaussianos, modelos probabilísticos profundos) y aplicaciones del pronóstico probabilístico en diversos dominios. También abarca técnicas cruciales como el preprocesamiento de datos, la selección de modelos y la calibración de la incertidumbre.

(github.com)

IA Pronóstico Probabilístico Series Temporales

OpenAI apuesta al plan de acción de IA de Trump para resolver disputas de derechos de autor

2025-03-14

OpenAI espera que el Plan de Acción de IA de Donald Trump, previsto para julio, declare el entrenamiento de IA como uso justo, resolviendo los debates sobre derechos de autor y otorgando a las empresas de IA acceso irrestricto a datos de entrenamiento. OpenAI argumenta que esto es crucial para ganar la carrera de IA contra China. Los tribunales están debatiendo actualmente si el entrenamiento de IA constituye un uso justo, y los titulares de derechos afirman que los modelos de IA amenazan su posición en el mercado y disminuyen la creatividad humana en general. OpenAI está involucrada en docenas de demandas, argumentando que la IA transforma las obras protegidas por derechos de autor y que las salidas de IA no son sustitutos de las originales. OpenAI espera que el plan de Trump evite fallos como el que favoreció a los titulares de derechos, que consideró que el entrenamiento de IA no era un uso justo porque amenazaba con reemplazar a una firma de investigación jurídica. OpenAI sugiere que EE. UU. debe priorizar la 'libertad de aprender' de la industria de la IA para evitar que China obtenga una ventaja al acceder a datos protegidos por derechos de autor a los que las empresas estadounidenses no pueden acceder.

(arstechnica.com)

IA Carrera IA EE. UU.-China

Gemini 2.0 de Google: Funciones de IA potentes ahora gratuitas, ¿pero a qué costo?

2025-03-13

Google está haciendo un gran esfuerzo para que Gemini sea un nombre familiar, lanzando importantes actualizaciones para Gemini 2.0. Las mejoras clave, que incluyen funciones avanzadas como la Investigación Profunda mejorada y un modelo de razonamiento que aprovecha tu historial de búsqueda, ahora están disponibles gratuitamente. Este modelo mejorado cuenta con una ventana de contexto de 1 millón de tokens, carga de archivos, procesamiento más rápido e integraciones con aplicaciones de Google como Calendario y Fotos. Si bien Google enfatiza el control del usuario y la capacidad de desactivar el acceso al historial de búsqueda, persisten las preocupaciones sobre la privacidad.

(arstechnica.com)

IA

IA y Matemáticas: Un Choque de Culturas y un Llamado a la Colaboración

2025-03-13

La Reunión Conjunta de Matemáticas de 2025 destacó la creciente intersección entre IA y matemáticas, revelando una división cultural entre matemáticos académicos e investigadores de IA de la industria. Los matemáticos priorizan la comprensión, mientras que los investigadores de IA a menudo se centran en los resultados. Esta diferencia se manifiesta en enfoques contrastantes con respecto a la apertura, la transparencia y la propia naturaleza de la demostración. El artículo profundiza en la esencia de las matemáticas, su cultura y valores, y explora las aplicaciones potenciales de la IA en la gestión de la literatura, la verificación de teoremas y otras áreas. El autor argumenta que la IA debe aumentar las capacidades matemáticas humanas, no reemplazar a los matemáticos humanos, enfatizando la necesidad de respeto mutuo y colaboración para el avance del campo.

(sugaku.net)

IA Diferencias Culturales

El CEO de Anthropic advierte sobre el espionaje chino que apunta a los secretos de IA de EE. UU.

2025-03-13

El CEO de Anthropic, Dario Amodei, ha advertido que los espías chinos probablemente están robando "secretos algorítmicos" valiosos de las principales empresas de IA de EE. UU., instando a la intervención del gobierno. Destacó la historia de espionaje industrial de China y el alto valor, potencialmente cientos de millones de dólares, de fragmentos de código aparentemente simples. Amodei aboga por una mayor colaboración entre el gobierno de EE. UU. y las empresas de IA para reforzar la seguridad en los principales laboratorios de IA, posiblemente involucrando a las agencias de inteligencia de EE. UU. y a sus aliados. Esta preocupación se alinea con las preocupaciones expresadas anteriormente por Amodei sobre el uso de la IA por parte de China para fines autoritarios y militares y sus llamamientos a controles de exportación más estrictos de chips de IA a China. Su postura ha generado críticas de algunos que creen que la colaboración entre EE. UU. y China en IA es necesaria para evitar una carrera armamentista de IA incontrolable.

(techcrunch.com)

IA espionaje chino robo de algoritmos

Google DeepMind presenta los modelos de IA Gemini Robotics para un control preciso de robots

2025-03-12

Google DeepMind anunció dos nuevos modelos de IA diseñados para controlar robots: Gemini Robotics y Gemini Robotics-ER. Estos modelos, basados en el modelo de lenguaje grande Gemini 2.0, incorporan capacidades de visión-lenguaje-acción (VLA) y razonamiento espacial mejorado. Gemini Robotics permite a los robots comprender y ejecutar comandos complejos, como "coge el plátano y ponlo en la cesta", mientras que Gemini Robotics-ER se centra en la integración perfecta con los sistemas de control de robots existentes. Esto representa un avance significativo en la robótica, particularmente en el manejo de manipulaciones físicas complejas y en la demostración de fuertes capacidades de generalización. Google se ha asociado con Apptronik para construir la próxima generación de robots humanoides utilizando Gemini 2.0, mostrando el potencial de adopción generalizada. Sin embargo, Google también enfatiza la seguridad, lanzando el conjunto de datos "ASIMOV" para ayudar a los investigadores a evaluar las implicaciones de seguridad de las acciones robóticas.

(arstechnica.com)

IA

Gemini 2.0 Flash: El modelo de generación de imágenes nativo de Google entra en fase de experimentación para desarrolladores

2025-03-12

Google ha lanzado Gemini 2.0 Flash, un modelo de IA multimodal con razonamiento mejorado y comprensión del lenguaje natural, capaz de generar imágenes. Puede crear historias con texto e imágenes, permite la edición de imágenes a través de conversaciones y genera imágenes con secuencias de texto largas y bien formateadas. Disponible para experimentación por desarrolladores en Google AI Studio y en la API de Gemini, Gemini 2.0 Flash promete posibilidades emocionantes para la creación de agentes de IA y aplicaciones visualmente ricas.

(developers.googleblog.com)

IA Generación de imágenes con IA

Google DeepMind presenta Gemini Robotics: Impulsando la próxima generación de robots

2025-03-12

Google DeepMind ha lanzado dos nuevos modelos de IA basados en Gemini 2.0: Gemini Robotics y Gemini Robotics-ER, que permiten a los robots realizar una gama más amplia de tareas del mundo real. Gemini Robotics es un modelo avanzado de visión-lenguaje-acción que controla directamente a los robots; Gemini Robotics-ER cuenta con una comprensión espacial avanzada, permitiendo a los robotistas ejecutar sus propios programas utilizando las capacidades de razonamiento encarnado de Gemini. Ambos modelos se caracterizan por su generalidad, interactividad y destreza, capaces de manejar diversas tareas y entornos, y colaborar mejor con los humanos. DeepMind también lanzó un nuevo conjunto de datos, ASIMOV, para evaluar y mejorar la seguridad semántica en IA encarnada y robótica, y se ha asociado con empresas como Apptronik para desarrollar la próxima generación de robots humanoides.

(deepmind.google)

IA IA Encarnada

Category: IA