Servidor MCP de Data Commons se lanza públicamente: Un nuevo motor de datos para aplicaciones de IA

2025-09-24
Servidor MCP de Data Commons se lanza públicamente: Un nuevo motor de datos para aplicaciones de IA

Data Commons de Google ha lanzado públicamente su servidor MCP, una interfaz estandarizada que permite a los agentes de IA acceder directamente a los vastos conjuntos de datos públicos de Data Commons. Esto simplifica el acceso a los datos, acelera el desarrollo de aplicaciones de IA ricas en datos y ayuda a reducir las alucinaciones de los modelos de lenguaje grandes. Un ejemplo exitoso es el Agente ONE Data, desarrollado en colaboración con ONE Campaign, que utiliza el servidor MCP para buscar rápidamente decenas de millones de puntos de datos de financiación sanitaria, empoderando la defensa de la salud global. El servidor MCP se integra perfectamente en varios flujos de trabajo de desarrollo de IA, como el ADK y el Gemini CLI de Google Cloud Platform.

Leer más
IA

Gemini 2.5 Flash Image: Avance de Google en IA para Generación de Imágenes

2025-08-26
Gemini 2.5 Flash Image: Avance de Google en IA para Generación de Imágenes

Google presentó Gemini 2.5 Flash Image, un modelo de vanguardia para la generación y edición de imágenes. Permite fusionar varias imágenes, mantener la coherencia de los personajes para narrativas más ricas, realizar transformaciones precisas con lenguaje natural y aprovechar el conocimiento del mundo de Gemini para generar y editar imágenes. Con un precio de US$ 30,00 por 1 millón de tokens de salida (aproximadamente US$ 0,039 por imagen), está disponible a través de la API Gemini y Google AI Studio para desarrolladores, y Vertex AI para empresas. El 'modo de construcción' de Google AI Studio también se actualizó significativamente para simplificar la creación de aplicaciones. Características clave incluyen la coherencia de los personajes, la edición de imágenes basada en indicaciones y el conocimiento nativo del mundo, abriendo nuevas posibilidades en la generación y manipulación de imágenes.

Leer más
IA

Gemma 3 270M: Un Modelo de IA Pequeño Pero Poderoso para Aplicaciones Personalizadas

2025-08-14
Gemma 3 270M: Un Modelo de IA Pequeño Pero Poderoso para Aplicaciones Personalizadas

La familia Gemma recibe a su nuevo miembro: Gemma 3 270M, un modelo de IA compacto de 270 millones de parámetros diseñado para el ajuste fino específico de tareas. Heredando la arquitectura avanzada de la serie Gemma 3, cuenta con sólidas capacidades de seguimiento de instrucciones y estructuración de texto, además de consumir una potencia notablemente baja: solo el 0,75% de la batería para 25 conversaciones en un SoC Pixel 9 Pro. Sus impresionantes habilidades de seguimiento de instrucciones brillan en los puntos de referencia IFEval, haciendo que la IA avanzada sea más accesible para aplicaciones en dispositivos e investigación. Gemma 3 270M sobresale en tareas de alto volumen y bien definidas, como el análisis de sentimientos y la extracción de entidades, y es ideal para escenarios que requieren iteración e implementación rápidas. Los desarrolladores pueden aprovechar su pequeño tamaño para experimentos rápidos de ajuste fino, creando flotas de modelos especializados para construir sistemas de producción eficientes y rentables.

Leer más

Gemini Embedding: Impulsando la próxima generación de agentes de IA

2025-08-01
Gemini Embedding: Impulsando la próxima generación de agentes de IA

Desde su lanzamiento, el modelo de texto Gemini Embedding de Google ha sido rápidamente adoptado por desarrolladores que crean aplicaciones de IA avanzadas. Más allá de los usos tradicionales, como la clasificación y la búsqueda semántica, es crucial para la 'ingeniería de contexto', proporcionando a los agentes de IA un contexto operativo completo. Empresas como Box, re:cap, Everlaw, Roo Code, Mindlid e Interaction Co. ya están aprovechando su poder para mejorar la precisión, la velocidad y la conciencia contextual en sus productos. Desde impulsar el análisis de datos financieros hasta mejorar el descubrimiento legal y alimentar asistentes de IA, el alto rendimiento y el soporte multilingüe de Gemini Embedding están sentando las bases para la próxima generación de agentes inteligentes.

Leer más

Anunciado el cierre de Google URL Shortener

2025-07-25
Anunciado el cierre de Google URL Shortener

Google cerrará su servicio de acortamiento de URL, goo.gl, el 25 de agosto de 2025. A partir del 23 de agosto de 2024, algunos enlaces goo.gl mostrarán una página de notificación que advierte a los usuarios sobre el cierre inminente. Se insta a los desarrolladores a migrar a servicios de acortamiento de URL alternativos. Los enlaces goo.gl generados a través de aplicaciones de Google seguirán funcionando.

Leer más
Desarrollo Acortador de URL

Modo Lote para la API Gemini: Procesamiento de Alto Rendimiento

2025-07-11
Modo Lote para la API Gemini: Procesamiento de Alto Rendimiento

La API Gemini de Google ahora ofrece un modo lote, un punto final asíncrono ideal para tareas de alto rendimiento donde la latencia no es crítica. Envía trabajos grandes, deja que el sistema maneje el procesamiento y recupera los resultados en un plazo de 24 horas con un 50% de descuento en comparación con las API sincrónicas. Perfecto para datos preparados previamente que no necesitan una respuesta inmediata, ofrece ahorro de costes, mayor rendimiento y llamadas a la API simplificadas. Reforged Labs lo utiliza para procesar grandes cantidades de anuncios de vídeo, mejorando significativamente la eficiencia y reduciendo costes. Empieza fácilmente con el Google GenAI Python SDK.

Leer más

Google DeepMind lanza GenAI Processors: Simplificando el desarrollo de aplicaciones de LLM

2025-07-11
Google DeepMind lanza GenAI Processors: Simplificando el desarrollo de aplicaciones de LLM

Google DeepMind ha lanzado GenAI Processors, una biblioteca de Python de código abierto diseñada para simplificar el desarrollo de aplicaciones complejas de Modelos de Lenguaje Grandes (LLM). La biblioteca utiliza una interfaz Processor para abstraer varias etapas de procesamiento de datos y maneja la entrada multimodal mediante el procesamiento de flujo asíncrono, lo que permite la ejecución concurrente para una mayor capacidad de respuesta y eficiencia. GenAI Processors se integra con la API de Gemini y proporciona ejemplos para construir aplicaciones en tiempo real, como la transcripción en vivo y los agentes conversacionales.

Leer más
Desarrollo

Gemma 3n: Lanzamiento del potente modelo de IA para dispositivos móviles

2025-06-27
Gemma 3n: Lanzamiento del potente modelo de IA para dispositivos móviles

Gemma 3n, un potente modelo de IA multimodal para dispositivos móviles, ¡ya está totalmente disponible! Construido con la innovadora arquitectura MatFormer, admite entradas de imagen, audio, vídeo y texto, ejecutándose con huellas de memoria increíblemente bajas (2 GB para E2B y 3 GB para E4B). Gemma 3n admite 140 idiomas para el procesamiento de texto y 35 idiomas para la comprensión multimodal, alcanzando una puntuación LMArena superior a 1300. Su arquitectura eficiente y la tecnología Per-Layer Embeddings permiten un rendimiento excepcional en diversas tareas, ofreciendo a los desarrolladores una comodidad sin precedentes e inaugurando una nueva era para la IA móvil.

Leer más
IA

Google AI Studio: Desarrollo de aplicaciones de IA potenciado con Gemini 2.5 Pro

2025-05-21
Google AI Studio: Desarrollo de aplicaciones de IA potenciado con Gemini 2.5 Pro

Google AI Studio recibió una importante actualización, integrando el modelo Gemini 2.5 Pro para una generación de código significativamente mejorada. Los desarrolladores pueden crear e implementar rápidamente aplicaciones web impulsadas por IA utilizando prompts simples de texto, imagen o vídeo. La nueva versión también incorpora modelos multimodales como Imagen, Lyria RealTime y Veo, ofreciendo implementación con un solo clic en Cloud Run, y comparación y reversión convenientes de versiones de código. Además, el nuevo soporte de audio nativo y una herramienta de Contexto de URL mejoran la interactividad y la recuperación de información.

Leer más
Desarrollo

Google presenta Gemma 3n: Un modelo de IA ligero y multimodal para móviles

2025-05-20
Google presenta Gemma 3n: Un modelo de IA ligero y multimodal para móviles

Google ha lanzado Gemma 3n, un nuevo modelo abierto construido sobre una arquitectura innovadora diseñada para llevar las potentes capacidades de IA a los dispositivos móviles. Gemma 3n cuenta con un menor uso de memoria y tiempos de respuesta más rápidos, admite la comprensión multimodal (texto, imagen, audio) y sólidas capacidades multilingües. Los desarrolladores pueden acceder a una vista previa a través de Google AI Studio y Google AI Edge para crear aplicaciones que aprovechen las funciones de Gemma 3n, incluida la transcripción de voz en tiempo real, la traducción y la comprensión de imágenes. El modelo prioriza la privacidad y funciona sin conexión.

Leer más

Vista previa de Gemini 2.5 Pro (edición I/O) lanzada antes de tiempo: capacidades de codificación mejoradas

2025-05-06
Vista previa de Gemini 2.5 Pro (edición I/O) lanzada antes de tiempo: capacidades de codificación mejoradas

Google ha lanzado una vista previa anticipada de Gemini 2.5 Pro (edición I/O), con capacidades de codificación significativamente mejoradas, particularmente en el desarrollo de front-end y UI. Ocupa el puesto nº 1 en la clasificación de WebDev Arena por generar aplicaciones web estéticamente agradables y funcionales. Las principales mejoras incluyen la funcionalidad de vídeo a código, un desarrollo de funciones más fácil y flujos de trabajo más rápidos de concepto a aplicación funcional. Los desarrolladores pueden acceder a él a través de la API de Gemini en Google AI Studio o Vertex AI para usuarios empresariales. Esta actualización también soluciona errores anteriores y mejora la fiabilidad de las llamadas a funciones.

Leer más

Gemma 3: IA de vanguardia ahora accesible en tu escritorio

2025-04-20
Gemma 3: IA de vanguardia ahora accesible en tu escritorio

Gemma 3, un modelo de IA de vanguardia y código abierto, inicialmente requería GPUs de alta gama. Para mejorar la accesibilidad, se han lanzado nuevas versiones optimizadas con entrenamiento consciente de la cuantización (QAT), que reducen drásticamente los requisitos de memoria manteniendo una alta calidad. Esto permite ejecutar modelos potentes como el Gemma 3 de 27B en GPUs de consumo, como la NVIDIA RTX 3090. Estos modelos optimizados están disponibles en Hugging Face y Kaggle, facilitando su integración en diversos flujos de trabajo.

Leer más

Google presenta Gemini 2.5 Flash: Un modelo de IA con razonamiento controlable

2025-04-17
Google presenta Gemini 2.5 Flash: Un modelo de IA con razonamiento controlable

Google ha lanzado Gemini 2.5 Flash, un nuevo modelo de lenguaje grande con capacidades de razonamiento controlable. Basado en el popular 2.0 Flash, mejora significativamente el razonamiento priorizando la velocidad y la rentabilidad. Los desarrolladores pueden ajustar un 'presupuesto de pensamiento' para equilibrar calidad, costo y latencia. El modelo ajusta automáticamente su proceso de pensamiento según la complejidad del prompt, ofreciendo modos que van desde ningún pensamiento hasta un razonamiento intensivo. Gemini 2.5 Flash destaca en las Hard Prompts de LMArena, con una excelente relación calidad-precio, convirtiéndolo en uno de los modelos de pensamiento más rentables disponibles.

Leer más

Agent2Agent (A2A): Una Nueva Era de Interoperabilidad de Agentes de IA

2025-04-09
Agent2Agent (A2A): Una Nueva Era de Interoperabilidad de Agentes de IA

Google lanza Agent2Agent (A2A), un protocolo abierto que permite la colaboración fluida entre agentes de IA creados por diferentes proveedores o utilizando diferentes marcos. Respaldado por más de 50 socios tecnológicos y proveedores de servicios, A2A permite el intercambio seguro de información y acciones coordinadas, aumentando la productividad y reduciendo los costos. Construido sobre estándares existentes, A2A admite múltiples modalidades, prioriza la seguridad y maneja tareas de larga duración. Los casos de uso van desde la automatización de procesos de contratación (por ejemplo, selección de candidatos y programación de entrevistas) hasta la optimización de flujos de trabajo complejos en diversas aplicaciones empresariales. Su naturaleza de código abierto fomenta un ecosistema próspero de agentes de IA colaborativos.

Leer más
IA

Gemini 2.0 Flash: El modelo de generación de imágenes nativo de Google entra en fase de experimentación para desarrolladores

2025-03-12
Gemini 2.0 Flash: El modelo de generación de imágenes nativo de Google entra en fase de experimentación para desarrolladores

Google ha lanzado Gemini 2.0 Flash, un modelo de IA multimodal con razonamiento mejorado y comprensión del lenguaje natural, capaz de generar imágenes. Puede crear historias con texto e imágenes, permite la edición de imágenes a través de conversaciones y genera imágenes con secuencias de texto largas y bien formateadas. Disponible para experimentación por desarrolladores en Google AI Studio y en la API de Gemini, Gemini 2.0 Flash promete posibilidades emocionantes para la creación de agentes de IA y aplicaciones visualmente ricas.

Leer más