Trabajos de Cloud Run ahora con GPUs: Desatando el poder del procesamiento por lotes

2025-06-04
Trabajos de Cloud Run ahora con GPUs: Desatando el poder del procesamiento por lotes

Google Cloud Run ahora ofrece soporte para GPU en sus trabajos, abriendo nuevas posibilidades para el procesamiento por lotes y las tareas asíncronas. Esto permite el ajuste fino eficiente de modelos, la inferencia por lotes de IA a gran escala y el procesamiento de medios de alta producción. Empresas como vivo, Wayfair y Midjourney han adoptado la solución y han reportado ahorros significativos de costos y mejoras en el rendimiento. El servicio permite a los desarrolladores concentrarse en la innovación, dejando la gestión de la infraestructura en manos de Google.

Leer más

Text-to-SQL de Gemini: Desafíos y Soluciones

2025-05-16
Text-to-SQL de Gemini: Desafíos y Soluciones

Si bien la funcionalidad de texto a SQL de Google Gemini inicialmente impresiona, las aplicaciones del mundo real revelan desafíos significativos. En primer lugar, el modelo necesita comprender el contexto específico del negocio, incluyendo el esquema de la base de datos, el significado de los datos y la lógica de negocios. El simple ajuste fino del modelo lucha por manejar las variaciones en las bases de datos y los datos. En segundo lugar, la ambigüedad del lenguaje natural dificulta que el modelo comprenda con precisión la intención del usuario, lo que requiere ajustes basados en el contexto, el tipo de usuario y las capacidades del modelo. Finalmente, las diferencias entre los dialectos SQL representan un desafío para generar código SQL preciso. Google Cloud aborda estos desafíos mediante la recuperación inteligente de datos, las capas semánticas, la desambiguación LLM, la validación de autoconsistencia del modelo y otras técnicas, mejorando continuamente la precisión y confiabilidad del texto a SQL de Gemini.

Leer más

Rapid Storage: Almacenamiento de Baja Latencia Basado en Colossus

2025-04-10
Rapid Storage: Almacenamiento de Baja Latencia Basado en Colossus

El Rapid Storage de Google aprovecha la arquitectura Colossus para lograr un increíble rendimiento de 20 millones de solicitudes por segundo, proporcionando latencia de submilisegundos para lectura y escritura, especialmente beneficioso para aplicaciones de IA/ML. Utilizando transmisión por secuencias gRPC y un protocolo con estado, Rapid Storage mejora drásticamente la eficiencia del acceso a datos, evitando que la latencia de almacenamiento bloquee los aceleradores durante el preentrenamiento de modelos, por ejemplo. Su robusta tolerancia a fallas garantiza la consistencia y continuidad de los datos incluso con fallas de cliente o servidor, permitiendo anexos ilimitados y la reanudación de operaciones interrumpidas. Esto lo convierte en una solución poderosa para el procesamiento de datos a gran escala.

Leer más

Google Cloud presenta importantes actualizaciones de software para AI Hypercomputer

2025-04-10
Google Cloud presenta importantes actualizaciones de software para AI Hypercomputer

Google Cloud anunció actualizaciones significativas en el software de su AI Hypercomputer, mejorando drásticamente la eficiencia del entrenamiento e inferencia de modelos de IA. Pathways on Cloud, un tiempo de ejecución distribuido, ahora está disponible en Google Cloud, permitiendo entrenamiento elástico e inferencia de alto rendimiento. Cluster Director agrega soporte para Slurm y funciones de observabilidad 360° para alto rendimiento y confiabilidad. GKE integra Inference Gateway e Inference Quickstart, reduciendo significativamente los costos de inferencia y aumentando el rendimiento. vLLM ahora admite TPUs, acelerando aún más la inferencia. Dynamic Workload Scheduler amplía el soporte para aceleradores, optimizando la utilización de recursos. Estas actualizaciones permiten a los desarrolladores crear e implementar aplicaciones de IA más rápido y de manera más económica.

Leer más

El depurador de viaje en el tiempo de Microsoft: Una inmersión profunda en TTD

2025-03-13
El depurador de viaje en el tiempo de Microsoft: Una inmersión profunda en TTD

El Time Travel Debugging (TTD) de Microsoft es un potente marco de grabación y reproducción en modo usuario que permite a los desarrolladores depurar programas como si estuvieran navegando en una línea de tiempo. Inyecta un DLL para capturar todos los estados de la ejecución de un proceso, almacenándolos en un archivo .trace. El núcleo es el motor de tiempo de ejecución Nirvana, que emula instrucciones de CPU para un control de grano fino. Incluso con desafíos como operaciones de punto flotante, modelos de memoria, emulación de periféricos y código automodificable, Nirvana utiliza la traducción binaria dinámica y las técnicas de almacenamiento en caché de código para lograr eficiencia y precisión. El artículo describe un error encontrado al depurar un archivo PE de 32 bits ofuscado usando TTD, destacando la ventaja de usar el propio archivo de rastreo de TTD para la depuración.

Leer más

Ofuscación de código Go: Un enfoque de máquina de estado para el descifrado dinámico de datos

2025-03-06
Ofuscación de código Go: Un enfoque de máquina de estado para el descifrado dinámico de datos

Este código Go implementa una técnica avanzada de ofuscación de código utilizando una máquina de estado e índices aleatorios para el descifrado dinámico de datos. Los datos se dividen aleatoriamente en fragmentos, y una secuencia de índices aleatorios controla el orden de descifrado. Se utiliza una clave de descifrado dependiente del estado para descifrar cada fragmento secuencialmente, reconstruyendo finalmente los datos originales. Este enfoque aumenta significativamente la dificultad de la ingeniería inversa, protegiendo eficazmente la seguridad del código.

Leer más

Hackers rusos explotan la función 'Dispositivos vinculados' de Signal para ataques de phishing

2025-02-19
Hackers rusos explotan la función 'Dispositivos vinculados' de Signal para ataques de phishing

Hackers alineados con Rusia están explotando la función 'Dispositivos vinculados' de Signal para ataques de phishing a gran escala. Los atacantes crean códigos QR maliciosos disfrazados de recursos legítimos de Signal, como invitaciones a grupos o alertas de seguridad. Escanear estos códigos vincula las cuentas de las víctimas a instancias de Signal controladas por los atacantes, permitiendo la escucha clandestina en tiempo real de conversaciones. Esta técnica, utilizada por grupos como APT44, incluso apunta a militares ucranianos. La naturaleza sigilosa y la falta de defensas eficaces hacen de este un ataque de alto riesgo y baja firma que puede pasar desapercibido durante largos períodos.

Leer más

Nueva sintaxis de consulta en canalización de BigQuery: Más fácil de leer, escribir y mantener

2025-02-13
Nueva sintaxis de consulta en canalización de BigQuery: Más fácil de leer, escribir y mantener

Google BigQuery presenta una nueva sintaxis de consulta en canalización que simplifica la escritura y el mantenimiento de consultas SQL con una estructura lineal. Esta sintaxis permite aplicar operadores como SELECT, agregación, GROUP BY, JOIN y WHERE en cualquier orden y tantas veces como sea necesario, lo que resulta en una lógica de consulta más clara y comprensible. Resuelve problemas en el SQL estándar, como el orden estricto de las cláusulas, la necesidad de CTE o subconsultas anidadas para consultas complejas, e introduce nuevos operadores de canalización como EXTEND, SET, DROP y RENAME para una mayor flexibilidad en la manipulación de datos.

Leer más

Descifrando ScatterBrain: Una Inmersión Profunda en el Sofisticado Ofuscador de Shadowpad

2025-02-02
Descifrando ScatterBrain: Una Inmersión Profunda en el Sofisticado Ofuscador de Shadowpad

POISONPLUG.SHADOW (Shadowpad), una familia de malware identificada por Kaspersky, utiliza un compilador ofuscador personalizado, ScatterBrain, para evadir la detección. El Grupo de Inteligencia de Amenazas de Google (GTIG) y el equipo FLARE colaboraron para realizar ingeniería inversa de ScatterBrain, creando un desofuscador estático independiente. Este desofuscador maneja los tres modos de protección de ScatterBrain (Selectivo, Completo, Completo "sin encabezado"), neutralizando su ofuscación del gráfico de flujo de control, mutaciones de instrucciones y protección de la tabla de importación. Esta investigación mejora significativamente la capacidad de analizar y contrarrestar malware sofisticado como Shadowpad.

Leer más
Tecnología Desofuscador

gRPC vs REST: Elegir el Modelo de Diseño de API Adecuado

2025-01-23
gRPC vs REST: Elegir el Modelo de Diseño de API Adecuado

Este artículo analiza gRPC y REST, dos modelos principales de diseño de API, y el papel de OpenAPI. gRPC, basado en el modelo RPC, oculta los detalles de los datos, mientras que REST, basado en HTTP, está orientado a recursos. Muchas API combinan inteligentemente las fortalezas de ambos, utilizando un enfoque orientado a entidades, pero implementado con gRPC. El artículo compara tres formas de usar HTTP para API: REST, gRPC y OpenAPI, describiendo sus ventajas y desventajas, y finalmente sugiriendo elegir el mejor enfoque según las necesidades específicas. gRPC ofrece un rendimiento superior, pero requiere software especial; OpenAPI es flexible, pero complejo de diseñar; REST es simple e intuitivo, pero menos utilizado. La elección implica sopesar los requisitos del proyecto, la pila de tecnología del equipo y la capacidad de mantenimiento.

Leer más
Desarrollo Diseño de API