Webtagr - Resumen de noticias de tecnología

Trabajos de Cloud Run ahora con GPUs: Desatando el poder del procesamiento por lotes

2025-06-04

Google Cloud Run ahora ofrece soporte para GPU en sus trabajos, abriendo nuevas posibilidades para el procesamiento por lotes y las tareas asíncronas. Esto permite el ajuste fino eficiente de modelos, la inferencia por lotes de IA a gran escala y el procesamiento de medios de alta producción. Empresas como vivo, Wayfair y Midjourney han adoptado la solución y han reportado ahorros significativos de costos y mejoras en el rendimiento. El servicio permite a los desarrolladores concentrarse en la innovación, dejando la gestión de la infraestructura en manos de Google.

(cloud.google.com)

Desarrollo Procesamiento por lotes

Text-to-SQL de Gemini: Desafíos y Soluciones

2025-05-16

Si bien la funcionalidad de texto a SQL de Google Gemini inicialmente impresiona, las aplicaciones del mundo real revelan desafíos significativos. En primer lugar, el modelo necesita comprender el contexto específico del negocio, incluyendo el esquema de la base de datos, el significado de los datos y la lógica de negocios. El simple ajuste fino del modelo lucha por manejar las variaciones en las bases de datos y los datos. En segundo lugar, la ambigüedad del lenguaje natural dificulta que el modelo comprenda con precisión la intención del usuario, lo que requiere ajustes basados en el contexto, el tipo de usuario y las capacidades del modelo. Finalmente, las diferencias entre los dialectos SQL representan un desafío para generar código SQL preciso. Google Cloud aborda estos desafíos mediante la recuperación inteligente de datos, las capas semánticas, la desambiguación LLM, la validación de autoconsistencia del modelo y otras técnicas, mejorando continuamente la precisión y confiabilidad del texto a SQL de Gemini.

(cloud.google.com)

IA Texto a SQL

Rapid Storage: Almacenamiento de Baja Latencia Basado en Colossus

2025-04-10

El Rapid Storage de Google aprovecha la arquitectura Colossus para lograr un increíble rendimiento de 20 millones de solicitudes por segundo, proporcionando latencia de submilisegundos para lectura y escritura, especialmente beneficioso para aplicaciones de IA/ML. Utilizando transmisión por secuencias gRPC y un protocolo con estado, Rapid Storage mejora drásticamente la eficiencia del acceso a datos, evitando que la latencia de almacenamiento bloquee los aceleradores durante el preentrenamiento de modelos, por ejemplo. Su robusta tolerancia a fallas garantiza la consistencia y continuidad de los datos incluso con fallas de cliente o servidor, permitiendo anexos ilimitados y la reanudación de operaciones interrumpidas. Esto lo convierte en una solución poderosa para el procesamiento de datos a gran escala.

(cloud.google.com)

Tecnología Almacenamiento en la Nube

Google Cloud presenta importantes actualizaciones de software para AI Hypercomputer

2025-04-10

Google Cloud anunció actualizaciones significativas en el software de su AI Hypercomputer, mejorando drásticamente la eficiencia del entrenamiento e inferencia de modelos de IA. Pathways on Cloud, un tiempo de ejecución distribuido, ahora está disponible en Google Cloud, permitiendo entrenamiento elástico e inferencia de alto rendimiento. Cluster Director agrega soporte para Slurm y funciones de observabilidad 360° para alto rendimiento y confiabilidad. GKE integra Inference Gateway e Inference Quickstart, reduciendo significativamente los costos de inferencia y aumentando el rendimiento. vLLM ahora admite TPUs, acelerando aún más la inferencia. Dynamic Workload Scheduler amplía el soporte para aceleradores, optimizando la utilización de recursos. Estas actualizaciones permiten a los desarrolladores crear e implementar aplicaciones de IA más rápido y de manera más económica.

(cloud.google.com)

Tecnología eficiencia de inferencia

El depurador de viaje en el tiempo de Microsoft: Una inmersión profunda en TTD

2025-03-13

El Time Travel Debugging (TTD) de Microsoft es un potente marco de grabación y reproducción en modo usuario que permite a los desarrolladores depurar programas como si estuvieran navegando en una línea de tiempo. Inyecta un DLL para capturar todos los estados de la ejecución de un proceso, almacenándolos en un archivo .trace. El núcleo es el motor de tiempo de ejecución Nirvana, que emula instrucciones de CPU para un control de grano fino. Incluso con desafíos como operaciones de punto flotante, modelos de memoria, emulación de periféricos y código automodificable, Nirvana utiliza la traducción binaria dinámica y las técnicas de almacenamiento en caché de código para lograr eficiencia y precisión. El artículo describe un error encontrado al depurar un archivo PE de 32 bits ofuscado usando TTD, destacando la ventaja de usar el propio archivo de rastreo de TTD para la depuración.

(cloud.google.com)

Desarrollo Reproducción de código

Ofuscación de código Go: Un enfoque de máquina de estado para el descifrado dinámico de datos

2025-03-06

Este código Go implementa una técnica avanzada de ofuscación de código utilizando una máquina de estado e índices aleatorios para el descifrado dinámico de datos. Los datos se dividen aleatoriamente en fragmentos, y una secuencia de índices aleatorios controla el orden de descifrado. Se utiliza una clave de descifrado dependiente del estado para descifrar cada fragmento secuencialmente, reconstruyendo finalmente los datos originales. Este enfoque aumenta significativamente la dificultad de la ingeniería inversa, protegiendo eficazmente la seguridad del código.

(cloud.google.com)

Desarrollo ofuscamiento de código

Hackers rusos explotan la función 'Dispositivos vinculados' de Signal para ataques de phishing

2025-02-19

Hackers alineados con Rusia están explotando la función 'Dispositivos vinculados' de Signal para ataques de phishing a gran escala. Los atacantes crean códigos QR maliciosos disfrazados de recursos legítimos de Signal, como invitaciones a grupos o alertas de seguridad. Escanear estos códigos vincula las cuentas de las víctimas a instancias de Signal controladas por los atacantes, permitiendo la escucha clandestina en tiempo real de conversaciones. Esta técnica, utilizada por grupos como APT44, incluso apunta a militares ucranianos. La naturaleza sigilosa y la falta de defensas eficaces hacen de este un ataque de alto riesgo y baja firma que puede pasar desapercibido durante largos períodos.

(cloud.google.com)

Tecnología vulnerabilidad de Signal

Nueva sintaxis de consulta en canalización de BigQuery: Más fácil de leer, escribir y mantener

2025-02-13

Google BigQuery presenta una nueva sintaxis de consulta en canalización que simplifica la escritura y el mantenimiento de consultas SQL con una estructura lineal. Esta sintaxis permite aplicar operadores como SELECT, agregación, GROUP BY, JOIN y WHERE en cualquier orden y tantas veces como sea necesario, lo que resulta en una lógica de consulta más clara y comprensible. Resuelve problemas en el SQL estándar, como el orden estricto de las cláusulas, la necesidad de CTE o subconsultas anidadas para consultas complejas, e introduce nuevos operadores de canalización como EXTEND, SET, DROP y RENAME para una mayor flexibilidad en la manipulación de datos.

(cloud.google.com)

Desarrollo Sintaxis de canalización

Descifrando ScatterBrain: Una Inmersión Profunda en el Sofisticado Ofuscador de Shadowpad

2025-02-02

POISONPLUG.SHADOW (Shadowpad), una familia de malware identificada por Kaspersky, utiliza un compilador ofuscador personalizado, ScatterBrain, para evadir la detección. El Grupo de Inteligencia de Amenazas de Google (GTIG) y el equipo FLARE colaboraron para realizar ingeniería inversa de ScatterBrain, creando un desofuscador estático independiente. Este desofuscador maneja los tres modos de protección de ScatterBrain (Selectivo, Completo, Completo "sin encabezado"), neutralizando su ofuscación del gráfico de flujo de control, mutaciones de instrucciones y protección de la tabla de importación. Esta investigación mejora significativamente la capacidad de analizar y contrarrestar malware sofisticado como Shadowpad.

(cloud.google.com)

Tecnología Desofuscador

gRPC vs REST: Elegir el Modelo de Diseño de API Adecuado

2025-01-23

Este artículo analiza gRPC y REST, dos modelos principales de diseño de API, y el papel de OpenAPI. gRPC, basado en el modelo RPC, oculta los detalles de los datos, mientras que REST, basado en HTTP, está orientado a recursos. Muchas API combinan inteligentemente las fortalezas de ambos, utilizando un enfoque orientado a entidades, pero implementado con gRPC. El artículo compara tres formas de usar HTTP para API: REST, gRPC y OpenAPI, describiendo sus ventajas y desventajas, y finalmente sugiriendo elegir el mejor enfoque según las necesidades específicas. gRPC ofrece un rendimiento superior, pero requiere software especial; OpenAPI es flexible, pero complejo de diseñar; REST es simple e intuitivo, pero menos utilizado. La elección implica sopesar los requisitos del proyecto, la pila de tecnología del equipo y la capacidad de mantenimiento.

(cloud.google.com)

Desarrollo Diseño de API