Jobs do Cloud Run agora com GPUs: Desbloqueando o poder do processamento em lote

2025-06-04
Jobs do Cloud Run agora com GPUs: Desbloqueando o poder do processamento em lote

O Google Cloud Run agora oferece suporte a GPU para seus jobs, abrindo novas possibilidades para processamento em lote e tarefas assíncronas. Isso permite o ajuste fino eficiente de modelos, inferência em lote de IA em larga escala e processamento de mídia de alta produção. Empresas como vivo, Wayfair e Midjourney adotaram a solução e relataram economias significativas de custos e melhorias de desempenho. O serviço permite que os desenvolvedores se concentrem na inovação, deixando a gerência de infraestrutura por conta do Google.

Leia mais
Desenvolvimento Processamento em Lote

Text-to-SQL do Gemini: Desafios e Soluções

2025-05-16
Text-to-SQL do Gemini: Desafios e Soluções

Embora a funcionalidade de texto para SQL do Google Gemini impressione inicialmente, os aplicativos do mundo real revelam desafios significativos. Primeiro, o modelo precisa entender o contexto específico do negócio, incluindo o esquema do banco de dados, o significado dos dados e a lógica de negócios. O simples ajuste fino do modelo luta para lidar com as variações em bancos de dados e dados. Em segundo lugar, a ambiguidade da linguagem natural dificulta a compreensão precisa da intenção do usuário pelo modelo, exigindo ajustes com base no contexto, no tipo de usuário e nas capacidades do modelo. Finalmente, as diferenças entre os dialetos SQL representam um desafio para a geração de código SQL preciso. O Google Cloud aborda esses desafios por meio de recuperação inteligente de dados, camadas semânticas, desambiguação LLM, validação de autoconsistência do modelo e outras técnicas, melhorando continuamente a precisão e confiabilidade do texto para SQL do Gemini.

Leia mais

Rapid Storage: Armazenamento com Latência Submilisegundos Baseado em Colossus

2025-04-10
Rapid Storage: Armazenamento com Latência Submilisegundos Baseado em Colossus

O Rapid Storage do Google utiliza a arquitetura Colossus para atingir uma incrível taxa de transferência de 20 milhões de solicitações por segundo, fornecendo latência submilisegundos para leitura e gravação, especialmente benéfico para aplicações de IA/ML. Usando streaming gRPC e um protocolo com estado, o Rapid Storage melhora drasticamente a eficiência de acesso a dados, evitando que a latência de armazenamento bloqueie aceleradores durante o pré-treinamento de modelos, por exemplo. Sua tolerância a falhas robusta garante a consistência e continuidade dos dados mesmo com falhas de cliente ou servidor, permitindo anexos ilimitados e a retomada de operações interrompidas. Isso o torna uma solução poderosa para processamento de dados em larga escala.

Leia mais

Google Cloud lança atualizações importantes para o software AI Hypercomputer

2025-04-10
Google Cloud lança atualizações importantes para o software AI Hypercomputer

O Google Cloud anunciou atualizações significativas no software do seu AI Hypercomputer, melhorando drasticamente a eficiência do treinamento e inferência de modelos de IA. O Pathways on Cloud, um tempo de execução distribuído, agora está disponível no Google Cloud, permitindo treinamento elástico e inferência de alto rendimento. O Cluster Director adiciona suporte ao Slurm e recursos de observabilidade 360° para alto desempenho e confiabilidade. O GKE integra o Inference Gateway e o Inference Quickstart, reduzindo significativamente os custos de inferência e aumentando a taxa de transferência. O vLLM agora suporta TPUs, acelerando ainda mais a inferência. O Dynamic Workload Scheduler expande o suporte a aceleradores, otimizando a utilização de recursos. Essas atualizações permitem que os desenvolvedores criem e implantem aplicativos de IA mais rápido e de forma mais econômica.

Leia mais

Depurador de viagem no tempo da Microsoft: Um mergulho profundo no TTD

2025-03-13
Depurador de viagem no tempo da Microsoft: Um mergulho profundo no TTD

O Time Travel Debugging (TTD) da Microsoft é uma poderosa estrutura de gravação e reprodução no modo usuário que permite aos desenvolvedores depurar programas como se estivessem navegando em uma linha do tempo. Ele injeta um DLL para capturar todos os estados da execução de um processo, armazenando-os em um arquivo .trace. O núcleo é o mecanismo de runtime Nirvana, que emula instruções de CPU para controle de grão fino. Mesmo com desafios como operações de ponto flutuante, modelos de memória, emulação de periféricos e código automodificável, o Nirvana usa tradução binária dinâmica e técnicas de cache de código para eficiência e precisão. O artigo descreve um bug encontrado ao depurar um arquivo PE de 32 bits ofuscado usando o TTD, destacando a vantagem de usar o próprio arquivo de rastreamento do TTD para depuração.

Leia mais
Desenvolvimento Reproduçao de Código

Ofuscação de código Go: Uma abordagem de máquina de estado para descriptografia de dados dinâmica

2025-03-06
Ofuscação de código Go: Uma abordagem de máquina de estado para descriptografia de dados dinâmica

Este código Go implementa uma técnica avançada de ofuscação de código usando uma máquina de estado e índices aleatórios para descriptografia de dados dinâmica. Os dados são divididos aleatoriamente em pedaços, e uma sequência de índices aleatórios controla a ordem de descriptografia. Uma chave de descriptografia dependente do estado é usada para descriptografar cada pedaço sequencialmente, reconstruindo finalmente os dados originais. Essa abordagem aumenta significativamente a dificuldade de engenharia reversa, protegendo efetivamente a segurança do código.

Leia mais
Desenvolvimento ofuscação de código

Hackers russos exploram o recurso 'Dispositivos Vinculados' do Signal para ataques de phishing

2025-02-19
Hackers russos exploram o recurso 'Dispositivos Vinculados' do Signal para ataques de phishing

Hackers alinhados com a Rússia estão explorando o recurso 'Dispositivos Vinculados' do Signal para ataques de phishing em larga escala. Os atacantes criam códigos QR maliciosos disfarçados de recursos legítimos do Signal, como convites para grupos ou alertas de segurança. A digitalização desses códigos vincula as contas das vítimas a instâncias do Signal controladas pelos atacantes, permitindo a escuta clandestina em tempo real de conversas. Essa técnica, usada por grupos como o APT44, visa até mesmo militares ucranianos. A natureza furtiva e a falta de defesas eficazes tornam este um ataque de alto risco e baixa assinatura que pode passar despercebido por longos períodos.

Leia mais

Nova Sintaxe de Consulta em Pipe do BigQuery: Mais fácil de ler, escrever e manter

2025-02-13
Nova Sintaxe de Consulta em Pipe do BigQuery: Mais fácil de ler, escrever e manter

O Google BigQuery apresenta uma nova sintaxe de consulta em pipe que simplifica a escrita e a manutenção de consultas SQL com uma estrutura linear. Essa sintaxe permite aplicar operadores como SELECT, agregação, GROUP BY, JOIN e WHERE em qualquer ordem e quantas vezes forem necessárias, resultando em uma lógica de consulta mais clara e compreensível. Ela resolve problemas no SQL padrão, como a ordem estrita das cláusulas, a necessidade de CTEs ou subconsultas aninhadas para consultas complexas, e introduz novos operadores de pipe como EXTEND, SET, DROP e RENAME para maior flexibilidade na manipulação de dados.

Leia mais
Desenvolvimento Sintaxe em Pipe

Desvendando o ScatterBrain: Uma Análise Profunda do Sofisticado Ofuscador do Shadowpad

2025-02-02
Desvendando o ScatterBrain: Uma Análise Profunda do Sofisticado Ofuscador do Shadowpad

POISONPLUG.SHADOW (Shadowpad), uma família de malware identificada pela Kaspersky, usa um compilador ofuscador personalizado, o ScatterBrain, para escapar da detecção. O Grupo de Inteligência de Ameaças do Google (GTIG) e a equipe FLARE colaboraram para realizar engenharia reversa do ScatterBrain, criando um desofuscador estático independente. Esse desofuscador lida com os três modos de proteção do ScatterBrain (Seletivo, Completo, Completo "sem cabeçalho"), neutralizando sua ofuscação do gráfico de fluxo de controle, mutações de instruções e proteção da tabela de importação. Essa pesquisa aprimora significativamente a capacidade de analisar e combater malwares sofisticados como o Shadowpad.

Leia mais
Tecnologia Desofuscação

gRPC vs REST: Escolhendo o Modelo de Design de API Certo

2025-01-23
gRPC vs REST: Escolhendo o Modelo de Design de API Certo

Este artigo mergulha em gRPC e REST, dois modelos principais de design de API, e o papel do OpenAPI. O gRPC, baseado no modelo RPC, oculta detalhes de dados, enquanto o REST, baseado em HTTP, é orientado a recursos. Muitas APIs combinam inteligentemente os pontos fortes de ambos, usando uma abordagem orientada a entidades, mas implementada com gRPC. O artigo compara três maneiras de usar HTTP para APIs: REST, gRPC e OpenAPI, descrevendo suas vantagens e desvantagens, sugerindo, por fim, a escolha da melhor abordagem com base em necessidades específicas. O gRPC oferece desempenho superior, mas requer software especial; o OpenAPI é flexível, mas complexo de projetar; o REST é simples e direto, mas menos usado. A escolha envolve pesar os requisitos do projeto, a pilha de tecnologia da equipe e a manutenibilidade.

Leia mais
Desenvolvimento Design de API