Gemini 2.5 Flash Image: Avanço da IA do Google em Geração de Imagens

2025-08-26
Gemini 2.5 Flash Image: Avanço da IA do Google em Geração de Imagens

O Google lançou o Gemini 2.5 Flash Image, um modelo de última geração para geração e edição de imagens. Ele permite a combinação de várias imagens, mantém a consistência dos personagens para narrativas mais ricas, faz transformações precisas usando linguagem natural e usa o conhecimento de mundo do Gemini para gerar e editar imagens. Com preço de US$ 30,00 por 1 milhão de tokens de saída (aproximadamente US$ 0,039 por imagem), está disponível através da API Gemini e do Google AI Studio para desenvolvedores e do Vertex AI para empresas. O 'modo de construção' do Google AI Studio também foi significativamente atualizado para simplificar a criação de aplicativos. Recursos importantes incluem consistência de personagens, edição de imagens baseada em prompts e conhecimento de mundo nativo, abrindo novas possibilidades na geração e manipulação de imagens.

Leia mais
IA

Gemma 3 270M: Um Modelo de IA Pequeno, Mas Poderoso, para Aplicações Personalizadas

2025-08-14
Gemma 3 270M: Um Modelo de IA Pequeno, Mas Poderoso, para Aplicações Personalizadas

A família Gemma recebe seu mais novo membro: Gemma 3 270M, um modelo de IA compacto de 270 milhões de parâmetros, projetado para ajuste fino específico para tarefas. Herdando a arquitetura avançada da série Gemma 3, ele possui capacidades robustas de seguimento de instruções e estruturação de texto, além de consumir uma potência notavelmente baixa — apenas 0,75% de uso da bateria para 25 conversas em um SoC Pixel 9 Pro. Suas impressionantes habilidades de seguimento de instruções se destacam nos benchmarks IFEval, tornando a IA avançada mais acessível para aplicativos em dispositivos e pesquisa. O Gemma 3 270M se destaca em tarefas de alto volume e bem definidas, como análise de sentimento e extração de entidades, e é ideal para cenários que exigem iteração e implantação rápidas. Os desenvolvedores podem aproveitar seu pequeno tamanho para experimentos rápidos de ajuste fino, construindo frotas de modelos especializados para criar sistemas de produção eficientes e econômicos.

Leia mais

Gemini Embedding: Potenciando a Próxima Geração de Agentes de IA

2025-08-01
Gemini Embedding: Potenciando a Próxima Geração de Agentes de IA

Desde seu lançamento, o modelo de texto Gemini Embedding do Google tem sido rapidamente adotado por desenvolvedores que constroem aplicativos de IA avançados. Além de usos tradicionais, como classificação e pesquisa semântica, ele é crucial para a 'engenharia de contexto', fornecendo aos agentes de IA um contexto operacional completo. Empresas como Box, re:cap, Everlaw, Roo Code, Mindlid e Interaction Co. já estão aproveitando seu poder para melhorar a precisão, a velocidade e a conscientização contextual em seus produtos. De impulsionar a análise de dados financeiros a aprimorar a descoberta legal e alimentar assistentes de IA, o alto desempenho e o suporte multilíngue do Gemini Embedding estão lançando as bases para a próxima geração de agentes inteligentes.

Leia mais

Encerramento do Google URL Shortener Anunciado

2025-07-25
Encerramento do Google URL Shortener Anunciado

O Google está desativando seu serviço de encurtamento de URLs, goo.gl, em 25 de agosto de 2025. A partir de 23 de agosto de 2024, alguns links goo.gl exibirão uma página de notificação alertando os usuários sobre o encerramento iminente. Os desenvolvedores são instados a migrar para serviços de encurtamento de URLs alternativos. Links goo.gl gerados por meio de aplicativos do Google continuarão funcionando.

Leia mais
Desenvolvimento Encurtador de URL

Modo Batch para a API Gemini: Processamento de Alta Taxa de Transferência

2025-07-11
Modo Batch para a API Gemini: Processamento de Alta Taxa de Transferência

A API Gemini do Google agora inclui um modo batch, um endpoint assíncrono ideal para tarefas de alta taxa de transferência onde a latência não é crítica. Envie grandes trabalhos, deixe o sistema lidar com o processamento e recupere os resultados em até 24 horas com 50% de desconto em comparação com as APIs síncronas. Perfeito para dados preparados previamente que não precisam de resposta imediata, oferece economia de custos, aumento da taxa de transferência e chamadas de API simplificadas. A Reforged Labs o utiliza para processar grandes quantidades de anúncios em vídeo, melhorando significativamente a eficiência e reduzindo custos. Comece facilmente com o Google GenAI Python SDK.

Leia mais

Google DeepMind lança GenAI Processors: Simplificando o desenvolvimento de aplicativos de LLM

2025-07-11
Google DeepMind lança GenAI Processors: Simplificando o desenvolvimento de aplicativos de LLM

O Google DeepMind lançou o GenAI Processors, uma biblioteca Python de código aberto projetada para simplificar o desenvolvimento de aplicativos complexos de Modelos de Linguagem Grandes (LLM). A biblioteca usa uma interface Processor para abstrair várias etapas de processamento de dados e lida com entrada multimodal por meio de processamento de stream assíncrono, permitindo execução concorrente para maior capacidade de resposta e eficiência. O GenAI Processors integra-se à API Gemini e fornece exemplos para a construção de aplicativos em tempo real, como transcrição ao vivo e agentes conversacionais.

Leia mais
Desenvolvimento

Gemma 3n: Lançamento do Poderoso Modelo de IA para Dispositivos Móveis

2025-06-27
Gemma 3n: Lançamento do Poderoso Modelo de IA para Dispositivos Móveis

O Gemma 3n, um poderoso modelo de IA multimodal para dispositivos móveis, foi totalmente lançado! Construído na inovadora arquitetura MatFormer, ele suporta entradas de imagem, áudio, vídeo e texto, rodando com pegadas de memória incrivelmente baixas (2 GB para E2B e 3 GB para E4B). O Gemma 3n suporta 140 idiomas para processamento de texto e 35 idiomas para compreensão multimodal, alcançando uma pontuação LMArena superior a 1300. Sua arquitetura eficiente e a tecnologia Per-Layer Embeddings permitem desempenho excepcional em várias tarefas, oferecendo aos desenvolvedores conveniência sem precedentes e inaugurando uma nova era para IA móvel.

Leia mais
IA

Google AI Studio: Desenvolvimento de aplicativos de IA aprimorado com o Gemini 2.5 Pro

2025-05-21
Google AI Studio: Desenvolvimento de aplicativos de IA aprimorado com o Gemini 2.5 Pro

O Google AI Studio recebeu uma atualização importante, integrando o modelo Gemini 2.5 Pro para geração de código significativamente aprimorada. Os desenvolvedores podem criar e implantar rapidamente aplicativos web com tecnologia de IA usando prompts simples de texto, imagem ou vídeo. A nova versão também incorpora modelos multimodais como Imagen, Lyria RealTime e Veo, oferecendo implantação com um único clique no Cloud Run e comparação e reversão convenientes de versões de código. Além disso, o novo suporte a áudio nativo e uma ferramenta de Contexto de URL aprimoram a interatividade e a recuperação de informações.

Leia mais
Desenvolvimento

Google apresenta Gemma 3n: Um modelo de IA leve e multimodal para dispositivos móveis

2025-05-20
Google apresenta Gemma 3n: Um modelo de IA leve e multimodal para dispositivos móveis

O Google lançou o Gemma 3n, um novo modelo aberto construído em uma arquitetura inovadora projetada para levar recursos poderosos de IA para dispositivos móveis. O Gemma 3n possui menor uso de memória e tempos de resposta mais rápidos, suportando compreensão multimodal (texto, imagem, áudio) e fortes capacidades multilíngues. Os desenvolvedores podem acessar uma prévia por meio do Google AI Studio e do Google AI Edge para criar aplicativos que utilizam os recursos do Gemma 3n, incluindo transcrição de fala em tempo real, tradução e compreensão de imagens. O modelo prioriza a privacidade e funciona offline.

Leia mais

Pré-visualização do Gemini 2.5 Pro (edição I/O) lançada antecipadamente: recursos aprimorados de codificação

2025-05-06
Pré-visualização do Gemini 2.5 Pro (edição I/O) lançada antecipadamente: recursos aprimorados de codificação

O Google lançou uma pré-visualização antecipada do Gemini 2.5 Pro (edição I/O), com recursos de codificação significativamente aprimorados, particularmente em desenvolvimento front-end e de IU. Ele ocupa a posição nº 1 no ranking do WebDev Arena pela geração de aplicativos da web esteticamente agradáveis e funcionais. As principais melhorias incluem a funcionalidade de vídeo para código, desenvolvimento de recursos mais fácil e fluxos de trabalho mais rápidos de conceito para aplicativo em funcionamento. Os desenvolvedores podem acessá-lo por meio da API Gemini no Google AI Studio ou Vertex AI para usuários corporativos. Esta atualização também corrige erros anteriores e melhora a confiabilidade da chamada de função.

Leia mais

Gemma 3: IA de ponta agora acessível em seu desktop

2025-04-20
Gemma 3: IA de ponta agora acessível em seu desktop

O Gemma 3, um modelo de IA de ponta e código aberto, inicialmente exigia GPUs de alto nível. Para melhorar o acesso, novas versões otimizadas com Treinamento Consciente de Quantização (QAT) reduzem drasticamente os requisitos de memória, mantendo alta qualidade. Isso permite a execução de modelos poderosos como o Gemma 3 de 27B em GPUs de nível consumidor, como a NVIDIA RTX 3090. Esses modelos otimizados estão disponíveis no Hugging Face e Kaggle, permitindo fácil integração em vários fluxos de trabalho.

Leia mais

Google lança Gemini 2.5 Flash: Modelo de IA com raciocínio controlável

2025-04-17
Google lança Gemini 2.5 Flash: Modelo de IA com raciocínio controlável

O Google lançou o Gemini 2.5 Flash, um novo modelo de linguagem grande com recursos de raciocínio controlável. Construído sobre a base popular do 2.0 Flash, ele melhora significativamente o raciocínio priorizando velocidade e custo-benefício. Os desenvolvedores podem ajustar um 'orçamento de pensamento' para equilibrar qualidade, custo e latência. O modelo ajusta automaticamente seu processo de pensamento com base na complexidade do prompt, oferecendo modos que variam de nenhum pensamento a raciocínio intensivo. O Gemini 2.5 Flash se destaca nos Hard Prompts do LMArena, com uma excelente relação custo-benefício, tornando-o um dos modelos de pensamento mais econômicos disponíveis.

Leia mais

Agent2Agent (A2A): Uma Nova Era de Interoperabilidade de Agentes de IA

2025-04-09
Agent2Agent (A2A): Uma Nova Era de Interoperabilidade de Agentes de IA

O Google lança o Agent2Agent (A2A), um protocolo aberto que permite a colaboração perfeita entre agentes de IA construídos por diferentes fornecedores ou usando diferentes estruturas. Suportado por mais de 50 parceiros de tecnologia e fornecedores de serviços, o A2A permite a troca segura de informações e ações coordenadas, aumentando a produtividade e reduzindo custos. Construído com base em padrões existentes, o A2A suporta várias modalidades, prioriza a segurança e lida com tarefas de longa duração. Os casos de uso variam da automação de processos de contratação (por exemplo, seleção de candidatos e agendamento de entrevistas) à otimização de fluxos de trabalho complexos em vários aplicativos empresariais. Sua natureza de código aberto fomenta um ecossistema próspero de agentes de IA colaborativos.

Leia mais

Gemini 2.0 Flash: Modelo de Geração de Imagens Nativo do Google em Experimentação para Desenvolvedores

2025-03-12
Gemini 2.0 Flash: Modelo de Geração de Imagens Nativo do Google em Experimentação para Desenvolvedores

O Google lançou o Gemini 2.0 Flash, um modelo de IA multimodal com raciocínio aprimorado e compreensão de linguagem natural, capaz de gerar imagens. Ele pode criar histórias com texto e imagens, permitir edição de imagens por meio de conversas e gerar imagens com sequências de texto longas e bem formatadas. Disponível para experimentação por desenvolvedores no Google AI Studio e na API do Gemini, o Gemini 2.0 Flash promete possibilidades empolgantes para a criação de agentes de IA e aplicativos visualmente ricos.

Leia mais