Webtagr - Sumário de Notícias de Tecnologia

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Além da Engenharia de Prompt: Engenharia de Contexto para Agentes de IA Potentes

2025-07-01

Engenharia de contexto está surgindo como a próxima fronteira na IA, indo além da simples engenharia de prompt. Ela se concentra em fornecer aos LLMs informações contextuais abrangentes para resolução eficaz de problemas. O artigo argumenta que o sucesso dos agentes de IA depende da qualidade do contexto, não apenas das capacidades do modelo. A engenharia de contexto abrange instruções iniciais, prompts do usuário, memória de curto prazo, memória de longo prazo, recuperação de informações externas, ferramentas disponíveis e saída estruturada. Um agente de IA bem-sucedido, como aquele que agenda reuniões a partir de e-mails, precisa de dados de calendário integrados, histórico de e-mails e informações de contato para gerar respostas humanas em vez de robóticas. O artigo destaca que a engenharia de contexto é um sistema dinâmico, fornecendo as informações e ferramentas certas no momento certo, garantindo que o LLM possa concluir sua tarefa — a chave para construir agentes de IA robustos e confiáveis.

2025-01-31

DeepSeek R1: Modelo de código aberto desafia a OpenAI em raciocínio complexo

O DeepSeek R1, um modelo de código aberto, está desafiando os modelos da OpenAI em tarefas de raciocínio complexo. Usando a Otimização de Política Relativa de Grupo (GRPO) e uma abordagem de treinamento de múltiplas etapas focada em aprendizado por reforço, os criadores lançaram não apenas o modelo, mas também um artigo de pesquisa detalhando seu desenvolvimento. O artigo descreve um "momento de epifania" durante o treinamento, onde o modelo aprendeu a alocar mais tempo de pensamento para um problema reavaliando sua abordagem inicial, sem feedback humano. Este post de blog recria esse "momento de epifania" usando GRPO e o jogo Countdown, treinando um modelo aberto para aprender habilidades de autoverificação e pesquisa. Um código interativo do Jupyter Notebook, juntamente com scripts e instruções para treinamento distribuído em nós multi-GPU ou clusters SLURM, é fornecido para facilitar o aprendizado de GRPO e TRL.

Além da Engenharia de Prompt: Engenharia de Contexto para Agentes de IA Potentes

DeepSeek R1: Modelo de código aberto desafia a OpenAI em raciocínio complexo