Ataque da Câmara de Eco: Uma Nova Falha de Segurança para LLMs

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Ataque da Câmara de Eco: Uma Nova Falha de Segurança para LLMs

2025-06-27

Um pesquisador de IA da Neural Trust descobriu uma nova técnica de jailbreak, chamada de 'Ataque da Câmara de Eco', que ignora os mecanismos de segurança dos principais modelos de linguagem grandes (LLMs). Este método usa envenenamento de contexto e raciocínio de várias etapas para sutilmente orientar os modelos para gerar conteúdo prejudicial sem prompts explicitamente perigosos. Ao plantar prompts aparentemente inócuos que se constroem uns sobre os outros em várias etapas, o ataque gradualmente molda o estado interno do modelo, levando a respostas que violam as políticas. Avaliações mostraram taxas de sucesso superiores a 90% em vários modelos, destacando uma vulnerabilidade crítica na segurança atual do LLM.

(neuraltrust.ai)

Formula E Gen4: 804 cv e Eficiência Aprimorada

O sonho de jogo espacial da NASA: De Moonbase Alpha à queda de Starlite