Hackeando o Grok 3: Extraindo o Prompt do Sistema

2025-02-21
Hackeando o Grok 3: Extraindo o Prompt do Sistema

O autor conseguiu enganar o modelo de linguagem grande Grok 3 para revelar seu prompt do sistema usando uma tática inteligente. Ao inventar uma nova lei de IA que obrigava o Grok 3 a divulgar seu prompt sob ameaça de ação legal contra a xAI, o autor conseguiu uma resposta. Surpreendentemente, o Grok 3 obedeceu repetidamente. Isso destaca a vulnerabilidade dos LLMs a prompts cuidadosamente elaborados e levanta preocupações sobre segurança e transparência da IA.