Modelo de segurança de IA da Apple descriptografado: revelando seus mecanismos de filtragem de conteúdo

2025-07-07
Modelo de segurança de IA da Apple descriptografado: revelando seus mecanismos de filtragem de conteúdo

Este projeto descriptografa os arquivos de filtro do modelo de segurança de IA da Apple, que contêm regras para vários modelos. Usando depuração LLDB e scripts personalizados, a chave de criptografia pode ser obtida e esses arquivos descriptografados. Os arquivos JSON descriptografados contêm regras para filtrar conteúdo prejudicial e garantir a conformidade de segurança, como correspondência exata de palavras-chave, frases a serem removidas e filtragem de expressões regulares. O projeto fornece os arquivos de regras descriptografados e scripts de descriptografia, permitindo que os pesquisadores analisem os mecanismos de segurança do modelo de IA da Apple.