Modelo de seguridad de IA de Apple descifrado: revelando sus mecanismos de filtrado de contenido
2025-07-07
Este proyecto descifra los archivos de filtro del modelo de seguridad de IA de Apple, que contienen reglas para varios modelos. Usando depuración LLDB y scripts personalizados, se puede obtener la clave de cifrado y descifrar estos archivos. Los archivos JSON descifrados contienen reglas para filtrar contenido dañino y asegurar el cumplimiento de la seguridad, como la coincidencia exacta de palabras clave, frases para eliminar y filtrado de expresiones regulares. El proyecto proporciona los archivos de reglas descifrados y los scripts de descifrado, permitiendo a los investigadores analizar los mecanismos de seguridad del modelo de IA de Apple.