Modelo de seguridad de IA de Apple descifrado: revelando sus mecanismos de filtrado de contenido

2025-07-07
Modelo de seguridad de IA de Apple descifrado: revelando sus mecanismos de filtrado de contenido

Este proyecto descifra los archivos de filtro del modelo de seguridad de IA de Apple, que contienen reglas para varios modelos. Usando depuración LLDB y scripts personalizados, se puede obtener la clave de cifrado y descifrar estos archivos. Los archivos JSON descifrados contienen reglas para filtrar contenido dañino y asegurar el cumplimiento de la seguridad, como la coincidencia exacta de palabras clave, frases para eliminar y filtrado de expresiones regulares. El proyecto proporciona los archivos de reglas descifrados y los scripts de descifrado, permitiendo a los investigadores analizar los mecanismos de seguridad del modelo de IA de Apple.