Avance innovador: Compilando C a Rust de forma segura

2024-12-21

Investigadores han desarrollado un nuevo método para compilar código C a Rust de forma segura. Esta técnica utiliza análisis estático y traducción dirigida por tipos para evitar la dependencia de bloques `unsafe` de Rust, garantizando así la seguridad de memoria. El método se ha aplicado con éxito a código de la biblioteca criptográfica HACL* y de las bibliotecas EverParse, resultando en una biblioteca criptográfica moderna verificada de 80.000 líneas en Rust puro, la primera de su tipo.

Leer más

Clasificación de Seguridad Ligera Usando Modelos de Lenguaje Podados

2024-12-19

Los investigadores presentan la Clasificación Mejorada por Capas (LEC), una nueva técnica ligera para la clasificación de seguridad de contenido e inyección de indicaciones en Modelos de Lenguaje Grandes (LLMs). LEC entrena un clasificador de Regresión Logística Penalizada (PLR) optimizado en el estado oculto de la capa transformadora intermedia óptima de un LLM. Al combinar la eficiencia de PLR con la sofisticada comprensión del lenguaje de los LLMs, LEC supera a GPT-4o y modelos especializados. Los modelos de propósito general pequeños, como Qwen 2.5, y arquitecturas como DeBERTa v3, demuestran ser robustos extractores de características, entrenando eficazmente con menos de 100 ejemplos de alta calidad. Es crucial que las capas transformadoras intermedias suelen superar a la capa final. Un único LLM de propósito general puede clasificar la seguridad del contenido, detectar inyecciones de indicaciones y generar salida, o los LLMs más pequeños pueden podarse a su capa intermedia óptima para la extracción de características. Los resultados consistentes en diferentes arquitecturas sugieren que la extracción robusta de características es inherente a muchos LLMs.

Leer más

Los algoritmos de ordenación clásicos revelan capacidades inesperadas en un modelo mínimo de inteligencia basal

2024-12-19

Un nuevo estudio utiliza algoritmos de ordenación clásicos como modelo de morfogénesis, desafiando la sabiduría convencional sobre estos algoritmos. Al romper las suposiciones de control de arriba hacia abajo y hardware perfectamente fiable, los investigadores descubrieron que las matrices de elementos autónomos se ordenan de forma más fiable y robusta que las implementaciones tradicionales, incluso en presencia de errores. Sorprendentemente, estos algoritmos muestran la capacidad de reducir temporalmente el progreso para navegar alrededor de defectos y un comportamiento de agrupación inesperado entre los elementos en matrices quiméricas que siguen algoritmos diferentes. Este descubrimiento proporciona una nueva perspectiva sobre la inteligencia diversa, demostrando cómo las formas basales de inteligencia pueden surgir en sistemas simples sin codificación explícita en su mecánica subyacente.

Leer más

Evolución Cultural de la Cooperación entre Agentes de LLM

2024-12-18

Los investigadores examinaron si una 'sociedad' de agentes de Modelos de Lenguaje Grandes (LLM) puede aprender normas sociales mutuamente beneficiosas a pesar de los incentivos para desertar. Los experimentos revelaron diferencias significativas en la evolución de la cooperación entre los modelos base, con Claude 3.5 Sonnet superando significativamente a Gemini 1.5 Flash y GPT-4o. Además, Claude 3.5 Sonnet utilizó un mecanismo de castigo costoso para lograr puntuaciones aún más altas, una hazaña no replicada por los otros modelos. Este estudio propone un nuevo punto de referencia para LLM centrado en las implicaciones sociales de la implementación de agentes LLM, ofreciendo información sobre la construcción de agentes de IA más robustos y cooperativos.

Leer más

Se acabó Adam: El escalado de la tasa de aprendizaje en la inicialización es todo lo que necesitas

2024-12-18

Los investigadores presentan SGD-SaI, un nuevo optimizador que mejora el método de descenso de gradiente estocástico. SGD-SaI aborda los desequilibrios de entrenamiento mediante el escalado de la tasa de aprendizaje en la inicialización para diferentes grupos de parámetros, basándose en sus relaciones señal-ruido de gradiente. Mucho más eficiente en memoria que AdamW, SGD-SaI iguala o supera el rendimiento de AdamW en diversas tareas basadas en Transformer, incluyendo la clasificación ImageNet y el preentrenamiento de LLM. Su robustez y practicidad se demuestran en diversas aplicaciones, convirtiéndolo en una alternativa convincente.

Leer más
IA

Ataque Best-of-N: Cómo vulnerar sistemas de IA

2024-12-15

Investigadores han desarrollado un nuevo algoritmo de ataque de IA llamado Best-of-N (BoN). Este algoritmo de caja negra modifica repetidamente las indicaciones —barajando aleatoriamente o poniendo en mayúsculas el texto, por ejemplo— hasta obtener una respuesta dañina del sistema de IA. BoN logró tasas de éxito de ataque (ASR) impresionantemente altas en modelos de lenguaje de código cerrado como GPT-4o (89%) y Claude 3.5 Sonnet (78%), eludiendo eficazmente las defensas existentes. Además, BoN se extiende sin problemas a modelos de lenguaje visual y de audio, destacando la vulnerabilidad incluso de los sistemas de IA avanzados a variaciones de entrada aparentemente inocuas. Esta investigación subraya preocupaciones de seguridad significativas en el campo de la IA.

Leer más

Fábrica Automática de Insectos Ciborg: Sistema de Ensamblaje Automático para Construir Robots Híbridos Insecto-Computadora

2024-12-15

Los investigadores han desarrollado un sistema automatizado para ensamblar robots híbridos insecto-computadora. El sistema utiliza un brazo robótico guiado por visión para implantar con precisión electrodos bipolares personalizados en la espalda de cucarachas silbantes de Madagascar. Todo el proceso lleva solo 68 segundos, y los robots ensamblados logran un control de dirección y desaceleración comparable a los sistemas ensamblados manualmente. Un sistema multiagente de 4 robots navegó con éxito un recorrido con obstáculos, demostrando la viabilidad de la producción en masa y las aplicaciones del mundo real. Esta investigación allana el camino para la producción y el despliegue a escala de robots insecto.

Leer más

CCxTrust: Plataforma de Computación Confidencial basada en TEE y TPM con Confianza Colaborativa

2024-12-12

CCxTrust es una plataforma innovadora de computación confidencial que combina las ventajas de los Entornos de Ejecución de Confianza (TEEs) y los Módulos de Plataforma de Confianza (TPMs) para establecer un marco de confianza colaborativa. Aprovechando la raíz de confianza (RoT) de caja negra integrada en los TEEs de la CPU y la RoT de caja blanca flexible de los TPMs, CCxTrust logra la protección de extremo a extremo de datos y modelos sensibles, superando las limitaciones de depender de una sola RoT de hardware. La plataforma implementa raíces de confianza para la medición (RTM) independientes y una raíz de confianza para el informe (RTR) colaborativa, mejorada mediante un protocolo de atestación compuesta para una mayor seguridad y eficiencia. Los resultados experimentales demuestran ventajas de rendimiento significativas.

Leer más

Avance en el Análisis de Alcanzabilidad del Sistema de Nombres de Dominio

2024-12-12

Investigadores han presentado el primer procedimiento de decisión para verificar el Sistema de Nombres de Dominio (DNS), estableciendo su complejidad como 2ExpTime. El estudio formaliza la semántica del DNS y utiliza una nueva abstracción basada en lenguajes positivamente prefijo-testables, reduciendo el problema de verificación del DNS al problema de verificación para sistemas pushdown. Este enfoque modela eficazmente los vectores de ataque en el DNS, como los ataques de amplificación y el blackholing de reescritura, proporcionando una nueva base teórica para garantizar la seguridad y fiabilidad del DNS.

Leer más