Webtagr - Resumen de noticias de tecnología

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Explicación de las decisiones de los modelos de lenguaje grandes utilizando valores de Shapley

2024-12-28

Los modelos de lenguaje grandes (LLM) ofrecen posibilidades emocionantes para simular el comportamiento humano, pero sus procesos de toma de decisiones carecen de transparencia. Este artículo presenta un nuevo enfoque basado en los valores de Shapley para interpretar el comportamiento de los LLM y cuantificar la contribución de cada componente del prompt a la salida del modelo. A través de dos aplicaciones, el estudio revela que las decisiones de los LLM son susceptibles al "ruido de token", donde el modelo reacciona de forma desproporcionada a los tokens con contenido informativo mínimo. Esto plantea preocupaciones sobre la solidez y la generalización de los conocimientos obtenidos de los LLM en la simulación del comportamiento humano, destacando la necesidad de una ingeniería cuidadosa de los prompts y una comprensión más matizada de sus limitaciones cuando se utilizan en la investigación.

(arxiv.org)

IA Explicabilidad

Invariantes: Cálculo y Aplicaciones

2024-12-27

Un artículo tutorial publicado en las actas de ISSAC 2023 explora el cálculo y las aplicaciones de los invariantes en matemáticas. El artículo se centra en la interacción entre las teorías de invariantes diferenciales y algebraicas, presentando una adaptación algebraica del método del marco móvil de la geometría diferencial para calcular un conjunto generador de invariantes racionales. También se discute el papel de las firmas de invariantes diferenciales en la resolución de problemas de equivalencia en geometría y álgebra, y los desafíos en el diseño de algoritmos basados en este concepto.

(arxiv.org)

Desarrollo geometría diferencial

Políticas Adversarias Derrotan a las IA de Go Superhumanas

2024-12-24

Los investigadores lograron una tasa de victorias superior al 97% contra KataGo, un sistema de IA de Go de última generación, entrenando políticas adversarias. Estos adversarios no ganaron jugando bien al Go, sino engañando a KataGo para que cometiera errores críticos. El ataque se transfirió sin entrenamiento a otras IA de Go superhumanas y fue lo suficientemente simple como para que los expertos humanos lo replicaran sin asistencia algorítmica. La vulnerabilidad persistió incluso después de que KataGo fue entrenado adversarialmente para defenderse contra ella, destacando modos de falla sorprendentes incluso en sistemas de IA superhumanos.

(arxiv.org)

IA políticas adversarias

Evidencia de Supernovas Sugiere un Cambio Fundamental en los Modelos Cosmológicos

2024-12-23

Un nuevo estudio presenta un análisis estadístico independiente del modelo cosmológico del conjunto de datos espectroscópicos de supernovas de Tipo Ia Pantheon+, mejorando la metodología estándar utilizada por Lane et al. Al emplear únicamente la ecuación de Tripp para la estandarización de supernovas, el estudio evita posibles correlaciones en las distribuciones de estiramiento y color. Los resultados favorecen fuertemente la cosmología 'Timescape' sobre el modelo ΛCDM estándar al explicar los datos, proporcionando evidencia de la necesidad de revisar los fundamentos de la cosmología teórica y observacional. Incluso al restringir la muestra a corrimientos al rojo más allá de las escalas convencionales de homogeneidad estadística (z > 0,075), Timescape sigue siendo preferido sobre ΛCDM.

(arxiv.org)

Tecnología Cosmología Cosmología Timescape

Aprendizaje por Refuerzo Sin Conexión Mejora el Razonamiento en Múltiples Pasos de los LLMs

2024-12-23

Los investigadores presentan OREO, un método de aprendizaje por refuerzo sin conexión diseñado para mejorar las capacidades de razonamiento en múltiples pasos de los modelos de lenguaje grandes (LLMs). Basado en el aprendizaje por refuerzo de entropía máxima, OREO aprende conjuntamente un modelo de política y una función de valor optimizando la ecuación de Bellman suave. Esto resuelve las limitaciones de la Optimización Directa de Preferencias (DPO) en el razonamiento en múltiples pasos, específicamente la necesidad de datos de preferencia emparejados extensos y el desafío de la asignación de crédito eficaz. Los experimentos demuestran la superioridad de OREO sobre los métodos de aprendizaje sin conexión existentes en los puntos de referencia que involucran razonamiento matemático y control de agentes encarnados.

(arxiv.org)

IA Razonamiento en Múltiples Pasos

Problema de Tokenización Demostrado como NP-Completo: Se Duplican los Retos de la Compresión de Datos

2024-12-22

Un artículo publicado en arXiv demuestra la completitud NP de dos variantes de la tokenización, definida como el problema de comprimir un conjunto de datos a un máximo de δ símbolos, ya sea encontrando un vocabulario directamente (tokenización directa) o seleccionando una secuencia de operaciones de fusión (tokenización ascendente). Este hallazgo tiene implicaciones significativas para la compresión de datos y el procesamiento del lenguaje natural, destacando el inmenso desafío de resolver eficientemente el problema de la tokenización para conjuntos de datos a gran escala.

(arxiv.org)

Desarrollo tokenización compresión de datos

Avance innovador: Compilando C a Rust de forma segura

2024-12-21

Investigadores han desarrollado un nuevo método para compilar código C a Rust de forma segura. Esta técnica utiliza análisis estático y traducción dirigida por tipos para evitar la dependencia de bloques `unsafe` de Rust, garantizando así la seguridad de memoria. El método se ha aplicado con éxito a código de la biblioteca criptográfica HACL* y de las bibliotecas EverParse, resultando en una biblioteca criptográfica moderna verificada de 80.000 líneas en Rust puro, la primera de su tipo.

(arxiv.org)

Desarrollo Compilación C Seguridad de memoria

Clasificación de Seguridad Ligera Usando Modelos de Lenguaje Podados

2024-12-19

Los investigadores presentan la Clasificación Mejorada por Capas (LEC), una nueva técnica ligera para la clasificación de seguridad de contenido e inyección de indicaciones en Modelos de Lenguaje Grandes (LLMs). LEC entrena un clasificador de Regresión Logística Penalizada (PLR) optimizado en el estado oculto de la capa transformadora intermedia óptima de un LLM. Al combinar la eficiencia de PLR con la sofisticada comprensión del lenguaje de los LLMs, LEC supera a GPT-4o y modelos especializados. Los modelos de propósito general pequeños, como Qwen 2.5, y arquitecturas como DeBERTa v3, demuestran ser robustos extractores de características, entrenando eficazmente con menos de 100 ejemplos de alta calidad. Es crucial que las capas transformadoras intermedias suelen superar a la capa final. Un único LLM de propósito general puede clasificar la seguridad del contenido, detectar inyecciones de indicaciones y generar salida, o los LLMs más pequeños pueden podarse a su capa intermedia óptima para la extracción de características. Los resultados consistentes en diferentes arquitecturas sugieren que la extracción robusta de características es inherente a muchos LLMs.

(arxiv.org)

IA Clasificación de Seguridad Extracción de Características

Los algoritmos de ordenación clásicos revelan capacidades inesperadas en un modelo mínimo de inteligencia basal

2024-12-19

Un nuevo estudio utiliza algoritmos de ordenación clásicos como modelo de morfogénesis, desafiando la sabiduría convencional sobre estos algoritmos. Al romper las suposiciones de control de arriba hacia abajo y hardware perfectamente fiable, los investigadores descubrieron que las matrices de elementos autónomos se ordenan de forma más fiable y robusta que las implementaciones tradicionales, incluso en presencia de errores. Sorprendentemente, estos algoritmos muestran la capacidad de reducir temporalmente el progreso para navegar alrededor de defectos y un comportamiento de agrupación inesperado entre los elementos en matrices quiméricas que siguen algoritmos diferentes. Este descubrimiento proporciona una nueva perspectiva sobre la inteligencia diversa, demostrando cómo las formas basales de inteligencia pueden surgir en sistemas simples sin codificación explícita en su mecánica subyacente.

(arxiv.org)

IA inteligencia diversa morfogénesis algoritmos de ordenación

Evolución Cultural de la Cooperación entre Agentes de LLM

2024-12-18

Los investigadores examinaron si una 'sociedad' de agentes de Modelos de Lenguaje Grandes (LLM) puede aprender normas sociales mutuamente beneficiosas a pesar de los incentivos para desertar. Los experimentos revelaron diferencias significativas en la evolución de la cooperación entre los modelos base, con Claude 3.5 Sonnet superando significativamente a Gemini 1.5 Flash y GPT-4o. Además, Claude 3.5 Sonnet utilizó un mecanismo de castigo costoso para lograr puntuaciones aún más altas, una hazaña no replicada por los otros modelos. Este estudio propone un nuevo punto de referencia para LLM centrado en las implicaciones sociales de la implementación de agentes LLM, ofreciendo información sobre la construcción de agentes de IA más robustos y cooperativos.

(arxiv.org)

IA Cooperación Normas Sociales

Se acabó Adam: El escalado de la tasa de aprendizaje en la inicialización es todo lo que necesitas

2024-12-18

Los investigadores presentan SGD-SaI, un nuevo optimizador que mejora el método de descenso de gradiente estocástico. SGD-SaI aborda los desequilibrios de entrenamiento mediante el escalado de la tasa de aprendizaje en la inicialización para diferentes grupos de parámetros, basándose en sus relaciones señal-ruido de gradiente. Mucho más eficiente en memoria que AdamW, SGD-SaI iguala o supera el rendimiento de AdamW en diversas tareas basadas en Transformer, incluyendo la clasificación ImageNet y el preentrenamiento de LLM. Su robustez y practicidad se demuestran en diversas aplicaciones, convirtiéndolo en una alternativa convincente.

(arxiv.org)

IA

Ataque Best-of-N: Cómo vulnerar sistemas de IA

2024-12-15

Investigadores han desarrollado un nuevo algoritmo de ataque de IA llamado Best-of-N (BoN). Este algoritmo de caja negra modifica repetidamente las indicaciones —barajando aleatoriamente o poniendo en mayúsculas el texto, por ejemplo— hasta obtener una respuesta dañina del sistema de IA. BoN logró tasas de éxito de ataque (ASR) impresionantemente altas en modelos de lenguaje de código cerrado como GPT-4o (89%) y Claude 3.5 Sonnet (78%), eludiendo eficazmente las defensas existentes. Además, BoN se extiende sin problemas a modelos de lenguaje visual y de audio, destacando la vulnerabilidad incluso de los sistemas de IA avanzados a variaciones de entrada aparentemente inocuas. Esta investigación subraya preocupaciones de seguridad significativas en el campo de la IA.

(arxiv.org)

IA Seguridad de IA

Fábrica Automática de Insectos Ciborg: Sistema de Ensamblaje Automático para Construir Robots Híbridos Insecto-Computadora

2024-12-15

Los investigadores han desarrollado un sistema automatizado para ensamblar robots híbridos insecto-computadora. El sistema utiliza un brazo robótico guiado por visión para implantar con precisión electrodos bipolares personalizados en la espalda de cucarachas silbantes de Madagascar. Todo el proceso lleva solo 68 segundos, y los robots ensamblados logran un control de dirección y desaceleración comparable a los sistemas ensamblados manualmente. Un sistema multiagente de 4 robots navegó con éxito un recorrido con obstáculos, demostrando la viabilidad de la producción en masa y las aplicaciones del mundo real. Esta investigación allana el camino para la producción y el despliegue a escala de robots insecto.

(arxiv.org)

IA robots insecto ensamblaje automatizado

CCxTrust: Plataforma de Computación Confidencial basada en TEE y TPM con Confianza Colaborativa

2024-12-12

CCxTrust es una plataforma innovadora de computación confidencial que combina las ventajas de los Entornos de Ejecución de Confianza (TEEs) y los Módulos de Plataforma de Confianza (TPMs) para establecer un marco de confianza colaborativa. Aprovechando la raíz de confianza (RoT) de caja negra integrada en los TEEs de la CPU y la RoT de caja blanca flexible de los TPMs, CCxTrust logra la protección de extremo a extremo de datos y modelos sensibles, superando las limitaciones de depender de una sola RoT de hardware. La plataforma implementa raíces de confianza para la medición (RTM) independientes y una raíz de confianza para el informe (RTR) colaborativa, mejorada mediante un protocolo de atestación compuesta para una mayor seguridad y eficiencia. Los resultados experimentales demuestran ventajas de rendimiento significativas.

(arxiv.org)

IA Computación Confidencial Entorno de Ejecución de Confianza Módulo de Plataforma de Confianza

Avance en el Análisis de Alcanzabilidad del Sistema de Nombres de Dominio

2024-12-12

Investigadores han presentado el primer procedimiento de decisión para verificar el Sistema de Nombres de Dominio (DNS), estableciendo su complejidad como 2ExpTime. El estudio formaliza la semántica del DNS y utiliza una nueva abstracción basada en lenguajes positivamente prefijo-testables, reduciendo el problema de verificación del DNS al problema de verificación para sistemas pushdown. Este enfoque modela eficazmente los vectores de ataque en el DNS, como los ataques de amplificación y el blackholing de reescritura, proporcionando una nueva base teórica para garantizar la seguridad y fiabilidad del DNS.

(arxiv.org)

Desarrollo seguridad DNS verificación formal análisis de alcanzabilidad

← Previous 1 2 3 4 5 6 7 8 9 10 Next →