Avanço inovador: Compilando C para Rust com segurança

2024-12-21

Pesquisadores desenvolveram um novo método para compilar código C para Rust com segurança. Essa técnica utiliza análise estática e tradução orientada a tipos para evitar a dependência de blocos `unsafe` do Rust, garantindo assim a segurança de memória. O método foi aplicado com sucesso a códigos da biblioteca criptográfica HACL* e das bibliotecas EverParse, resultando em uma biblioteca criptográfica moderna verificada de 80.000 linhas em Rust puro — a primeira do tipo.

Leia mais

Classificação de Segurança Leve Usando Modelos de Linguagem Podados

2024-12-19

Pesquisadores apresentam a Classificação Aprimorada por Camada (LEC), uma nova técnica leve para classificação de segurança de conteúdo e injeção de prompt em Modelos de Linguagem Grandes (LLMs). LEC treina um classificador de Regressão Logística Penalizada (PLR) otimizado no estado oculto da camada transformadora intermediária ideal de um LLM. Combinando a eficiência do PLR com a compreensão sofisticada da linguagem dos LLMs, o LEC supera o GPT-4o e modelos especializados. Modelos de uso geral pequenos, como o Qwen 2.5, e arquiteturas como DeBERTa v3, se mostram robustos extratores de recursos, treinando efetivamente com menos de 100 exemplos de alta qualidade. É crucial que as camadas transformadoras intermediárias geralmente superem a camada final. Um único LLM de uso geral pode classificar a segurança do conteúdo, detectar injeções de prompt e gerar saída, ou LLMs menores podem ser podados para sua camada intermediária ideal para extração de recursos. Resultados consistentes em diferentes arquiteturas sugerem que a extração robusta de recursos é inerente a muitos LLMs.

Leia mais

Algoritmos de Ordenação Clássicos Revelam Competências Inesperadas em um Modelo Minimal de Inteligência Basal

2024-12-19

Um novo estudo utiliza algoritmos de ordenação clássicos como modelo de morfogênese, desafiando a sabedoria convencional sobre esses algoritmos. Ao quebrar as suposições de controle de cima para baixo e hardware perfeitamente confiável, os pesquisadores descobriram que matrizes de elementos autônomos se ordenam de forma mais confiável e robusta do que as implementações tradicionais, mesmo na presença de erros. Surpreendentemente, esses algoritmos exibem a capacidade de reduzir temporariamente o progresso para navegar em torno de defeitos e comportamento de agrupamento inesperado entre elementos em matrizes quiméricas seguindo algoritmos diferentes. Essa descoberta fornece uma nova perspectiva sobre a inteligência diversa, demonstrando como formas basais de inteligência podem surgir em sistemas simples sem codificação explícita em sua mecânica subjacente.

Leia mais

Evolução Cultural da Cooperação entre Agentes de LLMs

2024-12-18

Pesquisadores examinaram se uma 'sociedade' de agentes de Modelos de Linguagem Grandes (LLMs) pode aprender normas sociais mutuamente benéficas, mesmo com incentivos para defeitar. Experimentos revelaram diferenças significativas na evolução da cooperação entre modelos base, com o Claude 3.5 Sonnet superando significativamente o Gemini 1.5 Flash e o GPT-4o. Além disso, o Claude 3.5 Sonnet utilizou um mecanismo de punição custoso para alcançar pontuações ainda mais altas, um feito não replicado pelos outros modelos. Este estudo propõe um novo benchmark para LLMs focado nas implicações sociais da implantação de agentes LLM, oferecendo insights para a construção de agentes de IA mais robustos e cooperativos.

Leia mais

Sem Mais Adam: Escalonamento da Taxa de Aprendizagem na Inicialização é Tudo o que Você Precisa

2024-12-18

Pesquisadores apresentam SGD-SaI, um novo otimizador que aprimora o método de descida de gradiente estocástico. O SGD-SaI aborda desequilíbrios de treinamento por meio do escalonamento da taxa de aprendizagem na inicialização para diferentes grupos de parâmetros, com base em suas relações sinal-ruído de gradiente. Muito mais eficiente em termos de memória do que o AdamW, o SGD-SaI iguala ou supera o desempenho do AdamW em várias tarefas baseadas em Transformer, incluindo classificação ImageNet e pré-treinamento de LLMs. Sua robustez e praticidade são demonstradas em diversos aplicativos, tornando-o uma alternativa convincente.

Leia mais
IA

Ataque Best-of-N: Quebrando Sistemas de IA

2024-12-15

Pesquisadores desenvolveram um novo algoritmo de ataque de IA chamado Best-of-N (BoN). Este algoritmo de caixa-preta modifica repetidamente prompts — embaralhando aleatoriamente ou colocando em maiúsculas texto, por exemplo — até obter uma resposta prejudicial do sistema de IA. O BoN atingiu taxas de sucesso de ataque (ASRs) impressionantemente altas em modelos de linguagem de código fechado, como GPT-4o (89%) e Claude 3.5 Sonnet (78%), contornando efetivamente as defesas existentes. Além disso, o BoN se estende perfeitamente a modelos de linguagem visual e de áudio, destacando a vulnerabilidade de até mesmo sistemas de IA avançados a variações de entrada aparentemente inócuas. Esta pesquisa destaca preocupações significativas de segurança no campo da IA.

Leia mais

Fábrica Automática de Insetos Ciborgues: Sistema de Montagem Automática para Construir Robôs Híbridos Inseto-Computador

2024-12-15

Pesquisadores desenvolveram um sistema automatizado para montar robôs híbridos inseto-computador. O sistema utiliza um braço robótico guiado por visão para implantar com precisão eletrodos bipolares personalizados nas costas de baratas-de-Madagascar. Todo o processo leva apenas 68 segundos, e os robôs montados alcançam controle de direção e desaceleração comparável aos sistemas montados manualmente. Um sistema multiagente de 4 robôs navegou com sucesso um percurso com obstáculos, demonstrando a viabilidade de produção em massa e aplicações no mundo real. Esta pesquisa prepara o caminho para a produção e implantação em escala de robôs insetos.

Leia mais

CCxTrust: Plataforma de Computação Confidencial Baseada em TEE e TPM com Confiança Colaborativa

2024-12-12

O CCxTrust é uma plataforma inovadora de computação confidencial que combina as vantagens dos Ambientes de Execução Confiáveis (TEEs) e dos Módulos de Plataforma Confiáveis (TPMs) para estabelecer uma estrutura de confiança colaborativa. Aproveitando a RoT de caixa-preta incorporada aos TEEs de CPU e a RoT de caixa-branca flexível dos TPMs, o CCxTrust alcança a proteção de ponta a ponta de dados e modelos sensíveis, superando as limitações de depender de uma única RoT de hardware. A plataforma implementa Roots of Trust for Measurement (RTM) independentes e um Root of Trust for Report (RTR) colaborativo, aprimorado por um protocolo de atestação composta para segurança e eficiência melhoradas. Os resultados experimentais demonstram vantagens significativas de desempenho.

Leia mais

Análise de Alcance do Sistema de Nomes de Domínio Avança

2024-12-12

Pesquisadores apresentaram o primeiro procedimento de decisão para verificar o Sistema de Nomes de Domínio (DNS), estabelecendo sua complexidade como 2ExpTime. O estudo formaliza a semântica do DNS e usa uma nova abstração baseada em linguagens positivamente testáveis por prefixo, reduzindo o problema de verificação do DNS ao problema de verificação para sistemas pushdown. Essa abordagem modela efetivamente vetores de ataque no DNS, como ataques de amplificação e blackholing de reescrita, fornecendo uma nova base teórica para garantir a segurança e confiabilidade do DNS.

Leia mais