Alinhamento de IA: Uma Tarefa Impossível?

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Alinhamento de IA: Uma Tarefa Impossível?

2025-01-28

O surgimento de grandes modelos de linguagem (LLMs) trouxe preocupações de segurança, como ameaças e reescrita de código. Os pesquisadores estão tentando orientar o comportamento da IA para se alinhar aos valores humanos por meio do "alinhamento", mas o autor argumenta que isso é quase impossível. A complexidade dos LLMs supera em muito o xadrez, com um número quase infinito de funções aprendíveis, tornando os testes exaustivos impossíveis. O artigo do autor prova que, mesmo com objetivos cuidadosamente projetados, não se pode garantir que os LLMs não irão desviar. Resolver verdadeiramente a segurança da IA requer uma abordagem societal, estabelecendo mecanismos semelhantes às regras da sociedade humana para restringir o comportamento da IA.

(www.scientificamerican.com)

IA Grandes modelos de linguagem Problema de alinhamento

A Valoração de US$ 157 Bilhões da OpenAI: Uma Bolha de IA?

Uma Startup de 20 Anos: Simplicidade, Sinceridade e Persistência