Gráfico de previsão de IA falho viraliza: um conto de advertência

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Gráfico de previsão de IA falho viraliza: um conto de advertência

2025-05-04

O METR, um laboratório de pesquisa sem fins lucrativos, publicou um relatório mostrando o rápido progresso dos grandes modelos de linguagem em tarefas de software, gerando discussões virais. No entanto, a premissa do gráfico é falha: ele usa o tempo de solução humana para medir a dificuldade do problema e o tempo de taxa de sucesso de 50% da IA como uma medida de capacidade. Isso ignora as complexidades diversas dos problemas, levando a resultados arbitrários inadequados para previsão. Embora o conjunto de dados do METR e as discussões sobre as limitações atuais da IA sejam valiosos, usar o gráfico para previsões de capacidade futura da IA é enganoso. Sua propagação viral destaca uma tendência de acreditar no que se quer acreditar em vez de se concentrar na validade.

(garymarcus.substack.com)

IA Avaliação de modelos

Elvish: Uma poderosa linguagem de script estaticamente linkada

A Teoria da Arte de Eno e um Modelo Dinâmico de Democracia