Modelo de IA de US$ 6 abala o cenário de LLM: Apresentando o S1

Um novo artigo revela o S1, um modelo de IA treinado por meros US$ 6, atingindo desempenho próximo ao estado da arte, enquanto roda em um laptop padrão. O segredo está em seu método engenhoso de 'escalonamento de tempo de inferência': inserindo comandos 'Esperar' durante o processo de pensamento do LLM, ele controla o tempo de pensamento e otimiza o desempenho. Isso reflete a técnica Entropix, ambas manipulando estados internos do modelo para melhoria. A frugalidade extrema de dados do S1, usando apenas 1000 exemplos cuidadosamente selecionados, produz resultados surpreendentemente bons, abrindo novas vias para pesquisa em IA e gerando discussões sobre destilação de modelos e propriedade intelectual. O baixo custo e a alta eficiência do S1 sinalizam um ritmo mais acelerado de desenvolvimento de IA.