LLM에서 시스템 2 추론을 향하여: 메타 사고 연쇄를 통한 사고 학습
2025-01-10
연구원들은 기존의 사고 연쇄(CoT)를 확장하여 특정 CoT에 이르는 기본 추론을 명시적으로 모델링하는 새로운 프레임워크인 '메타 사고 연쇄(Meta-CoT)'를 제안합니다. Meta-CoT는 프로세스 감독, 합성 데이터 생성, 검색 알고리즘을 활용합니다. 본 논문에서는 선형화된 검색 추적과 강화 학습을 사용한 지시 조정을 통합한 모델 훈련 파이프라인을 개괄합니다. 이 연구는 LLM에서 Meta-CoT를 가능하게 하는 로드맵을 제공하여 AI에서 더욱 강력하고 인간과 유사한 추론으로 가는 길을 열어줍니다.
AI
사고 연쇄