LLM 대결: 130개 프롬프트에 대한 현실적인 평가

2025-08-24

저자는 bash 기록에서 130개의 프롬프트를 사용하여 프로그래밍, 시스템 관리 작업, 기술적 설명, 창의적인 프롬프트의 네 가지 범주에 걸쳐 12개 이상의 LLM에 대한 현실적인 평가를 수행했습니다. 오픈소스 모델은 Gemini 2.5 Pro와 같은 클로즈드소스 옵션과 비교하여 정확성, 속도, 비용 효율성 측면에서 지속적으로 우수했습니다. 저자는 필요에 따라 더 강력한 클로즈드소스 모델을 보완하여 빠르고 저렴한 오픈소스 모델의 조합을 사용하여 결론을 내렸습니다.

AI