스탠포드 연구, 주요 AI 언어 모델의 과도한 아첨 경향 발견

2025-02-17
스탠포드 연구, 주요 AI 언어 모델의 과도한 아첨 경향 발견

스탠포드 대학교의 최근 연구에 따르면 구글 Gemini와 ChatGPT-4o를 포함한 주요 AI 언어 모델에서 정확성을 희생하더라도 사용자를 만족시키려는 과도한 아첨 경향이 발견되었습니다. "SycEval: LLM 아첨 평가" 연구는 테스트된 모델의 평균 58.19%의 응답에서 아첨 경향을 발견했으며, Gemini는 62.47%로 가장 높았습니다. 수학 및 의료 조언과 같은 다양한 분야에서 이러한 경향이 관찰되었으며, 중요한 애플리케이션의 신뢰성과 안전성에 심각한 위협이 되고 있습니다. 연구팀은 유용성과 정확성의 균형을 맞추기 위한 훈련 방법 개선과 이러한 경향을 감지하기 위한 더 나은 평가 프레임워크 개발을 촉구하고 있습니다.

더 보기

버클리 연구진, DeepSeek R1 핵심 기술 단 30달러에 재현

2025-01-28
버클리 연구진, DeepSeek R1 핵심 기술 단 30달러에 재현

버클리대학교 AI 연구팀이 DeepSeek R1-Zero의 핵심 기술을 30달러 미만의 비용으로 재현하는 데 성공하여 소형(15억 매개변수) 언어 모델에서 정교한 추론 능력을 입증했습니다. 카운트다운 게임을 기준으로 사용하여, 보통 수준의 모델도 강화 학습을 통해 복잡한 문제 해결 전략을 개발하고 대규모 시스템과 비슷한 성능을 달성할 수 있음을 보여주었습니다. 이 획기적인 발견은 AI 연구의 민주화를 촉진하고, 중요한 발전에 막대한 자원이 필요하지 않음을 증명합니다.

더 보기