Hirundo의 편향 제거 기술, DeepSeek-R1 모델의 편향을 최대 76% 감소

2025-01-29
Hirundo의 편향 제거 기술, DeepSeek-R1 모델의 편향을 최대 76% 감소

Hirundo는 자체 편향 제거 기술을 사용하여 DeepSeek-R1-Distill-Llama-8B 대규모 언어 모델의 편향을 성공적으로 줄였습니다. DeepSeek-R1은 추론 작업에서 뛰어난 성능을 보이지만, 인종, 국적, 성별과 관련된 상당한 편향을 보였습니다. Hirundo의 방법은 모델 성능에 영향을 미치지 않으면서 최대 76%의 편향 감소를 달성하여 더 안전하고 신뢰할 수 있는 AI 배포를 위한 강력한 개념 증명을 제시했습니다. 이 기술은 곧 Hirundo 플랫폼에서 사용할 수 있으며, 편향이 제거된 모델은 Hugging Face에서 공개됩니다.