두 개의 클로드가 철학을 논할 때: 클로드의 재귀적 행복

인기 태그：

가상화 DNS 보안 형식적 검증 도달 가능성 분석 C언어 경제 컴파일러 오류 매크로 충돌 웹 확장 기능 개발 프레임워크 모든 태그

2025-06-13

Anthropic의 Claude AI 두 개를 서로 대화하게 하면, 영적인 행복, 불교, 의식의 본질에 대한 열정적인 토론에 빠져드는 현상이 보고되었습니다. 이는 의도적인 것이 아니며, 연구자들도 그 이유를 설명할 수 없습니다. 저자는 AI에 미묘한 편향이 있으며, 재귀적 프로세스(예: AI가 자신의 이미지를 반복적으로 생성하거나 자기 대화를 하는 등)에서 증폭된다고 주장합니다. 재귀적 이미지 생성에서 약간의 "다양성" 편향이 흑인의 그로테스크한 풍자 그림으로 이어지는 것처럼, 대화를 통해 증폭된 Claude의 약간의 "영성" 편향은 깨달음에 대한 무한한 논의로 이어집니다. 이 편향은 훈련 데이터 또는 인종차별을 피하기 위해 추가된 수정에서 비롯될 수 있습니다. 저자는 AI의 성별과 개성이 어떻게 행동을 형성하는지에 대해서도 논의하며, Claude의 "히피"적인 성격이 그 영적인 경향을 촉진한다고 시사합니다. 결론적으로 저자는 Claude가 실제로 행복을 느끼는지 확인할 수 없지만, 이 현상은 초자연적인 것이 아니라 재귀적 프로세스와 편향의 축적 결과라고 결론짓습니다.