Webtagr - 기술 뉴스 다이제스트

인기 태그：

가상화 DNS 보안 형식적 검증 도달 가능성 분석 C언어 경제 컴파일러 오류 매크로 충돌 웹 확장 기능 개발 프레임워크 모든 태그

프롬프트 엔지니어링을 넘어: 강력한 AI 에이전트를 위한 컨텍스트 엔지니어링

2025-07-01

컨텍스트 엔지니어링은 단순한 프롬프트 엔지니어링을 넘어선 AI의 새로운 영역으로 부상하고 있습니다. 이는 LLM(대규모 언어 모델)에 포괄적인 컨텍스트 정보를 제공하여 문제를 효과적으로 해결하는 데 중점을 둡니다. 이 글에서는 AI 에이전트의 성공은 모델의 능력뿐 아니라 컨텍스트의 질에 달려 있다고 주장합니다. 컨텍스트 엔지니어링에는 초기 지시, 사용자 프롬프트, 단기 기억, 장기 기억, 외부 정보 검색, 사용 가능한 도구, 구조화된 출력 등이 포함됩니다. 이메일을 통해 회의를 예약하는 등 성공적인 AI 에이전트는 캘린더 데이터, 이메일 기록, 연락처 정보를 통합하여 로봇 같은 반응이 아니라 사람 같은 반응을 생성해야 합니다. 이 글에서는 컨텍스트 엔지니어링은 LLM이 작업을 완료할 수 있도록 적절한 정보와 도구를 적절한 시기에 제공하는 동적인 시스템이며, 강력하고 신뢰할 수 있는 AI 에이전트를 구축하는 핵심이라고 강조합니다.

2025-01-31

DeepSeek R1: 복잡한 추론 작업에서 OpenAI에 도전하는 오픈소스 모델

DeepSeek R1은 복잡한 추론 작업에서 OpenAI 모델에 도전하는 오픈소스 모델입니다. 그룹 상대 정책 최적화(GRPO)와 강화 학습에 중점을 둔 다단계 교육 방식을 사용하며, 모델뿐만 아니라 개발에 대한 자세한 내용을 설명하는 연구 논문도 공개되었습니다. 논문에서는 교육 중 모델이 인간의 피드백 없이 초기 접근 방식을 재평가하여 문제에 더 많은 사고 시간을 할당하는 것을 학습한 '번뜩이는 순간'에 대해 설명합니다. 이 블로그 게시물에서는 GRPO와 카운트다운 게임을 사용하여 이 '번뜩이는 순간'을 재현하고 자체 검증 및 검색 기능을 학습하는 오픈 모델을 교육합니다. GRPO 및 TRL 학습을 용이하게 하기 위해 대화형 Jupyter Notebook 코드, 멀티 GPU 노드 또는 SLURM 클러스터에서의 분산 교육을 위한 스크립트 및 지침을 제공합니다.

프롬프트 엔지니어링을 넘어: 강력한 AI 에이전트를 위한 컨텍스트 엔지니어링

DeepSeek R1: 복잡한 추론 작업에서 OpenAI에 도전하는 오픈소스 모델