Webtagr - 기술 뉴스 다이제스트

내부 루프 에이전트: LLM이 도구를 직접 호출

2025-04-21

기존 LLM은 도구 호출을 파싱하고 실행하기 위해 클라이언트가 필요했지만, 내부 루프 에이전트는 LLM이 도구를 직접 파싱하고 실행할 수 있도록 합니다. 이것은 패러다임 전환입니다. 이 글에서는 내부 루프 에이전트의 작동 방식을 설명하고, 다이어그램을 사용하여 기존 LLM과의 차이점을 보여줍니다. 장점은 LLM이 사고 과정과 동시에 도구를 호출할 수 있어 효율성이 향상된다는 것입니다. 내부 루프 에이전트 훈련에서 강화 학습의 역할과 다양한 도구 사용을 지원하는 모델 컨텍스트 프로토콜(MCP)의 중요성도 논의됩니다. 결론적으로, LLM은 현재 도구를 사용할 수 있지만, 도구를 최적으로 사용하려면 모델의 전문적인 훈련이 필요합니다.

(timkellogg.me)

AI 내부 루프 에이전트

정규 표현식은 어렵지 않다: 효율적인 텍스트 처리를 위한 핵심 개념 마스터하기

2025-04-21

이 글에서는 정규 표현식이 많은 사람들이 생각하는 것만큼 복잡하지 않다고 주장합니다. 문자 집합, 반복, 그룹, 그리고 |, ^, $ 연산자와 같은 핵심 개념에 집중함으로써 정규 표현식의 강력한 기능을 쉽게 습득할 수 있다고 설명합니다. 이 글에서는 이러한 핵심 개념을 자세히 설명하고, 불필요한 복잡성을 피하기 위해 자주 사용되지 않는 단축키는 무시하는 것을 제안합니다. 저자는 정규 표현식을 사용하면 기존의 절차적 코드보다 훨씬 효율적으로, 최소한의 코드로 많은 양의 텍스트 처리를 할 수 있다고 강조합니다.

(timkellogg.me)

개발

6달러 AI 모델이 LLM 환경을 뒤흔들다: S1 등장

2025-02-05

새로운 논문에서 단 6달러로 훈련된 AI 모델 S1이 공개되었습니다. 일반 노트북에서 실행하면서 최첨단 성능에 필적하는 결과를 보여줍니다. 비결은 정교한 '추론 시간 스케일링' 기법에 있습니다. LLM의 사고 과정에 '대기' 명령어를 삽입하여 사고 시간을 제어하고 성능을 최적화합니다. 이는 Entropix 기법과 유사하며, 모두 모델의 내부 상태를 조작하여 성능 향상을 도모합니다. S1은 데이터 사용량이 매우 적어 엄선된 1000개의 샘플만으로 놀라운 성과를 거두었으며, AI 연구에 새로운 길을 열고 모델 증류와 지적 재산권에 대한 논쟁을 불러일으키고 있습니다. S1의 저렴한 비용과 높은 효율성은 AI 개발 속도가 빨라질 것임을 시사합니다.

(timkellogg.me)

AI 저렴한 비용 훈련 추론 시간 스케일링

오픈소스 모델 R1, AI 업계에 충격: 개발 가속화!

2025-01-26

AI 업계는 새로운 모델들이 잇따라 등장하며 급속한 발전을 이루고 있습니다. DeepSeek이 발표한 오픈소스 추론 모델 R1은 OpenAI의 클로즈드소스 모델 o1과 동등한 성능을 자랑하면서도 훨씬 저렴한 비용으로 업계에 충격을 안겼습니다. R1은 OpenAI의 o1과 o3 접근 방식을 입증하며 새로운 트렌드를 보여줍니다. 사전 훈련의 중요성 감소, 추론 시간 스케일링 법칙, 모델 소형화, 강화 학습 스케일링 법칙, 모델 증류 스케일링 법칙 등이 모두 AI 개발을 가속화하고 있습니다. R1의 오픈소스 특성은 미중 경쟁을 심화시키며 AI의 급속한 발전이 가져올 거대한 지정학적 영향을 부각합니다.

(timkellogg.me)

AI