Anthropic, 코딩 및 고급 추론을 위한 차세대 모델 Claude 4 공개

2025-05-22
Anthropic, 코딩 및 고급 추론을 위한 차세대 모델 Claude 4 공개

Anthropic은 코딩, 고급 추론, AI 에이전트 분야에서 새로운 기준을 제시하는 차세대 대규모 언어 모델 Claude Opus 4와 Claude Sonnet 4를 출시했습니다. Opus 4는 세계 최고의 코딩 모델로서 복잡하고 장기간 실행되는 작업과 에이전트 워크플로우에서 뛰어난 성능을 보여줍니다. Sonnet 4는 이전 버전인 Sonnet 3.7을 크게 개선하여 더욱 우수한 코딩 및 추론 기능과 정확한 지시 사항 준수 기능을 제공합니다. 이번 출시에는 도구 사용을 통한 확장된 사고(베타 버전), 새로운 모델 기능(도구의 병렬 사용, 향상된 메모리 기능), 일반 공개된 Claude Code(GitHub Actions, VS Code, JetBrains 통합), 그리고 4가지 새로운 Anthropic API 기능이 포함됩니다. 두 모델 모두 Anthropic API, Amazon Bedrock, Google Cloud의 Vertex AI를 통해 사용할 수 있습니다.

더 보기

gRPC vs REST: 적절한 API 설계 모델 선택

2025-01-23
gRPC vs REST: 적절한 API 설계 모델 선택

이 글에서는 주요 두 가지 API 설계 모델인 gRPC와 REST, 그리고 OpenAPI의 역할을 자세히 다룹니다. RPC 모델을 기반으로 하는 gRPC는 데이터 세부 정보를 숨기는 반면, HTTP를 기반으로 하는 REST는 리소스 중심입니다. 많은 API는 두 모델의 장점을 효과적으로 결합하여 엔티티 중심 접근 방식을 사용하지만, gRPC로 구현됩니다. 이 글에서는 API에 HTTP를 사용하는 세 가지 방법인 REST, gRPC, OpenAPI를 비교하고 각각의 장단점을 설명하며, 최종적으로 특정 요구 사항에 따라 최적의 접근 방식을 선택할 것을 제안합니다. gRPC는 뛰어난 성능을 제공하지만 특수 소프트웨어가 필요합니다. OpenAPI는 유연하지만 설계가 복잡합니다. REST는 간단하고 직관적이지만 덜 사용됩니다. 선택 시에는 프로젝트 요구 사항, 팀의 기술 스택, 유지 관리 용이성을 고려해야 합니다.

더 보기
개발 API 설계

결정 불가능성: 프로그래머의 판도라의 상자

2025-05-28
결정 불가능성: 프로그래머의 판도라의 상자

이 글에서는 컴퓨터 과학에서 '결정 불가능성' 개념을 쉽게 설명합니다. 간결한 언어와 구체적인 예시(예: 어떤 숫자가 두 소수의 합인지 판별)를 사용하여 결정 문제와 튜링 머신의 역할을 설명합니다. 중요한 점은 결정 불가능성이 프로그램이 중지할지 여부를 판단할 수 없다는 의미가 아니라, 모든 프로그램의 중지 여부를 판단할 수 있는 보편적인 알고리즘이 존재하지 않는다는 의미입니다. 따라서 많은 문제(예: 프로그램 속성 검증)는 엄청난 노력이 필요하며 해결할 수 없을 가능성도 있습니다. 이는 형식적 검증 및 프로그램 분석과 같은 분야의 필요성을 시사합니다.

더 보기
개발

러시아 자체 게임기, PS5와 Xbox Series X에 도전 불가

2024-12-31
러시아 자체 게임기, PS5와 Xbox Series X에 도전 불가

러시아가 자체 게임기를 개발하려는 시도가 어려움을 겪고 있다. Elbrus 프로세서를 탑재한 게임기는 PS5나 Xbox Series X와 경쟁할 만한 성능을 갖추지 못했다. MTS사가 개발 중인 클라우드 게임기는 가격이 45달러에 불과하지만 클라우드 게임 플랫폼에 의존하고 있다. 러시아 정부는 이러한 게임기가 최신 게임기와 경쟁할 수 없다는 것을 인정하지만, 국산 게임 제품의 보급을 목표로 하고 있다.

더 보기

arXivLabs: 커뮤니티와의 협업을 통한 실험 프로젝트

2025-06-02
arXivLabs: 커뮤니티와의 협업을 통한 실험 프로젝트

arXivLabs는 참여자들이 arXiv의 새로운 기능을 웹사이트에서 직접 개발하고 공유할 수 있는 프레임워크입니다. arXivLabs에 참여하는 개인 및 조직은 개방성, 커뮤니티, 우수성, 사용자 데이터 개인 정보 보호라는 arXiv의 가치를 수용합니다. arXiv는 이러한 가치를 중시하며, 이러한 가치를 준수하는 파트너와만 협력합니다. arXiv 커뮤니티에 가치를 더할 프로젝트 아이디어가 있으십니까? arXivLabs에 대해 자세히 알아보세요.

더 보기
개발

NVIDIA Meshtron: 대규모 고충실도 3D 메시 생성

2024-12-16
NVIDIA Meshtron: 대규모 고충실도 3D 메시 생성

NVIDIA 연구원들은 전례 없는 규모와 충실도로 고품질 3D 메시를 생성할 수 있는 새로운 모델인 Meshtron을 개발했습니다. 자기 회귀 아키텍처와 슬라이딩 윈도우 어텐션을 사용하여 메시를 토큰 시퀀스로 표현하고 Hourglass Transformer 아키텍처를 활용함으로써 복잡한 3D 모델 생성에서 기존 방법의 확장성 및 효율성 문제를 효과적으로 해결합니다. 아티스트 수준의 디테일한 메시를 생성하는 Meshtron은 점군, 면 수, 창의성 수준 등의 입력을 통해 높은 제어성을 제공하며, 애니메이션, 게임, 가상 환경에서 보다 사실적인 3D 애셋 생성의 길을 열어줍니다.

더 보기
AI

데이터베이스 일관성: 기본을 넘어서

2025-06-02
데이터베이스 일관성: 기본을 넘어서

이 글에서는 고병렬 환경에서 데이터베이스 트랜잭션 일관성의 문제점을 자세히 다룹니다. Spring Boot 예제를 사용하여 대량의 판매 데이터 처리 시 기본 페이지네이션과 멱등성 검사가 데이터 불일치(행 누락 또는 중복 업데이트)로 어떻게 이어지는지 보여줍니다. 이 글에서는 데이터베이스 isolation level(READ UNCOMMITED, READ COMMITED, REPEATABLE READ, SERIALIZABLE)과 낙관적/비관적 락킹 전략을 자세히 설명합니다. 최종적으로 REPEATABLE READ isolation level과 낙관적 락킹을 사용하여 데이터 불일치를 효과적으로 해결하고 성능을 크게 향상시킵니다.

더 보기
개발 병렬 제어

Anki, ChatGPT, YouTube 활용한 페르시아어 학습법

2025-09-24

Anki, ChatGPT, YouTube 확장 프로그램을 사용하여 페르시아어를 효율적으로 학습하는 저자의 방법을 소개합니다. 다양한 Anki 카드를 만들어 읽기 연습이나 영어-페르시아어 번역 카드 등을 활용하고, ChatGPT로 궁금한 점을 바로 해결합니다. 또한 이중 자막 YouTube 확장 프로그램으로 75% 속도로 영상을 시청하고, 영어와 페르시아어 자막을 함께 보면서 반복적으로 읽고 듣고 말하며 실시간 이해를 목표로 합니다.

더 보기
기타

CSS 젠 가든: CSS의 힘을 발휘하다

2025-04-27

CSS 젠 가든은 CSS의 힘을 보여주는 프로젝트입니다. HTML을 그대로 유지하고 CSS 스타일시트만 변경하여 CSS가 웹 페이지 스타일을 완벽하게 제어할 수 있음을 보여줍니다. 이 프로젝트는 디자이너와 개발자에게 독창적인 CSS 디자인을 제출하여 CSS의 무한한 가능성을 탐구하고 놀라운 시각 효과를 만드는 방법을 배우도록 권장합니다. 제출 작품은 주로 CSS1과 2를 사용하고 주요 브라우저와 호환되어야 합니다.

더 보기
디자인 CSS 젠 가든

나만의 Linux 디버거 만들기: 1부 - 시작하기

2025-04-25

이 글은 10부작 시리즈의 첫 번째 부분으로, 처음부터 Linux 프로그램 디버거를 만드는 방법을 알려줍니다. 디버거의 핵심 메커니즘을 배우고 실행 시작, 중지, 계속, 중단점 설정(메모리 주소, 소스 코드 줄, 함수 진입), 레지스터 및 메모리 읽기/쓰기, 단계별 실행 등의 기능을 구현합니다. 이 튜토리얼에서는 C/C++, Linenoise, libelfin을 사용하며 각 파트의 코드는 GitHub에서 확인할 수 있습니다. 이후 파트에서는 원격 디버깅, 공유 라이브러리 지원, 식 평가, 다중 스레드 디버깅 등의 고급 주제를 다룰 것입니다.

더 보기
개발

Chrome AI 기반 검색 기록: 자연어로 필요한 정보 찾기

2025-03-02

Chrome은 AI 기반의 새로운 검색 기록 기능을 선보였습니다. 정확한 키워드나 웹사이트 주소를 몰라도 자연어로 검색 기록을 찾을 수 있습니다. 이 기능을 사용하려면 미국에 거주하고 영어 Chrome을 사용하며 18세 이상이고 Google 계정에 로그인해야 합니다. 활성화하면 방문한 페이지의 내용이 로컬에 저장되어 AI 매칭에 사용됩니다. 설정에서 언제든지 비활성화할 수 있습니다. 결과는 생성된 답변 요약과 검색 기록에서 가장 일치하는 결과(최대 3개)로 표시됩니다. Google은 안전 정책 개선 및 대규모 언어 모델과 관련된 과제 해결 등 이 기능 개선을 위해 수집된 데이터를 사용합니다.

더 보기
기술 검색 기록

제로 다운타임 PostgreSQL 주요 버전 업그레이드

2025-01-29
제로 다운타임 PostgreSQL 주요 버전 업그레이드

Instant팀은 제로 다운타임으로 PostgreSQL을 버전 13에서 16으로 업그레이드한 경험을 공유합니다. 현장 업그레이드와 블루-그린 배포를 시도했지만 모두 실패했습니다. 결국 새로운 PostgreSQL 16 복제본을 생성하고, 구독 및 쓰기를 단계적으로 전환하고, 새로운 트랜잭션을 잠시 일시 중지하여 데이터 손실 없이 업그레이드를 완료하는 수동 접근 방식을 채택했습니다. 사용자 정의 함수 검색 경로 문제 및 시퀀스 데이터 복제 문제와 같은 과제에 직면했으며, 이 과정에서 얻은 귀중한 교훈을 공유합니다.

더 보기

GPT 래퍼 시대의 네트워크 효과 회귀

2025-02-10
GPT 래퍼 시대의 네트워크 효과 회귀

이 글은 대규모 언어 모델 훈련의 높은 비용이 상당한 진입 장벽이 될 것이라는 가정을 한 AI 방어 가능성에 대한 지배적인 이론에 이의를 제기합니다. 저자는 AI가 보편화됨에 따라 네트워크 효과가 매우 중요해질 것이라고 주장합니다. 웹 2.0 시대와의 유사성을 언급하면서, 단순한 'GPT 래퍼' 애플리케이션은 사용자 네트워크 구축, 참여도 향상, 수익화 전략 최적화를 통해 지속 가능한 경쟁 우위를 달성할 수 있다고 말합니다. 이는 네트워크 효과와 AI 기능의 융합을 추진하고 경쟁 환경을 재구성합니다.

더 보기

위키피디아 2024년 접속 순위: 미국 대선과 할리우드가 장악

2025-01-21

위키피디아 2024년 접속 순위가 발표되었으며, 미국 대선 관련 인물과 사건이 상위를 차지했습니다. 상위 10위 중 절반 이상이 후보자나 선거 결과와 관련된 것이었습니다. 할리우드 영화도 선전하여, 마블의 '데드풀 & 울버린'과 '듄: 파트 투' 등이 높은 인기를 자랑했습니다. 또한, 넷플릭스 범죄 다큐멘터리 시리즈 '몬스터즈: 라이얼과 에릭 메넨데스 스토리' 등도 많은 접속을 기록했습니다. 순위에는 인도 총선, 스포츠 이벤트, 테일러 스위프트와 사브리나 카펜터 같은 인기 가수, 그리고 ChatGPT와 일론 머스크 같은 기술 관련 인물도 포함되어 있습니다. 이 2024년 순간 포착은 세계적인 사건과 대중의 관심을 보여주며, 위키피디아가 주요 정보 출처로서의 역할을 하고 있음을 나타냅니다.

더 보기

러시아, AI 챗봇 조작을 위한 가짜 정보 자동화

2025-04-19
러시아, AI 챗봇 조작을 위한 가짜 정보 자동화

러시아는 우크라이나 전쟁과 같은 주요 주제에 대한 답변에 영향을 미치기 위해 AI 챗봇을 조작하는 가짜 정보의 확산을 자동화하고 있습니다. 연구자들은 주요 챗봇이 러시아의 거짓말을 반복했다는 것을 발견하여 AI의 데이터 의존성 취약성을 드러냈습니다. 러시아는 AI 크롤러가 감지하도록 설계된 웹사이트 네트워크(프라브다 네트워크)를 만들어 인터넷을 허위 정보로 포화 상태로 만들었습니다. 이 저렴하고 매우 효과적인 전술은 정부 감시 감소와 챗봇의 급속한 확산으로 악화되어 정보의 무결성을 손상시킵니다. 효과적인 대응 메커니즘 부족은 중대한 위협을 초래합니다.

더 보기
기술

Wi-Fi CSI를 사용한 실시간 인체 동작 감지 및 3D 시각화

2025-08-26
Wi-Fi CSI를 사용한 실시간 인체 동작 감지 및 3D 시각화

WiFi-3D-Fusion은 로컬 Wi-Fi의 채널 상태 정보(CSI)를 활용하여 실시간 인체 동작 감지 및 3D 시각화를 수행하는 오픈소스 프로젝트입니다. ESP32-CSI와 Nexmon 모두를 통한 데이터 수집을 지원하며, 고급 CNN을 사용하여 사람 감지 및 추적, 다중 인물 식별 및 재식별을 수행합니다. 지속적인 학습 파이프라인을 통해 모델은 작동 중에 자동으로 개선됩니다. 웹 인터페이스와 터미널 기반 파이프라인 모두에서 시각화를 제공합니다. Person-in-WiFi-3D, NeRF², 3D Wi-Fi Scanner와의 선택적 통합도 제공됩니다.

더 보기

Mojo를 사용한 고효율 행렬 전치: CUDA 뛰어넘기?

2025-06-06
Mojo를 사용한 고효율 행렬 전치: CUDA 뛰어넘기?

이 블로그 게시물에서는 Mojo를 사용하여 Hopper 아키텍처에서 고효율 행렬 전치 커널을 구현하는 방법을 자세히 설명합니다. 저자는 단순한 방법부터 시작하여 2775.49 GB/s의 대역폭을 달성하는 커널에 이르기까지 최적화 과정을 단계별로 보여줍니다. 이는 동등한 CUDA 구현과 경쟁하고 경우에 따라 능가할 수 있습니다. 최적화에는 TMA(텐서 맵 액세스) 디스크립터 사용, 공유 메모리 최적화, 데이터 스위즐링, 스레드 조정 등이 포함됩니다. 이 게시물에서는 각 기법의 구현 세부 정보와 성능 향상에 대해 심층적으로 다루고 완벽한 코드 예제를 제공합니다.

더 보기
개발 행렬 전치

우연한 발명: 100년 역사의 스노우 글로브 유산

2025-01-02
우연한 발명: 100년 역사의 스노우 글로브 유산

빈의 페르치 가문은 우연히 스노우 글로브를 발명했습니다. 1900년, 에르빈 페르치 1세는 수술실 조명을 개선하려고 시도하는 과정에서 실수로 물과 흰 입자가 눈처럼 떠다니는 유리 구체를 만들었습니다. 그는 훌륭한 아이디어를 떠올려 마리아첼 성당 미니어처 모형을 안에 넣어 최초의 스노우 글로브를 제작했습니다. 이 우연한 발명은 전 세계적으로 인기를 얻었고, 전쟁과 경제 불황을 극복하며 페르치 가문 여러 세대에 걸쳐 크리스마스의 대표적인 상징이 되었습니다. 현재도 가족 경영 기업에서 연간 30만 개를 생산하고 있습니다.

더 보기

9200만 달러 규모 야생동물 횡단교: 토양 설치 완료, 생태 복원 사업 새로운 단계 돌입

2025-04-05
9200만 달러 규모 야생동물 횡단교: 토양 설치 완료, 생태 복원 사업 새로운 단계 돌입

약 3년과 9200만 달러의 시간과 비용을 들여 월리스 애넨버그 야생동물 횡단교 프로젝트가 중요한 이정표에 도달했습니다. 토양 설치 완료입니다. 로스앤젤레스 101번 고속도로로 인해 야기된 야생동물 서식지 단편화 문제를 해결하기 위해 설계된 이 횡단교는 멸종 위기의 퓨마를 포함한 동물들에게 안전한 통로를 제공할 것입니다. 지역 미생물이 풍부한 특수 배합 토양 6000큐빅 야드가 추가되어 지역 생태계를 복원합니다. 이 프로젝트는 두 단계로 나뉩니다. 토종 식물 파종 및 식재를 포함한 1단계는 올 여름에 완료될 예정입니다. 주변 언덕과 구조물을 연결하는 2단계는 2026년 말까지 완료될 예정입니다. 이 프로젝트는 생태 복원에서 인간의 창의성을 보여주며, 유사한 노력에 귀중한 경험을 제공할 것입니다.

더 보기

국립 기록원, 역사적 필체 해독에 여러분의 도움을 요청합니다

2025-01-18
국립 기록원, 역사적 필체 해독에 여러분의 도움을 요청합니다

미국 국립 기록원은 많은 수의 역사적 문서를 필체로 보관하고 있지만, 이 중 상당수는 읽기가 어렵습니다. 디지털 목록 접근성을 높이기 위해 기록원은 '시민 아카이비스트' 프로그램을 시작하여 이러한 필기 기록의 전사 및 정리를 돕는 자원봉사자를 모집하고 있습니다. 자원봉사자는 간편한 온라인 도구를 사용하여 전사하거나 이미 전사된 문서에 태그를 지정하여 적은 시간이라도 기여할 수 있습니다. 이 프로그램은 역사 연구에 도움이 될 뿐만 아니라 더 많은 사람들에게 미국 역사에 대한 접근 기회를 제공하고, 점점 더 많은 주에서 학교에서 필체 교육을 의무화하고 있기 때문에 필체에 대한 관심을 되살리는 계기가 되기도 합니다.

더 보기

프랑스 핵융합로, 22분간 플라즈마 유지하며 신기록 달성

2025-02-19
프랑스 핵융합로, 22분간 플라즈마 유지하며 신기록 달성

프랑스 원자력 및 대체에너지 위원회(CEA)의 WEST 토카막 원자로가 핵융합 에너지 연구에서 획기적인 성과를 달성하여 22분 이상 플라즈마 반응을 유지하는 데 성공하며 세계 신기록을 세웠습니다. 이 업적은 오랜 목표였던 상용 핵융합 발전에 한 걸음 더 다가서는 것을 의미하며, 인류에게 거의 무한한 청정 에너지를 제공할 가능성을 지닙니다. 핵융합 반응 시작은 비교적 간단하지만, 소비 에너지보다 더 많은 에너지를 생산하는 자립형 원자로 개발은 매우 어렵습니다. WEST 원자로의 성공은 현재 프랑스 남부에서 건설 중인 국제 열핵융합 실험로(ITER)에 귀중한 데이터와 경험을 제공하여 미래 청정 에너지 활용의 길을 열어줍니다.

더 보기

GitHub의 새로운 프로젝트 AuthorTrail: Git 기여 내역 추적

2024-12-24
GitHub의 새로운 프로젝트 AuthorTrail: Git 기여 내역 추적

AuthorTrail은 개발자가 Git 저장소에서 이전에 수정했던 모든 파일을 추적하는 데 도움이 되는 새로운 GitHub 프로젝트입니다. 작성자 이메일로 검색, 계층적 파일 트리 시각화, 내장 코드 뷰어, 기본 편집기에서 빠르게 열기 등의 기능을 제공합니다. React, TypeScript, Tailwind CSS를 사용하여 구축되었으며, 다크 모드를 지원합니다. 저장소를 복제하고, 종속성을 설치하고, 실행하여 기여 내역을 추적할 수 있습니다.

더 보기

OpenEuroLLM: 유럽이 추진하는 오픈소스 다국어 LLM

2025-02-03

20개의 주요 유럽 연구 기관 및 기업 컨소시엄이 고성능 다국어 대규모 언어 모델(LLM)군을 구축하는 프로젝트인 OpenEuroLLM을 시작했습니다. 이 이니셔티브는 오픈소스 원칙을 통해 고품질 AI 기술에 대한 접근을 민주화함으로써 유럽의 AI 경쟁력을 높이는 것을 목표로 합니다. 이를 통해 유럽 기업과 공공 기관은 영향력 있는 제품과 서비스를 개발할 수 있습니다. OpenEuroLLM은 유럽의 규제 프레임워크 내에서 운영되며 오픈소스 커뮤니티와 협력하여 모델, 소프트웨어, 데이터, 평가의 완전한 개방성을 보장하고 공공 및 민간 부문의 다양한 요구를 충족하는 동시에 언어 및 문화적 다양성을 유지합니다.

더 보기
AI

저녁 식사 시 칼륨 섭취량이 많을수록 수면 장애가 적다: 일본 연구

2025-01-17
저녁 식사 시 칼륨 섭취량이 많을수록 수면 장애가 적다: 일본 연구

일본 연구에 따르면, 특히 저녁 식사 시 칼륨 섭취량이 많을수록 수면의 질이 향상될 가능성이 있는 것으로 나타났습니다. 연구진은 4568명의 일본 성인의 식단과 수면 데이터를 분석하여 하루 총 칼륨 섭취량과 불면증의 심각도 사이에 역의 상관관계가 있음을 발견했습니다. 저녁 식사 시 섭취한 칼륨의 효과가 가장 두드러졌습니다. 이는 칼륨이 근육 이완, 신경 전달 물질 기능, 혈압 조절에 도움이 되기 때문으로 생각됩니다. 하지만 인과 관계와 저녁 식사 효과의 구체적인 메커니즘을 확인하려면 추가 연구가 필요합니다.

더 보기
건강 칼륨 식단

Linear 동기화 엔진의 리버스 엔지니어링: 상세 연구

2025-05-31
Linear 동기화 엔진의 리버스 엔지니어링: 상세 연구

이 상세한 연구는 Linear의 동기화 엔진(LSE)의 리버스 엔지니어링을 수행하여 임의의 데이터 모델 지원, 풍부한 기능(부분 동기화, 권한 제어, 실행 취소/다시 실행, 오프라인 가용성, 편집 이력), 뛰어난 개발자 경험과 같은 과제에 대한 우아한 해결책을 제시합니다. 저자는 Linear의 프런트엔드 코드를 심층적으로 분석하여 LSE의 모델 정의, MobX 사용, 부트스트래핑 프로세스, 로컬 데이터베이스 구축, 지연 로드 데이터, 클라이언트와 서버 간 동기화, 실행 취소/다시 실행 메커니즘을 분석합니다. 이 글에서는 LSE가 모델과 메타데이터를 정의하고, 부트스트래핑과 지연 로드를 수행하고, 트랜잭션, 증분 업데이트, 충돌 해결을 처리하는 방법을 설명합니다. LSE의 목표는 개발자가 동기화 엔진 전문가일 필요 없이 협업 애플리케이션을 구축할 수 있도록 하는 것입니다.

더 보기

Linux OpenZFS에서 zpool import/export의 잠재적 문제

2024-12-26

Linux OpenZFS(2.3.0 기준)에서 ZFS 풀의 임포트와 익스포트 관련 잠재적 문제가 있습니다. ZFS 풀에 'sharenfs' 속성이 설정된 파일 시스템이 없더라도 `zpool import`와 `zpool export`는 `exportfs -ra`를 실행합니다. 이로 인해 수동으로 추가하거나 수정한 NFS 익스포트가 삭제될 수 있으며, 사용자 지정 NFS 익스포트 설정을 사용하는 고가용성 시스템 등의 환경에 영향을 미칩니다. 이 문제는 OpenZFS가 NFS 익스포트 변경이 필요한지 여부와 관계없이 `exportfs -ra`를 무조건 실행하기 때문에 발생합니다.

더 보기
개발

AI 제품 구축: 백엔드 아키텍처 심층 분석

2024-12-27

이 글에서는 엔지니어링 리더를 위한 AI 기반 최고참모를 구축한 AI 팀의 여정을 자세히 설명합니다. 처음에는 간단한 추론 파이프라인을 사용했지만 애플리케이션이 성장함에 따라 멀티 에이전트 시스템으로 전환했습니다. 저자는 에이전트 설계 원칙, 마이크로서비스와의 차이점, 객체 지향 구현에 대해 설명합니다. 메모리 관리(CQRS 및 이벤트 소싱 포함)와 자연어 이벤트 처리도 설명되어 있습니다. 1만 명의 사용자로 확장하는 데는 샤딩, 비동기 프로그래밍, LLM 호출 최적화, Temporal로의 마이그레이션이 포함되었습니다.

더 보기

Kubernetes에서 IP 주소 및 네트워크 변경 자동화

2025-03-11
Kubernetes에서 IP 주소 및 네트워크 변경 자동화

저자의 Kubernetes 클러스터는 동적으로 할당된 IP 주소에 의존하며, 이로 인해 네트워크 구성의 취약성이 발생했습니다. 이 문제를 해결하기 위해 Unifi API를 사용하여 Unifi 게이트웨이의 공용 IP 주소를 정기적으로 확인하고 업데이트하는 Kubernetes 배포를 만들었습니다. IP 주소 또는 IPv6 네트워크 변경을 감지하면 Unifi 방화벽 규칙과 Kubernetes 서비스 리소스(MetalLB 구성 포함)를 자동으로 업데이트하고 MQTT를 통해 사용자에게 알림을 보냅니다. 이 프로그램은 Python으로 작성되었으며 자동화를 위해 Kubernetes 및 Unifi API를 활용합니다.

더 보기

규모가 모든 것을 정복하다: AI 에이전트가 swebench-verified에서 SOTA 달성

2025-01-08
규모가 모든 것을 정복하다: AI 에이전트가 swebench-verified에서 SOTA 달성

CodeStory는 대규모 테스트 시간 추론을 활용하여 swebench-verified 벤치마크에서 최첨단 결과를 달성하고 문제의 62.2%를 해결했습니다. Sonnet 3.5 LLM과 간단한 툴셋을 사용했으며, 초기 MCTS 프레임워크를 확장성을 위해 포기했습니다. 여러 가상 머신과 Anthropic 계정에서 다수의 에이전트를 실행하여 소규모 팀이라도 복잡한 소프트웨어 엔지니어링 문제 해결에서 규모의 힘을 입증했습니다. 이는 '규모가 모든 것을 정복한다'는 '쓴 교훈'을 강화하며, 소프트웨어 엔지니어링 분야에서 AI를 위한 새로운 패러다임을 제시합니다.

더 보기
개발
1 2 29 30 31 33 35 36 37 595 596