Category: AI

CRISPR을 이용한 프로그래밍 가능한 배아 모델 생성

2025-03-23
CRISPR을 이용한 프로그래밍 가능한 배아 모델 생성

UC 산타크루즈 대학의 과학자들은 실제 배아를 사용하지 않고 수정 후 며칠을 모방하는 배아의 세포 모델을 개발했습니다. CRISPR 기반 유전자 편집 기술을 사용하여 마우스 줄기 세포를 초기 배아 발생의 중요한 단계를 복제하는 배아 유사체라고 불리는 자기 조직화 구조로 유도했습니다. 이를 통해 초기 발생에서 유전자의 기능과 발생 장애의 메커니즘을 연구할 수 있습니다. Cell Stem Cell에 게재된 이 연구는 인간 불임의 이해와 불임 치료 개선에 새로운 길을 열었습니다.

야행성과 우울증: 마음챙김이 열쇠일 수 있다

2025-03-23
야행성과 우울증: 마음챙김이 열쇠일 수 있다

젊은 성인을 대상으로 한 연구에서 야행성(밤에 활동적인 사람)과 우울증 증상 증가 사이의 강력한 연관성이 밝혀졌습니다. 연구자들은 마음챙김, 되새김질, 알코올 섭취, 수면의 질을 잠재적 매개 변수로 조사했습니다. 결과는 이러한 요소들이 관계를 유의미하게 매개한다는 것을 보여주며, '의식적으로 행동하기'라는 마음챙김의 한 측면이 우울증에 대한 특별한 보호 효과를 제공합니다. 이 연구는 청년들의 정신 건강을 개선하기 위한 새로운 개입 전략을 제시합니다.

LLM이 추천 시스템과 검색 엔진에 혁명을 일으키다: 종합적인 설문 조사

2025-03-23
LLM이 추천 시스템과 검색 엔진에 혁명을 일으키다: 종합적인 설문 조사

이 기사에서는 대규모 언어 모델(LLM)을 추천 시스템과 검색 엔진에 적용한 최근 연구를 개괄적으로 살펴봅니다. 이러한 연구는 LLM로 향상된 모델 아키텍처(예: YouTube의 Semantic ID, Kuaishou의 M3CSR), LLM을 사용한 데이터 생성 및 분석(예: Bing의 추천 품질 개선, Indeed의 예상되는 불일치), LLM 교육 방법론(예: 스케일링 법칙, 전이 학습, 지식 증류) 등 다양한 접근 방식을 탐구합니다. 또한 효율성과 성능을 향상시키기 위해 LinkedIn의 360Brew나 Netflix의 UniCoRn과 같은 검색 및 추천 시스템의 통합 아키텍처에 중점을 둡니다. 전반적으로 이러한 연구는 추천 시스템과 검색 엔진의 성능 향상에 있어 LLM의 큰 잠재력을 보여주며, 상당한 현실 세계 결과를 가져왔습니다.

AI

AI의 경제적 영향: 단순히 R&D 자동화가 아니다?

2025-03-22
AI의 경제적 영향: 단순히 R&D 자동화가 아니다?

일반적인 견해는 AI의 주요 경제적 영향이 R&D 자동화에 있다는 것입니다. 하지만 이 글에서는 이러한 견해에 이의를 제기하며, R&D의 경제적 가치는 과대평가되어 있으며 생산성 향상에 대한 기여는 일반적으로 생각하는 것보다 훨씬 적다고 주장합니다. 저자들은 AI의 경제적 가치는 주로 광범위한 노동 자동화에서 비롯되며, 이는 생산성과 생산량의 상당한 증가로 이어질 것이라고 주장합니다. 이는 R&D 발전에만 국한되지 않습니다. AI가 결국 R&D를 자동화한다 하더라도, 이는 더 광범위한 자동화 이후, AI가 더 폭넓은 작업을 수행할 수 있게 된 후에 일어날 것입니다.

AI

바이브 코딩의 여섯 가지 파장과 프로그래밍의 미래

2025-03-22
바이브 코딩의 여섯 가지 파장과 프로그래밍의 미래

본 기사는 전통적인 코딩에서 코드 완성, 채팅 기반 코딩, 코딩 에이전트, 에이전트 클러스터, 그리고 마지막으로 에이전트 함대에 이르기까지 AI 코딩의 진화를 탐구합니다. 저자는 코딩 에이전트가 개발 효율성을 극적으로 높일 것이지만 높은 비용도 수반될 것이라고 예측합니다. 미래 프로그래머의 역할은 AI 에이전트 관리 및 조정으로 전환됩니다. 본 기사는 젊은 세대의 프로그래머가 베테랑 개발자보다 AI 기술을 더 적극적으로 채택하고 있으며, 이는 소프트웨어 개발 업계의 인재 구조를 재편성할 것이라고 강조합니다. 저자는 이 분야에서 미래에 성공하려면 코딩 에이전트를 효과적으로 사용하는 방법을 배우는 것이 필수적이라고 결론짓습니다.

AI 선호도 표준화: AI 학습 데이터의 저작권 문제 해결

2025-03-22
AI 선호도 표준화: AI 학습 데이터의 저작권 문제 해결

AI 모델 학습에 인터넷 콘텐츠를 사용함으로써 발생하는 저작권 문제를 해결하기 위해, IETF의 새롭게 구성된 AI 선호도 작업 그룹(AIPREF)은 콘텐츠 수집 및 처리 방법에 대한 선호도를 표현하는 구성 요소를 표준화하기 위해 노력하고 있습니다. 현재 AI 공급업체는 크롤링 및 학습 결정을 안내하기 위해 혼란스러운 비표준 신호(robots.txt 등)를 사용하고 있으며, 이로 인해 저자와 게시자는 자신의 선호도가 존중될 것이라는 확신을 얻지 못하고 있습니다. AIPREF는 저자와 게시자의 선호도를 표현하는 공통 어휘, 이 어휘를 인터넷 콘텐츠에 첨부하는 방법, 그리고 여러 선호도 표현을 조정하기 위한 표준 메커니즘을 정의할 것입니다. 작업 그룹의 첫 번째 회의는 IETF 122 방콕에서 개최됩니다.

AI

AI 확장의 한계: 무작정 규모 확장은 끝을 맞이할 것인가?

2025-03-22
AI 확장의 한계: 무작정 규모 확장은 끝을 맞이할 것인가?

475명의 AI 연구원을 대상으로 한 설문조사에 따르면, 현재 AI 접근 방식을 단순히 확장하는 것만으로는 범용 인공지능(AGI)으로 이어질 가능성이 낮은 것으로 나타났습니다. 기술 대기업의 데이터 센터 투자에도 불구하고, 수확 체감은 분명합니다. OpenAI의 최신 GPT 모델은 제한적인 개선만 보여주는 반면, DeepSeek는 비용과 에너지 소비의 일부만으로 동등한 AI 성능을 달성했습니다. 이는 OpenAI의 테스트 시간 연산 및 DeepSeek의 '전문가 혼합' 접근 방식과 같이 더 저렴하고 효율적인 방법이 미래의 핵심이 될 것임을 시사합니다. 그러나 대기업들은 여전히 무작정 규모 확장을 선호하며, 더 작은 스타트업들이 보다 경제적인 대안을 모색하게 될 것입니다.

AI

AI 팀 동료: 생성형 AI가 팀워크와 전문성을 어떻게 변화시키는지 보여주는 현장 실험

2025-03-22
AI 팀 동료: 생성형 AI가 팀워크와 전문성을 어떻게 변화시키는지 보여주는 현장 실험

P&G에서 수행된 무작위 대조 시험에서 생성형 AI가 팀 생산성과 솔루션 품질을 크게 향상시키는 것으로 나타났습니다. AI를 사용한 개인은 AI를 사용하지 않는 팀과 동등한 성과를 거두었고, AI를 사용한 팀은 뛰어난 성과를 거두어 최상위 솔루션을 만들어낼 가능성이 크게 높아졌습니다. AI는 효율성을 높일 뿐만 아니라 긍정적인 감정을 증가시키고, 부서 간의 벽을 허물고, 경험이 적은 직원들이 경험이 많은 팀 구성원과 동등한 수준에 도달할 수 있도록 했습니다. 이 연구는 AI가 단순한 생산성 향상 도구가 아니라 팀워크와 조직 구조를 변혁시킬 수 있는 "팀 동료"임을 시사합니다.

AI

R1-Zero의 비밀: Oat 프레임워크를 사용한 LLM의 효율적인 정렬

2025-03-22
R1-Zero의 비밀: Oat 프레임워크를 사용한 LLM의 효율적인 정렬

연구자들은 R1-Zero 유사 훈련의 비밀을 밝히는 논문, 모델 및 코드베이스를 발표했습니다. 그들은 고도로 모듈화되고 효율적인 LLM 강화 학습 프레임워크인 Oat를 개발하여 Qwen2.5와 같은 모델을 R1-Zero로 훈련했습니다. 연구에 따르면 적절한 기본 모델과 개선된 강화 학습 알고리즘(Dr. GRPO)이 중요하며, 일치하지 않는 템플릿과 질문 세트로 인한 편향된 최적화를 방지할 수 있습니다. 결과적으로 8개의 A100 GPU에서 단 27시간의 연산으로 최첨단 성능을 달성했습니다.

AI

메타와 오픈AI, 불법 데이터베이스 사용해 AI 모델 학습 논란

2025-03-22
메타와 오픈AI, 불법 데이터베이스 사용해 AI 모델 학습 논란

메타와 오픈AI가 불법 복제 도서 데이터베이스인 Library Genesis(LibGen)를 사용하여 AI 모델을 학습시켰다는 사실이 드러나면서 저작권 침해 논란에 휩싸였다. 메타는 Llama 3 모델 학습 속도를 높이기 위해 고가의 라이선스 계약 대신 LibGen에서 수백만 권의 책과 논문을 직접 다운로드했다. 소송이 제기되면서 메타 직원들이 법적 위험을 인지하면서도 행위를 은폐하려 했다는 사실이 드러났다. 오픈AI 역시 LibGen을 과거에 사용했음을 인정했지만, 최신 모델에는 사용하지 않는다고 주장했다. 이 사건은 AI 모델 학습 데이터의 윤리적, 법적 문제와 지적 재산권 보호의 어려움을 보여주는 사례다.

FutureHouse: 반자율 AI 과학자 구축

2025-03-22
FutureHouse: 반자율 AI 과학자 구축

샌프란시스코에 본사를 둔 비영리 단체 FutureHouse는 AI를 사용하여 과학적 발견을 자동화하는 임무를 수행하고 있습니다. "까마귀"를 테마로 한 도구 세트를 개발했는데, ChemCrow는 화학 반응 설계, WikiCrow는 단백질 정보 요약, ContraCrow는 문헌 내 모순 식별, PaperQA 시리즈는 PDF의 신뢰할 수 있는 쿼리에 사용됩니다. FutureHouse의 목표는 예측 모델부터 궁극적으로 독립적으로 실험을 수행할 수 있는 휴머노이드 로봇에 이르기까지 반자율 AI 과학자를 구축하는 것입니다. 이를 통해 과학적 발견이 가속화되고 생의학 문헌의 요약 어려움이나 신뢰성 문제 등이 해결됩니다. 과제로는 인프라 구축, 데이터 접근, 엔지니어링 문제 해결 등이 있지만, AI 모델은 가설 생성과 결론 도출에 탁월한 성능을 발휘합니다. FutureHouse는 AI 과학자의 신뢰성을 중시하며, 데이터 분석 개선과 재현성 향상을 통해 문제 해결에 노력하고 있습니다.

텐센트의 Hunyuan-T1: Mamba 기반 최초의 초대형 모델, 추론 효율성 재정의

2025-03-22

텐센트는 자사의 Hunyuan 대규모 언어 모델 시리즈에 최신 모델인 Hunyuan-T1을 발표했습니다. 세계 최초의 초대규모 하이브리드 Transformer-Mamba MoE 대규모 모델인 TurboS를 기반으로 구축된 Hunyuan-T1은 광범위한 사후 훈련을 통해 추론 능력이 크게 향상되었고, 사용자 선호도와의 일관성이 개선되었습니다. 미리보기 버전과 비교하여 Hunyuan-T1은 성능이 크게 향상되었으며, 디코딩 속도가 2배가 되었습니다. 다양한 공개 벤치마크에서 R1과 동등하거나 약간 더 나은 결과를 달성했으며, 내부 인간 평가 데이터 세트에서는 특히 문화적 및 창의적 지시 사항 준수, 텍스트 요약, 에이전트 기능 측면에서 R1을 능가했습니다. 이번 출시는 대규모 언어 모델의 사후 훈련 최적화에서 강화 학습 활용의 중요한 진전을 보여줍니다.

AI

도구형 AI vs. 에이전트형 AI: 제어와 능력의 힘겨루기

2025-03-21
도구형 AI vs. 에이전트형 AI: 제어와 능력의 힘겨루기

이 글에서는 위험을 줄이기 위해 인공지능을 순수한 정보 처리 작업으로 제한하는(도구형 AI) 접근 방식의 효과에 대해 의문을 제기한다. 저자는 행동을 취할 수 있는 에이전트형 AI가 경제적, 지적으로 더 우월하기 때문에 이 접근 방식은 실행 불가능하다고 주장한다. 에이전트형 AI는 데이터 선택, 학습 최적화, 자기 설계, 외부 리소스 활용에 뛰어나 더 높은 지능 수준을 달성한다. 강화 학습은 복잡한 것을 처음부터 배우는 데 이상적인 방법은 아니지만 복잡한 시스템을 제어하는 최선의 방법이며, 세상에는 AI 자체를 포함하여 제어하고 싶은 복잡한 시스템이 가득하다. 따라서 도구형 AI는 궁극적으로 에이전트형 AI로 대체될 것이다. 후자가 시장 수요와 실용적인 응용 프로그램에 더 부합하기 때문이다.

AI

Meta의 Jagged Flash Attention: 추천 시스템 성능 혁명

2025-03-21
Meta의 Jagged Flash Attention: 추천 시스템 성능 혁명

Meta는 대규모 추천 시스템의 성능과 확장성을 획기적으로 개선하는 Jagged Flash Attention을 발표했습니다. 기존 방식은 가변 길이 범주형 특징(사용자 상호 작용 이력 등)을 처리하는 데 어려움을 겪었고, 많은 패딩이 필요했습니다. Jagged Flash Attention은 자그드 텐서를 사용하여 이러한 특징을 효율적으로 처리하고 패딩으로 인한 오버헤드를 제거합니다. TorchRec 라이브러리와 결합하여 Meta의 운영 환경에서 최대 10배의 성능 향상을 달성하고, 3조 개가 넘는 매개변수를 가진 모델의 학습을 가능하게 합니다. 이 획기적인 기술은 개인 맞춤형 추천 시스템의 발전을 크게 촉진할 것입니다.

AI

ChatGPT 사용과 고독감 증가의 연관성: OpenAI와 MIT 연구

2025-03-21
ChatGPT 사용과 고독감 증가의 연관성: OpenAI와 MIT 연구

OpenAI와 MIT의 새로운 연구에 따르면 ChatGPT와 같은 챗봇 사용 증가는 고독감 증가 및 사회적 상호 작용 감소와 관련이 있을 수 있다는 것을 시사합니다. 한 달 동안 약 1000명의 사용자를 추적한 연구에서 ChatGPT와 많은 시간을 보낸 사용자는 정서적 의존성과 고독감을 더 크게 보고했습니다. 정서적 지원을 위해 ChatGPT를 사용한 사용자는 적었지만, 이 연구는 정서적 의존 경향이 있는 사람들의 경우 고독감이 악화될 가능성을 시사합니다. 연구자들은 AI가 인간의 행복에 미치는 영향과 책임감 있는 AI 설계에 대한 추가 연구의 필요성을 강조합니다.

PocketFlow: 기업용 AI 시스템 구축을 위한 새로운 프레임워크

2025-03-21
PocketFlow: 기업용 AI 시스템 구축을 위한 새로운 프레임워크

PocketFlow는 TypeScript 기반의 LLM 프레임워크로, 중첩된 방향 그래프 구조를 사용합니다. 복잡한 AI 작업을 재사용 가능한 LLM 단계로 분해하여 에이전트와 같은 의사 결정을 위한 분기 및 재귀를 가능하게 합니다. 이 프레임워크는 확장성이 뛰어나고, 특수한 래퍼 없이 다양한 LLM 및 API를 통합할 수 있으며, 워크플로 시각화 및 상태 유지를 통한 디버깅 기능도 갖추고 있습니다. 이를 통해 기업 수준의 AI 시스템 구축 속도를 높일 수 있습니다.

영지식 증명 설명: 비디오 심층 분석

2025-03-21
영지식 증명 설명: 비디오 심층 분석

작성자는 영지식 증명을 설명하는 비디오를 공개했습니다. 놀랍게도 이 복잡한 알고리즘을 명확하게 설명하려면 많은 작업이 필요했습니다. 비디오에서는 다양한 측면과 응용 프로그램을 다루지만 완전한 이해를 위해서는 더 자세한 리소스가 필요하다는 점을 인정합니다. 게시물에서는 만족도 문제를 3색 문제로 축소하는 방법을 자세히 설명하고 신뢰할 수 있는 당국이 없는 투표 시스템 및 통화 시스템 등 분산 시스템에 미치는 영향에 대해 논의합니다. 마지막으로 비대화형 증명을 소개하고 암호화 해시 함수를 사용하여 무작위 비콘을 시뮬레이션하여 생성하는 방법을 보여줌으로써 최근 비디오의 주제를 효과적으로 통합합니다.

AI 생성 아동 성학대 자료: 수정헌법 제1조와의 대결

2025-03-20
AI 생성 아동 성학대 자료: 수정헌법 제1조와의 대결

AI 생성 아동 성학대 자료(CSAM) 관련 최근 미국 지방법원 판결이 수정헌법 제1조에 대한 논쟁을 불러일으켰다. 법원은 AI 생성 가상 CSAM의 개인 소지는 수정헌법 제1조에 의해 보호되지만, 제작 및 배포는 보호되지 않는다고 판결했다. 이 판결은 AI 기반 아동 성 착취 및 학대 대응에 있어 법 집행 기관이 직면한 과제와 법적 복잡성을 보여준다.

AI

Google Gemma 3: 단일 가속기 AI 모델의 주요 업그레이드

2025-03-20
Google Gemma 3: 단일 가속기 AI 모델의 주요 업그레이드

초기 Gemma AI 모델 출시 후 1년 이상이 지난 후 Google은 경쟁사인 Llama 및 OpenAI보다 뛰어난 성능을 자랑하는 Gemma 3을 공개했습니다. 특히 단일 GPU 시스템에서 그 성능이 두드러집니다. 이 향상된 모델은 35개 이상의 언어를 지원하며 텍스트, 이미지, 짧은 비디오를 처리합니다. Gemma 3은 고해상도 및 비정방형 이미지를 지원하는 업그레이드된 비전 인코더를 갖추고 있으며, 부적절한 콘텐츠를 필터링하기 위한 새로운 ShieldGemma 2 이미지 안전 분류기가 포함되어 있습니다. 라이선스와 관련된 '오픈'의 정의에 대한 논의가 계속되고 있지만, Google은 Google Cloud 크레딧과 연구에 1만 달러의 크레딧을 제공하는 학술 프로그램을 통해 Gemma 3을 계속 홍보하고 있습니다.

AI

ChatGPT 환각으로 인한 OpenAI에 대한 새로운 개인 정보 보호 소송

2025-03-20
ChatGPT 환각으로 인한 OpenAI에 대한 새로운 개인 정보 보호 소송

OpenAI는 ChatGPT가 허위 정보를 생성하는 경향으로 인해 유럽에서 새로운 개인 정보 보호 소송에 직면하고 있습니다. Noyb는 ChatGPT에 의해 두 명의 아이를 살해하고 세 번째 아이를 살해하려고 시도했다는 거짓 혐의를 받은 노르웨이 사용자를 지원하고 있습니다. 이는 LLM의 '환각' 위험과 GDPR의 정확성 요구 사항을 강조합니다. OpenAI는 프롬프트 차단과 같은 해결책을 제공하지만 GDPR의 정정 권리 측면에서는 불충분합니다. 이 소송은 연간 매출의 최대 4%에 해당하는 벌금으로 이어질 수 있으며, OpenAI가 AI 제품을 수정하도록 강제하고 업계 전체에 영향을 미칠 것입니다.

AI

Pump: AI 기반 클라우드 비용 최적화로 60% 절감

2025-03-20
Pump: AI 기반 클라우드 비용 최적화로 60% 절감

클라우드 지출은 연간 5000억 달러에 달하며, 기술 회사의 가장 빠르게 성장하는 비용 항목입니다. Pump는 AI 기반 플랫폼을 제공하여 비용 절감을 자동화하고 공동 구매를 활용하여 클라우드 비용을 최대 60%까지 절감합니다. Y Combinator의 지원을 받는 Pump의 경험 많은 팀은 투명하고 협력적이며 빠른 속도로 성공을 추구하는 기업 문화를 구축하고 있습니다.

Claude가 이제 웹 검색을 사용합니다. 더 정확하고 최신 정보의 응답

2025-03-20
Claude가 이제 웹 검색을 사용합니다. 더 정확하고 최신 정보의 응답

Anthropic의 Claude AI 모델은 이제 더 정확하고 시기 적절한 응답을 제공하기 위해 웹 검색을 통합했습니다. Claude는 최신 이벤트와 정보에 액세스하고 사실 확인을 용이하게 하기 위해 출처를 직접 인용합니다. 이 기능은 현재 미국 유료 사용자를 위한 기능 미리보기로 제공되며, 무료 플랜 및 다른 국가에 대한 지원은 곧 시작될 예정입니다. 이러한 기능 향상을 통해 Claude는 트렌드 분석, 시장 데이터 평가, 연구 보고서 작성, 제품 세부 정보 비교 등을 통해 영업, 재무 분석가, 연구, 쇼핑에서 더 효과적으로 지원할 수 있습니다.

OpenAI의 고가 모델 o1-pro: 강력한 추론 AI이지만, 비용을 정당화할 수 있을까?

2025-03-20
OpenAI의 고가 모델 o1-pro: 강력한 추론 AI이지만, 비용을 정당화할 수 있을까?

OpenAI는 개발자 API를 통해 더욱 강력한 추론 AI 모델인 o1-pro를 출시했습니다. 높은 연산 능력으로 우수한 성능과 신뢰할 수 있는 응답을 자랑하지만, o1-pro는 매우 비쌉니다. 입력 토큰 100만 개당 150달러, 출력 토큰 100만 개당 600달러로 GPT-4.5 입력 비용의 2배, 일반 o1의 10배에 달합니다. 그러나 초기 테스트에서는 스도쿠 퍼즐이나 착시 유머 등에서 어려움을 겪는 등 결과가 엇갈렸습니다. 내부 벤치마크 결과는 코딩 및 수학 문제에 대한 성능이 o1보다 약간 우수하지만, 신뢰성이 향상되었음을 보여주었습니다. OpenAI의 승부수는 이러한 향상된 신뢰성이 개발자에게 높은 비용을 정당화할 수 있느냐에 달려 있습니다.

AI

심층 학습 강의 개요: 퍼셉트론부터 트랜스포머까지

2025-03-20

이 강의 개요는 초기 퍼셉트론과 역전파 알고리즘부터 최신 합성곱 신경망(CNN), 순환 신경망(RNN), 트랜스포머 모델까지 심층 학습의 광범위한 주제를 다룹니다. 본 강의에서는 최적화 알고리즘 및 정규화 방법 등 신경망 훈련 기법을 단계적으로 설명합니다. 시계열 예측, 시퀀스 투 시퀀스 예측, 적대적 생성 네트워크(GAN) 등 고급 주제도 다룹니다. 강의는 일련의 강의, 과제, 퀴즈를 통해 평가됩니다.

AI

Bolt3D: 몇 초 만에 3D 장면 생성

2025-03-19
Bolt3D: 몇 초 만에 3D 장면 생성

Google Research, VGG, Google DeepMind의 공동 연구로 탄생한 Bolt3D 모델은 단일 GPU에서 단 6.25초 만에 사실적인 3D 장면을 생성합니다. 이 모델은 멀티뷰 확산 모델을 사용하여 장면의 외관과 기하학적 형태를 생성한 다음, 가우시안 헤드를 사용하여 스플래터 이미지를 회귀 분석합니다. 마지막으로 여러 스플래터 이미지의 3D 가우시안 분포를 결합하여 완벽한 3D 장면을 형성합니다. 하나 이상의 입력 이미지를 지원하며, 재투영이나 인페인팅 메커니즘 없이 관찰되지 않은 장면 영역을 생성합니다. 이는 3D 장면 생성 속도의 획기적인 향상을 보여줍니다.

AI

LLM 에이전트: 놀랍도록 간단합니다!

2025-03-19
LLM 에이전트: 놀랍도록 간단합니다!

이 가이드는 LLM 에이전트의 내부 작동 방식을 명확하게 설명합니다. 간단한 부엌 비유를 사용하여 에이전트 시스템이 그래프로 어떻게 구성되는지 설명합니다. 노드는 조리 스테이션을, 플로우는 레시피를, 공유 저장소는 조리대를 나타냅니다. 각 노드는 준비, 실행, 결과 게시를 수행하고, 플로우는 결정에 따라 다음 노드를 결정합니다. 저자는 PocketFlow 프레임워크(겨우 100줄의 코드)를 사용하여 에이전트가 의사 결정 노드, 액션 노드, 종료 노드를 통해 어떻게 작동하는지 보여주고, 복잡한 알고리즘이 아닌 기본적인 그래프 구조를 강조합니다. 루프와 분기가 전부입니다!

개인 디지털 아카이브: AI 시대의 독특한 데이터 보고

2025-03-19
개인 디지털 아카이브: AI 시대의 독특한 데이터 보고

최신 격주 뉴스레터에서 린다는 개인 디지털 아카이브의 가치를 탐구합니다. 그녀는 평범해지기 쉬운 생성 AI 시대에 개인의 고유한 경험, 선호도, 관점을 포함하는 이러한 아카이브가 AI 모델 훈련 및 더욱 개인화된 작품 제작에 유용한 귀중한 리소스가 된다고 주장합니다. 이 기사에서는 저자가 책, 이미지, 링크를 수집한 경험을 예로 들고 역사가의 관점도 포함하여 AI 시대의 개인 아카이브의 중요성을 보여줍니다. 핀란드의 개인 아카이브 사례도 몇 가지 소개됩니다. 마지막으로 저자는 독자들에게 자신의 수집품과 스토리를 공유하여 개인 아카이브의 풍부함과 독특한 매력을 소개해 줄 것을 요청합니다.

Nvidia, Isaac GR00T N1 발표: 범용 로봇 시대의 도래

2025-03-19
Nvidia, Isaac GR00T N1 발표: 범용 로봇 시대의 도래

Nvidia는 인간형 로봇을 위한 오픈소스, 사전 훈련된 기반 모델인 Isaac GR00T N1을 발표하며 범용 로봇 시대의 도래를 알렸습니다. 인간의 인지에서 영감을 얻은 이 이중 시스템 모델은 빠른 반응의 '시스템 1'과 비전 언어 모델을 탑재한 더 느린 추론을 담당하는 '시스템 2'로 구성됩니다. 최소한의 추가 훈련 데이터로 파지 및 물체 조작과 같은 복잡한 작업을 수행할 수 있습니다. 1X Technologies는 이를 NEO Gamma 휴머노이드 로봇에 성공적으로 구축하여 자율적인 정리 작업을 실현했습니다. 이 모델의 오픈소스 특성과 사용자 정의 가능성은 인간형 로봇 개발을 크게 가속화하고 AI 발전을 촉진할 것으로 기대됩니다.

AI

NVIDIA Dynamo: 고처리량, 저지연 생성 AI 추론 프레임워크

2025-03-18
NVIDIA Dynamo: 고처리량, 저지연 생성 AI 추론 프레임워크

NVIDIA는 다중 노드 분산 환경에서 생성 AI 및 추론 모델을 제공하도록 설계된 고처리량, 저지연 추론 프레임워크인 Dynamo를 발표했습니다. Dynamo는 추론 엔진에 종속되지 않으며(TRT-LLM, vLLM, SGLang 등을 지원), 분산된 프리필 및 디코드 추론, 동적 GPU 스케줄링, LLM 인식 요청 라우팅, 고속 데이터 전송, KV 캐시 오프로딩 등의 기능을 통해 GPU 처리량을 극대화하고 지연 시간을 최소화합니다. 성능을 위해 Rust로, 확장성을 위해 Python으로 구축되었으며 완전히 오픈 소스입니다.

Meta의 Llama, 다운로드 10억 건 돌파, 오픈소스 AI 주도권 확보 목표

2025-03-18
Meta의 Llama, 다운로드 10억 건 돌파, 오픈소스 AI 주도권 확보 목표

Meta CEO 마크 저커버그는 자사의 오픈소스 AI 모델 Llama의 다운로드 수가 10억 건을 돌파했다고 발표했습니다. 2024년 12월 초와 비교하여 53% 증가한 수치입니다. Llama는 Meta의 AI 어시스턴트를 지원하며 Spotify, AT&T 등의 기업에서도 사용되고 있지만, 저작권 소송 및 데이터 프라이버시 문제에도 직면해 있습니다. 그럼에도 불구하고 Meta는 향후 몇 달 동안 추론 모델 및 멀티모달 모델을 포함한 새로운 Llama 모델을 출시할 계획이며, AI 프로젝트에 800억 달러를 투자하여 AI 분야에서 선두를 차지할 목표를 가지고 있습니다.

AI
1 2 28 29 30 32 34 35 36 40 41