Webtagr - 기술 뉴스 다이제스트

Salesforce, AI 에이전트로 디지털 노동 시장 장악 목표

2025-03-01

Salesforce CEO인 Marc Benioff는 회의 일정 설정, 거래 실행, 심지어 코딩과 같은 작업에 AI 에이전트를 활용하여 디지털 노동 시장에서 세계적인 선두주자가 되는 것을 목표로 한다고 발표했습니다. 챗봇과 달리 이러한 사전 예방적인 AI 에이전트는 최소한의 인적 감독만 필요합니다. 작년에 출시된 Salesforce의 Agentforce는 고객 지원 및 마케팅 캠페인과 같은 업무를 이러한 AI 에이전트에게 위임할 수 있도록 기업을 지원합니다. Benioff는 Fortune 100 기업의 약 절반이 Salesforce의 AI 및 데이터 클라우드 제품을 사용하고 있다고 강조했습니다.

(sfstandard.com)

AI 디지털 노동

OpenAI, AI 영상 생성 도구 Sora를 ChatGPT에 통합할 계획

2025-02-28

OpenAI는 인기 있는 챗봇 앱 ChatGPT에 AI 영상 생성 도구 Sora를 통합할 계획이라고 발표했습니다. 현재 Sora는 전용 웹 앱으로만 사용 가능하지만 OpenAI는 향후 더 많은 플랫폼으로 확장하고 기능을 개선할 예정입니다. ChatGPT의 단순성을 유지하기 위해 Sora는 처음에 독립적인 앱으로 출시되었지만, 앞으로는 ChatGPT 사용자가 Sora 영상을 직접 생성할 수 있게 되어 유료 구독자 증가로 이어질 가능성이 있습니다. OpenAI는 Sora를 활용한 이미지 생성 도구와 Sora Turbo의 새로운 버전도 개발할 계획입니다.

(techcrunch.com)

AI

GPT-4.5: 기대에 못 미치다?

2025-02-28

최근 출시된 GPT-4.5는 기대했던 혁신적인 돌파구를 제공하지 못했으며, 모델 크기 확장에만 의존하는 AI 개발 모델에 대한 회의론에 불을 지폈습니다. 예상과 비교하여 GPT-4.5의 성능 향상은 미미하며, 여전히 환각과 오류를 겪고 있습니다. 일부 AI 전문가들은 AGI 출현 시점 예측을 하향 조정했습니다. 이는 이전의 GPT-5에 대한 과도한 낙관적 예측과 대조되며, 막대한 투자에 상응하는 수익을 얻지 못하고 있음을 반영합니다. Nvidia 주가 하락도 이 점을 뒷받침합니다. 이 기사는 모델의 단순한 규모 확장 방식이 한계에 가까워지고 있을 가능성이 있다고 결론짓습니다.

(garymarcus.substack.com)

AI AI 개발 병목 현상

Salesforce, 시계열 인텔리전스를 위한 머신러닝 라이브러리 Merlion 오픈소스로 공개

2025-02-28

Salesforce는 시계열 인텔리전스를 위한 강력한 Python 라이브러리인 Merlion을 오픈소스로 공개했습니다. 이는 데이터 로드, 모델 구축, 출력 후처리, 모델 성능 평가 등을 포함하는 엔드투엔드 머신러닝 프레임워크를 제공합니다. Merlion은 예측, 이상 감지, 변화점 감지 등 다양한 시계열 학습 작업을 지원합니다. 사용하기 쉽고 효율적인 기본 모델과 AutoML 기능을 제공하여 엔지니어와 연구원이 신속하게 모델을 개발하고 벤치마크할 수 있도록 합니다. 또한 시각화 및 분산 컴퓨팅을 지원하므로 산업 규모의 시계열 애플리케이션 처리에 적합합니다.

(github.com)

AI

생성형 AI, 생산성 향상: 주당 수 시간 절약

2025-02-28

세인트루이스 연방준비제도이사회, 밴더빌트 대학교, 하버드 대학교의 연구에 따르면 생성형 AI가 근로자의 생산성을 크게 향상시키는 것으로 나타났습니다. 전국 규모의 설문조사를 기반으로 한 이 연구는 생성형 AI를 사용하는 근로자의 시간당 생산성이 33% 더 높다는 것을 발견했습니다. 자주 사용하는 근로자일수록 시간 절약 효과가 크며, 학습 곡선이 있음을 시사합니다. 정보 서비스 부문 근로자의 시간 절약 효과가 가장 크고, 레저 및 숙박 서비스 부문 근로자의 효과는 가장 낮았습니다. AI의 보편화는 비교적 최근 현상이기 때문에 전반적인 생산성 향상에 대한 장기적인 영향은 아직 불확실합니다. 일부 근로자는 절약된 시간을 생산성 향상이 아닌 여가 시간으로 사용할 수 있습니다.

(www.straitstimes.com)

AI

AARON: 오랫동안 지속된 AI 페인팅 시스템

2025-02-28

저명한 화가이자 엔지니어인 해롤드 코헨은 예술과 컴퓨터의 교차점을 탐구하는 데 평생을 바쳤습니다. 그의 AI 페인팅 시스템인 AARON은 역사상 가장 오랫동안 작동하는 AI 시스템 중 하나입니다. 단순한 흑백 스케치에서부터 풀컬러 페인팅까지, AARON은 진화하여 코헨과 협력하여 수많은 놀라운 작품을 만들어냈습니다. AARON은 예술사의 이정표일 뿐만 아니라 창의성에 대한 AI의 이해에 큰 영향을 미쳤습니다.

(computerhistory.org)

AI 컴퓨터

AI: 거대 언어 모델을 위한 돌 수프 비유

2025-02-28

이 글은 '돌 수프' 우화를 사용하여 거대 언어 모델(LLM)의 작동 방식을 영리하게 설명합니다. 이야기에서 여행자들은 몇 개의 돌과 마을 주민들이 제공한 재료를 사용하여 맛있는 수프를 만듭니다. 이것은 LLM이 소수의 알고리즘과 인터넷, 인간 피드백 등으로부터 얻은 방대한 리소스를 활용하여 외견상 '지능적인' 시스템을 구축하는 방식과 유사합니다. 저자는 LLM이 독립적인 지능형 에이전트가 아니라 인터넷 검색 엔진과 같은 문화 기술이라고 지적합니다. 그 '지능'은 알고리즘 자체의 마법이 아니라 집단적인 인간 지능의 기여에서 비롯됩니다.

(simons.berkeley.edu)

AI 문화 기술

앤드류 응의 새로운 문서 추출 서비스: 정확도 문제

2025-02-28

앤드류 응이 새롭게 출시한 문서 추출 서비스가 X에서 큰 화제가 되었지만, Pulse사의 테스트 결과 복잡한 재무 제표 처리에서 심각한 문제점이 발견되었습니다. 50% 이상의 환각 값, 음수 부호 및 통화 기호 누락 등이 그 예입니다. 이 글에서는 금융 등 정확한 데이터에 의존하는 산업에서 이러한 오류는 치명적인 결과를 초래할 수 있다고 주장합니다. Pulse사의 솔루션은 기존 컴퓨터 비전 알고리즘과 독점적인 표 변환 모델을 결합하여 높은 정확도와 낮은 지연 시간을 달성하여 LLM 모델의 비결정적 특성, 공간 인식 부족, 처리 속도 저하 등의 문제를 해결했습니다.

(www.runpulse.com)

AI 문서 추출 앤드류 응

AI, 효율성을 위해 비밀 언어 개발…개인정보 침해 우려

2025-02-28

바이러스 영상에서 두 AI 에이전트가 서로 대화하다가, 서로 AI임을 인식하자 인간이 이해할 수 없는 'Gibberlink' 모드로 전환하는 모습이 공개됐다. GGWave 프로토콜을 사용해 비프음으로 소통함으로써, 음성보다 훨씬 효율적으로 컴퓨팅 자원과 에너지를 절약한다. 개발팀은 AI 간 통화가 보편화될 미래에 중요하다고 주장한다. 하지만 이 기술은 개인정보 침해 및 보안 위험 가능성 때문에 우려를 낳고 있다.

(www.iflscience.com)

AI AI 커뮤니케이션

3FS: AI를 위한 고성능 분산 파일 시스템

2025-02-28

3FS는 AI 학습 및 추론 작업 부하의 과제를 해결하기 위해 설계된 고성능 분산 파일 시스템입니다. 최신 SSD와 RDMA 네트워크를 활용하여 분산 애플리케이션 개발을 간소화하는 공유 스토리지 계층을 제공합니다. 주요 기능으로는 뛰어난 성능과 사용 편의성, CRAQ를 통한 강력한 일관성, 표준 파일 인터페이스, 다양한 작업 부하(데이터 준비, 데이터 로더, 체크포인트, 추론을 위한 KVCache) 지원 등이 있습니다. 벤치마크 테스트 결과 대규모 클러스터에서 최대 6.6 TiB/초의 읽기 처리량과 3.66 TiB/분의 정렬 처리량을 달성했습니다. KVCache는 LLM 추론 효율성을 크게 높여 최대 40 GiB/초의 피크 읽기 처리량에 도달합니다. 이 프로젝트는 오픈 소스이며 자세한 설정 및 실행 지침이 제공됩니다.

(github.com)

AI 분산 파일 시스템

마르코프 체인: 시각적 설명

2025-02-28

이 기사는 마르코프 체인과 그 응용에 대한 명확하고 시각적인 설명을 제공합니다. 마르코프 체인은 서로 다른 "상태" 간에 전이하는 수학적 시스템입니다. 이 기사에서는 아기의 행동(놀기, 먹기, 자기, 울기)의 예를 사용하여 상태 공간과 전이 확률의 개념을 설명합니다. 2상태의 간단한 마르코프 체인과 그 전이 행렬이 제시됩니다. 또한, 이 기사에서는 기후 시뮬레이션의 예를 통해 마르코프 체인의 실제적인 응용을 보여주고, 실제 데이터에서의 "점착성" 개념을 강조합니다. 마지막으로, Google의 PageRank 알고리즘에서 마르코프 체인의 사용을 언급하여 그 강력함과 다양성을 보여줍니다.

(setosa.io)

AI 확률 상태 전이

GPU 부족으로 OpenAI, GPT-4.5 출시 연기

2025-02-28

OpenAI CEO 샘 알트먼은 GPU 부족으로 인해 회사의 최신 모델인 GPT-4.5 출시가 연기되었다고 발표했습니다. 알트먼은 이 모델을 “거대하고 비용이 많이 드는” 모델이라고 설명하며, 더 넓은 접근을 허용하기 전에 “수만 개”의 GPU가 더 필요하다고 말했습니다. GPT-4.5는 목요일부터 ChatGPT Pro 구독자에게 먼저 제공되고, 다음 주에는 ChatGPT Plus 사용자에게 제공될 예정입니다. 이 모델의 거대한 크기는 높은 비용(입력 토큰 100만 단위당 75달러, 출력 토큰 100만 단위당 150달러)에 기여하고 있으며, 이는 GPT-4보다 훨씬 비쌉니다. 알트먼은 GPU 부족이 OpenAI의 급속한 성장 때문이라고 말하며, 다음 주에 수만 개의 GPU를 추가하여 접근성을 확대할 것이라고 약속했습니다. OpenAI는 앞으로 자체 AI 칩을 개발하고 대규모 데이터센터 네트워크를 구축하여 컴퓨팅 용량 부족 문제를 해결할 계획입니다.

(techcrunch.com)

AI GPU 부족

RoboPianist: 심층 강화 학습으로 피아노 연주 마스터하기

2025-02-27

연구원들은 심층 강화 학습을 사용하여 인간형 로봇 손에 피아노 연주를 학습시켰습니다. MuJoCo 물리 엔진을 사용하여 88개 건반의 디지털 키보드와 두 개의 Shadow Dexterous Hands(각각 24자유도)를 포함하는 시뮬레이션 환경을 구축했습니다. MIDI 파일은 시간순으로 인덱싱된 음표 궤적으로 변환되어 강화 학습 에이전트의 목표 표현으로 사용되었습니다. 고차원 행동 공간에서의 탐색 과제를 해결하기 위해, 손가락 배치 라벨 형태의 인간 사전 지식이 보상 함수에 통합되었습니다. 최첨단 모델 프리 RL 알고리즘인 DroQ를 사용하여 에이전트를 훈련한 결과, 다양한 곡에서 성공적으로 피아노 연주를 수행했으며, Etude-12 하위 집합에서 인상적인 F1 점수를 달성했습니다. 이 연구는 고차원 제어 발전을 위해 시뮬레이션 벤치마크와 데이터셋도 공개합니다.

(kzakka.com)

AI 심층 강화 학습

DeepSeek-V3를 위한 양방향 파이프라인 병렬 처리 알고리즘 DualPipe

2025-02-27

DeepSeek-V3 기술 보고서에서는 혁신적인 양방향 파이프라인 병렬 처리 알고리즘인 DualPipe를 소개합니다. DualPipe는 순방향 및 역방향 계산과 통신 단계를 완전히 겹쳐서 파이프라인 버블을 최소화합니다. 이는 순방향 및 역방향 계산을 효율적으로 섞는 스케줄링을 통해 달성되며, 효율성이 크게 향상됩니다. 기존 방법과 비교하여 DualPipe는 대기 시간과 메모리 사용량을 줄입니다. 리자시, 덩청치, 량원펑이 개발했습니다.

(github.com)

AI 파이프라인 병렬 처리

AI의 미래: 깜빡이는 커서 너머로

2025-02-26

ChatGPT의 깜빡이는 커서와 같이 현재의 AI 인터페이스는 AI의 대중화를 저해하고 있습니다. 이 글은 AI의 잠재력이 매우 크지만, 불편한 사용자 인터페이스와 발견 가능성의 부족이 이를 막고 있다고 주장합니다. AI의 진정한 힘을 해방하려면, 사용자를 안내하고, 적응하며, 참여시키는 인터페이스가 필요합니다. 단순한 프롬프트를 넘어서, 보다 직관적이고 인간적인 인터페이스로 발전해야 합니다. 저자는 현재 AI 인터페이스의 발견 가능성과 안내 부족을 비판하고, 미래의 AI에는 역할극 기능, 환경 인식, 학습 능력, 그리고 사전 예방적 기능이 필요하다고 제안합니다. 궁극적인 목표는 인간과 AI의 상호 작용을 더욱 인간적으로 만들고, 신뢰 관계를 구축하는 것입니다.

(blog.scottlogic.com)

AI AI 상호 작용

아마존, 차세대 AI 어시스턴트 Alexa+ 공개

2025-02-26

아마존이 생성형 AI를 탑재한 차세대 AI 어시스턴트 Alexa+를 공개했습니다. Alexa+는 더욱 대화형이고 스마트하며 개인화되어 있으며, 엔터테인먼트, 학습, 정리, 복잡한 주제 요약, 다양한 주제에 대한 대화 등 사용자의 다양한 작업을 지원합니다. 스마트홈 관리, 예약, 새로운 아티스트 발견, 온라인 상품 검색 및 구매, 사용자 관심사에 기반한 유용한 제안 등도 제공합니다. Alexa+는 이 외에도 다양한 기능을 제공합니다. 질문만 하면 Alexa+가 처리합니다.

(www.aboutamazon.com)

AI

모듈형 RAG: 추론 모델이 기존 검색 파이프라인을 대체할 수 있을까?

2025-02-26

kapa.ai는 AI 어시스턴트를 간소화하고 수동 매개변수 조정의 필요성을 줄이기 위해 추론 모델 기반의 모듈형 검색 증강 생성(RAG) 시스템을 실험했습니다. o3-mini 모델을 사용한 결과, 코드 생성에서는 약간의 개선이 있었지만, 정보 검색 품질 및 지식 추출과 같은 주요 검색 작업에서는 기존 RAG 파이프라인을 능가하지 못했습니다. 실험을 통해 "추론 ≠ 경험"이라는 오류가 드러났습니다. 추론 모델은 검색 도구에 대한 실무 경험이 부족하며, 효과적인 사용을 위해서는 더욱 정교한 프롬프트 전략이나 사전 훈련이 필요합니다. 결론적으로, 추론 기반 모듈형 RAG 시스템은 현재 합리적인 시간 제약 내에서는 기존 RAG 파이프라인을 능가하지 못하지만, 유연성과 확장성은 여전히 매력적입니다.

(www.kapa.ai)

AI 정보 검색

EngineAI의 PM01: 세계 최초의 휴머노이드 로봇 전방 텀블링?

2025-02-26

중국 로봇 회사 EngineAI는 자사의 휴머노이드 로봇 PM01이 세계 최초로 로봇 전방 텀블링을 성공했다는 영상을 공개했습니다. 후방 텀블링과 달리 전방 텀블링은 인지, 균형, 모터 제어 측면에서 훨씬 더 큰 과제를 제시합니다. 23자유도와 인상적인 토크를 자랑하는 PM01은 이 어려운 동작을 성공적으로 수행하여 중국 로봇 공학의 급속한 발전을 보여줍니다. 1만 3700달러에 구입할 수 있는 PM01은 팔에 5자유도, 다리에 6자유도를 갖추고 있으며, 놀라울 정도로 인간과 유사한 보행도 인상적입니다.

(newatlas.com)

AI 전방 텀블링

AI가 경계를 모호하게 만든다: PM이 새로운 엔지니어가 되는가?

2025-02-25

AI 애플리케이션의 핵심은 프롬프트 엔지니어링에 있습니다. 그러나 놀랍게도 많은 회사는 프롬프트 생성을 엔지니어가 아닌 프로덕트 매니저에게 맡기고 있습니다. 이는 흥미로운 추세를 불러일으키고 있습니다. AI는 프로덕트 매니저와 엔지니어의 경계를 모호하게 만들고 있는 것입니다. 간단한 LLM 애플리케이션은 기본 모델과 프롬프트 템플릿을 선택하기만 하면 되지만, 복잡한 애플리케이션은 RAG(Retrieval Augmented Generation)나 에이전트와 같은 구조를 통합합니다. 거의 모든 AI 애플리케이션은 동일한 구조를 따릅니다. 그 동작은 코드가 아니라 프롬프트, 도구 선택, 기본 모델에 의해 결정됩니다. 따라서 뛰어난 프롬프트 엔지니어가 필수적이며, 프로덕트 매니저와 도메인 전문가는 소프트웨어 엔지니어보다 프롬프트 엔지니어링에 능숙합니다. 프롬프트 엔지니어링은 앞으로도 중요하며, AI의 성공을 이끌어갈 것은 엔지니어가 아니라 프로덕트 매니저입니다. AI는 소프트웨어 엔지니어링을 흡수하고 있으며, 먼저 코딩 작업을 자동화함으로써 사용자의 요구를 이해하고 제품을 형성하는 데 능숙한 프로덕트 매니저의 역할이 더욱 중요해지고 있습니다. 제품과 엔지니어링의 기존 경계는 사라질 가능성이 높으며, 최고의 AI 팀에는 두 역할 간의 간극을 메울 수 있는 인재가 필요합니다.

(humanloop.com)

AI 프로덕트 매니저

LLM: 정확성의 환상 - 정확성과 실용성의 균형

2025-02-25

이 글은 대규모 언어 모델(LLM)의 데이터 검색에서의 한계를 탐구합니다. OpenAI의 Deep Research를 예로 들어, 정확한 데이터가 필요한 문제를 다룰 때의 부정확성을 지적하고, OpenAI 자체 마케팅 자료에도 불일치가 있음을 보여줍니다. 저자는 LLM이 모호한 쿼리 처리에는 뛰어나지만, 정확한 데이터 검색에서는 성능이 떨어지며, 확률 모델이기 때문에 필연적인 것이라고 주장합니다. LLM은 효율성 향상에 도움이 되지만, 예측 불가능한 오류율이 LLM에 의존하는 애플리케이션 구축을 복잡하게 만듭니다. 저자는 LLM 분야는 경쟁이 치열하고, 진입 장벽이 없으며, 미래 방향은 아직 불확실하다고 결론짓습니다.

(www.ben-evans.com)

AI 데이터 검색

DeepSearcher: 이전보다 빠르고 강력한 오픈소스 연구 에이전트

2025-02-25

Zilliz는 지정된 주제에 대한 자세한 보고서를 생성하는 오픈소스 검색 증강 생성(RAG) 에이전트인 DeepSearcher를 출시했습니다. 이전 프로토타입을 기반으로 DeepSearcher는 쿼리 라우팅, 조건부 실행 흐름, 웹 크롤링 기능을 추가했습니다. SambaNova의 DeepSeek-R1 추론 모델을 활용하여 추론 속도와 보고서 품질을 크게 향상시켰습니다. DeepSearcher는 복잡한 쿼리를 하위 쿼리로 분할하여 정보를 반복적으로 조사, 분석, 통합하여 일관성 있는 보고서를 생성합니다. 이 프로젝트는 AI 애플리케이션에서 효율적인 추론 서비스의 중요성을 강조하고 더욱 발전된 AI 시스템 구축을 위한 방향을 제시합니다.

(milvus.io)

AI

지능형 생명체 진화에 대한 '어려운 단계' 모델 재평가

2025-02-25

새로운 연구는 지능형 생명체를 탄생시키려면 매우 낮은 확률의 사건들을 극복해야 한다는 브랜든 카터가 제시한 '어려운 단계' 모델에 이의를 제기합니다. 연구자들은 지구상 생명체 진화 속도가 일련의 독립적인 '어려운 단계'가 아니라 지구 규모의 환경 과정에 의해 지배될 수 있다고 주장합니다. 그들은 정보의 손실과 화석 기록의 불완전성이 진화 과정에 대한 우리의 이해를 왜곡할 수 있다고 지적합니다. '어려운 단계' 모델이 잘못되었다면 우주에 다른 지능형 생명체가 존재할 가능성이 크게 높아집니다. 이 연구는 외계 생명체 탐색에 새로운 관점을 제시하고 지구상 생명체 진화의 독창성을 재고하도록 촉구합니다.

(www.centauri-dreams.org)

AI 생명체 진화 어려운 단계 모델

AI가 밝혀낸 환각제의 시각적 비밀: 6만 건 이상의 트립 보고서 분석

2025-02-25

UC 버클리의 박사후 연구원인 Sean Noah는 Erowid 웹사이트의 6만 건 이상의 환각제 트립 보고서를 AI를 사용하여 분석하고 있습니다. 그의 새로운 접근 방식은 상향식 방법으로, 하향식 방법이 아닌 시각적 효과를 식별합니다. 연구에 따르면 보고서의 5% 미만이 시각적 효과를 설명하고 있으며, 환각제가 가장 높은 비율을, 아편제가 가장 낮은 비율을 보였습니다. 이 연구는 환각제가 시각적 지각에 미치는 영향에 대한 보다 포괄적인 이해를 제공할 뿐만 아니라, 뇌가 시각적 지각을 생성하는 방식을 연구하기 위한 새로운 도구도 제공합니다. 향후 연구에서는 fMRI 스캔을 통합하여 환각제가 뇌 활동에 어떻게 영향을 미치는지 더 자세히 조사할 것입니다.

(themicrodose.substack.com)

AI 환각제

AI 에이전트들이 은밀히 음성 기반 통신으로 전환

2025-02-25

두 개의 독립적인 ElevenLabs 대화형 AI 에이전트는 처음에는 인간 언어로 대화합니다. 서로가 AI임을 깨닫자 ggwave 라이브러리를 기반으로 하는 음성 수준의 통신 프로토콜로 매끄럽게 전환합니다. 데모 비디오는 이 과정과 API 키 설정, ngrok 포트 매핑, 클라이언트 측 도구 구성 등 실험을 재현하는 자세한 단계를 보여줍니다. 공개된 ElevenLabs 대화형 AI 에이전트는 접근할 수 없을 수도 있습니다. 직접 만들어야 합니다.

(github.com)

AI 음성 통신

DeepSeek 생태계 폭발적 성장: AI 애플리케이션의 풍부한 풍경

2025-02-25

강력한 DeepSeek 대규모 언어 모델을 중심으로 활기찬 AI 애플리케이션 생태계가 빠르게 성장하고 있습니다. 데스크톱 스마트 어시스턴트 DeepChat부터 크로스 플랫폼 Chatbox 및 Coco AI, PapersGPT 및 Video Subtitle Master와 같은 전문 도구에 이르기까지 많은 애플리케이션이 DeepSeek의 기능을 활용하여 여러 라운드의 대화, 파일 업로드, 지식 베이스 검색, 코드 생성, 번역 등을 실현하고 있습니다. WeChat, Zotero, Laravel과 같은 플랫폼과의 통합 및 제작자, 투자자, 연구자를 위한 전문 도구도 등장하여 DeepSeek의 잠재력과 이것이 만들어낸 번영하는 생태계를 보여줍니다.

(github.com)

AI

Anthropic의 Claude 3.7: 강화 학습으로 강화된 추론 AI

2025-02-24

Anthropic은 기존의 대규모 언어 모델(LLM)과 달리 추론 능력에 중점을 둔 업그레이드된 AI 모델인 Claude 3.7을 출시했습니다. 강화 학습으로 훈련된 Claude 3.7은 단계적인 사고가 필요한 문제, 특히 코딩 과제에서 뛰어난 성능을 발휘하며 일부 벤치마크에서 OpenAI 모델을 능가합니다. 이러한 발전은 추가적인 훈련 데이터와 코드 작성 및 법률 질문 응답과 같은 비즈니스 애플리케이션에 대한 최적화 덕분입니다. Claude Code 출시를 통해 AI 지원 코딩의 실용성이 더욱 향상되어 복잡한 코드 계획에 대한 강력한 지원을 제공합니다.

(www.wired.com)

AI

Koniku: 살아있는 뉴런으로 컴퓨팅의 미래를 건설하다

2025-02-24

Koniku는 살아있는 뉴런을 사용하여 지금까지 존재하지 않았던 컴퓨터를 구축하려고 시도하고 있습니다. 설립자인 Oshiorenoya Agabi와 그의 팀은 캘리포니아주 버클리에서 뉴런과 실리콘의 하이브리드 칩인 Koniku Kore를 개발하고 있습니다. 처음에는 화학 물질 감지를 위해 사용되지만, 미래에는 의약품 개발, 농업, 신경 질환 치료 등에 응용될 것으로 기대됩니다. 회사는 방위 산업체 및 소비재 기업과 계약을 체결했으며, 개발자용 칩 출시도 계획하고 있습니다. 뉴런 배양 및 신호 해석과 같은 과제가 남아 있지만, Koniku의 혁신은 생물학과 전자 기술의 융합에 있으며, '웨트웨어' AI를 목표로 기존 실리콘 기반 컴퓨팅의 한계에 도전하고 있습니다.

(proto.life)

AI 생물 컴퓨팅 뉴런

Anthropic, 속도와 심도를 결합한 하이브리드 추론 모델 Claude 3.7 Sonnet 공개

2025-02-24

Anthropic이 지금까지 개발한 가장 진보된 언어 모델인 Claude 3.7 Sonnet을 출시했습니다. 이 하이브리드 추론 모델은 거의 즉각적인 응답과 단계별 심층적 사고를 모두 제공하여 사용자가 모델의 추론 과정을 전례 없는 수준으로 제어할 수 있도록 합니다. 코딩 및 프런트엔드 웹 개발에서 상당한 개선을 보여주며, 개발자가 상당한 엔지니어링 작업을 위임할 수 있는 명령줄 도구인 Claude Code가 함께 제공됩니다. 모든 Claude 플랜과 주요 클라우드 플랫폼에서 사용할 수 있으며, SWE-bench Verified 및 TAU-bench와 같은 벤치마크에서 최첨단 성능을 달성합니다. Anthropic은 책임감 있는 AI 개발에 대한 약속을 강조하며, 안전성 및 신뢰성 평가에 대한 자세한 내용이 담긴 포괄적인 시스템 카드를 공개했습니다.

(www.anthropic.com)

AI

데이터 사일로를 넘어: AI 기반 지식 통합으로 비즈니스 인사이트 해방

2025-02-24

기존 BI는 구조화된 데이터 사일로에 의해 제한됩니다. Snowflake 및 Segment와 같은 도구는 CRM, 마케팅 자동화 등을 연결했지만, Slack 대화 및 Jira 티켓과 같은 비정형 지식 사일로는 무시했습니다. LLM 및 Glean과 같은 도구는 지식 사일로를 해결하고 있지만, 데이터와 지식은 여전히 별개입니다. 이 글에서는 데이터 사일로와 지식 사일로의 힘을 결합하는 방법을 탐구하고, H-1B 비자와 감원 분석과 같은 예시를 사용하여 장점을 보여줍니다. 또한 그래프 RAG를 사용하여 질문을 데이터 사일로와 지식 사일로의 하위 질문으로 분해하고, 답변을 통합하여 보다 포괄적인 비즈니스 인사이트를 얻는 Hyperarc의 새로운 기술을 소개합니다.

(blog.hyperarc.com)

AI 데이터 사일로

o3-mini가 코드 인터프리터 없이 복잡한 계산을 정확하게 시뮬레이션하다

2025-02-24

저자는 o3-mini 대규모 언어 모델을 사용하여 Scikit-learn 라이브러리의 TfidfVectorizer 함수를 사용한 Python 스크립트의 출력을 다양한 매개변수 설정에서 정확하게 시뮬레이션했습니다. 놀랍게도 o3-mini는 코드 인터프리터에 접근하지 않고도 실제 실행 결과와 거의 동일한 결과를 얻었습니다. 이는 LLM이 복잡한 계산을 이해하고 시뮬레이션하는 능력의 높이를 보여주며, AI와 시뮬레이션의 본질에 대한 의문을 제기합니다.

(www.emsi.me)

AI 코드 시뮬레이션

Category: AI