Webtagr - 기술 뉴스 다이제스트

보스턴 다이내믹스, 아틀라스 로봇의 강화 학습 개선 위해 RAI 연구소와 제휴

2025-02-06

보스턴 다이내믹스는 자체 로보틱스 및 AI 연구소(RAI 연구소)와 제휴하여 전동 휴머노이드 로봇 아틀라스의 강화 학습 능력을 향상시키는 것을 발표했습니다. 이 협력은 아틀라스가 새로운 작업을 더 빠르게 학습하고, 역동적인 달리기나 무거운 물체 조작과 같은 실제 환경에서의 움직임과 상호 작용을 개선하는 것을 목표로 합니다. 이는 로보틱스 분야에서의 강화 학습의 큰 발전이며, Figure AI가 OpenAI와의 제휴를 해소한 사례와 마찬가지로 로봇 AI의 수직 통합의 중요성을 강조합니다.

(techcrunch.com)

AI 보스턴 다이내믹스

집합론을 이용한 복잡계 해명: 단순한 인과 관계를 넘어서

2025-02-06

이 글에서는 집합론의 한 분야인 메레올로지에 기반한 복잡계의 고차 구조 이해를 위한 새로운 접근법을 제시합니다. 보로메오 고리의 예시를 통해 전체가 부분의 합보다 더 크다는 것을 보여줍니다. 저자는 시스템의 메레올로지를 구축하고 메비우스 반전 공식을 적용함으로써 거시적인 양을 미시적인 기여의 합으로 분해하여 고차 상호 작용의 본질을 밝힐 수 있다고 제안합니다. 유전자 상호 작용과 정보 이론의 상호 정보량과 같은 예시를 통해 이 방법의 응용을 보여주며 기계 학습과 물리학에의 응용 가능성을 시사합니다.

(abeljansma.nl)

AI 고차 구조 메비우스 반전

LLM 추론 모델 구축을 위한 네 가지 접근 방식

2025-02-06

본 기사에서는 대규모 언어 모델(LLM)의 추론 능력을 향상시키기 위한 네 가지 주요 접근 방식을 살펴봅니다. 추론 시간 확장, 순수 강화 학습, 지도 학습 미세 조정 및 강화 학습 결합, 그리고 모델 증류입니다. DeepSeek R1의 개발을 사례 연구로 사용하여 이러한 방법들이 어떻게 강력한 추론 모델을 구축할 수 있는지, 그리고 예산이 제한된 연구자들도 증류를 통해 뛰어난 결과를 얻을 수 있는지 보여줍니다. 또한 DeepSeek R1과 OpenAI의 o1을 비교하고 비용 효율적인 추론 모델을 구축하기 위한 전략에 대해 논의합니다.

(magazine.sebastianraschka.com)

AI

AI 에이전트, 사람처럼 컴퓨터 사용 학습

2025-02-06

r1-computer-use 프로젝트는 파일 시스템, 웹 브라우저, 명령줄 등을 포함하여 사람처럼 컴퓨터를 사용할 수 있는 AI 에이전트를 훈련하는 것을 목표로 합니다. DeepSeek-R1의 강화 학습 기술에서 영감을 받은 이 프로젝트는 기존의 하드 코딩된 검증기 대신 에이전트의 행동의 정확성과 유용성을 평가하기 위한 뉴럴 보상 모델을 사용합니다. 훈련 파이프라인은 전문가 데모에서 보상 모델 기반 정책 최적화 및 미세 조정까지 여러 단계를 포함하며, 궁극적으로 복잡한 작업을 수행할 수 있는 안전하고 신뢰할 수 있는 AI 에이전트를 목표로 합니다.

(github.com)

AI 컴퓨터 상호 작용

50달러 미만으로 최첨단 AI 모델에 필적하는 추론 모델 등장

2025-02-06

스탠포드 대학교와 워싱턴 대학교 연구진이 클라우드 컴퓨팅 비용 50달러 미만으로 s1이라는 AI 추론 모델을 개발했다. s1은 수학 및 코딩 능력을 측정하는 테스트에서 OpenAI의 o1이나 DeepSeek의 R1과 같은 최첨단 추론 모델과 동등한 성능을 보였다. 연구팀은 Google의 Gemini 2.0 Flash Thinking Experimental을 교사 모델로 사용하고, 엄선된 1000개의 질문과 답변 데이터 세트를 사용한 지식 증류법을 활용했다. 이러한 저비용 재현은 AI 모델의 상품화에 대한 논쟁을 불러일으키고, 대형 AI 연구소들을 당황하게 만들었다고 전해진다.

(techcrunch.com)

AI 지식 증류 저비용 AI

1890년대 키네토스코프: AI 시대의 고독의 전조?

2025-02-05

이 글은 1890년대 개인용 키네토스코프와 오늘날의 AI 기술, 특히 대규모 언어 모델의 유사점을 논의합니다. 이 글은 두 기술 모두 대량 생산된 콘텐츠를 제공하면서 동시에 상호 연결되면서도 원자화된 경험을 만들어내 새로운 유형의 기술적 고독을 초래한다고 주장합니다. 저자는 에디슨의 발명의 역사적 맥락과 놀라울 정도로 예지력 있는 설계 선택을 탐구하고, 개인화된 알고리즘 피드와 AI 동반자에 대한 현재의 의존과의 기묘한 유사성을 강조합니다. 이것은 기술 발전의 방향과 개인적 경험에 미치는 영향에 대해 심사숙고하게 만듭니다.

(resobscura.substack.com)

AI

헤르쿨라네움 파피루스 5: 잉크 감지의 돌파구

2025-02-05

옥스포드 보들리안 도서관의 P.Herc. 172(두루마리 5)의 잉크 감지 및 분할에 상당한 진전이 있었습니다. 이 두루마리는 비정상적으로 눈에 잘 띄는 잉크를 보여주어 잉크 감지 모델 훈련에 크게 도움이 됩니다. 분할에는 추가적인 개선이 필요하지만, 예비 분석에 따르면 필로데무스가 저자일 가능성이 시사되며, '혐오', '공포', '삶'과 같은 단어와 완성된 작품을 시사하는 기호가 확인되었습니다. 두루마리 5의 고유한 특징은 다른 두루마리의 잉크 감지에서 '로제타석'으로서의 가능성을 제공합니다. 연구팀은 연구를 촉진하기 위해 광범위한 분할 데이터를 공개했습니다.

(scrollprize.substack.com)

AI 잉크 감지 파피루스

Gemini 2.0 제품군 주요 업데이트: 성능 향상 및 다중 모드 기능 강화

2025-02-05

Google이 Gemini 2.0 제품군 모델을 대폭 업데이트했습니다! 2.0 Flash 모델이 API를 통해 일반 공개되어 개발자는 프로덕션 애플리케이션을 구축할 수 있게 되었습니다. 200만 토큰의 컨텍스트 윈도우를 갖춘 뛰어난 코딩 성능과 복잡한 프롬프트 처리 능력을 자랑하는 2.0 Pro의 시험 버전도 출시되었습니다. 비용 효율적인 2.0 Flash-Lite 모델도 공개 프리뷰로 제공됩니다. 모든 모델은 현재 텍스트 출력을 지원하는 다중 모드 입력을 지원하며, 향후 몇 달 동안 더 많은 모달리티가 추가될 예정입니다. 이번 업데이트는 성능을 크게 향상시키고 적용 범위를 확장하여 AI 분야에서 Gemini가 한 단계 도약하는 계기가 되었습니다.

(blog.google)

AI

넷플릭스 어워드: 머신러닝의 이정표와 쓰라린 교훈

2025-02-05

2006년, 넷플릭스는 추천 시스템을 개선하기 위해 100만 달러 상금의 경진대회를 개최했습니다. 이 대회는 수천 개의 팀을 유치하여 머신러닝 분야의 발전에 크게 기여했습니다. 결과는 간단한 알고리즘으로도 놀라울 정도로 좋은 성과를 얻을 수 있으며, 더 큰 모델일수록 점수가 높아지고, 과적합이 항상 문제가 되는 것은 아님을 보여주었습니다. 하지만 이 대회는 쓰라린 교훈도 남겼습니다. 데이터 프라이버시에 대한 우려로 넷플릭스는 향후 대회를 취소하여 추천 시스템 알고리즘에 대한 공개 연구를 제한했습니다. 기술 기업의 데이터 장악력은 전례 없는 수준에 이르렀습니다.

(www.argmin.net)

AI

6달러 AI 모델이 LLM 환경을 뒤흔들다: S1 등장

2025-02-05

새로운 논문에서 단 6달러로 훈련된 AI 모델 S1이 공개되었습니다. 일반 노트북에서 실행하면서 최첨단 성능에 필적하는 결과를 보여줍니다. 비결은 정교한 '추론 시간 스케일링' 기법에 있습니다. LLM의 사고 과정에 '대기' 명령어를 삽입하여 사고 시간을 제어하고 성능을 최적화합니다. 이는 Entropix 기법과 유사하며, 모두 모델의 내부 상태를 조작하여 성능 향상을 도모합니다. S1은 데이터 사용량이 매우 적어 엄선된 1000개의 샘플만으로 놀라운 성과를 거두었으며, AI 연구에 새로운 길을 열고 모델 증류와 지적 재산권에 대한 논쟁을 불러일으키고 있습니다. S1의 저렴한 비용과 높은 효율성은 AI 개발 속도가 빨라질 것임을 시사합니다.

(timkellogg.me)

AI 저렴한 비용 훈련 추론 시간 스케일링

Toma: 1조 5천억 달러 규모 자동차 산업을 위한 AI 인력 구축

2025-02-05

Toma는 1조 5천억 달러 규모의 자동차 산업을 위해 엔드투엔드 AI 인력을 구축하고 있습니다. 주요 고객들은 AI로 쉽게 자동화할 수 있는 프로세스(고객 서비스, 수리 주문 관리, 보증 처리, 판매 등)에 연간 15억 달러 이상을 지출하고 있습니다. Toma 팀은 성공적인 AI 애플리케이션 구축 및 판매 실적, 최고 수준의 음성 AI 제품, 그리고 자동차 딜러와의 직접적인 협력 및 연구를 통해 얻은 풍부한 현장 경험을 자랑합니다. 팀 중심적이고 책임감 있는 접근 방식으로 운영되며, 데이터 중심적인 의사 결정과 높은 자율성을 중시합니다. 샌프란시스코 Dogpatch 지역에 본사를 둔 Toma는 뛰어난 인재가 큰 영향을 미칠 수 있는 신속하고 장식 없는 환경을 제공합니다. 주 5일 사무실 근무입니다.

(www.ycombinator.com)

AI

구글, 무기 및 감시용 AI 개발 서약 삭제

2025-02-04

구글이 이번 주 웹사이트에서 무기 또는 감시용 AI를 개발하지 않겠다는 서약을 조용히 삭제했습니다. 블룸버그가 처음 보도한 이 변경은 논란을 불러일으켰습니다. 구글은 현재 국제법과 인권에 부합하는 책임감 있는 AI 개발을 강조하지만, 미국과 이스라엘 군대와의 계약 및 펜타곤의 구글 AI가 군의 '킬 체인'을 가속화하고 있다는 주장은 공표된 원칙과 행동 간의 차이에 대한 우려를 제기합니다. 직원들의 내부 항의와 대중의 주목은 AI 개발 및 배포를 둘러싼 윤리적 딜레마를 부각합니다.

(techcrunch.com)

AI 군사적 이용

LLM의 효율적인 학습의 연금술: 컴퓨팅 한계를 넘어서

2025-02-04

이 글에서는 대규모 언어 모델(LLM)을 대규모로 효율적으로 학습시키는 방법에 대해 심층적으로 다룹니다. 저자는 수만 개의 가속기가 사용되는 경우에도 비교적 간단한 원칙으로 모델 성능을 크게 향상시킬 수 있다고 주장합니다. 다루는 주제는 모델 성능 평가, 다양한 규모에서의 병렬 처리 방식 선택, 대규모 Transformer 모델의 비용 및 시간 추정, 특정 하드웨어의 장점을 활용한 알고리즘 설계 등입니다. TPU 및 GPU 아키텍처에 대한 자세한 설명과 Transformer 아키텍처에 대한 면밀한 분석을 통해 독자는 스케일링 병목 현상을 더 잘 이해하고 더 효율적인 모델과 알고리즘을 설계할 수 있습니다.

(jax-ml.github.io)

AI 효율적인 학습

OmniHuman-1: 1단계 조건부 휴먼 애니메이션 모델의 확장성 재고

2025-02-04

OmniHuman-1은 사실적인 인간 비디오를 생성할 수 있는 AI 모델입니다. 다양한 시각 및 오디오 스타일을 지원하며, 임의의 종횡비와 신체 비율(프로필, 반신, 전신)로 비디오를 생성합니다. 사실성은 포괄적인 모션, 조명, 텍스처 세부 정보에서 비롯됩니다. 이 모델은 노래, 대화, 다양한 포즈 등 다양한 입력을 처리하며, 만화나 어려운 포즈도 처리합니다. 정확한 제어를 위해 오디오 및 비디오 구동 신호를 사용합니다. 윤리적 고려 사항도 고려되었으며, 이미지와 오디오는 공개 도메인 또는 생성된 모델에서 가져옵니다.

(omnihuman-lab.github.io)

AI 비디오 생성 휴먼 애니메이션

Radiant Foam: 실시간 미분 가능 레이 트레이싱의 획기적인 발전

2025-02-04

연구원들은 볼류메트릭 메쉬 레이 트레이싱의 효율성과 스플래팅 기법의 재구성 품질을 결합한 새로운 장면 표현 방식인 Radiant Foam을 발표했습니다. Voronoi 다이어그램과 Delaunay 삼각 분할을 활용하여 Radiant Foam은 하드웨어 가속 Gaussian 레이 트레이싱보다 속도가 빠르면서도 Gaussian 스플래팅 기법과 거의 동일한 재구성 품질을 제공하는 실시간 레이 트레이싱을 구현합니다. 복잡한 가속 구조나 특수 하드웨어/API 없이 표준 프로그래머블 GPU만으로 작동합니다. 이 획기적인 기술은 실시간 렌더링 기술의 혁신적인 발전을 약속합니다.

(radfoam.github.io)

AI 실시간 렌더링

OpenAI, 소프트뱅크와 30억 달러 합작 투자…모델 오픈소스화 가능성 시사

2025-02-04

OpenAI는 월요일 일본 소프트뱅크와 30억 달러 규모의 합작 투자를 발표했습니다. 소프트뱅크는 OpenAI 소프트웨어 사용을 위해 매년 30억 달러를 투자할 예정입니다. 이는 DeepSeek의 예상치 못한 부상에 따른 전략적 변화로 보입니다. 중국 기업 DeepSeek의 최첨단 인공지능 모델은 OpenAI의 ChatGPT 등과 같은 제품보다 훨씬 적은 컴퓨팅 파워만 사용하여 AI 확장의 기술적, 재정적 요구 사항에 대한 일반적인 가정을 뒤엎었습니다. 한편, OpenAI CEO 샘 알트먼은 DeepSeek처럼 제품을 오픈소스화하는 것을 고려하고 있다고 밝히며, 누구나 OpenAI 모델을 사용하고 재사용할 수 있게 될 가능성을 시사했습니다. 알트먼은 Reddit에서 OpenAI가 소스 코드를 비공개로 유지해 온 것을 두고 “역사의 잘못된 쪽에 서 있었다”고 말했습니다.

(www.semafor.com)

AI 소프트뱅크 AI 오픈소스

보노보, 타인의 무지를 이해하다: 마음 이론 연구의 돌파구

2025-02-04

새로운 연구에 따르면 보노보는 마음 이론을 가지고 있으며, 다른 개체의 지식 부족을 이해하고 그에 따라 행동하는 것으로 나타났습니다. 연구자들은 보노보가 실험자를 도와 숨겨진 간식을 찾는 실험을 설계했습니다. 그 결과 보노보는 실험자가 간식의 위치를 모른다는 것을 깨닫자 더 빠르고 더 자주 가리키는 것으로 나타났습니다. 이는 보노보가 서로 다른 관점을 추적하고 반응한다는 것을 나타내며, 마음 이론이 이전에 생각했던 것보다 더 오래되었고, 공통 조상에게 존재했을 가능성을 시사합니다.

(www.newscientist.com)

AI 마음 이론 보노보

Auto-AVSR: 오픈소스 립리딩 음성 인식 프레임워크

2025-02-03

Auto-AVSR은 시각적 음성(립리딩)에 중점을 둔 엔드투엔드 오디오비주얼 음성 인식(AV-ASR)을 위한 오픈소스 프레임워크입니다. LRS3 벤치마크에서 시각적 음성 인식(VSR) 20.3%, 음성 인식(ASR) 1.0%의 단어 오류율(WER)을 달성했습니다. 교육, 평가, API 사용에 대한 코드와 튜토리얼을 제공하며, 멀티노드 교육을 지원합니다. 사용자는 사전 훈련된 모델을 사용하거나 처음부터 교육하고 필요에 따라 하이퍼파라미터를 사용자 지정할 수 있습니다.

(github.com)

AI 립리딩

OpenEuroLLM: 유럽이 추진하는 오픈소스 다국어 LLM

2025-02-03

20개의 주요 유럽 연구 기관 및 기업 컨소시엄이 고성능 다국어 대규모 언어 모델(LLM)군을 구축하는 프로젝트인 OpenEuroLLM을 시작했습니다. 이 이니셔티브는 오픈소스 원칙을 통해 고품질 AI 기술에 대한 접근을 민주화함으로써 유럽의 AI 경쟁력을 높이는 것을 목표로 합니다. 이를 통해 유럽 기업과 공공 기관은 영향력 있는 제품과 서비스를 개발할 수 있습니다. OpenEuroLLM은 유럽의 규제 프레임워크 내에서 운영되며 오픈소스 커뮤니티와 협력하여 모델, 소프트웨어, 데이터, 평가의 완전한 개방성을 보장하고 공공 및 민간 부문의 다양한 요구를 충족하는 동시에 언어 및 문화적 다양성을 유지합니다.

(openeurollm.eu)

AI

분실된 IBM 교육 자료: 컴퓨터는 책임질 수 없다 (1979)

2025-02-03

1979년 IBM 내부 교육 자료의 전설적인 페이지가 온라인에서 다시 등장하여 "컴퓨터는 결코 책임을 질 수 없다. 따라서 컴퓨터는 결코 경영상의 결정을 내려서는 안 된다."라고 명시하고 있다. 원본 자료는 분실되었으며, 홍수로 인해 파괴된 것으로 알려져 있다. 이 진술은 AI 중심의 현대 사회에서 큰 반향을 불러일으키며, AI의 책임과 의사 결정에 대한 심사숙고를 촉구하고 있다.

(simonwillison.net)

AI

s1: 강력한 추론 성능을 위한 간단한 테스트 시간 스케일링

2025-02-03

본 논문에서는 s1이라는 간단한 테스트 시간 스케일링 방법을 소개합니다. 단 1,000개의 예제와 예산 제약만으로 o1-preview와 동등한 강력한 추론 성능을 달성합니다. 이 방법은 영리한 테스트 시간 전략을 통해 대규모 언어 모델의 성능을 크게 향상시킵니다. 코드와 데이터는 오픈소스로 공개되어 재현성과 추가적인 연구를 용이하게 합니다.

(github.com)

AI 추론 성능 테스트 시간 스케일링

Anthropic의 헌법 분류기: AI 탈옥에 대한 새로운 방어

2025-02-03

Anthropic의 안전 연구팀은 AI 탈옥에 대한 새로운 방어책으로 헌법 분류기를 발표했습니다. 합성 데이터로 훈련된 이 시스템은 유해한 출력을 효과적으로 필터링하면서 오탐을 최소화합니다. 프로토타입은 수천 시간의 인간 레드 팀 테스트를 견뎌내며 탈옥 성공률을 크게 줄였지만, 초기에는 높은 거부율과 계산 오버헤드에 시달렸습니다. 업데이트된 버전은 거부율의 약간 증가와 적당한 계산 비용만으로 강력함을 유지합니다. 기간 한정 라이브 데모에서는 보안 전문가를 초대하여 내구성을 테스트하고 점점 더 강력해지는 AI 모델의 더욱 안전한 배포를 위한 길을 열 것입니다.

(www.anthropic.com)

AI 탈옥 방지 헌법 분류기

Klarity: 생성 모델의 불확실성 규명

2025-02-03

Klarity는 생성 모델 출력의 불확실성을 분석하는 도구입니다. 원시 확률 분석과 의미 이해를 결합하여 텍스트 생성 중 모델의 동작에 대한 심층적인 통찰력을 제공합니다. 이 라이브러리는 이중 엔트로피 분석, 의미 클러스터링, 구조화된 JSON 출력, 그리고 사람이 읽을 수 있는 통찰력을 제공하는 AI 기반 분석을 제공합니다. 현재 Hugging Face Transformers를 지원하며, 더 광범위한 프레임워크 및 모델 지원을 계획하고 있습니다.

(github.com)

AI 불확실성 분석 AI 도구

지각 정렬 동적 얼굴 투영 매핑: 고속 얼굴 추적 및 동축 설정

2025-02-03

연구원들은 정렬 오류 아티팩트를 크게 줄이는 새로운 고속 동적 얼굴 투영 매핑(DFPM) 시스템을 개발했습니다. 이는 잘라낸 영역으로 제한된 보간/외삽 기반 얼굴 감지와 고속 회귀 트리 앙상블(ERT)을 사용한 랜드마크 감지(0.107밀리초)를 사용하는 고속 얼굴 추적 방법을 통해 달성됩니다. 렌즈 시프트가 있는 동축 프로젝터 카메라 설정은 최소 오류(1m~2m 사이에서 1.274픽셀)로 높은 광학 정렬을 유지합니다. 이 시스템은 거의 완벽한 정렬을 달성하여 메이크업과 엔터테인먼트 분야의 몰입형 경험을 향상시킵니다.

(www.vision.ict.e.titech.ac.jp)

AI 동적 얼굴 투영 매핑 얼굴 추적

베이즈적 인식론 입문: 신념, 증거, 합리성

2025-02-03

이 튜토리얼은 베이즈적 인식론을 소개하고, 그 핵심 규범인 확률주의와 조건화 원칙에 초점을 맞춥니다. 에딩턴의 일식 관측을 사례 연구로 사용하여 베이즈적 방법이 가설에 대한 신념을 어떻게 갱신하는지 보여줍니다. 그런 다음 사전 확률, 일관성, 조건화의 범위에 대한 베이즈주의 내부의 의견 차이를 탐구하고, 네덜란드 도박 논증, 정확도 우위 논증, 비교 확률 논증 등의 기본적인 주장을 제시합니다. 마지막으로 이상화 문제와 과학에서 베이즈적 방법의 응용에 대해 논의합니다.

(plato.stanford.edu)

AI 베이즈적 인식론 확률주의 조건화 원칙

진짜 사고 vs. 가짜 사고: AI 시대의 각성

2025-02-03

이 에세이는 '진짜 사고'와 '가짜 사고'의 차이를 탐구합니다. 저자는 '진짜 사고'가 단순히 구체적인 것들에 대해 생각하는 것이 아니라 추상적인 개념이나 기존 프레임에 갇히지 않고 세상을 진정으로 이해하는 데 초점을 맞춘 더 깊고 통찰력 있는 사고 방식이라고 주장합니다. AI 위험, 철학, 경쟁 토론 등의 예시를 사용하여 '진짜 사고'의 몇 가지 측면을 설명하고 속도를 늦추고, 호기심을 따르고, 사고의 동기에 주의를 기울이는 등 이 능력을 배양하는 방법을 제안합니다. 저자는 AI 시대에 각성을 유지하고, '가짜 사고'의 함정을 피하며, 진정으로 변화를 이해하고 대응할 것을 촉구합니다.

(joecarlsmith.com)

AI 진짜 사고 인지

TopoNets: 뇌와 유사한 지형도를 가진 고성능 시각 및 언어 모델

2025-02-03

연구자들은 성능 저하를 최소화하면서 주요 AI 아키텍처(합성곱 신경망 및 트랜스포머)에 뇌와 유사한 지형도를 통합하는 새로운 방법인 TopoLoss를 발표했습니다. 결과적으로 생성된 TopoNets는 지도 학습 토포그래픽 신경망 중 최고 성능을 달성합니다. TopoLoss는 구현이 간편하며, 실험을 통해 TopoNets는 높은 성능을 유지하면서 뇌와 유사한 공간적 구조를 보이는 것으로 나타났습니다. 또한, TopoNets는 희소하고 매개변수 효율적인 언어 모델을 생성하며, 이미지 인식에서 뇌의 시각 피질과 유사한 영역 선택성을 보이고, 언어 모델에서는 뇌의 뉴런과 유사한 시간적 통합 창 특성을 보입니다. 이는 뇌의 시각 피질 및 언어 처리 영역에서 관찰되는 패턴을 반영합니다.

(toponets.github.io)

AI

OpenAI의 '스트로베리' 프로젝트: AI 심층 추론을 목표로

2025-02-03

OpenAI는 현재 AI 모델의 추론 능력 한계를 극복하기 위해 '스트로베리'라는 코드명의 프로젝트를 비밀리에 개발하고 있습니다. 이 프로젝트는 AI가 단순히 질문에 답하는 것을 넘어, 자율적으로 인터넷에서 심층적인 연구를 수행할 수 있도록 계획하는 것을 목표로 합니다. 내부 문서에 따르면 '스트로베리' 모델은 특수한 사후 훈련 방법과 자기 학습 및 계획 능력을 결합하여 복잡한 문제를 안정적으로 해결합니다. 이는 과학적 발견과 소프트웨어 개발에서 AI의 역할에 혁명을 일으킬 가능성이 있는 중대한 돌파구로 여겨지지만, 동시에 미래 AI 능력에 대한 윤리적 우려도 제기하고 있습니다.

(economictimes.indiatimes.com)

AI

중국 AI 챗봇 DeepSeek, ‘탱크맨’ 사진 검열 논란…미국 시장 충격

2025-02-02

중국 AI 챗봇 DeepSeek이 1989년 천안문 광장의 상징적인 ‘탱크맨’ 사진에 대한 질문에 답변을 거부하며 논란을 일으켰습니다. 이 챗봇은 사진 및 중국 관련 민감한 주제에 대한 논의를 갑자기 중단하지만, 영국 총리 등 세계 지도자에 대한 질문에는 자세한 답변을 제공합니다. 동시에 DeepSeek의 강력한 이미지 생성 기능(Janus-Pro-7B)과 놀라울 정도로 낮은 개발 비용(보도에 따르면 600만 달러)은 미국 시장에 충격을 주었고, Nvidia 주가가 사상 최대 17% 하락하며 미국 기술 대기업과 정치인들의 우려를 자아냈습니다.

(petapixel.com)

AI 천안문 사건

SF 작가 테드 창이 말하는 AI와 기술의 미래

2025-02-02

이 인터뷰에서 SF 거장 테드 창은 자신의 창작 영감, AI에 대한 비판적 시각, 그리고 기술의 미래에 대한 우려를 이야기합니다. 창은 현재의 AI, 특히 대규모 언어 모델은 인터넷의 저해상도 이미지와 같아서 신뢰성과 진정한 이해력이 부족하다고 주장합니다. 그는 인간과 도구의 관계, 그리고 인간이 도구 속에서 자신을 발견하려는 경향을 강조합니다. 인터뷰에서는 언어의 본질, AI의 예술 창작에서의 역할, 기술 개발에서의 윤리적 고려 사항도 다룹니다. 창은 기술에 대한 낙관적인 시각은 신중하며, 잠재적인 부정적 영향을 유의하고 그 피해를 줄이기 위한 노력을 해야 한다고 생각합니다.

(lareviewofbooks.org)

AI

Category: AI