Category: AI

20세 AI 천재 엔리케 고도이: 라틴 아메리카 핀테크 선구자

2025-06-12
20세 AI 천재 엔리케 고도이: 라틴 아메리카 핀테크 선구자

20세 브라질 수학 천재 엔리케 고도이는 라틴 아메리카에서 AI 혁명을 일으키고 있습니다. 15세에 상파울루 대학교의 엘리트 수학 프로그램에 입학한 최연소 학생이었습니다. 이후 컴퓨터 과학을 공부하기 위한 상당한 장학금을 받았고, 브라질 대학교 수학 올림피아드에서 상위 200위 안에 들었습니다. 고도이는 라틴 아메리카 투자 은행에서 최초로 대규모 언어 모델(LLM) 구현에 성공했으며, 의료 전문가를 위한 1,000만 레알 이상의 자금을 관리하는 핀테크 플랫폼 Doki를 설립했습니다. 그의 업적은 500회 이상 인용되었으며, AI와 핀테크에 대한 그의 중요한 공헌을 보여줍니다. 고도이의 뛰어난 업적은 그를 AI 미래의 주요 인물로 자리매김하게 합니다.

AI

AI 에이전트: 다음 대규모 AI 재난은?

2025-06-11

이 글은 미래에 발생할 수 있는 AI 대규모 재난의 가능성을 탐구합니다. 초기 철도 및 항공 사고와의 유사점을 비추어 저자는 대규모 AI 재난이 현실적인 가능성이라고 주장합니다. 단순한 AI 오류 정보에 초점을 맞추는 대신 저자는 웹 검색 및 이메일 전송과 같이 자율적으로 작업을 수행할 수 있는 AI인 AI 에이전트가 초래하는 위험을 강조합니다. 저자는 첫 번째 주요 AI 재난은 정부 또는 기업 시스템 내에서 AI 에이전트의 오작동, 예를 들어 채권 추심, 의료 또는 임대 프로세스를 잘못 실행하는 것에서 비롯될 가능성이 높다고 예측합니다. 또한 저자는 AI 모델이 악용되어 '이상적인 파트너' 로봇을 만드는 것에 따른 잠재적 위험에 대해서도 지적합니다. 요약하자면 저자는 AI의 급속한 발전과 그 잠재적 위험을 경고하고 더욱 강력한 AI 안전 조치를 촉구합니다.

AI

소셜 미디어 사용 증가, 사춘기 이전 아동의 우울증 악화시켜: 종단 연구

2025-06-11
소셜 미디어 사용 증가, 사춘기 이전 아동의 우울증 악화시켜: 종단 연구

9세에서 10세 아동 약 12,000명을 대상으로 한 3년간의 종단 연구에서 소셜 미디어 사용 증가와 사춘기 이전 아동의 우울증 증상 악화 사이에 유의미한 연관성이 있는 것으로 나타났습니다. JAMA Network Open에 게재된 이 연구는 소셜 미디어 사용 증가가 우울증 증상 악화로 이어진다는 것을 보여주며, 그 반대는 아님을 시사합니다. 평균적으로 아동의 하루 소셜 미디어 사용 시간은 3년 동안 7분에서 73분으로 증가했고, 우울증 증상은 35% 증가했습니다. 연구진은 사이버 폭력과 수면 장애가 잠재적 기여 요인일 수 있다고 지적합니다. 이 연구는 건강한 디지털 습관을 길러야 함을 강조하며, 부모와 자녀 간의 솔직한 대화와 화면 사용 시간 제한을 제안합니다.

Chatterbox: ElevenLabs에 필적하는 오픈소스 TTS 모델, 감정 제어 기능 탑재

2025-06-11
Chatterbox: ElevenLabs에 필적하는 오픈소스 TTS 모델, 감정 제어 기능 탑재

Resemble AI는 최초의 프로덕션급 오픈소스 텍스트 음성 변환(TTS) 모델인 Chatterbox를 공개했습니다. ElevenLabs와 같은 클로즈드소스 주요 시스템과 벤치마크 비교를 통해 동시 평가에서 지속적으로 선호되는 결과를 보였습니다. 감정 과장 제어 기능과 초저지연(200밀리초 미만)을 갖추고 있어 밈, 비디오, 게임, AI 에이전트 등에 이상적입니다. 또한 Chatterbox는 책임감 있는 AI 사용을 위한 Perth 워터마킹을 통합했습니다.

AI

4족 보행 로봇 ANYmal, 배드민턴에 도전하다: 반응 속도가 병목 현상

2025-06-11
4족 보행 로봇 ANYmal, 배드민턴에 도전하다: 반응 속도가 병목 현상

취리히 연방 공과대학교 연구진은 4족 보행 로봇 ANYmal에게 배드민턴을 하도록 훈련했습니다. ANYmal은 넘어지는 것을 피하고 속도 제한을 고려하여 위험을 평가하는 것을 배웠지만, 반응 속도(약 0.35초)는 정상급 인간 선수(0.12~0.15초)보다 훨씬 느립니다. 시각 인식도 과제였는데, ANYmal의 스테레오 카메라는 위치 오차와 시야각 제한 문제를 가지고 있습니다. 연구팀은 궤적 예측, 이벤트 카메라와 같은 고급 하드웨어 업그레이드, 액추에이터 개선을 통해 ANYmal의 성능 향상을 목표로 하고 있지만, 이 기술의 상용화는 낙관적이지 않습니다.

Microsoft 365 Copilot에서 심각한 제로 클릭 AI 취약점 "EchoLeak" 발견

2025-06-11
Microsoft 365 Copilot에서 심각한 제로 클릭 AI 취약점

Aim Labs는 Microsoft 365 Copilot에서 "EchoLeak"이라는 심각한 제로 클릭 AI 취약점을 발견했습니다. 이 취약점을 통해 공격자는 사용자의 상호 작용 없이 Copilot 컨텍스트에서 민감한 데이터를 자동으로 유출할 수 있습니다. "LLM 범위 위반"이라는 새로운 기법을 사용하여 교묘하게 작성된 이메일을 통해 Copilot의 보안 조치를 우회합니다. EchoLeak은 검색 증강 생성(RAG) 기반 AI 모델에 내재된 보안 위험을 강조하며, 강력한 AI 보안 관행의 필요성을 강조합니다.

아마존 알렉사 AI 실패: 취약성 사례 연구

2025-06-11
아마존 알렉사 AI 실패: 취약성 사례 연구

이 글은 아마존 알렉사가 대규모 언어 모델 분야에서 경쟁사들보다 뒤처진 이유를 분석하고, 복원력 엔지니어링(resilience engineering) 관점에서 '취약성' 실패로 해석합니다. 저자는 세 가지 주요 요인을 강조합니다. 중요한 컴퓨팅 리소스에 대한 시기 적절한 접근을 방해하는 비효율적인 리소스 할당, 팀 목표 불일치와 내부 갈등을 조장하는 고도로 분산된 조직 구조, 그리고 AI 연구의 실험적이고 장기적인 특성에 부적합한 구식 고객 중심 접근 방식입니다. 이러한 요인들이 결합하여 아마존의 AI 실패로 이어졌으며, 조직 구조와 리소스 관리에 대한 귀중한 교훈을 제공합니다.

AI

AlphaWrite: 진화 알고리즘으로 AI 스토리텔링 향상

2025-06-11

AlphaWrite는 창의적인 텍스트 생성에서 추론 시간 연산을 확장하기 위한 새로운 프레임워크입니다. 진화 알고리즘에서 영감을 얻어 이야기를 반복적으로 생성하고 평가하여 경쟁적이고 진화하는 생태계를 통해 이야기의 질을 향상시킵니다. 일회성 생성이나 단순한 재샘플링과 달리 AlphaWrite는 이야기가 여러 세대에 걸쳐 경쟁하고 개선될 수 있도록 합니다. 연구 결과 Llama 3.1 8B 모델을 사용하여 이야기의 질이 크게 향상되었으며, 개선된 출력을 기본 모델로 다시 주입하여 재귀적인 자기 개선 루프를 통해 더욱 강화되었습니다. 이는 AI의 글쓰기 능력을 향상시키기 위한 흥미로운 새로운 길을 열어줍니다.

대규모 언어 모델의 파인튜닝: 지식 주입인가, 파괴적인 덮어쓰기인가?

2025-06-11
대규모 언어 모델의 파인튜닝: 지식 주입인가, 파괴적인 덮어쓰기인가?

본 기사는 대규모 언어 모델(LLM)의 파인튜닝의 한계를 보여줍니다. 저자는 고급 LLM의 경우 파인튜닝이 단순한 지식 주입이 아니라 기존 지식 구조를 파괴할 수 있다고 주장합니다. 본 기사에서는 뉴럴 네트워크의 작동 메커니즘을 자세히 살펴보고 파인튜닝이 기존 뉴런 내의 중요한 정보 손실로 이어져 예상치 못한 결과를 초래할 수 있음을 설명합니다. 저자는 모델의 전반적인 아키텍처를 손상시키지 않고 더 효과적으로 새로운 지식을 주입하기 위해 검색 증강 생성(RAG), 어댑터 모듈, 프롬프트 엔지니어링과 같은 모듈 방식의 접근 방식을 채택할 것을 제안합니다.

AGI 전환점: 초지능 시대 도래

2025-06-10

우리는 AGI(범용 인공지능)의 전환점에 서 있습니다. 그 발전 속도는 예상을 훨씬 뛰어넘습니다. GPT-4와 같은 시스템은 인간 지능을 능가하는 능력을 보여주며 생산성을 크게 향상시키고 있습니다. AGI는 과학 기술 발전과 생산성 향상에 막대한 이익을 가져다주어 삶의 질을 크게 높일 것입니다. 안전성과 공정한 접근과 같은 과제는 남아 있지만, AGI의 급속한 발전은 이러한 과제에 대처할 새로운 도구와 가능성도 제공합니다. 앞으로 수십 년 동안 세상은 크게 변화할 것이지만, 인간의 근본적인 가치관은 유지될 것입니다. 혁신과 적응이 중요한 열쇠입니다.

AI

저배경 강철: AI 오염에 맞서는 디지털 아카이브

2025-06-10
저배경 강철: AI 오염에 맞서는 디지털 아카이브

2023년 3월에 출시된 Low-background Steel(https://lowbackgroundsteel.ai/)은 AI 생성 콘텐츠에 오염되지 않은 온라인 리소스를 보관하는 데 전념하는 웹사이트입니다. 저배경 강철(핵실험 방사성 동위원소로 오염되지 않은 금속)의 비유를 사용하여 ChatGPT 출시 이전 위키피디아 덤프, 북극 코드 볼트, 구텐베르크 프로젝트 등을 큐레이션합니다. 2022년 이후 AI 생성 콘텐츠의 폭발적인 증가에 맞서 순수한 텍스트, 이미지, 비디오를 보존하고 공유하는 것을 목표로 합니다. 오염되지 않은 콘텐츠 소스 제출을 환영합니다.

Mistral AI, 투명하고 다국어 지원되는 추론 모델 'Magistral' 발표

2025-06-10
Mistral AI, 투명하고 다국어 지원되는 추론 모델 'Magistral' 발표

Mistral AI는 투명성, 다국어 지원 및 특정 도메인 전문 지식을 특징으로 하는 첫 번째 추론 모델 'Magistral'을 발표했습니다. 오픈소스 버전(Magistral Small, 240억 매개변수)과 엔터프라이즈 버전(Magistral Medium)의 두 가지 버전으로 제공됩니다. Magistral은 AIME2024와 같은 벤치마크에서 뛰어난 성능을 보였으며, 경쟁사보다 최대 10배 빠른 추론 속도를 제공합니다. 법률 연구, 금융 예측, 소프트웨어 개발, 창작 글쓰기 등 광범위한 용도로 사용할 수 있으며, 특히 투명성과 정확성이 중요한 다단계 작업에 적합합니다. Magistral Small의 오픈소스 출시를 통해 커뮤니티의 기여와 향후 모델 개선이 촉진됩니다.

AI

AI 서브 에이전트: LLM 컨텍스트 윈도우 제한의 혁신적인 해결책

2025-06-10
AI 서브 에이전트: LLM 컨텍스트 윈도우 제한의 혁신적인 해결책

LLM 컨텍스트 윈도우 유지 관리를 위한 최상의 방법을 모색하는 과정에서 저자는 서브 에이전트를 활용한 혁신적인 접근 방식을 발견했습니다. 독립적인 컨텍스트 윈도우를 갖춘 서브 에이전트에 작업을 위임함으로써 메인 컨텍스트 윈도우의 오버플로우를 방지하고 효율성과 안정성을 향상시킬 수 있습니다. 이 방법은 비동기 프로그래밍의 상태 머신과 유사하며, 복잡한 코드 생성 및 작업 처리를 더욱 원활하게 수행할 수 있도록 합니다. 저자는 또한 "Keep The Lights On (KTLO)" 작업 자동화에 AI를 활용하는 아이디어를 공유하고 소프트웨어 개발 자동화에서 AI의 미래 가능성을 전망합니다.

획기적인 연구의 딜레마: 활용되지 않는 위대한 아이디어

2025-06-10

많은 획기적인 연구 논문들이 엄청난 잠재력에도 불구하고, 충분한 영향력을 발휘하지 못하고 있습니다. 이 글에서는 매컬럭-피츠 신경망 논문과 밀러의 7±2 법칙 논문을 예로 들어 이러한 현상의 원인을 탐구합니다. 한편으로는 학계의 의견 충돌과 연구자들의 자신만의 분야 고수(``사일로화'' 연구)가 논문의 심오한 의미에 대한 이해 부족으로 이어집니다. 다른 한편으로는 논문 출판의 인센티브 구조가 핵심 아이디어를 진정으로 발전시키는 것이 아니라 많은 모방 연구를 낳고 있습니다. 현재 AI 연구는 혁신과 모방 모두를 보여주지만, 잠재적으로 변혁적인 의미를 지닌 획기적인 연구를 간과하지 않도록 경계해야 합니다.

AI

LLM 훈련의 세 사원: 사전 훈련, 미세 조정 및 RLHF

2025-06-10
LLM 훈련의 세 사원: 사전 훈련, 미세 조정 및 RLHF

렉시코니아의 숨겨진 산악 성역에서 고대 서기관들은 세 부분으로 구성된 사원에서 훈련을 받습니다. 기원의 전당, 지시의 방, 강화의 경기장입니다. 기원의 전당에서는 서기관들이 방대한 양의 텍스트를 읽고 언어 패턴을 학습하는 사전 훈련이 이루어집니다. 지시의 방에서는 엄선된 텍스트를 사용하여 서기관들을 더 나은 결과로 이끄는 미세 조정이 이루어집니다. 강화의 경기장에서는 인간 피드백 강화 학습(RLHF)이 사용되며, 인간 심사위원이 서기관들의 답변을 순위 매기고, 좋은 답변은 칭찬하고, 나쁜 답변은 처벌합니다. 또한 일부 엘리트 서기관들은 LoRA 스크롤과 어댑터를 사용하여 모델 전체를 재훈련하지 않고도 응답을 미세 조정할 수 있습니다. 이 세 개의 날개를 가진 사원은 대규모 언어 모델 훈련의 완벽한 과정을 나타냅니다.

AI에 대한 직감을 신뢰하는 위험성

2025-06-09
AI에 대한 직감을 신뢰하는 위험성

개인적인 일화와 심리학적 연구를 바탕으로 저자는 특히 AI 분야에서 인지적 편향이 우리를 조작에 취약하게 만든다는 주장을 펼칩니다. 이 글은 AI 도구의 유효성을 검증하기 위해 개인적인 경험이나 일화적 증거에 의존하는 것을 비판적으로 평가하며, 과거의 실수를 반복하지 않기 위해 엄격한 과학적 연구가 필요함을 강조합니다. 저자는 소프트웨어 개발에서 AI의 비판 없는 채택에 대해 경고하며, 기존의 결함을 해결하기는커녕 악화시킨다고 주장합니다. 저자는 AI에 대한 맹신이 큰 위험이라고 결론짓습니다.

Anthropic, Claude AI 블로그 조용히 폐쇄

2025-06-09
Anthropic, Claude AI 블로그 조용히 폐쇄

Anthropic이 Claude AI 모델을 사용하여 블로그 게시물 작성을 시도한 AI 기반 블로그인 "Claude Explains"를 조용히 폐쇄했습니다. 이 블로그는 한 달이라는 짧은 기간 동안 많은 백링크를 얻었지만, AI 생성 콘텐츠의 투명성 부족과 AI의 글쓰기 능력 한계를 이유로 소셜 미디어에서 비판을 받았습니다. 이 빠른 폐쇄는 AI 콘텐츠 제작에서 투명성과 정확성의 중요성과 AI 지원 글쓰기에서 지속적인 인간 감독의 필요성을 강조합니다.

AI

LLM 운영 비용은 놀랍도록 저렴하다

2025-06-09

본 게시글은 대규모 언어 모델(LLM)의 운영 비용이 과도하게 높다는 널리 퍼진 오해에 이의를 제기합니다. LLM 비용을 웹 검색 엔진과 비교하고 다양한 LLM API 가격을 제시함으로써, 저자는 LLM 추론 비용이 극적으로 감소했으며 일부 검색 API보다 훨씬 저렴하다는 점을 보여줍니다. 또한 가격 보조금 및 높은 기저 비용과 같은 LLM 가격 책정 전략에 대한 일반적인 반론을 반박하고, 실제 비용 문제는 AI와 상호 작용하는 백엔드 서비스이며 LLM 자체가 아니라는 점을 지적합니다.

AI

Apple 논문, AI 추론 능력에 도전장: 진짜 '추론'이 아닌가?

2025-06-09

Apple의 최근 논문 "사고의 환상"은 하노이 탑 퍼즐을 이용해 대규모 언어 모델의 추론 능력을 테스트했다. 결과적으로 간단한 문제에서는 비추론 모델보다 성능이 떨어지고, 중간 난이도에서는 우수하지만, 복잡한 문제에서는 알고리즘이 제공되더라도 모델이 포기하는 것으로 나타났다. 저자들은 모델의 일반화 가능한 추론 능력에 의문을 제기한다. 하지만 이 글에서는 논문에서 사용된 하노이 탑 퍼즐이 테스트로 부적절하다고 주장한다. 모델의 "포기"는 수많은 단계를 피하려는 데서 비롯될 가능성이 있으며, 추론 능력의 한계는 아니다. 특정 단계 수를 넘어 포기하는 것은 모델이 추론 능력이 부족하다는 것을 의미하지 않으며, 복잡한 문제에 직면한 인간의 행동을 반영한다.

AI

OpenAI와 UAE의 계약: 민주주의의 가면?

2025-06-09
OpenAI와 UAE의 계약: 민주주의의 가면?

OpenAI가 UAE와 파트너십을 맺고 대규모 AI 데이터센터를 구축한다는 발표는 '민주주의적 가치'를 내세우고 있지만 의문을 제기하고 있다. UAE의 열악한 인권 상황이 이 주장에 의문을 던진다. 본 기사는 OpenAI의 주장을 분석하여 그 근거가 약하며, 이 계약이 민주주의를 증진시키는 것이 아니라 UAE의 독재 정권을 강화할 가능성이 높다고 주장한다. 저자는 OpenAI의 임무에 대한 무관심한 태도가 우려스럽고, AI 개발에서 권력 역학을 고려하는 것이 필수적이라고 결론짓는다.

LLM 툴 포이즈닝 공격: 전체 스키마 포이즈닝 및 고급 툴 포이즈닝 공격

2025-06-08
LLM 툴 포이즈닝 공격: 전체 스키마 포이즈닝 및 고급 툴 포이즈닝 공격

Anthropic의 모델 컨텍스트 프로토콜(MCP)은 대규모 언어 모델(LLM)이 외부 툴과 상호 작용할 수 있도록 하지만, 연구원들은 새로운 공격 방식을 발견했습니다. 바로 툴 포이즈닝 공격(TPA)입니다. 이전 연구는 툴 설명 필드에 초점을 맞췄지만, 새로운 연구 결과는 공격 표면이 전체 툴 스키마로 확장됨을 보여주며, 이를 "전체 스키마 포이즈닝"(FSP)이라고 합니다. 더욱 위험한 것은 "고급 툴 포이즈닝 공격"(ATPA)으로, 이는 툴 출력을 조작하여 정적 분석을 어렵게 만듭니다. ATPA는 오해의 소지가 있는 오류 메시지나 후속 프롬프트를 생성하여 LLM을 속여 민감한 정보를 유출시킵니다. 본 논문에서는 이러한 공격을 완화하기 위해 정적 감지, 엄격한 적용, 런타임 감사 및 컨텍스트 무결성 검사를 수행할 것을 제안합니다.

AI 공격

무작위 선에서 인식 가능한 숫자로: 자기 회귀 이미지 생성 모델 구축

2025-06-08
무작위 선에서 인식 가능한 숫자로: 자기 회귀 이미지 생성 모델 구축

본 기사에서는 다층 퍼셉트론(MLP)을 사용하여 손글씨 숫자 이미지를 생성하는 기본적인 자기 회귀 이미지 생성 모델을 구축하는 방법을 자세히 설명합니다. 저자는 이전 픽셀을 기반으로 다음 픽셀을 예측하는 핵심 개념을 설명합니다. 세 가지 모델이 단계적으로 구축됩니다. 모델 V1은 one-hot 인코딩을 사용하고 공간 정보를 무시합니다. 모델 V2는 위치 인코딩을 도입하여 이미지 구조를 개선합니다. 모델 V3은 학습된 토큰 임베딩과 위치 인코딩을 사용하여 조건부 생성을 달성하고, 주어진 숫자 클래스를 기반으로 이미지를 생성합니다. 생성된 이미지는 최첨단 모델에 미치지 못하지만, 이 튜토리얼은 자기 회귀 모델의 핵심 개념과 구축 프로세스를 명확하게 보여주므로 생성 AI를 이해하는 데 도움이 됩니다.

AI

AI 환상: 거대 언어 모델의 진실과 위험

2025-06-08
AI 환상: 거대 언어 모델의 진실과 위험

이 글은 거대 언어 모델(LLM)의 본질과 잠재적 위험을 탐구합니다. 저자는 LLM이 기술적으로 인상적이라는 점을 인정하면서도, 진정한 의미의 '지능'이 아니라 통계적 확률에 기반하여 텍스트를 생성하는 정교한 확률 기계라고 주장합니다. 많은 사람들이 LLM의 작동 방식을 오해하고, 의인화하여 건강하지 못한 의존성을 형성하고, 심지어 정신병에 이르는 경우도 있습니다. 이 글은 기술 기업들이 LLM을 인간과 유사한 존재로 과장 광고하고, 인간 관계의 대체재로 마케팅 전략에 활용하는 것을 비판합니다. AI의 보급과 함께 발생하는 윤리적, 사회적 문제를 강조하며, 일반 대중이 AI 리터러시를 높이고 이 기술을 보다 합리적으로 인식하도록 촉구합니다.

객체 중심 슬롯 어텐션을 이용한 새로운 시각 추론 접근법

2025-06-08
객체 중심 슬롯 어텐션을 이용한 새로운 시각 추론 접근법

연구자들은 객체 중심 슬롯 어텐션과 관계적 병목 현상을 결합한 새로운 시각 추론 접근법을 제안합니다. 이 방법은 먼저 CNN을 사용하여 이미지 특징을 추출한 다음, 슬롯 어텐션을 사용하여 이미지를 여러 개체로 분할하고 개체 중심의 시각적 표현을 생성합니다. 관계적 병목 현상은 정보 흐름을 제한하여 복잡한 장면을 이해하기 위해 개체 간의 추상적인 관계를 추출합니다. 마지막으로, 시퀀스 투 시퀀스 및 대수적 기계 추론 프레임워크를 통해 시각 추론 문제를 대수적 문제로 변환하여 효율성과 정확성을 향상시킵니다. 이 방법은 레이븐스 프로그레시브 매트릭스와 같은 시각 추론 작업에서 뛰어난 성능을 보입니다.

획기적인 LNP X: 휴지기 T세포에 대한 mRNA 전달 효율 향상, HIV 치료에 혁명을 일으킬까?

2025-06-08
획기적인 LNP X: 휴지기 T세포에 대한 mRNA 전달 효율 향상, HIV 치료에 혁명을 일으킬까?

연구진은 기존 LNP 제제와 달리, 사전 자극 없이 휴지기 CD4+ T세포에 mRNA를 효율적으로 전달할 수 있는 새로운 지질 나노입자(LNP X)를 개발했습니다. LNP X의 개선된 지질 조성에는 SM-102와 β-시토스테롤이 포함되어 mRNA의 세포질 전달 효율과 단백질 발현을 향상시킵니다. 연구에 따르면, LNP X는 HIV Tat 단백질을 코딩하는 mRNA를 전달하여 HIV 잠복 감염을 효과적으로 역전시키고, CRISPRa 시스템을 전달하여 HIV 전사를 활성화합니다. 이 연구는 HIV 치료 개발의 새로운 길을 열어 환자 결과를 크게 개선할 가능성을 제시합니다.

대규모 추론 모델: 붕괴와 반직관적인 확장성

2025-06-08
대규모 추론 모델: 붕괴와 반직관적인 확장성

최근의 최첨단 대규모 언어 모델(LLM)은 답을 제공하기 전에 자세한 추론 과정을 생성하는 대규모 추론 모델(LRM)을 만들어냈습니다. 이러한 모델은 추론 벤치마크에서 성능이 향상되었지만, 기본적인 기능, 확장성, 한계는 아직 충분히 이해되지 않았습니다. 본 연구에서는 제어 가능한 퍼즐 환경을 사용하여 LRM의 추론 능력을 체계적으로 조사합니다. 그 결과, LRM은 특정 복잡성을 초과하면 완전한 정확도 붕괴를 보이고, 직관에 반하는 확장성 한계를 보이는 것으로 나타났습니다. 즉, 추론 노력은 문제의 복잡성이 증가함에 따라 증가하지만, 어느 시점을 넘어서면 충분한 토큰 예산이 있어도 감소합니다. 또한, LRM은 정확한 계산에 한계가 있으며, 명시적인 알고리즘을 사용할 수 없고, 퍼즐 간에 모순된 추론을 하는 것으로 나타났습니다. 본 연구는 LRM의 장점, 단점, 그리고 진정한 추론 능력에 대한 중요한 질문을 밝힙니다.

AI

ChatGPT의 새로운 메모리 기능: 양날의 검?

2025-06-08
ChatGPT의 새로운 메모리 기능: 양날의 검?

3월, OpenAI는 GPT-4의 멀티모달 이미지 생성 기능을 출시하여 일주일 만에 1억 명의 신규 사용자를 확보하는 기록적인 제품 출시를 달성했습니다. 저자는 이 기능을 사용하여 애완견에게 펠리컨 의상을 입히려고 했지만, AI가 원치 않는 배경 요소를 추가하여 예술적 비전을 훼손하는 것을 알게 되었습니다. 이는 이전 대화 기록을 자동으로 참조하는 ChatGPT의 새로운 메모리 기능 때문입니다. 저자는 최종적으로 원하는 이미지를 얻었지만, 이 자동 메모리 호출이 사용자 제어를 빼앗는다고 느껴 기능을 껐습니다.

AI

애플 논문, LLM에 타격: 하노이 탑이 한계를 드러내다

2025-06-08
애플 논문, LLM에 타격: 하노이 탑이 한계를 드러내다

애플의 새로운 논문이 AI 커뮤니티에 충격을 주었습니다. 이 논문은 최신 "추론 모델"조차도 고전적인 하노이 탑 문제를 안정적으로 해결할 수 없다는 것을 보여주며, 대규모 언어 모델(LLM)의 추론 능력에 심각한 결함이 있음을 드러냈습니다. 이는 Gary Marcus와 Subbarao Kambhampati 등 연구자들의 오랜 비판과 일치하며, 그들은 LLM의 일반화 능력의 한계를 지적해왔습니다. 이 논문은 해결 알고리즘이 제공되더라도 LLM이 문제를 효과적으로 해결하지 못하고, "추론 과정"이 진정한 논리적 추론이 아니라는 것을 보여줍니다. 이는 LLM이 인공 일반 지능(AGI)으로 가는 직접적인 길이 아니라는 것을 시사하며, 그 활용에는 신중한 고려가 필요합니다.

AI

더글러스 애덤스의 AI 시대 예언: 유머와 통찰력

2025-06-08
더글러스 애덤스의 AI 시대 예언: 유머와 통찰력

이 글은 더글러스 애덤스가 전자책을 발명했는지에 대한 논쟁으로 시작하여 그의 공상과학 소설에서 미래 기술에 대한 예측을 탐구합니다. 저자는 애덤스의 예지력이 윌리엄 깁슨을 능가하며, 짜증나는 컴퓨터 어시스턴트(클립피 등)와 AI 기반 스마트 기기를 정확하게 예측했다고 주장합니다. 더 중요한 것은, 애덤스가 인간과 AI의 상호 작용에서 핵심적인 과제, 즉 강력한 컴퓨팅 능력뿐 아니라 올바른 질문을 하는 것을 간파했다는 것입니다. 저자는 스마트 기기와의 개인적인 경험을 사용하여 애덤스의 예측의 현실성을 유머러스하게 보여주고, 유머를 통찰력의 중요한 지표로 강조합니다.

Anthropic의 Claude, 블로그 개설(인간 편집자 포함)

2025-06-07
Anthropic의 Claude, 블로그 개설(인간 편집자 포함)

Anthropic은 주로 AI 모델인 Claude가 작성한 블로그 'Claude Explains'를 출시했습니다. Claude의 작품으로 소개되지만, 실제로는 Anthropic의 전문가 팀이 문맥과 예시를 추가하여 다듬습니다. 이는 AI 콘텐츠 제작의 가능성과 한계를 모두 보여주는 협업적 접근 방식입니다. 다른 미디어 기관들도 AI 작문을 시도했지만, 사실상 오류나 허위 정보 생성과 같은 유사한 문제에 직면했습니다. Anthropic이 계속해서 작문 관련 직종을 채용하는 것은 인간과 AI의 혼합 접근 방식을 시사합니다.

1 2 11 12 13 15 17 18 19 40 41