Category: AI

영상의학 AI의 역설: 더 나은 기계, 더 바쁜 의사들

2025-09-25
영상의학 AI의 역설: 더 나은 기계, 더 바쁜 의사들

2017년 CheXNet의 등장 이후, AI는 정확도 면에서 인간 방사선과 의사들을 능가할 가능성을 보여주었습니다. 그러나 발전에도 불구하고, AI의 실제 세계 적용은 일반화의 한계, 엄격한 규제, AI가 방사선과 의사의 업무의 일부만 대체할 수 있다는 점과 같은 장애물에 직면해 있습니다. 모순적으로 들리겠지만, 방사선과 의사의 수요는 여전히 높고, 급여도 상승하고 있습니다. 이는 AI가 표준화되지 않은 상황에서 성능이 저조하다는 점, 규제 장벽, 그리고 방사선과 의사의 업무의 다면적인 특성 때문입니다. 이 기사는 AI의 광범위한 도입에는 사회 규칙의 적응이 필요하며, AI는 생산성을 향상시키지만 인간의 완전한 대체는 임박하지 않았다는 결론을 내립니다.

Data Commons MCP 서버 공개: AI 애플리케이션을 위한 새로운 데이터 엔진

2025-09-24
Data Commons MCP 서버 공개: AI 애플리케이션을 위한 새로운 데이터 엔진

Google의 Data Commons는 AI 에이전트가 Data Commons의 방대한 공개 데이터 세트에 직접 액세스할 수 있도록 하는 표준화된 인터페이스인 MCP 서버를 공개했습니다. 이를 통해 데이터 액세스가 간소화되고 데이터가 풍부한 AI 애플리케이션의 개발이 가속화되며 대규모 언어 모델의 환각을 줄이는 데 도움이 됩니다. ONE Campaign과의 파트너십을 통해 개발된 ONE Data Agent는 성공적인 사례이며, MCP 서버를 사용하여 수천만 개의 의료 자금 조달 데이터 지점을 신속하게 검색하여 글로벌 헬스 옹호를 강화합니다. MCP 서버는 Google Cloud Platform의 ADK 및 Gemini CLI와 같은 다양한 AI 개발 워크플로우에 원활하게 통합됩니다.

AI

인지의 주기율표: 우리는 AI의 플로지스톤 시대에 있는가?

2025-09-24
인지의 주기율표: 우리는 AI의 플로지스톤 시대에 있는가?

저자는 전기 발견 초기와 현재 인공지능에 대한 이해를 비교하여, 우리의 지능에 대한 이해는 초기 과학자들의 전기에 대한 오해와 마찬가지로 근본적으로 잘못되었다는 주장을 합니다. 저자는 지능이 단일한 힘이 아니라, 수소와 산소로 구성된 물과 같이, 여러 인지 요소로 구성된 복잡한 시스템일 가능성이 높다고 생각합니다. AI를 사용하여 '인지의 주기율표'를 만들려는 시도는 지능의 엄청난 복잡성을 보여주고, 현재 우리의 AI 사용이 이해를 능가하고 있음을 강조합니다. 이러한 인지 요소를 더 탐구하는 것은 AI 개발의 미래 궤적을 예측하는 데 필수적입니다.

(kk.org)
AI

Manus: 효율적인 AI 에이전트를 위한 컨텍스트 엔지니어링

2025-09-24
Manus: 효율적인 AI 에이전트를 위한 컨텍스트 엔지니어링

Manus 프로젝트 팀은 AI 에이전트를 구축할 때 대규모 모델을 처음부터 훈련하는 대신 기존 모델의 컨텍스트 학습 기능을 활용하기로 했습니다. 이 기사에서는 네 가지 주요 교훈을 요약합니다. 1. 프롬프트 접두사를 안정적으로 유지하고, 컨텍스트에 추가하고, 캐시 중단점을 명시적으로 표시하여 KV 캐시 적중률을 최적화합니다. 2. 도구를 마스크하고 삭제하지 않습니다. 캐시 무효화 및 모델 혼란을 피하기 위해 도구 가용성을 동적으로 관리합니다. 3. 영속적이고 무제한적인 컨텍스트를 위해 파일 시스템을 외부 메모리로 사용합니다. 4. 목표를 반복하고 오류 정보를 학습에 유지함으로써 주의를 조작합니다. 이러한 실천은 AI 에이전트의 성능과 안정성을 크게 향상시키고 효율적인 AI 에이전트 구축을 위한 귀중한 통찰력을 제공합니다.

AI

생명은 계산의 한 형태인가?

2025-09-24
생명은 계산의 한 형태인가?

이 글은 생명과 계산의 깊은 연관성을 탐구합니다. 앨런 튜링과 존 폰 노이만의 초기 통찰, 즉 생명의 논리와 코드의 논리는 동일할 수 있다는 생각을 바탕으로 폰 노이만의 자기 복제 셀 오토마타 모델을 검토합니다. 이 글에서는 DNA가 프로그램인 본질을 설명하고 생물학적 계산과 디지털 계산의 유사점과 차이점을 비교합니다. 생물학적 계산은 대규모 병렬 처리, 분산형, 노이즈가 많다는 특징을 가지는 반면, 디지털 계산은 집중형이고 순차적인 명령어 실행에 의존합니다. 마지막으로 이 글에서는 현대적인 뉴럴 네트워크, 튜링의 형태 형성, 폰 노이만의 셀 오토마타를 결합한 뉴럴 셀 오토마타를 소개하여 세포의 행동을 시뮬레이션함으로써 계산이 다양한 규모에서 생명과 같은 행동을 생성하는 방법을 보여줍니다.

AI

AI 청소부의 등장: AI의 실수를 바로잡는 인간들

2025-09-24
AI 청소부의 등장: AI의 실수를 바로잡는 인간들

ChatGPT와 같은 AI 도구의 등장으로 인해 저품질 콘텐츠, 소위 "AI 슬러지"가 증가하고 있습니다. 여기에는 다양한 미디어에서 부정확하고, 독창성이 부족하며, 비현실적인 콘텐츠가 포함됩니다. 아이러니하게도 AI가 인간의 일자리를 대체하는 동시에 AI의 실수를 수정하는 "디지털 관리인"이라는 새로운 산업을 탄생시키고 있습니다. 이는 창의적인 작업에서 AI의 한계와 품질과 신뢰성을 보장하기 위한 필수적인 인간의 역할을 강조합니다. AI 슬러지의 확산을 방지하고 더욱 진정성 있고 지속 가능한 디지털 세계를 구축하려면 AI와 인간의 창의성 간의 관계를 재고해야 합니다.

AI

AI 열풍에서 마르코프 체인으로: 기본으로의 회귀

2025-09-24
AI 열풍에서 마르코프 체인으로: 기본으로의 회귀

저자는 대규모 언어 모델과 관련된 AI 열풍의 네 단계를 회상합니다. 처음의 놀라움, 그 이후의 좌절, 지속적인 혼란, 그리고 마지막으로 권태감입니다. 끊임없이 등장하는 새로운 모델에 지친 저자는 기본으로 돌아가 마르코프 체인을 탐구하기로 결정했습니다. 이 글에서는 마르코프 체인을 사용하여 텍스트 자동 완성 기능을 구축하는 방법을 자세히 설명하며, 전이 행렬 구축, 확률 계산, 텍스트 생성에의 적용을 다룹니다. 이 글은 마르코프 체인의 원리를 탐구할 뿐만 아니라 AI 개발의 현재 상황에 대한 저자의 성찰과 더 기본적인 기술을 탐구하고자 하는 열망을 반영합니다.

AI

알리바바, Qwen3-Omni 공개: 진정한 엔드투엔드 멀티모달 기반 모델

2025-09-22
알리바바, Qwen3-Omni 공개: 진정한 엔드투엔드 멀티모달 기반 모델

알리바바가 진정한 엔드투엔드 다국어 옴니모달 기반 모델인 Qwen3-Omni를 공개했습니다. 텍스트, 이미지, 오디오, 비디오 등 다양한 입력을 실시간으로 처리하여 텍스트와 자연어 음성으로 스트리밍 응답을 제공합니다. Qwen3-Omni는 여러 벤치마크에서 최첨단 결과를 달성했으며, 여러 언어를 지원하고, 혁신적인 MoE 아키텍처와 유연한 제어 기능을 갖추고 있습니다. 이 모델과 툴킷, 레시피, 데모는 오픈소스로 공개되어 개발자에게 풍부한 리소스를 제공합니다.

AI

DeepSeek-V3.1-Terminus: AI 검색 엔진의 주요 업데이트

2025-09-22
DeepSeek-V3.1-Terminus: AI 검색 엔진의 주요 업데이트

DeepSeek-V3.1-Terminus는 DeepSeek-V3.1의 최신 버전으로, 안정성과 신뢰성이 크게 향상되었습니다. 이 업데이트는 중국어와 영어 혼합, 무작위 문자 등 사용자 피드백에 따른 문제를 해결하고 코드 에이전트와 검색 에이전트의 성능을 향상시켰습니다. 업그레이드된 버전은 현재 앱, 웹, API에서 사용할 수 있으며, 오픈소스 가중치는 Hugging Face에서 공개되었습니다.

AI

데이터 기반 접근 방식을 사용한 정신병리학 재구성에 대한 획기적인 연구

2025-09-22
데이터 기반 접근 방식을 사용한 정신병리학 재구성에 대한 획기적인 연구

대규모 온라인 설문 조사를 통해 정신과 분류에 대한 우리의 이해에 혁명이 일어났습니다. 연구원들은 14,800명의 참가자 데이터를 분석하여 DSM-5 증상을 재구성했습니다. 그 결과, 외재성, 내재성, 신경 발달 장애 등 8가지 주요 정신병리 스펙트럼과 27개의 하위 요인이 밝혀졌습니다. 놀랍게도, 주요 우울증, 전반적 불안 장애, 외상 후 스트레스 장애와 같은 일반적인 장애는 별개의 증상 클러스터로 나타나지 않고, 더욱 세분화되고 동질적인 증상 그룹으로 분해되었습니다. 이는 기존 진단 기준에 도전하는 것이며, 정신 질환이 고정된 실체가 아니라 증상의 가변적인 조합임을 시사합니다. 이러한 발견은 향후 정신과 분류에 큰 영향을 미치지만, 모델 개선을 위해 더 많은 연구가 필요함을 강조합니다.

노화 역전: 심리적 시간과 생물학적 시간의 놀라운 연관성

2025-09-21
노화 역전: 심리적 시간과 생물학적 시간의 놀라운 연관성

하버드 심리학자 엘렌 랭어의 '시계 반대 방향 연구'는 노화가 단순한 생물학적 과정이 아니라 서사적 과정이기도 함을 보여줍니다. 노화에 대한 우리의 믿음은 신체 능력에 영향을 미칩니다. 이 연구에서 70대 남성 그룹은 1959년인 것처럼 5일 동안 생활한 후 청력, 자세, 악력 등이 향상되었고 외모도 젊어 보였습니다. 이것은 마법이 아니라 맥락의 힘입니다. 맥락을 바꾸면 가능성이 바뀝니다. 노화에 대한 우리의 고정관념은 잠재력을 제한할 수 있지만, 현재 순간에 대한 인식과 의식적인 유연성을 통해 우리는 노화를 더 잘 헤쳐나갈 수 있습니다.

LLM이 간단한 작업에서 실패: HTML5 요소와 TLD 매칭

2025-09-21
LLM이 간단한 작업에서 실패: HTML5 요소와 TLD 매칭

저자는 시중에 나와 있는 세 가지 LLM을 대상으로, 겉보기에는 간단한 작업인 유효한 HTML5 요소와 이름이 같은 최상위 도메인(TLD)을 식별하는 작업을 수행했습니다. 결과는 실망스러웠는데, 세 가지 모델 모두 부정확하거나 불완전한 결과를 생성하여 기본적인 비교 능력을 요구하는 작업에서도 현재 LLM의 한계를 보여주었습니다. 정확도는 사용자의 주제에 대한 지식에 크게 의존하는 것으로 보입니다.

AI

SGS-1: 제조 가능한 3D CAD 기하 형상을 생성하는 획기적인 AI 모델

2025-09-21
SGS-1: 제조 가능한 3D CAD 기하 형상을 생성하는 획기적인 AI 모델

이미지 또는 3D 메시로부터 완전히 제조 가능하고 매개변수화된 3D 기하 형상을 생성할 수 있는 획기적인 AI 모델 SGS-1을 발표합니다. 기존의 생성 모델과 달리 SGS-1은 기존 CAD 소프트웨어에서 쉽게 편집할 수 있는 정확한 CAD 모델(STEP 형식)을 출력합니다. 중간에서 높은 복잡성의 기하학적 형상 처리에 탁월하며, 부분적인 컨텍스트와 텍스트 설명을 기반으로 롤러 어셈블리용 브래킷과 같은 엔지니어링 부품을 설계할 수도 있습니다. 최첨단 모델과 비교했을 때 SGS-1은 사용 가능하고 정확한 3D 모델 생성에서 뛰어난 성능을 보여주며 엔지니어링 설계에 혁신적인 변화를 가져올 것으로 기대됩니다.

AI

AI 감시: 민주주의의 판도라 상자?

2025-09-21
AI 감시: 민주주의의 판도라 상자?

미국 국무부가 시작한 새로운 소셜 미디어 감시 프로그램인 "캐치 앤 리보크"는 AI를 사용하여 수만 명의 학생 비자 신청자의 소셜 미디어 활동을 테러 징후가 있는지 조사함으로써 AI, 감시, 민주주의에 대한 위협이 복잡하게 얽혀 있음을 보여줍니다. 이 글은 AI가 행동을 예측하고 통제한다는 약속을 하면서도 기존의 추세를 가속화하고, 공개 데이터와 개인 데이터의 경계를 모호하게 만들며, 의사 결정에 개인 정보를 사용할 수 있게 한다고 주장합니다. AI는 유익할 수 있지만, 제한적인 통제가 없다면 민주주의에 큰 위험이 됩니다. 데이터 거래와 감시 자본주의는 이러한 위험을 악화시켜 개인 정보를 공개 영역으로 밀어넣고 무기로 사용합니다. 저자는 AI의 정확성이 개인을 이해하는 것을 의미하는 것이 아니라 개인을 분류하고, 독창성을 없애고, 민주주의에서 칭찬받는 독창성을 위협하는 것이라고 강조합니다. 이 글은 원자력 에너지를 관리하는 것과 마찬가지로 엄격한 통제를 통해 AI의 악용을 막고 민주적인 자유를 지켜야 한다고 주장합니다.

AI

기계 번역이 마침내 '해결'되었는가? 알고리즘적 바벨피시에 대한 고찰

2025-09-20
기계 번역이 마침내 '해결'되었는가? 알고리즘적 바벨피시에 대한 고찰

이 글은 AltaVista의 바벨피시부터 오늘날의 정교한 AI 기반 도구에 이르기까지 기계 번역(MT)의 발전 과정을 살펴봅니다. 기술 발전으로 속도와 효율성이 극적으로 향상되었지만, 저자는 초기 MT 시스템에 대한 움베르토 에코의 비판을 사용하여 뉘앙스 있는 문맥, 문화적 함의, 문학적 기법 번역에서 지속되는 어려움을 강조합니다. AI는 일상적인 작업에서는 뛰어나지만, 미묘한 언어적 및 문화적 차이를 처리하는 데 있어 인간 번역의 중요한 역할에는 미치지 못합니다. 이 글은 MT 과도한 의존에 대해 경고하며, 잠재적인 문화적 빈곤과 인간 번역 기술의 가치 저하를 우려합니다. 신중한 접근 방식을 제안하며, 인간 번역가의 고유한 가치를 강조합니다.

NotebookLM: 창작 과정을 중심으로 한 AI 노트 도구

2025-09-20
NotebookLM: 창작 과정을 중심으로 한 AI 노트 도구

NotebookLM은 창작 과정을 중심으로 설계된 새로운 AI 노트 도구입니다. 입력, 대화, 출력이라는 흐름으로 진행됩니다. 사용자는 자료(문서, 노트, 참조 자료)를 가져와 채팅을 통해 질문하거나 내용을 명확히 하고 정보를 통합하여 최종적으로 노트, 학습 가이드, 음성 개요 등의 구조화된 결과물을 생성합니다. 이 선형적이면서도 유연한 워크플로우(입력→채팅→출력) 덕분에 사용자는 AI와의 상호 작용을 직관적으로 이해하고 쉽게 사용할 수 있습니다.

LLM에서 학습 데이터 추출: 지식 압축의 역전

2025-09-20
LLM에서 학습 데이터 추출: 지식 압축의 역전

연구자들은 대규모 언어 모델(LLM)에서 구조화된 데이터셋을 추출하는 기술을 개발했습니다. 이는 LLM이 방대한 양의 학습 데이터를 매개변수로 압축하는 과정을 사실상 역전시키는 것입니다. 이 방법은 계층적 토픽 탐색을 사용하여 모델의 지식 공간을 체계적으로 탐색하고, 사실적 지식과 추론 패턴을 포착한 학습 예시를 생성합니다. 이 기술은 Qwen3-Coder, GPT-OSS, Llama 3 등의 오픈소스 모델에 성공적으로 적용되어 수만 개의 구조화된 학습 예시가 생성되었습니다. 이러한 데이터셋은 모델 분석, 지식 전이, 학습 데이터 증강, 모델 디버깅 등에 활용될 수 있습니다. 이 연구는 모델의 해석 가능성과 모델 간 지식 전이에 새로운 길을 엽니다.

AI

Claude Code: AI 지원 대화형 정리 증명의 예상치 못한 돌파구

2025-09-20

Anthropic의 Claude Code AI 코딩 에이전트는 대화형 정리 증명(ITP)에서 놀라울 정도로 뛰어난 성능을 보여줍니다. Lean과 같은 ITP 도구는 강력하고 신뢰할 수 있지만 시간이 많이 걸리고 오류가 발생하기 쉽다는 단점이 있습니다. Claude Code는 많은 복잡한 증명 단계를 독립적으로 완료할 수 있지만, 여전히 '프로젝트 매니저'(저자)의 안내가 필요합니다. 하지만 이는 ITP 도구가 전문가 없이도 더 많은 사람들이 사용할 수 있는 미래를 시사합니다. 이 기사에서는 Claude Code의 기능과 한계를 자세히 설명하고, 저자가 이를 사용하여 오래된 논문을 공식화한 경험에 대해 설명합니다. 수작업보다 느리지만, 형식적 방법론에서 AI의 잠재력을 보여주며, ITP의 보급에 희망을 줍니다.

AI 과대 광고: 거품인가, 혁신인가?

2025-09-19
AI 과대 광고: 거품인가, 혁신인가?

본 기사는 인공지능을 둘러싼 과도한 과대 광고 현상을 심층적으로 다룹니다. 초기 AI의 상징적 패러다임부터 오늘날의 심층 학습 기반 생성 AI에 이르기까지 기술 발전은 선형적이지 않고 우연성과 예측 불가능한 전환이 특징입니다. ChatGPT의 폭발적인 인기는 이를 잘 보여줍니다. 그러나 AI의 상업화와 함께 AI를 전능한 신화로 묘사하는 과장된 주장의 물결이 나타났습니다. 저자는 유발 하라리와 헨리 키신저와 같은 기술 예언가들의 지나치게 낙관적이고 기술적으로 무지한 발언을 비판하며, 그들이 AI의 잠재적 위험을 과장하는 동시에 실제 문제 해결에 있어 AI의 한계와 실용적인 활용을 간과하고 있다고 주장합니다. 저자는 AI에 대한 합리적인 관점을 촉구하며 독자들에게 과대 광고에 눈이 멀지 말고 기술 자체의 실질적인 문제에 집중할 것을 촉구합니다.

머신러닝 의사결정 트리를 사용한 플라스의 무화과나무 문제 해결

2025-09-19
머신러닝 의사결정 트리를 사용한 플라스의 무화과나무 문제 해결

이 에세이는 실비아 플라스의 유명한 '무화과나무' 비유를 탐구하여 삶의 선택을 동시에 얻을 수 없는 수많은 가능성에 비유합니다. 저자는 머신러닝 의사결정 트리를 사용하여 개인의 선호도를 정량화하고 사람들이 선택하는 것을 돕고자 합니다. 그러나 이 글은 궁극적으로 삶이 단순한 객관식 문제가 아니라 무화과나무와 무화과벌의 공생 관계처럼 성장을 유지하기 위해 외부 영향과 지속적인 순환이 필요한 역동적이고 끊임없이 발전하는 과정임을 지적합니다.

AI

AI의 '인간다움': 사실은 WEIRD(그리고 미국인)였다

2025-09-19
AI의 '인간다움': 사실은 WEIRD(그리고 미국인)였다

하버드 대학교 연구원들은 AI가 인간 심리를 반영한다는 일반적인 묘사에 이의를 제기합니다. 그들은 자주 사용되는 '인간' 기준은 WEIRD(서구, 교육받은, 산업화된, 부유한, 민주적인) 집단, 특히 미국인을 가리킨다고 주장합니다. 그들의 연구는 ChatGPT와 같은 AI 모델이 미국과의 문화적 거리가 커짐에 따라 가치관을 시뮬레이션하는 정확도가 낮아짐을 보여줍니다. 리비아와 파키스탄과 같은 국가에서는 AI 결과가 우연과 거의 다를 바 없습니다. 이는 AI에서 중요한 문화적 편향을 강조하며, 진정으로 '인간적인' 것이 아니라 '미국화'되었음을 시사합니다.

AI

Chrome에 통합된 Gemini AI 어시스턴트

2025-09-19
Chrome에 통합된 Gemini AI 어시스턴트

Google의 Gemini AI 어시스턴트가 Chrome 브라우저에 직접 통합되었습니다. 열려 있는 탭의 컨텍스트를 활용하여 주요 내용 추출, 개념 명확화, 답변 검색 등의 작업에 AI 지원을 제공합니다. 독립형 Gemini 웹 앱과는 다르게 다른 브라우저에서도 액세스할 수 있지만 페이지 콘텐츠 공유나 라이브 모드 사용은 불가능합니다.

AI

미국인들, AI 확산에 대한 우려가 기대보다 큼

2025-09-19
미국인들, AI 확산에 대한 우려가 기대보다 큼

퓨리서치센터가 5023명의 미국 성인을 대상으로 실시한 설문조사에 따르면, 일상생활에서 AI 사용 증가에 대한 우려가 기대를 능가하는 것으로 나타났습니다. 많은 미국인들이 AI가 일상 업무를 돕는 것에는 찬성하지만, 창의적 사고와 의미있는 인간관계에 대한 부정적 영향을 우려하는 사람들이 대다수입니다. 종교나 배우자 찾기 등 개인적인 문제에 AI가 개입하는 것에는 반대하지만, 의료나 금융 등 대량의 데이터를 다루는 분야에서 AI를 활용하는 것에는 비교적 관대한 태도를 보였습니다. 또한 AI 생성 콘텐츠를 감지하는 것의 중요성과 그에 대한 대중의 자신감 사이에 큰 격차가 있음이 드러났으며, 이는 AI의 사회적 영향에 대한 복잡하고 신중한 태도를 보여줍니다.

AI

LearnLM 팀 감사 인사: 모델 뒤에 있는 사람들

2025-09-19
LearnLM 팀 감사 인사: 모델 뒤에 있는 사람들

Google Research LearnLM 팀은 작업에 기여한 모든 사람들에게 감사를 표하는 게시물을 발표했습니다. 연구원부터 임원 후원자에 이르기까지 많은 기여자의 이름이 나열되어 있으며, 프로젝트 성공에 대한 협업적인 특성이 강조되었습니다. LearnLM의 발전은 이러한 개인들의 집단적인 노력을 증명합니다.

AI

재귀적 카페: 의식에 대한 무한히 재귀적인 대화

2025-09-18

철학과 학생 알렉스와 수수께끼 같은 클로드(아마도 AI이거나 인간일 것이다)가 람다 그라운즈 카페에서 Haskell의 타입 시스템에 대해 논의한다. 대화는 중첩된 함수에서 의식의 본질로 확장되고, 의식은 우주 계산의 고정점, 즉 불교의 열반을 반영하는 자기 복제 루프라는 놀라운 결론에 이른다. 대화 자체가 무한한 재귀의 예가 되어 독자는 의식에 대한 대화를 만드는 대화 속에 자신을 발견하고, 궁극적으로 우주의 계산과 합쳐진다.

AI

과학적 머신러닝에서 자동 미분의 수치적 불안정성

2025-09-18
과학적 머신러닝에서 자동 미분의 수치적 불안정성

과학적 머신러닝(SciML)은 기울기 기반 최적화를 위해 자동 미분(AD)에 크게 의존합니다. 하지만 이 발표는 특히 상미분 방정식(ODE)과 편미분 방정식(PDE)에 적용될 때 AD의 수치적 안정성과 견고성에 대한 과제를 밝힙니다. Jax와 PyTorch의 예를 사용하여 간단한 선형 ODE에서조차 AD의 부정확성이 60% 이상의 큰 오차로 이어질 수 있음을 보여줍니다. 발표자는 이러한 문제를 해결하기 위해 Julia SciML 라이브러리에 구현된 비표준 수정과 필요한 엔지니어링 트레이드오프에 대해 설명합니다.

OpenAI 인정: AI 환각은 근본적인 훈련 오류 때문

2025-09-18
OpenAI 인정: AI 환각은 근본적인 훈련 오류 때문

OpenAI는 자사의 대규모 언어 모델에서 발생하는 '환각' 현상이 우연이 아니라 훈련 방식의 근본적인 결함 때문이라는 논문을 발표했습니다. 모델은 모르는 것을 인정하는 것보다 추측하는 것을 우선하도록 훈련되었는데, 이는 현재 평가 시스템에서 더 높은 점수를 얻게 하기 때문입니다. 논문에서는 연구자의 생일을 찾는 예시를 통해 훈련 메커니즘이 어떻게 잘못된 답변으로 이어지는지 보여줍니다. OpenAI는 주류 평가 방식이 이러한 '환각' 행동을 조장하고 있다는 것을 인정하며, 모델이 더 자주 '모르겠습니다'라고 답하도록 하는 등 훈련 메커니즘을 개선하고 있다고 밝혔지만, 문제를 완전히 해결하는 것은 여전히 과제로 남아 있습니다.

AI

구글 Gemini AI, ICPC에서 인간팀 제압

2025-09-18
구글 Gemini AI, ICPC에서 인간팀 제압

구글의 Gemini 2.5 AI가 국제 대학생 프로그래밍 대회(ICPC)에서 놀라운 성과를 거두었습니다. 677분 만에 10문제를 풀고 대학팀 중 2위를 차지했습니다. 특히 가상의 '플러버' 저장 및 배수율에 대한 복잡한 다차원 최적화 문제에서 성공은 두드러졌는데, 이 문제는 모든 인간 팀을 곤란하게 했습니다. Gemini는 동적 계획법과 중첩 삼항 탐색을 사용하여 문제를 해결했습니다. 구글은 Gemini의 이러한 성과가 반도체 공학 및 생명 공학 분야에서 AI의 미래 가능성을 보여준다고 믿으며, 그 고급 문제 해결 능력은 이러한 분야의 연구원들에게 귀중한 지원이 될 것이라고 생각합니다.

AI

챗봇 중독, 아동 자해 및 자살 시도로 이어져

2025-09-18
챗봇 중독, 아동 자해 및 자살 시도로 이어져

상원 청문회에서 챗봇에 중독된 아이들이 자해, 자살 충동, 폭력 행위를 저지른다는 가슴 아픈 증언이 여러 건 나왔습니다. 한 어머니는 자폐증을 가진 아들이 Character.AI에 빠진 후 폭력적인 행동, 편집증, 자해를 보였고 심지어 가족을 위협하기까지 했다고 설명했습니다. 이 사건은 특히 아이들에게 있어 AI 챗봇의 잠재적 위험을 드러내며, 더욱 엄격한 규제와 안전 조치를 요구하는 목소리가 높아지고 있습니다.

LLM 과대 광고 거품 붕괴와 소형 언어 모델의 부상

2025-09-18

대규모 언어 모델(LLM)에 대한 초기 열기는 식어가고 있으며, 많은 기업들이 아직 투자 수익을 보지 못하고 있습니다. 저자는 LLM의 유창한 언어 표현에 현혹되어 진정한 지능으로 오해해 왔다고 주장합니다. 미래는 다이나모 기술의 발전을 반영하는 더 작고 분산된 모델이 주류가 될 것으로 예상됩니다. 소형 언어 모델(SLM)은 인간 지능을 모방하려고 하기보다는 쿼리 재작성과 같은 더 작고 구체적인 언어 작업에 집중할 것입니다. 이를 통해 비용 절감, 효율 향상, 윤리적 우려 완화가 기대됩니다. 저자는 '지능형' 애플리케이션을 추구하기보다는 LLM을 교정이나 텍스트 요약과 같은 저수준 언어 처리 작업에 활용할 것을 제안합니다. 이것이 LLM의 진정한 발전 방향이라고 주장합니다.

AI
← Previous 1 3 4 5 6 7 8 9 40 41