Category: AI

Llama 4: 기대와 현실의 차이 - Meta의 논란이 된 LLM

2025-04-24

Meta가 출시한 Llama 4는 큰 기대와 함께 큰 논란을 불러일으켰습니다. 10M이라는 컨텍스트 길이를 자랑하지만, LM Arena와 같은 벤치마크 테스트에서는 기대에 미치지 못하는 결과를 보였고, 조작 의혹까지 제기되었습니다. 이론적으로 우수한 MoE 아키텍처를 채택했지만, 메모리 및 효율성 문제에 직면해 있습니다. 내부 고발에 따르면, Meta는 목표 달성을 위해 문제가 있는 방법을 사용했으며, 경영진의 사퇴로까지 이어졌습니다. Llama 4의 출시는 LLM 개발의 지속적인 과제를 보여주고, 벤치마크 기준과 투명성에 대한 중요한 의문을 제기합니다.

AI

FontDiffuser: 확산 모델 기반의 원샷 폰트 생성의 획기적인 발전

2025-04-24

FontDiffuser는 폰트 모방 작업을 노이즈 제거 패러다임으로 모델링한 새로운 확산 모델 기반의 원샷 폰트 생성 방법입니다. 복잡한 문자와 큰 스타일 변화에 대한 기존 방법의 한계를 해결하기 위해 FontDiffuser는 다중 스케일 콘텐츠 집계(MCA) 블록을 도입하여 다양한 스케일에서 전역 및 로컬 콘텐츠 큐를 효과적으로 결합하여 복잡한 문자의 복잡한 스트로크를 더 잘 보존합니다. 또한 스타일의 큰 변화를 더 잘 관리하기 위해 스타일 대조적 개선(SCR) 모듈, 즉 스타일 표현 학습을 위한 새로운 구조를 제안합니다. 이는 스타일 추출기를 사용하여 이미지에서 스타일을 분리하고, 신중하게 설계된 스타일 대조적 손실을 통해 확산 모델을 감독합니다. 광범위한 실험을 통해 FontDiffuser는 다양한 문자와 스타일 생성에서 최첨단 성능을 보여주며, 특히 복잡한 문자와 큰 스타일 변화에서 기존 방법을 일관되게 능가함을 보여줍니다.

LLM의 놀라운 CAD 모델 생성 능력

2025-04-23

최근 연구에 따르면 대규모 언어 모델(LLM)이 간단한 3D 기계 부품의 CAD 모델을 생성하는 놀라운 능력을 보여주고 있으며, 성능은 빠르게 향상되고 있습니다. 한 엔지니어는 LLM과 오픈소스 프로그래매틱 CAD 도구인 OpenSCAD를 결합하여 자연어 프롬프트를 사용하여 iPhone 케이스와 같은 모델을 성공적으로 생성했습니다. 이후 CadEval이라는 평가 프레임워크가 개발되어 다양한 LLM의 CAD 모델 생성 능력을 테스트한 결과, 추론 능력을 갖춘 모델이 추론 능력이 없는 모델보다 훨씬 우수한 성능을 보였습니다. 동시에 텍스트를 CAD로 생성하는 스타트업 기업들도 등장하고 있지만, 그 성능은 LLM과 OpenSCAD를 결합한 방법에 아직 미치지 못하고 있습니다. 앞으로 LLM 및 관련 기술의 발전에 따라 텍스트 기반 CAD 생성 기술은 기계공학 분야에서 널리 사용될 것으로 예상되며, CAD 설계의 자동화와 지능화가 실현될 것으로 기대됩니다.

MCP: AI의 미래를 누가 통제할 것인가?

2025-04-23
MCP: AI의 미래를 누가 통제할 것인가?

이 글은 모델 컨텍스트 프로토콜(MCP)의 잠재력과 한계를 심층적으로 다룹니다. MCP는 ChatGPT와 같은 대규모 언어 모델(LLM)과 외부 데이터 소스를 연결하는 표준화된 API로, LLM이 실시간 데이터에 액세스하고 작업을 수행할 수 있도록 합니다. 저자는 코드 학습용과 예측 시장에 연결되는 두 가지 실험적인 MCP 서버를 구축했습니다. 유망하지만 MCP는 현재 사용자 경험 저하와 심각한 보안 위험에 직면해 있습니다. 중요한 점은 ChatGPT와 같은 LLM 클라이언트가 새로운 관문 관리자가 되어 MCP의 설치, 사용, 가시성을 제어한다는 것입니다. 이는 Google의 검색 엔진과 앱 스토어에서의 지배력을 반영하여 AI 생태계를 재구성합니다. 미래에는 LLM 클라이언트가 어떤 MCP가 우선순위를 갖거나 허용될지 결정하여 MCP 패키지, 제휴 쇼핑 엔진, MCP 우선 콘텐츠 앱 등 새로운 비즈니스 모델로 이어질 것입니다.

AI

c/ua: AI 에이전트가 완전한 운영체제를 제어할 수 있는 경량 프레임워크

2025-04-23
c/ua: AI 에이전트가 완전한 운영체제를 제어할 수 있는 경량 프레임워크

c/ua(쿠아라고 발음)는 고성능의 경량 가상 컨테이너 내에서 AI 에이전트가 완전한 운영체제를 제어할 수 있도록 하는 경량 프레임워크입니다. Apple Silicon에서 최대 97%의 네이티브 속도를 달성하며, 모든 비전 언어 모델과 호환됩니다. 고성능 가상화(Lume CLI와 Apple의 Virtualization.Framework를 사용하여 Apple Silicon에서 macOS/Linux 가상 머신을 생성 및 실행)와 컴퓨터 사용 인터페이스 및 에이전트를 통합하여 AI 시스템이 가상 환경을 관찰하고 제어하며 웹 브라우징, 코드 작성, 복잡한 워크플로 실행을 가능하게 합니다. 보안, 격리, 고성능, 유연성, 재현성을 보장하며 다양한 LLM 제공업체를 지원합니다.

AI

MIT, 머신러닝 알고리즘 주기율표 생성, AI의 미래 예측

2025-04-23
MIT, 머신러닝 알고리즘 주기율표 생성, AI의 미래 예측

MIT 연구원들은 20개 이상의 고전적인 머신러닝 알고리즘을 연결하는 '머신러닝 주기율표'를 개발했습니다. 이 프레임워크는 서로 다른 방법의 전략을 결합하여 기존 AI를 개선하거나 새로운 AI를 만드는 방법을 보여줍니다. 연구원들은 두 가지 알고리즘의 요소를 결합하여 새로운 이미지 분류 알고리즘을 만들었으며, 최첨단 기법보다 8% 더 나은 성능을 보였습니다. 이 표의 기초: 모든 알고리즘은 데이터 포인트 간의 특정 관계를 학습합니다. 많은 알고리즘의 기반이 되는 통합 방정식이 있으며, 연구원들은 이를 통해 알고리즘을 분류할 수 있습니다. 화학 주기율표와 마찬가지로 아직 발견되지 않은 알고리즘을 예측하는 빈칸이 있으며, 기존 아이디어를 다시 발견하지 않고도 새로운 알고리즘을 설계하기 위한 도구 키트를 제공합니다.

AI

AI 친구: 외로움 해결책인가, 새로운 문제의 시작인가?

2025-04-23
AI 친구: 외로움 해결책인가, 새로운 문제의 시작인가?

하버드 경영대학원 연구에 따르면 AI 챗봇이 외로움을 완화하는 데 도움이 될 수 있다는 것이 시사됩니다. 하지만 이는 우려를 불러일으킵니다. 우리는 잠재적으로 더 심각한 문제를 만들어내면서 다른 문제를 해결하는 패턴을 반복하고 있는 것일까요? 패스트푸드가 기아 문제를 해결했지만 비만으로 이어진 것처럼, AI 친구는 편리한 동반자를 제공할 수 있지만, 진정한 인간 관계를 대체할 수 없으며 중독이나 사회 기술 저하로 이어질 수 있습니다. AI 챗봇에 과도하게 의존한 14세 소년의 자살 사례는 심각한 경고로 작용합니다. 우리는 사회적 고립의 근본 원인을 해결하고, 공동체 구축과 인간 관계에 투자해야 합니다. 기술에 의존하여 감정적 공허함을 채우는 것이 아니라 말입니다.

AI

Onyx: 오픈소스 GenAI 플랫폼에서 AI/ML 엔지니어 채용

2025-04-22
Onyx: 오픈소스 GenAI 플랫폼에서 AI/ML 엔지니어 채용

수십만 명의 사용자를 보유한 인기 오픈소스 GenAI 플랫폼인 Onyx에서 샌프란시스코에서 AI/ML 엔지니어를 채용하고 있습니다. 이 직무는 실제 AI/ML 애플리케이션 구축 경험 3년 이상, PyTorch/TensorFlow, NLP 모델 및 표준 ML 알고리즘에 대한 깊이 있는 지식, 최신 LLM, RAG 및 에이전트 프레임워크에 대한 숙지가 필요합니다. Onyx의 에이전트 및 지식 검색 기능 개선, 멀티 홉 QA 및 정확한 검색 강화, 플랫폼 사용자 경험 개선을 담당하게 됩니다. Onyx는 1000만 달러의 시드 펀딩을 유치했으며 Netflix 및 Ramp와 같은 고객을 보유하고 있습니다.

AI

π0.5: 새로운 집을 청소할 수 있는 범용 AI 모델

2025-04-22
π0.5: 새로운 집을 청소할 수 있는 범용 AI 모델

Physical Intelligence는 부엌이나 침실 정리와 같은 복잡한 청소 작업을 완전히 새로운 환경으로 일반화할 수 있는 로봇 기반 모델 π0.5를 개발했습니다. 제어된 환경에서만 작동하는 이전 로봇과 달리, π0.5는 다중 모드 데이터와 다양한 로봇의 데이터를 포함한 다양한 이종 데이터를 공동 학습하여 다양한 기술을 학습하고 그 의미론적 맥락을 이해합니다. 실험 결과, π0.5는 본 적 없는 집에서도 여러 작업을 수행할 수 있으며, 가끔 실패하지만 인간과 유사한 유연성과 기지를 보여줍니다. 이는 진정으로 일반화 가능한 물리적 지능을 향한 중요한 발걸음입니다.

회귀 분석에서 고차 다항식의 신화: 베르누이 기저를 이용한 우아한 해결책

2025-04-22
회귀 분석에서 고차 다항식의 신화: 베르누이 기저를 이용한 우아한 해결책

기계 학습에서 고차 다항식은 과적합되기 쉽고 제어하기 어렵다는 일반적인 통념에 대해 이 글에서는 이의를 제기합니다. 저자는 문제가 고차 다항식 자체가 아니라 표준 기저와 같은 부적절한 기저 함수의 사용에 있다고 주장합니다. 노이즈가 있는 데이터에 대한 적합성 측면에서 표준 기저, 체비셰프 기저, 르장드르 기저와 베르누이 기저를 비교한 실험 결과, 베르누이 기저는 계수가 동일한 '단위'를 가지고 쉽게 정규화될 수 있기 때문에 과적합을 효과적으로 방지하는 것으로 나타났습니다. 고차 다항식이라도 베르누이 기저를 사용하면 우수한 적합성을 얻을 수 있으며, 하이퍼파라미터 조정은 최소한으로 줄일 수 있습니다.

그래프 트랜스포머: 차세대 그래프 모델

2025-04-22
그래프 트랜스포머: 차세대 그래프 모델

그래프 데이터는 어디에나 존재하지만, 복잡하고 장거리에 걸친 관계를 활용하는 것은 기계 학습의 과제였습니다. 그래프 뉴럴 네트워크(GNN)는 지역적 패턴을 포착하는 데 뛰어나지만, 전역적 관계에는 어려움을 겪습니다. 여기서 등장한 것이 그래프 트랜스포머입니다. 강력한 자기 주의 메커니즘을 활용하여 각 노드는 그래프 내 어디든지 있는 정보에 직접 접근할 수 있으므로, 더 풍부한 관계와 미묘한 패턴을 포착할 수 있습니다. GNN과 비교하여 그래프 트랜스포머는 장거리 의존성 처리, 과도한 평활화 및 과도한 압축 완화, 그리고 이종 데이터의 더 효율적인 처리에서 이점을 제공합니다. 그래프 트랜스포머는 계산 복잡도가 높지만, 스파스한 어텐션 메커니즘 및 부분 그래프 샘플링과 같은 기술을 통해 대규모 그래프 데이터 세트를 효율적으로 처리할 수 있습니다.

RLVR, 추론 능력 향상? 실험 결과 예상 밖의 사실

2025-04-22

수학, 코딩, 시각적 추론 세 가지 대표적인 영역에서 실험을 수행하여 RLVR(인간 피드백 기반 강화 학습)이 기본 모델과 RLVR로 훈련된 대규모 언어 모델의 추론 능력 경계에 미치는 영향을 평가했습니다. 결과적으로 RLVR은 낮은 k 값에서는 정확도를 높였지만 높은 k 값에서는 문제의 포괄성을 낮췄습니다. 이는 RLVR이 결정론적 정확도를 높이는 동시에 탐색의 다양성을 제한한다는 것을 시사합니다. RL 초기 정확도 향상에도 불구하고 기본 모델은 더 넓은 추론 범위를 유지했습니다. 이는 RLVR이 추론 능력을 향상시키는 동시에 모델의 문제 해결 방식을 근본적으로 바꾸지는 않는다는 것을 시사합니다.

AI의 기하급수적 성장: AGI는 임박했는가?

2025-04-22
AI의 기하급수적 성장: AGI는 임박했는가?

METR의 연구에 따르면 AI의 능력은 기하급수적으로 성장하고 있으며, 최신 모델은 이전에 수 시간 또는 수일이 걸렸던 소프트웨어 엔지니어링 작업을 수개월 만에 수행할 수 있습니다. 이는 범용 인공 지능(AGI)의 임박한 도래를 시사합니다. 그러나 저자 Peter Wildeford는 METR의 연구가 특정 유형의 소프트웨어 엔지니어링 작업에만 초점을 맞추고 있으며, 실제 세계 작업의 복잡성과 인간 학습 능력의 영향을 무시하고 있다고 지적합니다. AI는 특정 분야에서는 뛰어나지만 여전히 많은 일상적인 작업에서 어려움을 겪고 있습니다. 그는 METR의 데이터와 다양한 불확실성 요소를 통합한 모델을 만들어 AGI가 2030년 1분기에 도착할 가능성이 있다고 예측하지만, 상당한 불확실성이 존재합니다.

Cekura: AI 음성 에이전트 테스트 자동화 혁명

2025-04-21
Cekura: AI 음성 에이전트 테스트 자동화 혁명

Y Combinator의 지원을 받는 스타트업 Cekura는 AI 음성 에이전트의 신뢰성을 재정의하고 있습니다. 인도 공과대학 봄베이 캠퍼스 출신으로 ETH 취리히에서 연구 경력을 쌓고 고위험 거래에서 성공적인 이력을 가진 Cekura 팀은 수동 음성 에이전트 테스트의 번거롭고 오류 발생률이 높은 특성을 해결하기 위해 설계되었습니다. Cekura는 음식 주문부터 면접 진행까지 수천 가지의 현실적인 실제 대화 시나리오를 시뮬레이션하여 AI 음성 에이전트의 테스트와 관찰 가능성을 자동화합니다. 이 플랫폼은 사용자 지정 및 AI 생성 데이터 세트, 상세한 워크플로우, 동적 페르소나 시뮬레이션을 활용하여 에지 케이스를 발견하고 실행 가능한 통찰력을 제공합니다. 실시간 모니터링, 포괄적인 로그, 즉각적인 경고는 모든 통화가 최적화되고 프로덕션 준비가 되도록 합니다. 수천 개의 음성 에이전트가 급속도로 확장되고 있는 시장에서 Cekura는 신뢰할 수 있는 성능을 보장하고 시장 출시 시간을 단축하며 비용이 많이 드는 생산 오류를 최소화하여 두각을 나타냅니다. Cekura는 팀이 배포 전에 신뢰성을 입증할 수 있도록 지원하여 고객 및 사용자와의 신뢰 관계 구축을 용이하게 합니다.

AI

AI 로봇: 동화와 현실의 경계에서

2025-04-21
AI 로봇: 동화와 현실의 경계에서

이 글은 애널리 뉴위츠의 이야기에 등장하는 허구의 AI 로봇 '로봇'과 현실 세계의 서투른 CIMON을 대비시켜 현재 AI의 한계를 탐구합니다. 프로그래밍을 뛰어넘어 자율적으로 학습할 수 있는 로봇은 범용 인공지능(AGI)의 가능성을 보여줍니다. 반대로 CIMON의 제한적인 협의 인공지능(ANI)은 그 경직성을 드러냅니다. 저자는 현재 AI 기술이 대부분 ANI 단계에 머물러 있으며 알고리즘 편향의 영향을 받기 쉽고 로봇처럼 복잡한 상황에 적응하지 못한다고 지적합니다. 기계 학습은 자연어 처리와 이미지 인식에서 발전을 이루었지만 AGI 수준에 도달하려면 아직 멀었습니다. 저자는 편향된 훈련 데이터에 대한 과도한 의존을 피하고 AI의 자기 학습과 피드백 메커니즘을 중시해야 한다고 주장합니다. 로봇을 목표로, CIMON을 예상하여 계획하십시오.

AI

Nari Labs, 16억 파라미터 텍스트 음성 변환 모델 'Dia' 공개

2025-04-21
Nari Labs, 16억 파라미터 텍스트 음성 변환 모델 'Dia' 공개

Nari Labs가 16억 파라미터의 텍스트 음성 변환 모델 'Dia'를 공개했습니다. 이 모델은 텍스트에서 매우 사실적인 대화를 직접 생성할 수 있으며, 음성으로 감정과 톤을 제어할 수도 있습니다. 웃음소리나 기침과 같은 비언어적 의사소통도 생성할 수 있습니다. 연구 가속화를 위해 사전 학습된 모델 체크포인트와 추론 코드가 Hugging Face에서 공개되었습니다. 데모 페이지에서는 Dia를 ElevenLabs Studio와 Sesame CSM-1B와 비교하고 있습니다. 약 10GB의 VRAM과 GPU가 필요하며(CPU 지원은 곧 추가될 예정), A4000 GPU에서는 초당 약 40토큰을 생성합니다. 메모리 효율을 높이기 위해 양자화 버전도 계획 중입니다. 이 프로젝트는 Apache License 2.0 라이선스를 따르며, 사칭, 오해의 소지가 있는 콘텐츠 생성, 불법 또는 악의적인 활동에 사용하는 것은 엄격히 금지됩니다.

AI

내부 루프 에이전트: LLM이 도구를 직접 호출

2025-04-21
내부 루프 에이전트: LLM이 도구를 직접 호출

기존 LLM은 도구 호출을 파싱하고 실행하기 위해 클라이언트가 필요했지만, 내부 루프 에이전트는 LLM이 도구를 직접 파싱하고 실행할 수 있도록 합니다. 이것은 패러다임 전환입니다. 이 글에서는 내부 루프 에이전트의 작동 방식을 설명하고, 다이어그램을 사용하여 기존 LLM과의 차이점을 보여줍니다. 장점은 LLM이 사고 과정과 동시에 도구를 호출할 수 있어 효율성이 향상된다는 것입니다. 내부 루프 에이전트 훈련에서 강화 학습의 역할과 다양한 도구 사용을 지원하는 모델 컨텍스트 프로토콜(MCP)의 중요성도 논의됩니다. 결론적으로, LLM은 현재 도구를 사용할 수 있지만, 도구를 최적으로 사용하려면 모델의 전문적인 훈련이 필요합니다.

AI 지원 검색 기반 연구: 마침내 유용해졌다!

2025-04-21
AI 지원 검색 기반 연구: 마침내 유용해졌다!

2년 반 동안 LLM이 자율적으로 검색 기반 연구를 수행한다는 꿈이 추구되어 왔습니다. 2023년 초, Perplexity와 Microsoft Bing이 시도했지만, 결과는 환각으로 인해 실망스러웠습니다. 그러나 2025년 상반기에 전환점이 찾아왔습니다. Gemini, OpenAI, Perplexity는 수많은 인용을 포함하는 장황한 보고서를 생성하는 "심층 연구" 기능을 출시했습니다. 속도는 느리지만 말입니다. OpenAI의 새로운 o3 및 o4-mini 모델은 획기적인데, 검색을 추론 과정에 매끄럽게 통합하여 실시간으로 신뢰할 수 있고 환각이 없는 답변을 제공합니다. 이는 강력한 추론 모델과 웹 스팸에 대한 내성 덕분입니다. Google Gemini와 Anthropic Claude도 검색 기능을 제공하지만, OpenAI의 제품에는 미치지 못합니다. 놀라운 예로, o4-mini가 코드 스니펫을 새로운 Google 라이브러리로 성공적으로 업그레이드한 것을 들 수 있으며, 이는 AI 지원 검색의 잠재력을 보여주는 동시에 웹 경제 모델의 미래와 잠재적인 법적 영향에 대한 우려를 제기합니다.

면역 사이토카인 IL-17: 뇌에서 양날의 검

2025-04-21
면역 사이토카인 IL-17: 뇌에서 양날의 검

MIT와 하버드 의과대학의 연구에 따르면 면역 사이토카인 IL-17이 뇌에 상반되는 영향을 미치는 것으로 나타났습니다. 편도체에서는 불안을 증가시키는 반면, 체감각 피질에서는 사회적 행동을 증진시킵니다. 이는 면역 체계와 신경 체계 사이의 강력한 상호 작용을 보여줍니다. 이 발견은 IL-17이 염증에 관여하기 전에 신경 조절 물질로 진화했을 가능성을 시사합니다. 이러한 발견은 면역 체계를 표적으로 하여 뇌 기능에 영향을 미침으로써 자폐증이나 우울증과 같은 신경 질환의 새로운 치료법으로 이어질 수 있습니다.

ChatGPT의 새로운 워터마크: 고양이와 쥐 게임?

2025-04-21
ChatGPT의 새로운 워터마크: 고양이와 쥐 게임?

Rumi 팀은 최신 GPT 모델(o3 및 o4-mini)이 생성된 긴 텍스트에 특수 문자 워터마크(주로 좁은 비분리 공백)를 삽입하고 있음을 발견했습니다. 이는 육안으로는 보이지 않지만 코드 편집기나 온라인 도구를 사용하면 감지할 수 있습니다. AI 생성 콘텐츠 감지를 위해 유용할 수 있지만 쉽게 제거할 수도 있습니다. 이는 학생들의 주목을 끌어 OpenAI가 기능을 제거할 가능성이 있습니다. Rumi는 쉽게 우회할 수 있는 기술적 해결책이 아닌, 학생들의 글쓰기에서 프로세스 중심 접근 방식과 AI 리터러시 강조를 주장합니다.

ChatGPT에 '제발'과 '고맙습니다'라고 말하는 것이 OpenAI에 수천만 달러의 비용을 초래

2025-04-20
ChatGPT에 '제발'과 '고맙습니다'라고 말하는 것이 OpenAI에 수천만 달러의 비용을 초래

OpenAI CEO 샘 알트만은 사용자의 예의 바름, 특히 ChatGPT에 '제발'과 '고맙습니다'라고 말하는 것이 회사에 수천만 달러의 전기 요금을 들인다는 것을 밝혔습니다. 알트만은 이것이 잘 투자된 돈이라고 주장하지만, 이 발표는 AI의 막대한 에너지 소비를 보여줍니다. 설문 조사에 따르면 사용자의 70%가 AI에 예의를 갖추는데, 일부는 로봇 반란을 우려하기 때문입니다. 하지만 논쟁은 계속됩니다. 예의 바름이 응답을 개선합니까? 그리고 그것은 환경 비용에 비해 가치가 있습니까? 정중한 프롬프트가 더 나은 결과를 얻고 편향을 줄이며 AI의 신뢰성을 향상시킨다고 주장하는 사람들도 있습니다.

AI

까마귀의 예상치 못한 기하학적 능력

2025-04-20
까마귀의 예상치 못한 기하학적 능력

튀빙겐 대학교 연구진은 까마귀가 기하학적 규칙성을 인식하는 능력을 가지고 있음을 증명했습니다. Science Advances에 발표된 연구에서 여러 유사한 모양 중에서 이상치 모양을 식별하도록 까마귀를 훈련했습니다. 까마귀는 모양 간의 미묘한 차이를 성공적으로 구별하고 직각, 평행선, 대칭에 대한 이해를 보여주었습니다. 이는 동물 인지에 대한 이전의 가정에 도전하는 것이며, 이러한 능력이 이전에 생각했던 것보다 훨씬 광범위하게 존재할 수 있음을 시사합니다.

논란을 일으킨 AI 스타트업, 모든 직업 자동화 목표

2025-04-20
논란을 일으킨 AI 스타트업, 모든 직업 자동화 목표

유명한 AI 연구원 Tamay Besiroglu가 설립한 실리콘밸리 스타트업 Mechanize는 모든 직업의 완전 자동화라는 야심찬 목표를 내세워 논란을 일으키고 있다. 이러한 목표와 Besiroglu가 권위 있는 AI 연구 기관 Epoch과의 연관성으로 인해 비판이 쏟아지고 있다. Mechanize는 필요한 데이터, 평가, 디지털 환경을 제공함으로써 모든 직업의 자동화를 목표로 하며, 막대한 잠재 시장을 창출하는 동시에 광범위한 실업 문제에 대한 우려를 불러일으키고 있다. Besiroglu는 자동화가 폭발적인 경제 성장과 생활 수준 향상으로 이어질 것이라고 주장하지만, 일자리가 없는 상황에서 소득을 어떻게 확보할 것인가에 대한 충분한 설명은 제공하지 못하고 있다. 극단적인 목표임에도 불구하고, 근본적인 기술적 과제는 현실적이며, 많은 대형 기술 기업들이 유사한 연구를 진행하고 있다.

재귀적 프롬프트: LLM을 사용한 재귀 구현

2025-04-20
재귀적 프롬프트: LLM을 사용한 재귀 구현

이 글에서는 대규모 언어 모델(LLM)을 사용한 재귀 구현에 대한 새로운 접근 방식을 탐구합니다. 내부 상태를 반복적으로 업데이트하는 재귀적 프롬프트를 만들어 LLM이 해결책으로 수렴하는 일련의 프롬프트를 생성할 수 있음을 보여주며, 코드에서 재귀 함수의 동작을 반영합니다. 피보나치 수열을 예로 들어 재귀적 프롬프트를 사용한 계산 방법을 보여주고, LLM 출력의 부정확성 및 LLM의 기존 지식 기반 활용, 인간이 암산을 수행할 때 기억된 대수적 및 원자적 규칙을 사용하는 방식과의 유사성에 대해 논의합니다. 이 연구는 ReAct 및 ACT-R과 같은 관련 연구와 관련이 있으며, LLM이 생성한 결과의 오류를 완화하기 위한 전략도 다룹니다.

AI

AGI가 도래했는가? 아니다, '들쭉날쭉 AGI'다!

2025-04-20
AGI가 도래했는가? 아니다, '들쭉날쭉 AGI'다!

OpenAI의 o3이나 Google의 Gemini 2.5 Pro와 같은 최신 AI 모델은 마케팅 캠페인, 웹사이트 구축과 같은 복잡한 작업까지 수행할 정도로 놀라운 발전을 이루었습니다. 경제학자 Tyler Cowen은 이것이 AGI의 도래를 의미한다고 시사합니다. 하지만 이 글에서는 이러한 AI들이 일부 영역에서는 뛰어나지만 간단한 작업에서는 실패하는 등 능력이 고르지 못한 '들쭉날쭉 AGI' 개념을 제시합니다. 이러한 불확실성으로 AGI의 정의와 실제 영향은 여전히 불분명하며, AGI의 적용과 사회 통합은 장기적이고 복잡한 과정이 될 수도 있고, 빠른 확산이 이루어질 가능성도 있다는 것을 시사합니다.

AI

Meta의 Llama와 EU AI 법안: 편리한 우연의 일치?

2025-04-20
Meta의 Llama와 EU AI 법안: 편리한 우연의 일치?

Meta가 Llama 모델을 "오픈소스"라고 부르는 것은 의문스럽다. 왜냐하면 해당 라이선스가 오픈소스 정의를 완전히 준수하지 않기 때문이다. 어떤 이론에서는 이것이 EU AI 법안이 오픈소스 모델에 특별한 규칙을 두어 OSI 준수를 피하기 때문이라고 주장한다. Gemini 2.5 Flash를 사용하여 법안을 분석한 결과, 저자는 사용자가 소프트웨어와 데이터를 실행, 복사, 배포, 연구, 수정, 개선할 수 있도록 허용하는 모델에 예외가 설정되어 있음을 발견했다. 이는 Meta가 전략적으로 "오픈소스"라는 라벨을 사용하고 있다는 이론을 뒷받침하지만, 이 관행이 EU AI 법안보다 오래되었다는 점에 유의해야 한다.

AI

FramePack: AI 비디오 생성을 위한 혁신적인 다음 프레임 예측 모델

2025-04-20

FramePack은 입력 컨텍스트를 고정 길이로 압축하여 생성 작업량을 비디오 길이와 독립적으로 만드는 혁신적인 다음 프레임 예측 신경망 아키텍처입니다. 이를 통해 스트리밍에서 O(1)의 계산 복잡도를 달성하여 AI 비디오 생성의 새로운 기준을 제시합니다. RTX 3060이 장착된 노트북에서 6GB의 GPU 메모리만 사용하여 고품질 비디오를 생성합니다. RTX 4090에서는 프레임당 1.5~2.5초의 생성 속도를 달성하지만, 3070ti/3060이 장착된 노트북에서는 4~8배 느립니다. 양방향 샘플링 방법을 통해 비디오 생성에서 일반적인 드리프트 문제를 효과적으로 해결합니다.

OpenAI의 30억 달러 Windsurf 인수: AI 경쟁에서의 절박함의 신호인가?

2025-04-20
OpenAI의 30억 달러 Windsurf 인수: AI 경쟁에서의 절박함의 신호인가?

OpenAI가 AI 코딩 어시스턴트인 Windsurf(구 Codeium)를 30억 달러에 인수한 것이 업계에 충격을 안겼습니다. 이는 Google의 Wiz 대규모 인수에 이은 것이지만, Windsurf의 상대적으로 작은 사용자 기반과 시장 점유율은 높은 인수 가격에 대한 의문을 제기합니다. 본 기사에서는 OpenAI의 이러한 결정 뒤에 숨겨진 잠재적 동기를 탐구하고, 데이터 확보, 유통 채널 강화, Microsoft와의 긴장된 관계 대처 등을 고려합니다. 또한 OpenAI, Google 및 기타 기업의 AI 분야 경쟁 상황을 비교 분석하여 Google이 모델 성능과 가격 경쟁력 면에서 우위를 점하고 있으며, 이러한 우위를 공고히 하기 위한 전략적 조치를 취하고 있음을 강조합니다. 마지막으로 Apple의 AI 분야 부진 원인을 분석하고, 컴퓨팅 자원과 데이터 확보의 부족, 그리고 사용자 개인정보 보호에 대한 고집으로 인한 제약을 지적합니다.

AI

Gemma 3: 최첨단 AI를 당신의 데스크탑으로

2025-04-20
Gemma 3: 최첨단 AI를 당신의 데스크탑으로

최첨단 오픈소스 AI 모델인 Gemma 3는 처음에는 하이엔드 GPU가 필요했습니다. 접근성을 높이기 위해, 양자화 인식 학습(QAT)으로 최적화된 새로운 버전이 출시되었습니다. QAT를 통해 메모리 요구 사항이 크게 줄어들면서 고품질이 유지됩니다. 이를 통해 NVIDIA RTX 3090과 같은 소비자용 GPU에서 Gemma 3 27B와 같은 강력한 모델을 실행할 수 있습니다. 이러한 최적화된 모델은 Hugging Face와 Kaggle에서 제공되며, 다양한 워크플로우에 쉽게 통합할 수 있습니다.

DeepSeek: 멈출 수 없는 오픈소스 AI의 물결

2025-04-20
DeepSeek: 멈출 수 없는 오픈소스 AI의 물결

DeepSeek 모델의 출시는 오픈소스 AI에 혁명을 일으켰습니다. 처음 중국 팀에 의해 출시된 후, 전 세계 개발자들에 의해 빠르게 복제 및 개선되어 베이징 인공지능 연구원의 OpenSeek 프로젝트 등이 탄생했습니다. 미국 정부의 관련 기관 제한 시도에도 불구하고, DeepSeek는 번영하는 커뮤니티로 발전했습니다. 수만 명의 개발자들이 협력하여 AI 기술 발전을 추진하고 있으며, 그 속도와 규모는 어떤 중앙 집권적 조직도 능가합니다. 이는 커뮤니티 주도의 오픈소스의 힘을 보여주는 것으로, 어떤 단일 국가, 기업, 정부도 통제할 수 없음을 증명합니다.

AI
1 2 21 22 23 25 27 28 29 40 41