Webtagr - 기술 뉴스 다이제스트

Sesame AI, 10억 매개변수 대화형 음성 모델 공개

2025-03-18

Sesame AI Labs는 Llama 아키텍처를 기반으로 하는 10억 매개변수의 대화형 음성 모델 CSM(Conversational Speech Model)을 발표했습니다. CSM은 텍스트 및 오디오 입력으로부터 RVQ 오디오 코드를 생성합니다. CSM의 체크포인트는 Hugging Face에서 공개되어 있으며, 인터랙티브한 음성 데모와 오디오 생성을 테스트하기 위한 Hugging Face 스페이스도 제공됩니다. 다양한 음성을 생성할 수 있지만, 특정 음성에 미세 조정되지 않았으며, 다국어 지원은 제한적입니다. Sesame AI는 연구 및 교육 목적으로만 사용할 것을 강조하며, 사칭, 허위 정보 유포, 불법 행위를 금지합니다.

(github.com)

AI 음성 생성

모델이 바로 제품이다: AI 투자의 다음 프런티어

2025-03-18

AI의 다음 물결에 대한 추측이 많다. 저자는 답이 명확하다고 주장한다. 모델 자체가 바로 제품이다. 범용 모델의 확장은 느려지고, 특화된 훈련은 기대를 뛰어넘고, 추론 비용은 하락하고 있다. 이로 인해 모델 제공업체는 가치 사슬을 상승해야 하며, 애플리케이션 계층은 자동화와 붕괴에 직면한다. OpenAI의 DeepResearch와 Anthropic의 Claude 3.7이 이를 보여준다. 단순한 LLM이나 챗봇이 아니라 특정 작업을 위해 설계된 모델이다. 이는 AI의 새로운 단계를 나타낸다. 모델 트레이너가 지배하고, 애플리케이션 개발자는 대체될 위험이 있다. 애플리케이션 계층에 대한 투자는 실패할 가능성이 있으며, 모델 훈련이 진정한 가치를 지닌다. AI의 미래 성공은 모델을 훈련할 수 있는 능력을 갖추고 다양한 전문 지식을 가진 팀과 강한 집중력을 가진 기업에 있다.

(vintagedata.org)

AI 투자 트렌드

Dust의 Query Tables: 구조화된 데이터 분석이 가능한 AI 에이전트

2025-03-18

Dust는 구조화된 데이터에 대한 SQL 쿼리를 가능하게 하는 강력한 AI 에이전트 툴인 Query Tables를 구축했습니다. 처음에는 CSV 파일을 지원했지만, Notion 데이터베이스, Google 스프레드시트, Office 365 스프레드시트로 발전했으며, 최종적으로는 Snowflake나 BigQuery와 같은 엔터프라이즈 데이터 웨어하우스 연결을 구현했습니다. 통합된 추상화 계층을 통해 사용자는 동일한 SQL 인터페이스를 사용하여 다양한 데이터 소스를 쿼리하고, 서로 다른 소스의 데이터를 결합하여 분석할 수도 있습니다. 향후 계획에는 Salesforce와의 통합을 통한 데이터 분석 기능의 추가 확장이 포함됩니다.

(blog.dust.tt)

AI 구조화된 데이터 SQL 쿼리

오픈소스 대규모 언어 모델 OLMo-2가 GPT-3.5를 능가한다? Mac에서도 간편하게 실행 가능!

2025-03-18

320억 매개변수를 가진 오픈소스 대규모 언어 모델 OLMo-2는 GPT-3.5-Turbo와 GPT-4 mini를 능가하는 성능을 자랑합니다. 데이터, 코드, 가중치, 세부 정보 모두 자유롭게 이용 가능합니다. 이 글에서는 llm-mlx 플러그인을 사용하여 Mac에서 간편하게 설치하고 실행하는 방법을 설명합니다. 몇 가지 명령어로 17GB 모델을 다운로드하고, 대화형 채팅이나 이미지 생성(예: 자전거를 타는 펠리컨 SVG 이미지)을 수행할 수 있습니다.

(simonwillison.net)

AI

양자 알고리즘 DQI: 최적화 문제의 돌파구?

2025-03-17

구글 양자 AI 팀은 광범위한 최적화 문제 해결에 있어 기존의 고전 알고리즘들을 모두 능가하는 새로운 양자 알고리즘인 DQI(Decoded Quantum Interferometry)를 개발했습니다. 이 알고리즘은 특정 문제를 위한 것이 아니라, 문제를 양자파로 변환하고 디코딩 기술을 적용하여 최적의 해결책을 찾는 방식입니다. 실험적 검증을 위한 충분한 양자 하드웨어가 부족하고, 향후 경쟁력 있는 고전 알고리즘이 등장할 가능성이 있지만, DQI는 최적화 문제에서의 잠재적 우위와 코딩 및 암호화 분야의 응용 가능성으로 인해 양자 컴퓨팅 커뮤니티에서 큰 주목을 받고 있습니다. 양자 알고리즘 분야의 중요한 돌파구로 여겨지고 있습니다.

(www.quantamagazine.org)

AI 양자 알고리즘 최적화 문제

구글의 Gemini 2.0 Flash: 강력한 AI 이미지 편집기이지만 저작권 문제를 야기하다

2025-03-17

구글의 새로운 AI 모델 Gemini 2.0 Flash는 강력한 이미지 편집 기능을 갖추고 있으며, Getty Images와 같은 유명한 스톡 이미지 제공업체의 이미지를 포함하여 이미지에서 워터마크를 손쉽게 제거할 수 있습니다. 이 기능은 허가 없이 워터마크를 제거하는 것이 미국 저작권법상 일반적으로 불법이기 때문에 저작권 문제를 야기하고 있습니다. 구글은 이 기능을 실험적인 것으로 분류하고 개발자에게만 제공하고 있지만, 강력한 워터마크 제거 기능과 사용 제한의 부족으로 인해 저작권 침해의 잠재적 도구가 되고 있습니다. Anthropic의 Claude 3.7 Sonnet이나 OpenAI의 GPT-4o와 같은 다른 AI 모델들은 워터마크 제거를 명시적으로 거부하며, 비윤리적이고 불법일 가능성이 있다고 간주하고 있습니다.

(techcrunch.com)

AI AI 이미지 편집

신경계 우선 AI 스타트업, 획기적인 뇌-컴퓨터 인터페이스 구축을 위한 엔지니어 모집

2025-03-17

Piramidal사는 신경 데이터에 초점을 맞춘 AI 시스템을 구축하여 이전에는 불가능했던 작업을 수행하기 위한 연구 엔지니어를 채용하고 있습니다. 이상적인 지원자는 대규모 분산 머신러닝 시스템의 설계, 구현 및 개선과 신경 과학에 대한 기본적인 이해를 포함한 강력한 엔지니어링 기술을 갖추고 있습니다. 회사는 경쟁력 있는 보상과 주식 보상을 제공하며, 기술을 통해 인간의 잠재력을 강화하고, 인지적 자유를 옹호하며, 마음의 상품화에 반대하는 사명감에 이끌리고 있습니다.

(www.ycombinator.com)

AI

구글 AI, 10년 묵은 슈퍼박테리아의 미스터리를 단 이틀 만에 해결

2025-03-17

구글의 새로운 AI 도구가 10년 동안 과학자들을 괴롭혀 온 미스터리를 단 이틀 만에 해결했습니다. 바로 슈퍼박테리아의 항생제 내성 메커니즘입니다. 임페리얼 칼리지 런던의 연구팀은 특정 슈퍼박테리아가 어떻게 내성을 획득하는지 10년간 연구해 왔지만, 구글의 '공동 연구자' AI 도구는 간단한 지시만으로 연구팀의 미발표 연구 결과와 동일한 결론에 단 48시간 만에 도달했습니다. 이는 AI가 증거를 통합하고, 연구 방향을 제시하고, 실험을 설계할 수 있는 잠재력을 보여주는 것으로, 과학 발전에 혁명을 일으킬 수 있습니다. 그러나 과학 연구에서 AI 사용에 대한 윤리적 문제와 신뢰성에 대한 우려도 제기하고 있습니다.

(www.livescience.com)

AI 슈퍼박테리아

Kastle 창립 멤버: 응용 AI 엔지니어 모집 - AI로 주택 담보 대출 서비스 혁신

2025-03-16

미국 주요 주택 담보 대출 제공업체에 서비스를 제공하는 AI 플랫폼인 Kastle에서 창립 멤버가 될 응용 AI 엔지니어를 모집하고 있습니다. Y Combinator 등 유력 투자자의 지원을 받는 Kastle은 주택 담보 대출 서비스를 재정의하고자 합니다. 이 역할에는 응용 AI 분야에서 3년 이상의 경험, Python 및 딥러닝 프레임워크에 대한 숙련도, 그리고 LLM의 파인튜닝 경험이 필요합니다. 책임에는 플랫폼에 대한 AI 통합, AI 워크플로 설계, 규정 준수(FDCPA, RESPA, TILA), 성능 및 확장성 최적화 등이 포함됩니다. 급성장하는 AI 스타트업의 기반을 구축할 수 있는 절호의 기회입니다.

(www.ycombinator.com)

AI

오픈 액세스 저장소에 대한 AI의 위협

2025-03-16

오픈 액세스 운동의 이상과 AI 모델 훈련의 현실이 충돌하고 있습니다. 기여자들은 자신의 작품이 영리 목적으로 사용되고 심지어 유해한 프로젝트에도 사용되고 있음을 발견하고, 지식 공유의 지속 가능성에 의문을 제기하고 있습니다. 이 글에서는 제한적인 라이선스를 넘어선 해결책을 모색하고, Wikimedia Enterprise나 Creative Commons의 선호 신호와 같은 공정한 협력 모델을 제시합니다. 단체 협상을 통해 AI 기업이 인프라 비용을 공정하게 보상하고, 저작자 표시를 하고, 공유지에 재투자함으로써 보편적인 지식 접근이라는 비전을 달성할 수 있습니다.

(www.citationneeded.news)

AI 오픈 액세스 공유지

MIT 학생들, 수백 줄의 코드로 최첨단 HPC 라이브러리 능가

2025-03-16

MIT CSAIL 연구원들은 컴파일러가 코드를 생성하는 방식을 명시적으로 제어하는 '스케줄'을 프로그래머가 작성할 수 있도록 하는 새로운 프로그래밍 언어 Exo 2를 개발했습니다. 기존의 사용자 스케줄 가능 언어(USL)와 달리 Exo 2는 컴파일러 외부에서 새로운 스케줄링 작업을 정의할 수 있으므로 재사용 가능한 스케줄링 라이브러리를 만들 수 있습니다. 이를 통해 엔지니어는 코드를 획기적으로 줄이면서 최첨단 HPC 라이브러리에 필적하거나 능가하는 성능을 달성하여 AI 및 머신러닝 애플리케이션의 효율성에 혁명을 일으킬 수 있습니다.

(news.mit.edu)

AI

AI 에이전트 해킹 위험 평가: 적대적 테스트가 취약성을 드러내다

2025-03-16

미국 AI 안전 연구소(US AISI)는 AgentDojo 프레임워크를 사용하여 Anthropic의 Claude 3.5 Sonnet 모델에 대한 AI 에이전트 해킹 위험을 평가했습니다. 주요 결과는 평가 프레임워크의 지속적인 개선, 진화하는 공격 방법에 대한 적응형 평가, 작업별 공격 성공률 분석의 중요성을 강조합니다. 본 연구에서는 원격 코드 실행, 데이터베이스 데이터 유출, 자동화된 피싱과 같은 새로운 공격 시나리오를 도입하여 다양한 환경에서의 효과를 보여주었습니다. 이 연구는 끊임없이 진화하는 AI 에이전트 해킹 위협에 대처하기 위해 AI 보안 평가 프레임워크를 반복적으로 개선해야 함을 강조합니다.

(www.nist.gov)

AI 에이전트 해킹

제인 스트리트의 퀀트: 수학 경시대회에서 AI 기반 트레이딩까지

2025-03-16

제인 스트리트의 양적 트레이더인 In Young Cho는 의대 진학을 목표로 했던 것에서부터 양적 트레이딩으로 이어진 비전통적인 경력 경로를 공유합니다. 그녀는 OCaml과 VBA와 같은 프로그래밍 언어를 트레이딩과 개발에 사용했던 것과 브로커와의 소통에 대한 유쾌한 일화를 포함하여 제인 스트리트에서의 인턴십과 업무 경험을 이야기합니다. 이 에피소드는 제인 스트리트의 트레이딩 연구를 심층적으로 파헤치며, 단순한 선형 모델에서 복잡한 심층 신경망에 이르기까지 빈번한 체제 변화의 영향을 받는 저데이터, 고노이즈 환경에서 머신러닝을 어떻게 활용하는지 설명합니다. In Young Cho는 탐색, 데이터 수집, 모델링, 프로덕션화라는 그녀의 연구 프로세스의 4단계를 자세히 설명하고, 유연한 연구 도구와 견고한 생산 시스템 간의 균형에 대해 논의합니다. 마지막으로, 그녀는 더 많은 자산 클래스와 데이터 모달리티로의 확장, 트레이더 효율성 향상을 위한 AI 활용 등 제인 스트리트의 머신러닝 연구의 미래 방향에 대한 전망을 제시합니다.

(signalsandthreads.com)

AI 양적 트레이딩 제인 스트리트

Parahelp: 인간 지원 에이전트를 대체할 AI 동료 구축

2025-03-15

Parahelp는 소프트웨어 회사를 위한 AI 기반 지원 에이전트를 구축하고 있습니다. Parahelp의 에이전트는 기존 인프라(Slack, Stripe 등)를 사용하여 지원 티켓을 처음부터 끝까지 해결하며, 인간 지원 에이전트를 완전히 대체하는 것을 목표로 합니다. Parahelp는 미래의 AI 동료에게 있어 지능이 아닌 맥락이 병목 현상이 될 것이라고 생각합니다. 2024년 8월에 출시된 Parahelp는 Y Combinator 등 저명한 투자자들의 지원을 받고 있으며, 이미 Perplexity, Framer 등 선도적인 기업들과 협력하고 있습니다.

(www.ycombinator.com)

AI

메이요 클리닉, 역 RAG 기술로 LLM 환각 문제 해결

2025-03-15

대규모 언어 모델(LLM)은 부정확한 정보를 생성하는 '환각' 문제를 겪는데, 이는 의료 분야에서 특히 위험합니다. 메이요 클리닉은 이 문제를 해결하기 위해 혁신적인 '역 RAG' 기술을 채택했습니다. 이 기술은 모델이 추출한 정보를 원본 데이터 소스에 연결하여 데이터 검색 기반 환각을 거의 모두 제거하고 임상 현장에 모델을 배포할 수 있게 했습니다. 이 기술은 CURE 알고리즘과 벡터 데이터베이스를 결합하여 모든 데이터 포인트의 원본 소스 추적 가능성을 보장합니다. 이를 통해 모델의 신뢰성과 신뢰도가 향상되고 의사의 업무 부담이 크게 줄어들며 개인 맞춤형 의료의 가능성이 확대됩니다.

(venturebeat.com)

AI 역 RAG

Optifye: YC 출신 AI 공장 최적화 스타트업, 창업팀 모집

2025-03-15

Optifye는 공장을 위한 AI 성능 모니터링 시스템으로, 컴퓨터 비전을 사용하여 실시간으로 생산 라인 비효율성을 감지합니다. 의류, 자동차, 의료, FMCG 산업의 주요 제조업체 3개 대륙에 시스템을 구축하여 고객 생산성을 12% 향상시켰습니다. YC W25 배치를 졸업하고 급성장 단계에 진입했으므로 창업팀 멤버 채용을 서두르고 있습니다. 향후 4개월 동안 100개의 생산 라인 구축을 목표로 하고 있습니다. GPU/CPU/메모리에 대한 심도있는 최적화 지식, 운영 환경에서의 CV 애플리케이션 확장 경험, 클라우드 상의 컨테이너화된 배포 설계, AWS 전문 지식이 필수입니다. 당신은 지금까지 들어간 어떤 방에서도 가장 똑똑한 사람이고, 다른 사람의 느림에 짜증을 내며, 다른 사람들이 회의를 하는 동안에도 운영 환경의 문제를 디버깅하는 사람일 것입니다. 매우 힘든 일이지만, 성공하면 주변 사람들보다 높은 수익을 얻을 수 있을 것입니다.

(www.ycombinator.com)

AI 공장 최적화

더글러스 호프스태터, GPT-4가 생성한 '내가 GEB를 쓴 이유'를 '가짜'라고 비난하며 LLM에 대한 우려 표명

2025-03-15

인공지능 분야의 선구자인 더글러스 호프스태터는 그의 대표작 '괴델, 에셔, 바흐'를 요약한 것으로 알려진 GPT-4가 생성한 텍스트 '내가 GEB를 쓴 이유'를 강력하게 비판했다. 그는 해당 텍스트가 일반적인 진부한 표현으로 가득 차 있으며, 그의 실제 글쓰기 방식과 책의 창작 과정을 심각하게 왜곡하고 있다고 주장한다. 호프스태터는 LLM의 독창성 부족과 허위 서사의 창조를 지적한다. 그는 GEB의 실제 창작 과정을 자세히 설명하며, 괴델의 불완전성 정리에 대한 초기 관심에서 에셔와 바흐의 작품 통합에 이르기까지 진정한 영감과 어려움을 밝힌다. 그는 LLM의 급증과 세계를 허위 정보로 넘쳐나게 할 가능성에 대해 심각한 우려를 표명하며, 고유한 위험에 대한 비판적인 평가를 촉구하고 있다.

(www.theatlantic.com)

AI

Siri AI 업그레이드 연기: 애플 내부의 어려움과 압박

2025-03-15

애플 Siri 팀의 내부 회의에서 작년 6월에 약속했던 Siri 인공지능 업그레이드가 무기한 연기되었다는 사실이 드러났습니다. 이 결정은 팀 내부에 불안감과 압박을 야기했으며, 애플이 AI 경쟁에서 뒤처져 있음을 보여주었습니다. 회의에서 연기는 내부 자원 재분배와 마케팅 부서와의 소통 부족으로 인한 과도한 홍보가 원인이라는 것이 밝혀졌습니다. 애플 경영진이 연기에 대한 책임을 졌지만, Siri의 미래는 기술적 문제와 사용자 기대 관리 등 여러 가지 과제에 직면해 있습니다.

(www.theverge.com)

AI

Gemini가 Google 어시스턴트를 대체하다: 생성형 AI 시대의 도래

2025-03-14

출시 1년이 넘은 후, Google은 Gemini AI 어시스턴트가 2025년 하반기에 Android 스마트폰의 Google 어시스턴트를 대체할 것이라고 발표했습니다. 이는 모바일 기기에서 생성형 AI의 대중화를 향한 중요한 발걸음입니다. 초기 버전의 Gemini는 기능이 제한적이었지만, Google은 지속적인 업데이트와 웨어러블, 자동차, 태블릿, 헤드폰 등으로의 확장을 통해 이러한 차이를 해소했습니다. Google은 수백만 명의 사용자가 이미 Gemini로 전환했다고 주장하며, 개인 맞춤형 기능, 세계 인식 기능, 생산성 향상 기능을 강조합니다. 이러한 교체는 기본적인 음성 어시스턴트에서 오늘날의 생성형 AI에 이르는 자연어 처리의 10년간의 발전을 보여주며, 급속한 기술 발전을 보여줍니다.

(9to5google.com)

AI Google 어시스턴트

오픈소스 멀티 에이전트 프레임워크 OWL, GAIA 벤치마크 1위 달성

2025-03-14

CAMEL-AI 프레임워크 기반의 최첨단 멀티 에이전트 협업 프레임워크인 OWL이 GAIA 벤치마크에서 평균 점수 58.18점으로 1위를 차지했습니다! 동적인 에이전트 상호 작용을 통해 다양한 분야에서 더욱 자연스럽고 효율적이며 강력한 작업 자동화를 가능하게 합니다. OWL은 오픈소스이며, 다양한 설치 방법과 모델(OpenAI, Qwen, DeepSeek 등)을 지원하며, 브라우저 자동화, 멀티모달 처리, 문서 분석 등 풍부한 툴킷을 제공합니다. 사용자 친화적인 웹 인터페이스도 제공됩니다. OWL 팀은 사용 사례에 대한 커뮤니티의 기여를 적극적으로 요청하고 있으며 프레임워크를 지속적으로 개선하고 있습니다.

(github.com)

AI 멀티 에이전트 협업

안데스 산맥에서 진화 심리학까지: 우연한 과학 여정

2025-03-14

저자가 어머니와 놀랍도록 닮은 페루 원주민 여성과 우연히 만난 것이 진화 심리학으로의 여정의 시작이었습니다. 이는 동아시아인과 아메리카 원주민의 유사점과 공통된 시베리아 기원에 대한 조사로 이어졌습니다. 학계의 이데올로기적 검열과 자금 조달 문제를 극복하고, 그는 독립적으로 연구를 수행하여 극한 기후가 인간 심리에 미치는 영향에 관한 논문을 발표했습니다. 그의 연구는 동아시아와 열대 지역 사회가 오랫동안 겪어 온 사회문화적 문제에 대한 해결책을 약속합니다.

(davidsun.substack.com)

AI 환경 적응

AI 에이전트: 과대 광고인가, 미래의 일자리인가?

2025-03-14

실리콘밸리는 AI 에이전트에 큰돈을 걸고 있지만, AI 에이전트가 정확히 무엇을 의미하는지에 대한 명확한 합의는 없습니다. OpenAI, Microsoft, Salesforce와 같은 회사는 AI 에이전트를 미래의 일자리로 보고 있지만, 기능과 구현 방식은 크게 다릅니다. 정의는 완전히 자율적인 시스템부터 미리 정의된 워크플로를 따르는 도구까지 다양하며, 업계 전문가조차 혼란스럽게 만듭니다. 이러한 모호성은 급속한 기술 발전과 마케팅 과장 광고에서 비롯되며, 혁신의 기회와 기대치 불일치 및 불확실한 ROI의 가능성을 모두 가져옵니다. 궁극적으로 AI 에이전트가 실제로 세상을 바꿀지는 업계가 통일된 정의를 확립할 수 있는지 여부에 달려 있습니다.

(techcrunch.com)

AI 기술적 정의

확률적 시계열 예측: 예측 분석의 패러다임 전환

2025-03-14

단일 값 예측과 작별하세요! 확률적 시계열 예측은 단일 값이 아닌 발생 가능한 결과와 그 확률을 포함하는 완전한 확률 분포를 제공하여 예측 분석에 혁신을 일으킵니다. 이를 통해 더욱 미묘하고 신뢰할 수 있는 의사 결정이 가능해집니다. 연구에 따르면 예측 정확도, 오류 감소, 특히 극단적인 이벤트 예측에서 상당한 개선이 나타납니다. 금융, 의료, 제조업 등 다양한 부문이 위험 평가, 자원 배분, 재고 관리 개선으로부터 이익을 얻고 있습니다. 이 포괄적인 가이드에서는 확률적 예측의 원리, 방법(베이즈 방법, 가우스 과정, 심층 확률 모델), 그리고 다양한 분야에서의 응용에 대해 자세히 설명합니다. 데이터 전처리, 모델 선택, 불확실성 보정 등 중요한 기술도 다룹니다.

(github.com)

AI 확률적 예측

2025-03-14

OpenAI는 7월에 발표될 예정인 도널드 트럼프의 AI 행동 계획이 AI 훈련을 공정 이용으로 선언하기를 기대하고 있다. 이를 통해 저작권 논쟁이 해결되고 AI 기업들이 훈련 데이터에 대한 무제한 접근 권한을 얻을 수 있을 것이라고 보고 있다. OpenAI는 이것이 중국과의 AI 경쟁에서 승리하는 데 필수적이라고 주장한다. 현재 법원에서는 AI 훈련이 공정 이용에 해당하는지 여부에 대한 논쟁이 진행 중이며, 권리 소유자들은 AI 모델이 시장에서의 지위를 위협하고 인간의 창의성을 전반적으로 저하시킨다고 주장하고 있다. OpenAI는 수십 건의 소송에 연루되어 있으며, AI가 저작권으로 보호되는 작품을 변형하고 AI 출력물이 원본 작품을 대체하는 것이 아니라고 주장하고 있다. OpenAI는 트럼프의 계획이 권리 소유자를 지지하는 판결(AI 훈련은 공정 이용이 아니라고 판단)과 같은 판결을 피할 수 있기를 기대하고 있다. OpenAI는 미국이 AI 산업의 '학습의 자유'를 우선시함으로써 중국이 미국 기업이 접근할 수 없는 저작권으로 보호되는 데이터에 접근하여 우위를 점하는 것을 방지해야 한다고 제안하고 있다.

(arstechnica.com)

AI

Google Gemini 2.0: 강력한 AI 기능이 무료로, 하지만 그 대가는?

2025-03-13

Google은 Gemini를 대중화하기 위해 Gemini 2.0에 대한 대대적인 업데이트를 제공했습니다. 향상된 심층 연구 및 검색 기록을 활용한 추론 모델 등 주요 기능 개선 사항이 무료로 제공됩니다. 이 향상된 모델은 100만 토큰의 컨텍스트 창, 파일 업로드, 고속 처리, 캘린더 및 사진과 같은 Google 앱과의 통합 기능을 갖추고 있습니다. Google은 사용자 제어 및 검색 기록 접근 해제 기능을 강조하지만, 개인 정보 보호에 대한 우려는 여전히 남아 있습니다.

(arstechnica.com)

AI

AI와 수학: 문화적 충돌과 협력 촉구

2025-03-13

2025년 합동 수학 회의에서는 AI와 수학의 교차점이 주목을 받았으며, 학계 수학자와 산업계 AI 연구자 간의 문화적 차이가 드러났습니다. 수학자들은 이해를 우선시하는 반면, AI 연구자들은 종종 결과에 중점을 둡니다. 이러한 차이는 개방성, 투명성, 그리고 증명의 본질 자체에 대한 상반된 접근 방식으로 나타납니다. 이 글에서는 수학의 본질, 문화 및 가치를 심층적으로 다루고, 문헌 관리, 정리 검증 등 분야에서 AI의 잠재적 응용 분야를 탐구합니다. 저자는 AI가 인간의 수학적 능력을 향상시키는 도구로 기능해야 하며, 인간 수학자를 대체해서는 안 된다고 주장하며, 분야 발전을 위해 상호 존중과 협력이 필요함을 강조합니다.

(sugaku.net)

AI

Anthropic CEO, 중국이 미국 AI 기업의 기밀 정보를 훔치고 있다고 경고

2025-03-13

Anthropic의 CEO인 다리오 아모데이는 중국 스파이들이 미국 최고 AI 기업들로부터 값비싼 "알고리즘 기밀"을 훔치고 있을 가능성이 있다고 경고하며 미국 정부의 개입을 촉구했습니다. 그는 중국의 산업 스파이 활동 역사와 단순해 보이는 코드 조각의 잠재적 가치(수억 달러에 달할 수 있음)를 강조했습니다. 아모데이는 미국 정부와 AI 기업 간의 협력 강화를 주장하며 주요 AI 연구소의 보안 강화와 미국 정보 기관 및 동맹국과의 협력 가능성을 시사했습니다. 이러한 우려는 아모데이가 이전에 표명한 중국의 권위주의적 및 군사적 목적을 위한 AI 사용에 대한 우려와 중국으로의 AI 칩 수출에 대한 더 엄격한 수출 규제 촉구와 일치합니다. 그의 입장은 AI 분야에서 미중 협력이 통제 불능의 AI 군비 경쟁을 방지하는 데 필요하다고 생각하는 일부 사람들로부터 비판을 받고 있습니다.

(techcrunch.com)

AI 중국 스파이 활동 알고리즘 절도

Google DeepMind, 정교한 로봇 제어를 위한 AI Gemini Robotics 공개

2025-03-12

Google DeepMind는 전례 없는 정교함과 정확도로 로봇을 제어하도록 설계된 두 가지 새로운 AI 모델인 Gemini Robotics와 Gemini Robotics-ER을 발표했습니다. Gemini 2.0 대규모 언어 모델을 기반으로 하는 이 모델들은 시각-언어-행동(VLA) 기능과 향상된 공간 추론 기능을 통합합니다. Gemini Robotics는 로봇이 "바나나를 집어서 바구니에 넣어라"와 같은 복잡한 명령을 이해하고 실행할 수 있도록 합니다. 반면 Gemini Robotics-ER은 기존 로봇 제어 시스템과의 원활한 통합에 중점을 둡니다. 이는 특히 복잡한 물리적 조작 처리 및 강력한 일반화 능력 시연 측면에서 로봇 공학의 큰 도약을 의미합니다. Google은 Gemini 2.0을 사용하여 차세대 휴머노이드 로봇을 구축하기 위해 Apptronik과 파트너십을 맺었으며, 광범위한 채택 가능성을 보여줍니다. 그러나 Google은 안전의 중요성도 강조하며, 연구자들이 로봇 행동의 안전성 영향을 평가하는 데 도움이 되는 "ASIMOV" 데이터 세트를 출시했습니다.

(arstechnica.com)

AI

Gemini 2.0 Flash: 구글의 네이티브 이미지 생성 모델, 개발자 실험 단계 진입

2025-03-12

구글이 향상된 추론 및 자연어 이해 기능을 갖춘 멀티모달 AI 모델인 Gemini 2.0 Flash를 출시했습니다. 텍스트로부터 이미지를 생성하고, 일러스트가 포함된 스토리를 만들며, 대화형 이미지 편집을 지원하고, 긴 텍스트 시퀀스도 선명하게 렌더링합니다. Google AI Studio 및 Gemini API를 통해 사용 가능하며, AI 에이전트 및 시각적으로 풍부한 애플리케이션 개발에 흥미로운 가능성을 제공합니다.

(developers.googleblog.com)

AI

Google DeepMind, Gemini Robotics 공개: 차세대 로봇의 힘

2025-03-12

Google DeepMind는 Gemini 2.0 기반의 두 가지 새로운 AI 모델인 Gemini Robotics와 Gemini Robotics-ER을 공개했습니다. 이를 통해 로봇은 더 넓은 범위의 실제 세계 작업을 수행할 수 있게 되었습니다. Gemini Robotics는 로봇을 직접 제어하는 고급 비전-언어-액션 모델입니다. Gemini Robotics-ER은 고급 공간 이해 기능을 갖추고 있어 로봇 전문가가 Gemini의 구현된 추론 기능을 사용하여 자체 프로그램을 실행할 수 있도록 합니다. 두 모델 모두 일반성, 상호 작용성, 숙련성을 갖추고 있으며 다양한 작업과 환경에 대처하고 인간과의 협업을 향상시킵니다. DeepMind는 구현된 AI 및 로봇 공학에서 의미적 안전성을 평가하고 개선하기 위한 새로운 데이터 세트 ASIMOV도 공개했으며, Apptronik과 같은 회사와 협력하여 차세대 휴머노이드 로봇을 개발하고 있습니다.

(deepmind.google)

AI AI 로봇 구현 AI

Category: AI

Sesame AI, 10억 매개변수 대화형 음성 모델 공개

모델이 바로 제품이다: AI 투자의 다음 프런티어

Dust의 Query Tables: 구조화된 데이터 분석이 가능한 AI 에이전트

오픈소스 대규모 언어 모델 OLMo-2가 GPT-3.5를 능가한다? Mac에서도 간편하게 실행 가능!

양자 알고리즘 DQI: 최적화 문제의 돌파구?

구글의 Gemini 2.0 Flash: 강력한 AI 이미지 편집기이지만 저작권 문제를 야기하다

신경계 우선 AI 스타트업, 획기적인 뇌-컴퓨터 인터페이스 구축을 위한 엔지니어 모집

구글 AI, 10년 묵은 슈퍼박테리아의 미스터리를 단 이틀 만에 해결

Kastle 창립 멤버: 응용 AI 엔지니어 모집 - AI로 주택 담보 대출 서비스 혁신

오픈 액세스 저장소에 대한 AI의 위협

MIT 학생들, 수백 줄의 코드로 최첨단 HPC 라이브러리 능가

AI 에이전트 해킹 위험 평가: 적대적 테스트가 취약성을 드러내다

제인 스트리트의 퀀트: 수학 경시대회에서 AI 기반 트레이딩까지

Parahelp: 인간 지원 에이전트를 대체할 AI 동료 구축

메이요 클리닉, 역 RAG 기술로 LLM 환각 문제 해결

Optifye: YC 출신 AI 공장 최적화 스타트업, 창업팀 모집

더글러스 호프스태터, GPT-4가 생성한 '내가 GEB를 쓴 이유'를 '가짜'라고 비난하며 LLM에 대한 우려 표명

Siri AI 업그레이드 연기: 애플 내부의 어려움과 압박

Gemini가 Google 어시스턴트를 대체하다: 생성형 AI 시대의 도래

오픈소스 멀티 에이전트 프레임워크 OWL, GAIA 벤치마크 1위 달성

안데스 산맥에서 진화 심리학까지: 우연한 과학 여정

AI 에이전트: 과대 광고인가, 미래의 일자리인가?

확률적 시계열 예측: 예측 분석의 패러다임 전환

OpenAI, 트럼프의 AI 행동 계획에 기대…저작권 논쟁 해결 기대

Google Gemini 2.0: 강력한 AI 기능이 무료로, 하지만 그 대가는?

AI와 수학: 문화적 충돌과 협력 촉구

Anthropic CEO, 중국이 미국 AI 기업의 기밀 정보를 훔치고 있다고 경고

Google DeepMind, 정교한 로봇 제어를 위한 AI Gemini Robotics 공개

Gemini 2.0 Flash: 구글의 네이티브 이미지 생성 모델, 개발자 실험 단계 진입

Google DeepMind, Gemini Robotics 공개: 차세대 로봇의 힘