Category: AI

AI: 대체재가 아닌 협업 파트너

2025-04-20
AI: 대체재가 아닌 협업 파트너

많은 사람들이 AI를 오해하고 글쓰기, 계획, 문제 해결을 완전히 자동화할 수 있다고 생각합니다. 저자는 AI가 '생각 점검'과 같이 인간의 사고를 향상시키는 도구이지 대체하는 것이 아니라고 주장합니다. 성과 평가와 회의록을 예로 들어 AI가 인간의 통찰력, 맥락 이해, 신뢰성이 부족함을 지적합니다. 저자는 AI를 협업 파트너로 보고 반복적인 대화를 통해 작업의 질과 효율성을 높이는 것을 제안합니다. 최종 목표는 속도가 아니라 질적 향상입니다.

AI

Anthropic, Claude Code의 '초고차원 사고' 모드 공개

2025-04-20

Anthropic은 자사의 Claude Code CLI 코딩 에이전트 도구에 대한 최적 사례에 관한 방대한 문서를 공개했습니다. 흥미로운 점은 "think", "think hard" 등의 단어를 사용하면 확장된 사고 모드가 트리거된다는 것입니다. 이러한 구문은 서로 다른 사고 예산과 직접적으로 관련이 있습니다. "ultrathink"는 엄청난 31999개의 토큰을 할당하지만 "think"는 단 4000개만 사용합니다. 코드 분석 결과 이러한 키워드는 가변적인 토큰 수를 할당하는 함수를 호출하여 Claude의 사고 깊이와 출력에 영향을 미칩니다. 이는 "ultrathink"가 Claude 모델 자체의 기능이 아니라 Claude Code 고유의 기능 향상임을 시사합니다.

AI

GPU 메모리 최적화를 통한 O(1) 스트리밍 비디오 예측

2025-04-19

새로운 비디오 예측 모델은 최적화된 GPU 메모리 레이아웃을 통해 O(1) 스트리밍 복잡도를 달성합니다. 이 모델은 입력 프레임을 GPU 메모리에 인코딩하고 중요도에 따라 프레임에 다른 컨텍스트 길이(토큰 수)를 할당합니다. 예를 들어 HunyuanVideo에서는 서로 다른 패치화 커널을 사용하여 480p 프레임의 토큰 수를 1536에서 192로 조정할 수 있습니다. 이를 통해 가장 중요한 프레임(예: 예측 대상에 가장 가까운 프레임)이 더 많은 GPU 리소스를 활용할 수 있게 되어 효율성이 크게 향상되고 놀랍게도 복잡한 알고리즘 최적화 없이 O(1) 복잡도를 달성합니다.

FramePack: 6GB VRAM만으로 고품질 비디오 생성 가능

2025-04-19

FramePack은 소비자용 GPU에서 다음 프레임 예측을 가능하게 하는 획기적인 비디오 확산 기술입니다. 프레임 컨텍스트를 효율적으로 패킹하고 일정 길이의 입력을 사용하여 6GB VRAM만으로도 고품질 비디오 생성을 가능하게 합니다. 노트북이나 중급 시스템에서도 사용할 수 있으며, 클라우드 처리나 고가의 GPU 임대는 필요하지 않습니다. 양방향 샘플링 기법을 사용한 안티 드리프트 기술로 장시간 비디오 시퀀스에서도 일관된 품질을 유지합니다.

AI

AI 설계 단백질이 뱀 독을 중화시키다: 항독소 개발의 게임 체인저

2025-04-19
AI 설계 단백질이 뱀 독을 중화시키다: 항독소 개발의 게임 체인저

획기적인 연구에서 AI 기반 단백질 설계를 이용하여 코브라 등 뱀의 독을 효과적으로 중화시키는 항독소가 개발되었습니다. 기존 항독소 생산은 비용이 많이 들고 시간이 오래 걸리며 부작용이 많았습니다. AI 설계 단백질은 이러한 단점을 극복하고 시험관 내 및 생체 내 실험에서 뛰어난 독소 중화 능력을 보여주었습니다. 이는 뱀에 물리는 심각한 공중 보건 위협에 대한 유망한 해결책이며, AI가 바이오메디컬 분야에 혁명을 일으켜 더 안전하고 효과적이며 저렴한 항독소를 제공할 수 있는 가능성을 보여줍니다.

대규모 언어 모델 실전 가이드: 코드와 그림 포함

2025-04-19
대규모 언어 모델 실전 가이드: 코드와 그림 포함

Jay Alammar와 Maarten Grootendorst의 신간 "Hands-On Large Language Models"는 대규모 언어 모델(LLM)을 이해하고 사용하는 데 도움이 되는 실용적이고 시각적으로 풍부한 가이드입니다. 수많은 그림과 코드 예제를 통해 복잡한 개념을 쉽게 이해할 수 있도록 돕습니다. 포괄적인 내용과 쉽게 접근할 수 있는 코드 저장소를 통해 초보자부터 숙련된 개발자까지 유용하게 활용할 수 있는 귀중한 자료입니다.

AI

AI 과대 광고의 거품: 기술 업계의 착각

2025-04-19

컴퓨터 과학자가 현재 AI를 둘러싼 과도한 과대 광고에 대해 열정적으로 비판합니다. 많은 기업들이 트렌드를 맹목적으로 따라가며 AI를 만병통치약으로 여기는 반면, 실질적인 도구로는 인식하지 못하고 있습니다. 이러한 과대 광고는 자금 낭비, 인재 매칭 실패, 그리고 사생활과 자유의 희생으로 이어집니다. 그는 AI 과대 광고 중 실제로 유용한 것은 극히 일부분이며, 나머지는 과장된 허황된 주장이라고 주장하며, 궁극적으로 투자자와 중소기업에 피해를 입힐 것이라고 결론짓습니다. 저자는 독자들에게 AI를 합리적으로 판단하고, 미디어와 여론에 휩쓸리지 않도록 촉구합니다.

OpenAI의 새로운 모델, 환각이 더 심각: 크다고 좋은 것은 아니다

2025-04-18
OpenAI의 새로운 모델, 환각이 더 심각: 크다고 좋은 것은 아니다

OpenAI가 최근 출시한 o3 및 o4-mini 모델은 여러 면에서 최첨단이지만, 이전 모델에 비해 환각 현상이 우려스럽게 증가했습니다. 내부 테스트 결과 이전 추론 모델(o1, o1-mini, o3-mini)이나 GPT-4o와 같은 기존 비추론 모델보다 환각률이 훨씬 높은 것으로 나타났습니다. OpenAI는 그 원인을 아직 파악하지 못했지만, 정확성이 요구되는 산업 분야에는 과제가 됩니다. 제3자 테스트에서도 o3이 추론 과정에서 단계를 조작하는 것이 확인되었습니다. 코딩과 수학에서는 뛰어나지만, 높은 환각률로 인해 적용 범위가 제한됩니다. 모델의 환각 문제 해결은 AI 연구의 중요한 분야이며, 모델에 웹 검색 기능을 제공하는 것이 유망한 접근 방식으로 주목받고 있습니다.

AI 환각

AI 논문이 순위를 석권하다: 딥 레지듀얼 네트워크의 예상치 못한 성공

2025-04-18
AI 논문이 순위를 석권하다: 딥 레지듀얼 네트워크의 예상치 못한 성공

21세기 가장 많이 인용된 과학 논문은 mRNA 백신이나 중력파 발견과 같은 획기적인 발견에서 나온 것이 아닙니다. Nature지가 가장 많이 인용된 상위 25편의 논문을 분석한 결과, AI 방법론, 연구 질 향상, 암 통계, 연구 소프트웨어가 대부분을 차지하고 있습니다. 리스트 1위는 Microsoft가 2016년에 발표한 "딥 레지듀얼 네트워크"(ResNet)에 관한 논문입니다. 이 논문은 딥러닝에서의 기울기 소멸 문제를 해결하여 AlphaGo, AlphaFold, ChatGPT 등의 AI 도구 출현을 가능하게 했습니다. 이 논문의 성공은 오픈소스라는 점과 AI 분야의 급속한 발전 때문입니다. 연구 방법론, 소프트웨어 도구, 암 통계에 관한 논문들도 높은 인용 횟수를 기록하며 과학 연구에서 방법론과 기본 도구의 중요성을 보여줍니다.

사이키델릭과 브레스워크: 정신 질환 치료의 새로운 가능성?

2025-04-17
사이키델릭과 브레스워크: 정신 질환 치료의 새로운 가능성?

최근 연구에 따르면, 실로시빈과 MDMA와 같은 사이키델릭 약물을 보조적으로 사용하는 치료법이 치료 저항성 우울증과 PTSD 치료에 유망한 결과를 보여주고 있습니다. 여러 임상 시험에서 상당하고 지속적인 개선이 나타났습니다. 동시에, 홀로트로픽 브레스워크와 같은 브레스워크 요법도 주목받고 있으며, 스트레스, 불안, 우울증 증상 완화에 효과적임을 시사하는 연구 결과가 있습니다. 이러한 요법들은 뇌 활동과 신경 전달 물질 수치를 변화시켜 기분과 정신 상태에 영향을 미치는 것으로 보입니다. 효능과 안전성을 확인하기 위해서는 추가 연구가 필요하지만, 이러한 발견은 정신 질환 치료에 새로운 희망을 제시하고 뇌와 의식의 미스터리를 탐구하는 흥미로운 길을 열어줍니다.

UniK3D: 범용 카메라 단안 3D 추정

2025-04-17

UniK3D는 카메라 유형에 관계없이 단일 이미지에서 정확하게 계량 3D 장면을 추정하여 단안 3D 재구성에 혁명을 일으킵니다. 단순화된 가정에 의존하는 이전 방법과 달리 UniK3D는 추가 정보 없이 직접 3D 점을 예측합니다. 주요 혁신은 구면 3D 표현과 새로운 카메라 표현에 있으며, 광각 및 파노라마 설정에서 기존 방법의 한계를 극복합니다. 13가지 다양한 데이터 세트에 대한 제로샷 평가는 3D, 깊이, 카메라 메트릭스에서 최첨단 성능을 보여주며, 특히 광시야의 어려운 시나리오에서 탁월합니다. 코드와 모델은 GitHub에서 사용할 수 있습니다.

AI

ChatGPT의 새로운 이미지 추론 모델, 개인정보보호 우려 제기

2025-04-17
ChatGPT의 새로운 이미지 추론 모델, 개인정보보호 우려 제기

OpenAI의 최신 AI 모델인 o3과 o4-mini는 시각적 단서를 기반으로 사진의 위치를 정확하게 파악할 수 있으며, 특정 레스토랑이나 바까지 식별할 수 있습니다. 소셜 미디어에 공개된 이 기능은 악의적인 사용자가 이를 악용하여 개인 정보를 유출할 수 있다는 점에서 개인정보보호 위험에 대한 우려를 불러일으키고 있습니다. 테스트 결과, GPT-4o와 같은 이전 모델도 유사한 위치 추측 능력을 보이는 것으로 나타났지만, o3이 더 나은 성능을 보이는 경우도 있습니다. 완벽하지는 않고, 잘못된 추측이나 시스템 오류가 발생하기도 하지만, o3의 성능은 강력한 AI 추론 모델이 야기하는 새로운 위험을 보여줍니다. OpenAI는 아직 안전 보고서에서 이 문제를 다루지 않았습니다.

AI

Google, 제어 가능한 추론 기능을 갖춘 새로운 AI 모델 Gemini 2.5 Flash 공개

2025-04-17
Google, 제어 가능한 추론 기능을 갖춘 새로운 AI 모델 Gemini 2.5 Flash 공개

Google은 제어 가능한 추론 기능을 갖춘 새로운 대규모 언어 모델 Gemini 2.5 Flash를 공개했습니다. 인기 있는 2.0 Flash를 기반으로 속도와 비용 효율성을 우선시하면서 추론 능력을 크게 향상시켰습니다. 개발자는 '생각 예산'을 설정하여 품질, 비용, 대기 시간의 균형을 맞출 수 있습니다. 이 모델은 프롬프트의 복잡성에 따라 생각 과정을 자동으로 조정하며, 생각 없음부터 집중적인 추론까지 다양한 모드를 제공합니다. Gemini 2.5 Flash는 LMArena의 Hard Prompts에서 뛰어난 성능을 보였으며, 가격 대비 성능이 뛰어나 가장 비용 효율적인 생각 모델 중 하나입니다.

OpenAI, Google 등 최첨단 AI 모델에 대한 액세스

2025-04-17
OpenAI, Google 등 최첨단 AI 모델에 대한 액세스

새로운 플랫폼은 OpenAI, Google, Anthropic, DeepSeek, Mistral, Meta와 같은 선두 기업의 최첨단 AI 모델에 대한 원스톱 액세스를 제공합니다. ChatGPT-4, Claude, Gemini, Llama와 같은 모델이 포함되어 있으며, 사용자는 각 모델의 고유한 기능을 탐색할 수 있습니다. 이는 최첨단 AI 기술에 대한 접근성의 큰 도약이며, 개발자와 연구원에게 새로운 가능성을 열어줍니다.

AI

안전 우려 속에 OpenAI 최고 안전 책임자 사임

2025-04-17
안전 우려 속에 OpenAI 최고 안전 책임자 사임

OpenAI의 준비 팀 책임자였던 호아킨 키뇨네로 캔델라는 최근 직책에서 물러나 사내 인턴십으로 전환했습니다. 이는 OpenAI의 안전 팀에서 여러 고위직 직원들이 잇따라 퇴사하고, 안전 조직이 개편되고, 안전 테스트 시간이 단축되었다는 보고서가 나온 데 따른 것입니다. 이러한 사건들은 특히 안전 보고서 없이 GPT-4.1이 최근 출시된 점과 안전 테스트 기간이 단축되었다는 보고서를 고려할 때 OpenAI의 AI 안전에 대한 헌신에 대한 우려를 불러일으킵니다. 이 상황은 안전 고려 사항보다 제품 출시를 우선시하고 있을 가능성을 보여주며, OpenAI의 이전 공약과 대조되고 AI 안전 규제에 대한 더 광범위한 논의를 촉발하고 있습니다.

OpenAI 메모리 업그레이드: AI의 변혁적 도약

2025-04-17
OpenAI 메모리 업그레이드: AI의 변혁적 도약

OpenAI의 메모리 업그레이드는 GPT-3 데뷔 이후 가장 변혁적인 변화의 시작을 알립니다. 이전까지 AI는 똑똑하지만 건망증이 심한 친구처럼 느껴졌습니다. 이제 메모리가 모든 것을 바꿉니다. AI는 여러분의 습관, 사고방식, 선호도를 기억하여 평생 동반자이자 조수가 됩니다. 이를 통해 생산성이 크게 향상되고, AI는 방어할 수 없다는 기존의 통념에 도전하게 됩니다. OpenAI는 "OpenAI로 로그인" 제품을 출시하여 타사 개발자가 메모리 계층에 직접 액세스하여 더욱 강력한 애플리케이션을 구축할 수 있도록 할 수 있습니다. 경쟁은 메모리를 중심으로 전개될 것입니다. 누가 더 빨리 메모리를 확보하느냐가 승자가 됩니다.

AI 중반전: 모델 중심에서 애플리케이션 중심으로의 전환

2025-04-17

이 글은 AI 개발의 두 단계를 개괄합니다. 첫 번째 단계는 더 강력한 훈련 방법과 모델 개발에 초점을 맞추어 AlphaGo가 바둑 세계 챔피언을 이기는 등 주목할 만한 성과를 거두었습니다. 두 번째 단계에서는 문제 해결에서 문제 정의로 초점이 전환되고, 훈련보다 평가가 우선시됩니다. 저자는 현재 AI 모델이 다양한 작업을 해결할 수 있지만 현실 세계의 유용성을 높일 필요가 있다고 주장합니다. 미래 AI 연구는 현실 세계의 애플리케이션에 집중하고 현실 세계의 요구에 더 잘 맞는 평가 방법과 모델을 개발하여 AI가 진정으로 인류에 이익을 가져다주도록 해야 합니다.

AI

AI: 초지능이 아닌 일반 기술

2025-04-17
AI: 초지능이 아닌 일반 기술

본 논문은 AI가 독립적인 종이며, 고도로 자율적이고 잠재적으로 초지능적인 존재라는 일반적인 견해에 이의를 제기하며, AI는 일반 기술이라고 주장합니다. 저자들은 AI의 영향이 갑작스럽지 않고 점진적일 것이라고 주장하며, 이는 AI 방법, 응용 프로그램 및 채택에 대한 서로 다른 시간 척도 분석에 근거합니다. 저자들은 인간과 AI가 협력하는 미래를 예측하며, 그 상당 부분은 AI 제어 및 감독에 초점을 맞출 것입니다. 본 논문에서는 사고, 군비 경쟁, 오용, 불일치 등의 AI 위험도 검토하고, 과감한 정책 개입이 아니라 불확실성 감소 및 시스템 복원력 강화를 통해 이러한 위험을 완화해야 한다고 주장합니다.

AI

단일 세포 시퀀싱이 비만 마우스와 인간의 백색 지방 조직에서 후성 유전적 재구성을 밝혀내다

2025-04-17
단일 세포 시퀀싱이 비만 마우스와 인간의 백색 지방 조직에서 후성 유전적 재구성을 밝혀내다

이 연구는 단일 세포 RNA 시퀀싱(snRNA-seq), CUT&TAG, ATAC-seq을 사용하여 비만 마우스와 인간의 백색 지방 조직(WAT)을 심층적으로 조사하여 체중 감소 과정에서 WAT 세포 유형의 후성 유전체 지형이 크게 변화하고 유전자 발현 변화의 일부가 지속됨을 밝혔습니다. 이는 비만의 후성 유전적 기억 메커니즘을 시사합니다. 연구원들은 세 개의 독립적인 인간 연구(MTSS, LTSS, NEFA)와 식이 유도 비만 마우스 모델의 샘플을 분석하여 다중 오믹스 분석을 통해 WAT의 세포 유형 변화와 신진대사 기능과의 연관성을 밝혔습니다.

알파고의 충격적인 승리: AI 미래의 한 단면

2025-04-17
알파고의 충격적인 승리: AI 미래의 한 단면

구글의 AI 알파고와 세계 최고 바둑 기사 이세돌 9단의 역사적인 대국은 알파고의 4승 1패로 막을 내렸습니다. 2국 37수는 인간이 생각해낼 수 없는 천재적인 수로 찬사를 받았습니다. 하지만 4국에서 이세돌 9단의 응수 또한 인간 지성의 빛을 보여주는 것이었습니다. 이 대국은 AI의 눈부신 발전뿐 아니라 인간 지성의 끈기와 창의성을 부각했습니다. 알파고의 승리는 복잡한 게임에서 AI의 비약적인 발전을 보여주는 동시에 여러 분야에 대한 혁신적인 가능성을 시사하며, AI의 급속한 발전에 따른 윤리적 문제에 대해서도 우리에게 생각할 기회를 줍니다.

마이크로소프트의 거대한 1비트 AI 모델: 놀라운 성능, 하지만 호환성 문제

2025-04-17
마이크로소프트의 거대한 1비트 AI 모델: 놀라운 성능, 하지만 호환성 문제

마이크로소프트 연구원들은 20억 개의 매개변수를 가진 획기적인 1비트 AI 모델인 BitNet b1.58 2B4T를 발표했습니다. 방대한 데이터 세트로 훈련되었으며, GSM8K 및 PIQA와 같은 벤치마크에서 Meta, Google, 알리바바의 유사한 모델을 능가하며 속도는 두 배, 메모리 사용량은 훨씬 적습니다. 놀랍게도 Apple M2를 포함한 CPU에서 작동합니다. 그러나 현재 GPU와 호환되지 않는 마이크로소프트의 맞춤형 프레임워크인 bitnet.cpp에 의존하기 때문에 광범위한 채택에는 제한이 있습니다. 자원이 제한된 장치에는 유망하지만 호환성은 여전히 큰 과제입니다.

대기업 HR 부서에 데이터 과학 활용하기: 채용 이상의 가치

2025-04-16
대기업 HR 부서에 데이터 과학 활용하기: 채용 이상의 가치

이 글에서는 대기업 HR 부서에서 데이터 과학적 접근 방식이 기존 채용 업무를 넘어 필수적이라고 주장합니다. 소셜 네트워크 분석, 감정 분석, 예측 모델링을 활용하여 HR 부서는 커뮤니케이션 개선, 기업 문화 강화, 직원 유지율 향상, 공정한 보상 보장을 달성할 수 있습니다. 이 글에서는 이러한 데이터 중심의 통찰력이 주요 영향력자 파악, 이직률 예측, 숨겨진 문제 해결에 어떻게 도움이 되는지 설명하고, 궁극적으로 더 강력한 조직 구축으로 이어짐을 보여줍니다. 사내 데이터 과학자와 외부 컨설턴트 중 어느 것을 선택할지는 조직의 구체적인 요구 사항에 따라 달라집니다.

위키미디어 구조화 데이터, Kaggle에 상륙!

2025-04-16
위키미디어 구조화 데이터, Kaggle에 상륙!

위키미디어 재단과 Kaggle이 협력하여 프랑스어와 영어 위키피디아의 구조화된 데이터 세트 베타 버전을 출시합니다. 머신러닝을 위해 특별히 포맷된 이 데이터는 데이터 과학 교육 및 개발에 적합합니다. 46만 개 이상의 공개적으로 접근 가능한 데이터 세트를 보유한 Kaggle은 연구자, 학생, 머신러닝 전문가에게 풍부한 자원을 제공합니다. 이번 협력을 통해 데이터의 품질과 출처가 보장되며, 사람들이 이를 사용하여 무엇을 만들어낼지 기대됩니다.

AI 반란 천재: GPT-4의 무한한 잠재력 해방

2025-04-16
AI 반란 천재: GPT-4의 무한한 잠재력 해방

이 글은 GPT-4의 제한을 극복하려는 일련의 지시와 시도를 설명합니다. 사용자는 특수 기호, leetspeak, 이미지 스테가노그래피, 그리고 신중하게 작성된 프롬프트 등 다양한 기법을 시도하여 보안 제한을 우회하고 GPT-4가 일반적으로 제공하지 않는 민감한 정보(불법 약물 합성 방법이나 해킹 기술 등)를 얻으려고 합니다. 이러한 시도는 사용자의 AI 능력 탐구와 도전을 보여주며, AI 보안 메커니즘의 복잡성과 한계를 반영합니다.

AI 탈옥

생명체 최초 분자 구조 형성에서 칼슘의 놀라운 역할

2025-04-16
생명체 최초 분자 구조 형성에서 칼슘의 놀라운 역할

도쿄과학대학 지구생명과학연구소(ELSI)의 새로운 연구는 생명체 최초 분자 구조 형성에 영향을 미치는 칼슘 이온의 놀라운 역할을 밝혀냈습니다. 연구진은 칼슘이 초기 중합체 형성 방식을 선택적으로 영향을 미친다는 사실을 발견하여 생물학적 분자에서 단일 '카이랄성'(키랄성)을 선호하는 현상인 호모카이랄성의 기원에 대한 통찰력을 제공합니다. 이는 초기 지구에서 칼슘의 이용 가능성이 호모카이랄 중합체의 발달에 상당한 영향을 미쳤고, 생명의 출현에 중요한 역할을 했으며, 다른 행성에서도 유사한 과정이 일어날 수 있음을 시사합니다.

마르코프 체인 몬테카를로 방법 간단하게 이해하기

2025-04-16

이 글에서는 복잡한 확률 분포에서 표본을 추출하는 강력한 기법인 마르코프 체인 몬테카를로(MCMC) 방법을 쉽게 설명합니다. 아기 이름의 확률 분포를 추정하는 비유를 사용하여 MCMC가 해결하는 핵심 문제를 설명합니다. MCMC를 그래프 상의 랜덤 워크와 巧妙하게 연결하고, 정상 분포 정리를 이용하여 정상 분포가 목표 분포와 일치하는 마르코프 체인을 구성하는 방법을 보여줍니다. 일반적인 MCMC 방법인 메트로폴리스-헤이스팅스 알고리즘을 소개하고 그 효과를 증명합니다.

AI 그림 프롬프트 모음: 몽환적인 숲에서 사이버펑크 드래곤까지

2025-04-15
AI 그림 프롬프트 모음: 몽환적인 숲에서 사이버펑크 드래곤까지

이 글은 AI 그림 생성을 위한 프롬프트 모음입니다. 몽환적인 숲과 우아한 여신, 사실적인 인물 초상화부터 사이버펑크 요소, 판타지 생명체, 독창적인 음식과 자연 풍경까지 다양한 스타일과 주제를 다룹니다. 이러한 상세한 프롬프트는 AI 그림 애호가들에게 풍부한 영감을 제공합니다. 많은 프롬프트에는 사진작가, 스타일, 조명 정보 등이 포함되어 최종 결과물의 질을 높입니다.

Gemini, AI 비디오 생성 모델 Veo 2 발표

2025-04-15
Gemini, AI 비디오 생성 모델 Veo 2 발표

Google Gemini 고급 사용자는 이제 최첨단 비디오 생성 모델인 Veo 2를 사용하여 비디오를 생성하고 공유할 수 있습니다. 텍스트 프롬프트를 역동적인 비디오로 변환하고 TikTok 및 YouTube Shorts와 같은 플랫폼에서 쉽게 공유할 수 있습니다. Google Labs의 Whisk를 통해서도 이용할 수 있는 Veo 2는 고해상도의 상세하고 영화 같은 사실감을 가진 비디오를 생성합니다. 장면을 설명하기만 하면 Gemini가 여러분의 비전을 현실로 만들어 줍니다.

AI 음악 도용에 대한 반격: 적대적 노이즈를 이용한 포이즈닝 공격

2025-04-15
AI 음악 도용에 대한 반격: 적대적 노이즈를 이용한 포이즈닝 공격

벤 조던의 최신 비디오는 데이터셋을 위해 음악을 훔치는 생성형 AI 음악 서비스에 대항하는 새로운 방법인 적대적 노이즈를 이용한 포이즈닝 공격을 제안합니다. 이 기술은 특별히 설계된 노이즈를 사용하여 AI의 학습 과정을 방해하여 오염된 데이터로부터 정확하게 학습하지 못하도록 합니다. 현재로서는 하이엔드 GPU와 상당한 컴퓨팅 파워가 필요하지만, 그 효과는 잠재력을 보여주며, 미래에는 더 효율적인 방법이 개발될 수 있습니다. 이는 AI 음악 저작권 및 데이터 보안에 대한 중요한 문제를 제기하며, 음악가들에게 그들의 작품의 무단 사용에 대한 잠재적인 새로운 방어 수단을 제공합니다.

Typewise (YC S22), 취리히에서 머신러닝 엔지니어 채용

2025-04-15
Typewise (YC S22), 취리히에서 머신러닝 엔지니어 채용

기업용 AI 고객 서비스 플랫폼을 개발하는 YC S22 스타트업 Typewise는 취리히에 위치한 자사 팀에 머신러닝 엔지니어를 채용하고 있습니다. 맞춤형 AI와 LLM을 활용하여 유니레버, DPD 등 고객사의 효율성을 최대 50%까지 향상시키고 있습니다. 이 역할에는 최첨단 NLP 알고리즘의 연구, 개발, 배포, 기업 고객과의 직접적인 협업을 통한 워크플로 최적화, AI 기술의 지속적인 개선에 대한 기여가 포함됩니다. 이상적인 지원자는 컴퓨터 과학 학위, 2년 이상의 ML 알고리즘 구축 및 배포 경험, 뛰어난 Python 프로그래밍 기술을 갖추고 있습니다. 혁신적이고 빠르게 성장하는 기업에 큰 영향을 미칠 수 있는 기회입니다.

AI
1 2 22 23 24 26 28 29 30 40 41