CocoIndex: 데이터 처리를 간소화하는 오픈소스 데이터 인덱싱 엔진
2025-04-24
CocoIndex는 사용자 정의 변환 로직과 증분 업데이트를 지원하고 데이터 인덱싱에 특화된 세계 최초의 오픈소스 엔진입니다. 사용자는 변환을 선언하고 CocoIndex는 인덱스를 생성하고 유지 관리하며, 소스 업데이트 시 최소한의 계산으로 파생 인덱스를 최신 상태로 유지합니다. 설명서, 빠른 시작 안내 및 비디오 자습서를 사용할 수 있습니다. Python 라이브러리 설치와 Docker Compose를 사용한 Postgres 데이터베이스 시작을 지원합니다. 사용자는 텍스트를 청크로 분할하고 벡터에 임베딩하고 벡터 인덱스로 내보내는 등 인덱싱 흐름을 정의하여 데이터를 쉽게 인덱싱할 수 있습니다. 예제와 데모가 제공되며 커뮤니티의 기여(코드 개선, 설명서 업데이트, 문제 보고, 기능 요청, Discord 토론)를 환영합니다.
개발
데이터 인덱싱