深入理解 Postgres 中 Pgvector 的 HNSW 索引存储

2024-09-05

本文深入探讨了 pgvector 在 Postgres 中创建的 HNSW 索引文件的底层结构。文章首先概述了 Postgres 的存储机制,然后详细介绍了 pgvector 索引的元数据页面和索引页面结构,包括元素元组和邻居信息元组的组成。文章还通过将索引页面结构映射到 JSON 表示,以及使用 C 语言编写的索引解析器,将 pgvector 索引可视化,帮助读者更好地理解其存储布局。

阅读更多
未分类 HNSW 索引

Postgres 对比 Pinecone: Lantern 博客

2024-07-20

本文是对 Pinecone 博客文章的回应,该文章声称 Postgres 作为向量数据库性能不足。文章使用 YFCC 数据集,比较了 Postgres 和 Pinecone 在向量搜索,特别是元数据过滤方面的性能和成本。文章指出,通过 Lantern 等扩展和一些优化,Postgres 可以实现比 Pinecone 更高的召回率和更低的延迟,并且成本更低。文章还反驳了 Pinecone 关于 Postgres 索引大小不可预测和构建速度慢的观点,认为这些问题可以通过 Lantern 的外部索引创建和 Postgres 云提供商的功能来解决。

阅读更多
未分类 Pinecone