RAG Latency Archives - Ash Sharan

Archive

Distributed Vector Search: How Real Vector Databases Scale Beyond One Machine

Distributed Vector Search: How Real Vector Databases Scale Beyond One Machine

Why dense search becomes a routing, sharding, and distributed-systems problem Vector search looks simple when everything fits on one machine. It becomes a different discipline...

AI Infrastructure

25/11/2025