Uitgebreide Uitleg
Vector databases zijn een nieuwe categorie databases ontworpen voor AI-toepassingen. In plaats van traditionele data zoals tekst en getallen, slaan ze vector embeddings op - de numerieke representaties die AI-modellen gebruiken. Het cruciale verschil is dat ze geoptimaliseerd zijn voor "similarity search": vind de vectors die het meest lijken op een gegeven query vector.
Dit maakt ze essentieel voor moderne AI-applicaties. Bij RAG bijvoorbeeld worden documenten omgezet naar embeddings en opgeslagen in een vector database. Wanneer een gebruiker een vraag stelt, wordt de vraag ook een embedding en de database vindt snel de meest relevante documenten op basis van semantische gelijkenis.
Populaire vector databases zijn Pinecone, Weaviate, Qdrant, en Chroma. Ze gebruiken geavanceerde indexeringstechnieken (zoals HNSW of IVF) om snel te kunnen zoeken in miljoenen vectors. Scalability is key: productie-systemen kunnen miljarden embeddings bevatten.
Praktijkvoorbeeld
Een Nederlandse kennisbank implementeert semantic search met een vector database. Zoekt iemand naar "geld besparen op energie", dan vindt het systeem ook artikelen over "energiekosten verlagen" en "isolatie tips" - omdat deze semantisch vergelijkbare embeddings hebben.
Veelgebruikte Zoektermen
Gerelateerde Termen
Embeddings
Embeddings
Numerieke representaties van data (zoals woorden of afbeeldingen) die betekenis vastleggen in een vector.
Retrieval-Augmented Generation
Retrieval-Augmented Generation (RAG)
Een techniek waarbij een AI-model externe kennisbronnen raadpleegt voordat het een antwoord genereert.
Semantic Search
Semantic Search
Zoeken op basis van betekenis en context in plaats van exacte keyword matching.