Aller au contenu principal

pgvector

Overview

pgvector est une extension PostgreSQL qui introduit un type vector pour stocker des embeddings, des opérateurs de similarité (cosine, L2, etc.) et des index adaptés pour accélérer la recherche.

Elle permet d'ajouter de la recherche sémantique dans une base PostgreSQL existante, sans déployer une base vectorielle dédiée. Idéal pour des POC rapides ou des intégrations progressives, elle bénéficie de la robustesse et des outils de l'écosystème Postgres.


Informations essentielles

PropriétéValeur
Repositoryhttps://github.com/pgvector/pgvector
LicencePostgreSQL License
TypeExtension de base de données (PostgreSQL)
DéploiementExtension PostgreSQL
Usage principalRecherche vectorielle dans Postgres
Public cibleÉquipes qui ont déjà beaucoup de données dans PostgreSQL

TL;DR

pgvector est parfait si tu veux tester ou déployer de la recherche vectorielle sans ajouter une nouvelle technologie de stockage dans ton écosystème.

Points clés à retenir :

  • Aucune nouvelle base à opérer : tout reste dans PostgreSQL
  • Idéal pour des POC rapides ou des intégrations progressives
  • Bénéficie de la robustesse et des outils de l'écosystème Postgres
  • Moins optimisé qu'une base vectorielle dédiée pour des volumes très importants

Cas d'usage typiques

  • Ajouter de la recherche sémantique à une application déjà centrée sur PostgreSQL
  • Prototyper un RAG sur une base de données existante
  • Mixer filtres SQL classiques et similarité vectorielle dans les mêmes requêtes

Avantages

  • Aucune nouvelle base à opérer : tout reste dans PostgreSQL
  • Idéal pour des POC rapides ou des intégrations progressives
  • Bénéficie de la robustesse et des outils de l'écosystème Postgres

Limites

  • Moins optimisé qu'une base vectorielle dédiée pour des volumes très importants
  • Nécessite PostgreSQL et un certain niveau d'expertise SQL

Ressources