pgvector
Overview
pgvector est une extension PostgreSQL qui introduit un type vector pour stocker des embeddings, des opérateurs de similarité (cosine, L2, etc.) et des index adaptés pour accélérer la recherche.
Elle permet d'ajouter de la recherche sémantique dans une base PostgreSQL existante, sans déployer une base vectorielle dédiée. Idéal pour des POC rapides ou des intégrations progressives, elle bénéficie de la robustesse et des outils de l'écosystème Postgres.
Informations essentielles
| Propriété | Valeur |
|---|---|
| Repository | https://github.com/pgvector/pgvector |
| Licence | PostgreSQL License |
| Type | Extension de base de données (PostgreSQL) |
| Déploiement | Extension PostgreSQL |
| Usage principal | Recherche vectorielle dans Postgres |
| Public cible | Équipes qui ont déjà beaucoup de données dans PostgreSQL |
TL;DR
pgvector est parfait si tu veux tester ou déployer de la recherche vectorielle sans ajouter une nouvelle technologie de stockage dans ton écosystème.
Points clés à retenir :
- Aucune nouvelle base à opérer : tout reste dans PostgreSQL
- Idéal pour des POC rapides ou des intégrations progressives
- Bénéficie de la robustesse et des outils de l'écosystème Postgres
- Moins optimisé qu'une base vectorielle dédiée pour des volumes très importants
Cas d'usage typiques
- Ajouter de la recherche sémantique à une application déjà centrée sur PostgreSQL
- Prototyper un RAG sur une base de données existante
- Mixer filtres SQL classiques et similarité vectorielle dans les mêmes requêtes
Avantages
- Aucune nouvelle base à opérer : tout reste dans PostgreSQL
- Idéal pour des POC rapides ou des intégrations progressives
- Bénéficie de la robustesse et des outils de l'écosystème Postgres
Limites
- Moins optimisé qu'une base vectorielle dédiée pour des volumes très importants
- Nécessite PostgreSQL et un certain niveau d'expertise SQL
Ressources
- Documentation : https://github.com/pgvector/pgvector
- GitHub : https://github.com/pgvector/pgvector