META TITLE: Bases de données publiques : enrichir vos données B2B en 2026 SLUG: /bases-de-donnees-publiques-enrichissement/ META DESCRIPTION: SIRENE, INPI, LinkedIn, BODACC… Découvrez quelles bases de données publiques utiliser pour enrichir vos données B2B, comment les exploiter et leurs limites RGPD.
Enrichir depuis des bases de données publiques : le guide complet pour la prospection B2B
Votre CRM est rempli de fiches entreprises à moitié vides. Code NAF introuvable, effectif approximatif, dirigeant inconnu. Vous passez plus de temps à chercher des informations qu’à prospecter. Pourtant, une partie de ces données existe déjà — gratuitement, légalement, mise à jour quotidiennement — dans des bases de données publiques accessibles à tous.
Le problème, c’est que personne ne vous a expliqué comment les utiliser efficacement. Quelles bases contiennent quoi ? Quelles données peut-on réellement exploiter pour la prospection B2B ? Où s’arrêtent les données publiques et où commencer à enrichir autrement ?
Ce guide répond à ces questions, du recensement des sources disponibles jusqu’au workflow d’enrichissement complet, en passant par les règles RGPD à respecter.
Enrichissez vos données B2B dans Google Sheets
Trouvez emails et téléphones de vos prospects directement depuis LinkedIn, sans quitter votre feuille de calcul.
Qu’est-ce qu’une base de données publiques en contexte B2B ?
Une base de données publiques est un registre ou répertoire rendu accessible par une autorité publique (État, collectivité, établissement public) dans le cadre de la politique d’open data. En France, cette ouverture s’est accélérée avec la loi Lemaire de 2016 et la loi pour une République numérique, qui ont imposé la publication gratuite des données produites par les administrations.
Pour la prospection B2B, ces bases présentent un intérêt direct : elles référencent l’ensemble des entreprises françaises, leurs informations légales, leurs dirigeants officiels, leur activité économique et leurs données financières publiées. Tout cela mis à jour quotidiennement, sans abonnement.
La distinction fondamentale à garder en tête est celle-ci : les bases de données publiques fournissent des données firmographiques (informations sur l’entreprise en tant qu’entité), pas des données de contact (email ou téléphone d’un décideur individuel). Comprendre cette limite permet d’utiliser ces sources à leur juste valeur — et de savoir quand les compléter.
Les 5 bases de données publiques incontournables pour la prospection B2B
1. La base SIRENE (INSEE) — le socle de tout enrichissement firmographique
La base SIRENE est le registre officiel de toutes les entreprises et établissements français. Gérée par l’INSEE, elle recense aujourd’hui plus de 13 millions d’unités légales et plus de 30 millions d’établissements (actifs et cessés). C’est la source la plus exhaustive qui existe sur le tissu économique français.
Ce qu’elle contient concrètement : numéro SIREN (identifiant entreprise), numéro SIRET (identifiant établissement), raison sociale, forme juridique, code APE/NAF (secteur d’activité), adresse du siège, date de création, statut actif ou radié, et effectifs déclarés par tranche.
Ce qu’elle ne contient pas : nom du dirigeant, données financières, email, téléphone.
L’API SIRENE de l’INSEE est accessible gratuitement sur portail-api.insee.fr, après création d’un compte. Pour un usage sans code, Pappers et data.gouv.fr proposent des exports CSV de la base complète.
Cas d’usage type : Thomas, Sales Ops dans une scale-up industrielle, dispose d’une liste de 2 000 entreprises avec seulement leur nom commercial. Il utilise la base SIRENE pour automatiquement ajouter le SIREN, le code NAF, la tranche d’effectifs et le statut juridique de chaque entité — en quelques minutes.
2. L’INPI et le RCS — dirigeants et actes juridiques
L’Institut National de la Propriété Industrielle (INPI) donne accès au Registre National du Commerce et des Sociétés (RCS). C’est là que sont déposés les actes constitutifs, les statuts, les bilans, et surtout les noms des mandataires sociaux (gérants, présidents, directeurs généraux).
Concrètement, le RCS vous donne accès à : l’identité complète des dirigeants officiels avec leur date de naissance et leur nationalité, les modifications de capital, les cessions de parts sociales, les comptes annuels déposés (chiffre d’affaires, résultat net pour les sociétés qui publient).
L’API data.inpi.fr est disponible gratuitement. Mise à jour quotidienne via flux JSON/XML.
Important : le nom d’un dirigeant issu du RCS est une donnée personnelle au sens du RGPD. Son utilisation pour la prospection commerciale doit s’appuyer sur une base légale documentée (voir section RGPD ci-dessous).
3. Le BODACC — les signaux d’affaires en temps réel
Le Bulletin Officiel des Annonces Civiles et Commerciales (BODACC) publie toutes les annonces légales obligatoires des entreprises : créations, modifications, procédures collectives (redressement, liquidation), cessions de fonds de commerce, nominations de dirigeants.
Pour la prospection, le BODACC est une mine de signaux d’affaires. Une entreprise qui vient de changer de dirigeant est souvent en phase de transformation — moment idéal pour proposer de nouveaux outils. Une entreprise qui ouvre un nouvel établissement est en croissance. Une société qui dépose une procédure collective est à éviter.
Le BODACC est accessible gratuitement sur bodacc.fr. Des API permettent de l’interroger programmatiquement et d’automatiser la veille sur vos comptes cibles.
4. Pappers — l’agrégateur public le plus accessible
Pappers n’est pas une base de données en soi : c’est un service qui agrège et normalise les données des registres officiels (INSEE, INPI, BODACC, greffes des tribunaux) pour les rendre exploitables sans compétences techniques. La plateforme permet d’exporter facilement des données au format CSV pour enrichir des fichiers de prospection ou alimenter un CRM.
L’API Pappers permet également de siretiser une base de données : utiliser une liste de SIREN/SIRET et l’enrichir avec des informations complémentaires (nom du dirigeant, forme juridique, données financières).
Pour un usage sans code, Pappers propose une interface claire, des exports CSV et des alertes automatiques sur les entreprises suivies. Pour les équipes techniques, l’API Pappers est disponible en freemium avec des crédits gratuits à la création de compte.
5. LinkedIn et les sites d’entreprises — les sources publiques complémentaires
Au-delà des registres officiels, deux sources « publiques » sont massivement utilisées pour l’enrichissement B2B : les profils LinkedIn accessibles publiquement et les pages « À propos » des sites d’entreprises.
LinkedIn donne accès à : intitulé de poste des décideurs, historique professionnel, taille approximative de l’équipe, secteur déclaré, technologies évoquées dans les descriptions. Ces données sont publiques dans la mesure où le profil est visible sans connexion ou avec un compte standard.
Les sites d’entreprises fournissent : email de contact général, numéro de téléphone du siège, description des activités, stack technologique détectable, réseaux sociaux. Des outils comme le Website Email & Social Media Extractor de Derrick automatisent cette collecte depuis une URL.
Ce que les bases publiques ne contiennent pas (et comment combler les lacunes)
C’est le point que personne ne précise clairement : les bases de données publiques françaises sont excellentes pour les données firmographiques légales, mais elles ne contiennent aucune donnée de contact individuel utilisable pour la prospection directe.
Les bases gratuites ne contiennent ni emails professionnels, ni numéros de téléphone, ni données sur les décideurs. Pour prospecter, il faut enrichir ces données avec une plateforme complémentaire.
Le tableau ci-dessous résume clairement ce que vous trouverez — et ce que vous ne trouverez pas :
| Donnée | SIRENE | INPI/RCS | BODACC | Pappers | |
|---|---|---|---|---|---|
| SIREN/SIRET | ✅ | ✅ | ✅ | ✅ | ❌ |
| Code NAF / secteur | ✅ | ✅ | — | ✅ | ✅ partiel |
| Effectifs | ✅ tranche | — | — | ✅ tranche | ✅ approx. |
| Nom du dirigeant | ❌ | ✅ | ✅ | ✅ | ✅ |
| Données financières | ❌ | ✅ (dépôts) | — | ✅ | ❌ |
| Signaux d’affaires | ❌ | ✅ | ✅ | ✅ | ✅ partiel |
| Email professionnel | ❌ | ❌ | ❌ | ❌ | ❌ |
| Téléphone direct | ❌ | ❌ | ❌ | ❌ | ❌ |
| Poste du contact | ❌ | ❌ | ❌ | ❌ | ✅ |
Pour trouver l’email professionnel d’un dirigeant identifié via le RCS, il faut utiliser un outil d’email finder — comme la fonctionnalité Email Finder de Derrick, qui recherche et valide l’adresse professionnelle à partir du nom, prénom et domaine de l’entreprise. Pour le numéro de téléphone direct, le Phone Finder de Derrick récupère ce type de donnée depuis le profil LinkedIn du contact.
Comment enrichir concrètement depuis les bases publiques : workflow étape par étape
Voici le workflow complet pour passer d’une liste brute à une base de prospects enrichie et qualifiée.
Étape 1 : Construire la liste cible avec les critères firmographiques
Définissez votre ICP (Ideal Customer Profile) en termes de critères objectifs : secteur (code NAF), taille (tranche d’effectifs), forme juridique, région, date de création, statut actif. Sur Pappers ou data.gouv.fr, filtrez les entreprises selon ces critères et exportez la liste en CSV avec les SIREN correspondants.
Résultat attendu : Un fichier de 500 à 5 000 entreprises avec SIREN, raison sociale, adresse, code NAF et tranche d’effectifs.
Étape 2 : Enrichir les données firmographiques manquantes
Siretisez votre base : prenez les SIREN obtenus et interrogez l’API Pappers ou SIRENE pour compléter les champs manquants — forme juridique exacte, capital social, date de création, établissements secondaires. Idéal pour segmenter votre base (TPE vs ETI, par exemple).
Si vous utilisez Google Sheets comme base de travail, des outils comme Derrick permettent d’automatiser cette étape via le LinkedIn Company Scraper pour récupérer les données d’une page entreprise LinkedIn, ou le Website Tech Lookup pour identifier le stack technologique à partir du domaine.
Résultat attendu : Chaque fiche entreprise contient désormais les données firmographiques complètes nécessaires pour la segmentation et la qualification.
Étape 3 : Identifier les décideurs via les sources publiques
Pour chaque entreprise cible, identifiez les contacts pertinents. Deux approches complémentaires :
Via l’INPI/RCS (Pappers) : récupérez le nom du dirigeant officiel (gérant, PDG, DG). C’est la source la plus fiable pour les PME où le dirigeant est souvent votre interlocuteur direct.
Via LinkedIn : recherchez manuellement ou automatiquement les personnes occupant le poste qui correspond à votre persona (Directeur Marketing, Head of Sales, VP Engineering…). Le LinkedIn Profile Scraper de Derrick permet d’enrichir un profil LinkedIn avec 50+ attributs : poste actuel, expérience, compétences, email, téléphone.
Résultat attendu : Pour chaque entreprise cible, vous avez le nom et le profil LinkedIn du ou des décideurs à contacter.
Étape 4 : Enrichir les données de contact
C’est là que les bases publiques atteignent leur limite. Pour contacter vos décideurs, vous avez besoin de leur email professionnel et/ou de leur numéro direct. Aucune base publique ne fournit ces données.
Utilisez un outil d’email finder sur les contacts identifiés à l’étape précédente. Combinez nom + prénom + domaine de l’entreprise pour obtenir l’adresse email professionnelle vérifiée. Pensez également à faire passer votre liste existante par un vérificateur d’emails pour éliminer les adresses invalides avant toute campagne.
Résultat attendu : Une base de prospects avec emails professionnels vérifiés, prête pour la prospection outbound.
Étape 5 : Valider et nettoyer la base
Avant d’utiliser votre base enrichie, appliquez une étape de nettoyage : suppression des doublons, normalisation des noms d’entreprises (majuscules, accents), vérification des adresses email, et purge des entreprises radiées ou en procédure collective (vérifiable via BODACC).
Cette étape est critique. Selon les standards du marché, le taux de dégradation des données B2B atteint 22 à 30 % par an. Même une base construite à partir de sources publiques peut contenir des informations périmées si vous ne la rafraîchissez pas régulièrement.
Bases de données publiques et RGPD : ce que dit la CNIL
L’utilisation des données publiques pour la prospection commerciale est expressément encadrée par le RGPD — mais elle est autorisée. La CNIL a publié des recommandations spécifiques sur ce sujet.
Les acteurs peuvent généralement se fonder sur la base légale de l’intérêt légitime lorsqu’ils réutilisent des données diffusées par des administrations en vertu de la législation sur l’open data.
En pratique, pour que l’intérêt légitime s’applique à votre enrichissement depuis des bases publiques, trois conditions doivent être réunies :
1. La finalité doit être précise et documentée. “Prospection commerciale” ne suffit pas. Précisez la cible (ex. : directeurs commerciaux de PME industrielles en Île-de-France), le canal (cold email), et l’offre proposée.
2. Le traitement doit être proportionné. Ne collectez que les données strictement nécessaires à votre objectif. Constituer des profils détaillés dépassant les besoins de la prospection peut être qualifié de traitement excessif par la CNIL.
3. Les droits des personnes doivent être respectés. Informez vos contacts dès le premier message de l’origine de leurs données, proposez un mécanisme de désinscription simple, et supprimez les données des prospects inactifs après 3 ans maximum (durée recommandée par la CNIL).
Pour les données firmographiques pures (SIREN, code NAF, adresse de siège), qui ne permettent pas d’identifier une personne physique, le RGPD ne s’applique pas directement. C’est uniquement lorsque vous enrichissez avec des données nominatives (nom de dirigeant, email professionnel) que les obligations RGPD s’activent.
Pour approfondir ce point, consultez notre article sur le registre des activités de traitement pour le data enrichment.
Les erreurs à éviter quand on enrichit depuis des sources publiques
Problème 1 : Confondre données publiques et données utilisables pour la prospection
Impact : Vous constituez une base volumineuse mais inexploitable, car les données publiques seules ne permettent pas de contacter les décideurs.
Solution : Adoptez le workflow en deux temps décrit ci-dessus — les bases publiques pour le ciblage firmographique, les outils d’enrichissement de contacts pour les emails et téléphones.
Problème 2 : Utiliser des données périmées sans vérification
Impact : Vous envoyez des campagnes à des entreprises radiées ou à des dirigeants qui ont changé de poste, ce qui nuit à votre délivrabilité et à votre réputation commerciale.
Solution : Croisez systématiquement vos données avec le BODACC pour les statuts d’entreprises, et enrichissez les profils LinkedIn pour détecter les changements de poste. Planifiez un rafraîchissement trimestriel de votre base.
Problème 3 : Omettre l’information des personnes concernées
Impact : Non-conformité RGPD, risque de sanction CNIL, perte de crédibilité auprès de vos prospects grands comptes.
Solution : Intégrez systématiquement dans vos emails de prospection la mention de la source des données et un lien de désinscription fonctionnel. Pour les données issues de l’INPI ou du RCS, précisez explicitement l’origine dans votre premier message.
Problème 4 : Surcharger les fiches avec des données non pertinentes
Impact : Base difficile à maintenir, coûts d’enrichissement inutiles, risque de traitement disproportionné selon le RGPD.
Solution : Définissez avant l’enrichissement les champs strictement nécessaires à votre cas d’usage. Pour la prospection outbound standard, vous avez besoin de : raison sociale, secteur, effectifs, nom du décideur, email, éventuellement téléphone. Pas besoin d’historique juridique complet ni de données financières détaillées.
À retenir
- Les bases publiques françaises (SIRENE, INPI, BODACC, Pappers) couvrent l’intégralité des entreprises françaises avec des données firmographiques fiables et à jour quotidiennement.
- Elles ne fournissent pas d’emails ni de téléphones directs des décideurs — ces données doivent être obtenues via un outil d’enrichissement de contacts.
- Le workflow optimal combine : ciblage firmographique via bases publiques + enrichissement contacts via LinkedIn et email finder.
- La CNIL autorise la réutilisation des données publiques pour la prospection B2B sur la base de l’intérêt légitime, sous conditions de proportionnalité et d’information des personnes.
- Les données B2B se dégradent à 22-30 % par an : planifiez un rafraîchissement régulier, même pour les données issues de sources officielles.
Conclusion : des bases solides, mais un point de départ
Les bases de données publiques sont un atout sous-utilisé par la majorité des équipes commerciales. Elles fournissent une fondation firmographique fiable, mise à jour quotidiennement, accessible gratuitement — ce que beaucoup de bases de données payantes ne font qu’agréger.
Mais ce sont précisément des bases, au sens littéral. Elles posent le cadre : vous savez quelles entreprises cibler, leur taille, leur secteur, leur dirigeant officiel. Ce qu’elles ne font pas, c’est vous donner les clés pour les contacter directement.
C’est là qu’intervient l’enrichissement de contacts, notamment depuis LinkedIn. Avec Derrick, vous pouvez passer de la liste d’entreprises identifiées via Pappers à une base de prospects avec emails vérifiés et téléphones — directement dans Google Sheets, sans jongler entre cinq outils différents.
De la base publique au contact qualifié, dans Google Sheets
Importez vos listes depuis LinkedIn ou Sales Navigator et enrichissez emails, téléphones et données firmographiques en quelques clics.
Enrichissement de base de données : méthodes et bonnes pratiques
Découvrez toutes les méthodes d'enrichissement B2B et comment choisir la bonne selon votre volume et votre cible.
FAQ
Peut-on utiliser la base SIRENE gratuitement pour la prospection B2B ? Oui. La base SIRENE est en open data depuis 2019 et accessible gratuitement via l’API INSEE ou en téléchargement sur data.gouv.fr. Son utilisation à des fins de prospection commerciale est permise sur la base de l’intérêt légitime, à condition d’informer les personnes concernées et de respecter leur droit d’opposition.
Quelle est la différence entre une donnée légale et une donnée commerciale ? Une donnée légale (SIREN, code NAF, capital social) identifie officiellement une entreprise et ne permet pas d’identifier une personne physique. Une donnée commerciale (email professionnel, téléphone direct, poste du décideur) permet de contacter une personne identifiée — elle est soumise au RGPD et requiert une base légale documentée.
Pappers est-il suffisant pour faire de la prospection B2B ? Non, pas seul. Pappers est excellent pour obtenir des données légales et firmographiques fiables sur n’importe quelle entreprise française. En revanche, il ne fournit pas d’emails professionnels vérifiés ni de numéros directs. Pour une prospection opérationnelle, il doit être complété par un outil d’enrichissement de contacts.
À quelle fréquence rafraîchir une base construite depuis des sources publiques ? Au minimum tous les trimestres. Les données B2B se dégradent à un rythme de 22 à 30 % par an : changements de dirigeants, déménagements, radiations, évolutions de secteur. Les sources publiques elles-mêmes sont mises à jour quotidiennement — c’est votre base enrichie qui nécessite une maintenance régulière.
Est-il légal d’utiliser le nom d’un dirigeant issu du RCS pour de la prospection par email ? Oui, sous conditions. Le nom d’un mandataire social issu du RCS est une donnée publique, mais son utilisation pour la prospection active (envoi d’emails, appels) constitue un traitement de données personnelles au sens du RGPD. Vous devez documenter votre intérêt légitime, informer la personne dès le premier contact et lui offrir un droit d’opposition simple.