4.6/5 - (16 votes)

Google sheet regorge de nombreuses fonctionnalités et notamment les regex, communément appelé Expressions régulières. Leurs champs d’utilisation sont très variés et permettent de traiter de gros volumes de bases de données. Les regex sont parfaits pour affiner les informations de vos prospects avant de lancer vos campagnes de prospection. Voyons ensemble comment les utiliser pour améliorer la qualité de votre copywriting ou de votre ciblage de leads ou d’account.

Regex : définition

Les expressions régulières ou regex permettent de différencier une suite de caractères d’une autre.

C’est une syntaxe qui permet entre autre de cleaner les grosses bases de données et de retirer les informations qui ne vous sont pas utiles.

L’utilisation la plus connue des regex est l’emploi dans des formulaires. Pour bien comprendre voici donc un exemple dans les formulaires du contact.

Imaginons que nous avons un formulaire de contact sur notre site demandant :

  • nom
  • prénom
  • email

Tous les champs sont nécessaires pour pouvoir soumettre le formulaire.

Quelque chose de très fréquent, c’est qu’un utilisateur ajoute une adresse email qui n’a pas un format “correct”, par exemple :

  1. jonathan@gmail.
  2. jonathangmail.com
  3. jonathan@g.fr

Les regex permettent d’identifier que l’email n’est pas correctement formé, c’est de l’analyse sémantique pure et simple.

Un être humain est capable de dire que le (1) n’est pas correct car il manque quelque chose après le “.”. Avec une regex, on peut créer une règle qui dit “s’il n’y a rien après le point c’est que l’email n’est pas bon”. Pareil pour le (2) et le (3).

Maintenant que vous avez compris ceci, nous allons voir comment s’en servir dans le cadre de base de données de lead ou d’account.

Votre liste de leads contient des emails ?
Mais ceux-ci peuvent contenir des erreurs ou des fautes. En utilisant les regex, vous pouvez identifier et même corriger en automatique les erreurs et diminuer de ce fait le taux de bounces et de mise en spams.

Votre liste contient des mails personnels ? #Rgpd
Avec les regex, vous pouvez indiquer que les expressions contenant “@gmail” ou “@hotmail” doivent être supprimées de la liste pour ne pas contacter des emails personnels et ainsi coller aux exigences de la RGPD.

La liste des possibles est infinie, nous allons vous parler de 3 éléments que vous pouvez mettre en place dès maintenant sur vos bases de données sur Google Sheet.

Si vous utilisez Derrick, il est aisé de :

  • Préparer des formules regex ;
  • Importer une liste avec l’import de lead LinkedIn de Derrick ;
  • Traiter directement les leads en 1 clin d’œil avec des regex.

➡️ Prenons un peu de recul :

La différence entre une recherche classique et regex
Pour le traitement d’un document, il est possible de passer par la recherche classique “Ctrl+F” ou “Cmd+F”. Cependant, ce filtre est trop limité pour traiter de nombreuses données. Les regex offrent quant à elle la possibilité de récupérer des variations spécifiques de caractère.

Dans l’exemple ci-dessous, vous voyez qu’on retrouve facilement tous les gmail, mais il faudra faire de même pour les yahoo, hotmail, etc et remplacer à la main à chaque fois.

Ça peut être très chronophage surtout si on peut tout faire automatiquement 😉

regex commande recherche

Les expressions régulières sont idéales pour traiter les grosses bases de données. Voyons dans les prochains points les 3 formules disponibles sur Google Sheet de regex pour cleaner au maximum vos bases de données.

Regex & Google Sheet : les principales formules

À 1ere vue, cela peut paraître un peu complexe, mais c’est un langage beaucoup plus simple à comprendre que l’anglais, c’est finalement assez basique.

Je vous recommande cette formation si vous souhaitez vous former :

Je vous recommande cette formation si vous souhaitez vous former.
Commencez maintenant
⬇️

JE ME FORME AUX REGEX

Il existe 3 principales formules que vous pouvez utiliser dans Google Sheet.

REGEXMATCH

La fonction REGEXMATCH indique si le résultat de votre formule est VRAI. En clair, si le texte sur lequel vous appliquez votre regex répond à l’exigence de celle-ci ou non.

Exemple d’utilisation de REGEXMATCH pour valider que des numéros de téléphone sont corrects dans notre base de données.

1ère étape : définir à quoi ressemble un numéro de téléphone

Voici les cas possibles dans le cas de numéro français :

  • 06 47 47 47 47
  • 06.47.47.47.47
  • 0647474747
  • +33647474747

2ème étape : isoler les patterns communs

  • Il y a au moins 8 chiffres et maximum 11 chiffres, mais seulement si la suite de caractère commence par un “+” ;
  • Il peut y avoir des espaces entre les chiffres ou des points ;
  • la suite commence par un 0 ou par un +.

Nous avons défini nos patterns, il est temps de les traduire en regex. Je vous passe l’explication mais je vais traduire nos patterns en regex.

Voici, un outil simple et sympa pour vérifier que vos regex fonctionnent : https://regex101.com/

regex101

Voici la regex :

^(?:(?:\+|00)33[\s.-]{0,3}(?:\(0\)[\s.-]{0,3})?|0)[1-9](?:(?:[\s.-]?\d{2}){4}|\d{2}(?:[\s.-]?\d{3}){2})$

Voilà ce que ca donne quand j’utilise la fonction RegexMatch de Google Sheet :

regexmatch

En TRUE : les numéros de téléphone français valide.
En FALSE : Les numéros de téléphone français non valide.

Imaginez maintenant faire ça sur des centaines de leads, pour des emails, numéros de téléphone ou n’importe quelles autres data.

REGEXEXTRACT

La formule REGEXEXTRACT permet d’extraire une partie d’un texte de la cellule à partir d’une expression régulière. Avec Derrick par exemple, vous pouvez récupérer la bio des profils LinkedIn de vos leads. Cette bio est une mine d’or d’information, parfois il y a des numéros ou des emails de renseignements. Les regex vous permettront de les extraire automatiquement sans avoir à lire la bio de chacun de vos leads et de les extraire à la main !

Exemple d’utilisation de REGEXEXTRACT pour retrouver un email dans une bio

1- Commencez par importer vos leads avec Derrick (voici une vidéo d’explication).

Screen Recording 2022-07-29 at 12.36.13 PM

2- Même chose que pour RegexMatch définissons d’abord à quoi ressemble un email.

  • contact@derrick-app.com
  • jonathan@gmail.com
  • jona123@gmail.fr
  • m0nsUPERMail@1234.fr

3- Les patterns :

Suite de caractères sans espace puis “@ puis suite de caractères puis “.” puis suite de caractères.

4- Retour sur https://regex101.com/

Il y a des regex plus ou moins “parfaites”, pour l’exemple je suis allé à l’essentiel.

regexextract

Voici la regex :

^(?:(?:\+|00)33[\s.-]{0,3}(?:\(0\)[\s.-]{0,3})?|0)[1-9](?:(?:[\s.-]?\d{2}){4}|\d{2}(?:[\s.-]?\d{3}){2})$

Voilà ce que ça donne quand j’utilise la fonction Regex Extract de Google Sheet sur la colonne summary de Derrick. Résultat sur la colonne “email in summary”.

googlesheet regexextract

NB : voici la formule exacte pour avoir des cases vides au lieu de #NA.

=iferror(REGEXEXTRACT({{cellule-Summary}}; »[a-z0-9]+@[a-z]+\.[a-z]{2,3} »); » »)

REGEXREPLACE

La fonction REGEXREPLACE permet de remplacer une partie d’un texte avec une expression régulière.

Exemple d’utilisation de REGEXREPLACE pour retirer les S.A, S.A.R.L EURL etc des noms d’entreprises. Ce qui sera super utile pour votre copywriting ! Qui n’en a pas marre de se faire griller en cold email ?

“Bonjour Monsieur, J’ai vu que vous travaillez chez Super Entreprise S.A.R.L

regexreplace S.A.R.L
“Bonjour Monsieur, J’ai vu que vous travaillez chez Super Entreprise”

➡️ Disqualifié

Et si on pouvait cleaner ça en une fraction de seconde. C’est parti !

1- Commencez par importer vos entreprises avec Derrick (voici une vidéo d’explication)

Screen Recording 2022-07-29 at 01.48.32 PM

2- Vous l’avez compris la suite

  • SARL
  • SAS
  • EURL
  • S.A.S
  • S.A.R.L

3- Nos patterns

  • suite de caractères
  • la suite de caractères en en majuscule
  • la suite de caractère est finie SAS,SARL,…

4- Voici la regex très simplifiée

(SARL|S.A.R.L|SAS|S.A.S|EURL|E.U.R.L)

Voilà ce que ça donne quand j’utilise la fonction Regex replace de Google Sheet sur la colonne CompanyName de Derrick.

regexreplace

TUTO : Nettoyer une base de données Derrick avec les regex

Vous l’avez compris, les regex sont indispensables pour traiter rapidement de grosses bases de données. Commencez par constituer votre nouvelle liste de leads avec Derrick.

Étape 1 : Télécharger et installer Derrick sur Google Sheet
Derrick est une application gratuite qui s’installe directement sur votre navigateur Chrome. Il vous permet de récupérer les données de vos prospects directement sur LinkedIn Sales Navigator.

Créez votre Machine a Prospect en 1 clic !

Avec Derrick App, Retrouvez vos Clients Ideaux, Trouvez leurs Informations de Contact et Constituez des Listes de Prospects pour votre Prospections en 1 clic directement dans Google Sheet.

Lancez vous Aujourd'hui et obtenez 200 Crédits Gratuit par Mois !

Essayez Gratuitement!

Étape 2 : Scraper les leads ou compagnies sur Linkedin Sales Navigator vers votre document Google Sheet :

  • Méthode 1 : scraper les leads
  • Méthode 2 : scraper les compagnies

Étape 3 : Enrichir les données d’entreprise

Une fois que tout ce travail est fait, vous pouvez commencer à cleaner votre base de données à l’aide des regex.

Exemple : dans la liste ci-dessous, je souhaite trouver les entreprises qui sont spécialisées dans le SEO. Grâce à l’enrichissement des données (Etape 3), Derrick a récupéré les hashtags associés aux pages LinkedIn des entreprises “Company associated hashtags (linkedin)”. Je vais donc utiliser l’expression régulière “seo” avec la formule REGEXMATCH.

J’insère une nouvelle colonne à côté de celle qui contient les hashtags “Company associated hashtags (linkedin)”.

enrichissement données entreprises

J’utilise la formule REGEXMATCH :

regexmatch formule

J’étire ma formule et récupère seulement les entreprises contenant l’expression régulière “seo”. Cela se repère facilement avec la donnée VRAI ou FAUX. Ici, je vais filtrer seulement sur VRAI pour n’avoir que les entreprises spécialisées en SEO.

regex filtres
regex appliquer filtres

Une fois que le filtre est appliqué, je me retrouve avec la liste de toutes les entreprises qui travaillent dans le SEO. Je peux sauvegarder ma nouvelle liste pour travailler ma prospection.

regex nouvelle liste

Le potentiel de ces fonctions simples est énorme pour le traitement des bases de données. Il existe également des règles de syntaxe avec les regex que vous pouvez utiliser pour affiner davantage vos informations. Pour aller plus loin et apprendre les regex sur python vous pouvez lire cet article.

Si vous avez des questions sur les formules, n’hésitez pas à nous les poser en commentaire.


2 commentaires

RegexMatch sur Google Sheets : Guide 2022 - · 27 septembre 2022 à 18h00

[…] Nous allons d’abord expliquer a quoi sert RegexMatch sur Google Sheet, ensuite nous verrons comment utiliser RegexMatch et enfin nous verrons quelques cas d’utilisation très sympa. Si vous voulez en savoir plus sur les types de Regex disponible sur Google Sheet, rendez-vous sur cet article. […]

RegexMatch on Google Sheets: Guide 2022 - · 27 septembre 2022 à 18h05

[…] use RegexMatch and finally we will see some very nice use cases If you want to know more about the Regex types available on Google Sheet, go to this […]

Laisser un commentaire

Avatar placeholder

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *