
Dans la plupart des organisations qui ont lancé une démarche qualité, le réflexe est le même : on commence par construire un tableau de bord. Un onglet quelque part, avec des barres rouges et vertes, un score global affiché en haut à droite, et la promesse implicite que ce chiffre va permettre de piloter. Sauf que personne ne sait quoi en faire.
Le score s'améliore d'un trimestre à l'autre, et pourtant les utilisateurs métiers continuent de remonter les mêmes problèmes : doublons dans le CRM, adresses obsolètes sur les factures, contradictions entre deux rapports censés mesurer la même chose. Le tableau de bord vit sa propre vie, déconnecté des usages qu'il était censé éclairer. Au bout de quelques mois, plus personne ne l'ouvre (sauf en COMEX, pour faire bonne figure).
Ce décalage n'est pas une fatalité, c'est un symptôme. La cause tient en une phrase : on a mesuré ce qui était facile à mesurer, pas ce qui aidait à décider. Cet article reprend la question de zéro : qu'est-ce que ça veut dire, concrètement, mesurer la qualité des données ? Quelles dimensions retenir, quels KPI suivre, quels indicateurs abandonner sans regret, et qui doit porter le sujet pour que les chiffres servent à quelque chose.
L'idée d'un score unique est séduisante. Un chiffre, une couleur, un message simple à présenter en comité. Le problème, c'est que ce chiffre ne dit jamais ce qu'il faudrait en faire. C'est un thermomètre qui indiquerait la température moyenne d'une maison : utile pour la météo, inutile pour savoir si la chambre du bébé est correctement chauffée.
Un score global de qualité, c'est une moyenne. Et comme toute moyenne, elle écrase les écarts. Une organisation peut afficher 87 % de qualité globale tout en ayant 99 % sur les données peu utilisées et 60 % sur les données critiques pour le reporting financier. Le chiffre rassure, mais il ment.
Le mécanisme est mécanique. On additionne le taux de complétude d'un champ « commentaire » dans une fiche client (renseigné à 92 %) et le taux d'exactitude d'un IBAN bancaire utilisé pour les virements (à 89 %). On en sort une moyenne pondérée qui ne dit ni où sont les défauts, ni quel est leur impact. Le Data Owner du domaine financier ne sait pas s'il doit s'inquiéter. Le Data Owner du domaine commercial non plus.
Le score agrégé a aussi un autre défaut, plus politique : il dépolitise le sujet. Quand tout est dans un chiffre, personne ne porte personnellement les défauts. Le score est « celui de l'entreprise », jamais celui d'un domaine ou d'un responsable. C'est exactement ce qui transforme une démarche qualité en exercice de communication.
Un indicateur qui ne déclenche pas une décision est un indicateur décoratif. La question à se poser pour chaque KPI envisagé est simple : si la valeur passe au rouge, qui fait quoi, et quand ? Si la réponse n'est pas immédiate, le KPI n'a pas sa place dans le tableau de bord.
Trois critères distinguent un bon indicateur d'une métrique qui occupe l'écran :
Ces trois critères ne sont pas négociables. Un indicateur qui n'en remplit pas au moins deux ne mérite pas qu'on lui consacre du temps. C'est aussi pour ça qu'un tableau de bord qualité utile a peu d'indicateurs, mais des indicateurs qui engagent.
👉 À lire aussi : Qualité des données : enjeux, responsabilités et pilotage
La qualité des données n'est pas un concept monolithique. Elle se décompose en plusieurs dimensions, qui répondent chacune à une question différente. Vouloir tout résumer à une seule de ces dimensions (typiquement la complétude, parce qu'elle est la plus facile à calculer) revient à juger la qualité d'une voiture uniquement par la quantité d'essence dans son réservoir.
Cinq dimensions structurent l'essentiel de ce qu'il faut mesurer en entreprise. Aucune n'est suffisante prise seule, mais leur combinaison donne une image fiable.
L'exactitude est le critère le plus intuitif et le plus difficile à mesurer. Une adresse client est-elle vraiment celle où le client réside ? Un montant de facture correspond-il bien au montant facturé ? Un code NAF associé à une entreprise est-il le bon ?
Le problème, c'est qu'on ne peut mesurer l'exactitude qu'en comparant à une source de vérité. Et cette source de vérité n'existe pas toujours. Pour les adresses, on peut s'appuyer sur des référentiels externes (BAN, INSEE). Pour les coordonnées bancaires, on vérifie le format puis on teste à l'usage (premier virement). Pour des données plus subjectives (segmentation client, qualification d'un prospect), la « réalité » est elle-même une construction métier.
En pratique, l'exactitude se mesure par échantillonnage et par confrontation à des sources externes ou à des contrôles indirects (taux de retour des courriers, taux de rejet bancaire, taux de réclamation client). C'est une dimension précieuse mais coûteuse, à réserver aux données les plus critiques.
La complétude est la dimension la plus facile à mesurer : on compte les champs renseignés, on divise par le total des champs attendus, on obtient un pourcentage. Tous les outils de profilage savent le faire en deux clics.
Le piège, c'est précisément cette facilité. Mesurer la complétude de tous les champs est inutile : c'est mesurer la complétude des champs critiques qui a du sens. Une fiche client sans champ « notes commerciales » est probablement utilisable. Une fiche client sans email ni numéro de téléphone est inutilisable pour 80 % des usages. La complétude n'a de valeur que rapportée à un usage précis.
Le travail de fond consiste à définir, pour chaque domaine, quels sont les champs réellement obligatoires en fonction des usages. Ce travail est métier, pas technique. Une fois la liste des champs critiques arrêtée, la mesure devient simple, et surtout exploitable.
La fraîcheur (ou actualité) mesure le délai entre la dernière mise à jour d'une donnée et sa consommation. Elle pose une question redoutablement simple : est-ce que ce qu'on utilise reflète encore la réalité ?
Une adresse correctement saisie il y a trois ans peut être devenue fausse. Un prix produit à jour il y a six mois ne reflète plus les conditions actuelles. Un statut de prospect qualifié il y a un an n'a plus aucune valeur opérationnelle. La fraîcheur n'est pas un défaut de saisie, c'est un défaut de cycle de vie.
La mesure de la fraîcheur dépend de l'usage. Pour une donnée d'analyse statistique, six mois de retard peuvent être acceptables. Pour une donnée de campagne marketing, trois mois sont déjà limite. Pour une donnée d'alerte opérationnelle, c'est l'heure qui compte. Avant de mesurer, il faut donc trancher : quel est le délai au-delà duquel cette donnée perd sa valeur ?
Les doublons sont la cause de défaut la plus visible, parce qu'ils sautent aux yeux des utilisateurs. Deux fiches clients pour la même personne, deux fiches produits pour la même référence, deux fiches fournisseurs pour le même prestataire. À chaque doublon, c'est la vue consolidée qui s'effondre.
L'unicité se mesure par le ratio entre les enregistrements uniques (après dédoublonnage) et les enregistrements totaux. Plus le ratio s'éloigne de 100 %, plus la base est inutilisable pour les usages transverses : un score 360°, une analyse de cycle de vie client, un reporting consolidé. Aucun de ces usages ne tolère plus de quelques pourcents de doublons.
La difficulté technique est dans la détection. Un doublon parfait (même nom, même email, même numéro) est facile à repérer. Un doublon partiel (« Société Dupont » et « Sté Dupont SAS », « jean.dupont@... » et « j.dupont@... ») demande des algorithmes de rapprochement probabilistes. C'est précisément ce qui justifie un outillage dédié, mais après avoir défini les règles métier de ce qu'est un doublon dans le contexte de l'entreprise.
La conformité couvre tout ce qui peut être vérifié par une règle automatique : format, structure, appartenance à un référentiel, respect d'une contrainte réglementaire. Un numéro de TVA bien formaté, un code postal qui existe, un consentement RGPD documenté, un IBAN dont la clé est valide.
C'est la dimension la plus industrialisable. Une fois les règles écrites, un outil les vérifie en continu et alerte sur les écarts. C'est aussi la dimension qui se prête le mieux à un contrôle à la saisie, ce qui permet de prévenir plutôt que de corriger.
La conformité a une particularité : elle a souvent une dimension réglementaire (RGPD, reporting financier, normes sectorielles). Le seuil acceptable est donc plus exigeant que pour d'autres dimensions. Sur une règle réglementaire, on ne tolère pas 5 % d'écart : on tolère zéro, ou on s'expose à une sanction.
.jpg)
Les dimensions sont le cadre conceptuel. Les KPI sont leur traduction opérationnelle. Pour chaque dimension, il existe un ou plusieurs indicateurs qui se calculent simplement, se suivent dans le temps, et se rattachent à un responsable. L'erreur consiste à en empiler vingt : un tableau de bord utile en contient quatre à six par domaine, pas plus.
Voici les quatre KPI les plus couramment utiles, à adapter selon la criticité du domaine et les enjeux métiers.
Le taux de complétude se calcule en rapportant le nombre d'enregistrements correctement renseignés sur un champ donné au nombre total d'enregistrements attendus. Mais le calcul global n'a aucun intérêt : il faut le décliner par champ, et uniquement sur les champs préalablement identifiés comme critiques.
Concrètement, pour une base clients, on ne suit pas « le taux de complétude global de la base ». On suit le taux de complétude de l'email, du téléphone mobile, de l'adresse postale, du SIRET pour les clients professionnels. Quatre ou cinq indicateurs ciblés disent infiniment plus qu'un score moyen sur trente champs.
Le seuil acceptable dépend de la criticité. Sur un champ utilisé pour des envois physiques (adresse), un seuil à 98 % est un minimum. Sur un champ utilisé pour des analyses statistiques, 90 % peut suffire. Le seuil n'est pas une norme, c'est une décision métier qui doit être tracée.
Le taux de doublons mesure la part d'enregistrements qui correspondent à une même entité du monde réel. Il se calcule sur les référentiels structurants : clients, produits, fournisseurs, employés. Il ne se calcule pas sur les données transactionnelles (commandes, factures), qui sont par nature dupliquées légitimement.
Le calcul demande de définir d'abord la règle de dédoublonnage : par identifiant unique (SIREN, numéro de sécurité sociale), par combinaison de champs (nom + date de naissance + adresse), ou par algorithme probabiliste. La règle est métier, pas technique : c'est au Data Owner de trancher ce qui constitue un doublon dans son domaine.
Une fois la règle posée, le taux se calcule simplement : (enregistrements après déduplication / enregistrements totaux) × 100. Un seuil typique se situe entre 98 % et 99 % sur les référentiels clés. Au-delà de 2 % de doublons, la fiabilité des analyses transverses est sérieusement compromise.
Le délai moyen de mise à jour mesure la fraîcheur des données. Il se calcule en faisant la moyenne (ou la médiane, plus robuste) du délai écoulé entre la dernière modification d'un enregistrement et le moment de la mesure.
L'indicateur prend tout son sens quand on le décline par segment :
Le seuil n'a aucune valeur dans l'absolu : c'est l'évolution dans le temps qui compte, et la capacité du domaine à mettre en place des routines de rafraîchissement (relances automatiques, campagnes de mise à jour, processus de revalidation).
Le taux de conformité mesure la part d'enregistrements qui respectent les règles définies (format, référentiel, contrainte réglementaire). C'est l'indicateur le plus industrialisable, parce que les règles s'écrivent en code et se vérifient en continu.
Le KPI se décline règle par règle, pas en agrégé. On suit le taux d'IBAN au format valide, le taux de SIRET présent dans le référentiel INSEE, le taux de consentements RGPD documentés, le taux de champs respectant les conventions de nommage internes. Chacun de ces taux a son responsable et son seuil propre.
Sur les règles réglementaires, le seuil est typiquement de 99,5 % ou plus. Une dérive de 0,5 % sur un consentement RGPD peut représenter plusieurs milliers d'enregistrements en infraction. Sur les règles purement métier (conventions de nommage, formats internes), le seuil peut être plus souple, mais il doit être documenté.
Ces quatre KPI couvrent l'essentiel des besoins de pilotage dans la plupart des contextes. Ils sont simples à calculer, faciles à interpréter, et chacun se rattache directement à une action corrective possible. C'est cette simplicité qui les rend utilisables, pas leur sophistication.
Tous les indicateurs ne se valent pas. Certains, très répandus dans les tableaux de bord qualité, n'aident en rien à piloter. Pire, ils donnent l'illusion d'un suivi sérieux alors qu'ils n'engagent personne et ne déclenchent aucune action. Quatre faux indicateurs reviennent particulièrement souvent.
La règle pour tester un indicateur est simple. Pour chaque KPI envisagé, se poser trois questions : (1) Si la valeur passe au rouge, qui agit ? (2) Si la valeur progresse, quelle décision peut-on prendre ? (3) Quel usage métier est protégé par cet indicateur ? Si l'une des trois réponses est floue, le KPI n'a pas sa place.
Mesurer la qualité ne suffit pas. Encore faut-il que les chiffres aient un destinataire qui en fasse quelque chose. Sans portage explicite, les KPI les mieux conçus restent des courbes orphelines. Trois niveaux de responsabilité interviennent dans la mesure, et chacun a un rôle distinct.
Le premier niveau est celui du Data Steward, garant opérationnel des indicateurs sur son domaine. C'est lui qui lit les rapports, identifie les dérives, alerte sur les anomalies récurrentes. Sans Data Steward nommé, les indicateurs flottent : ils existent dans l'outil, mais personne ne les regarde. Un KPI sans Data Steward est un KPI mort.
Le deuxième niveau est celui du Data Owner, arbitre métier du domaine. C'est lui qui fixe les seuils acceptables, valide les évolutions de règles, tranche quand un défaut de qualité oppose deux usages métiers. Le Data Owner n'est pas dans l'outil au quotidien, mais il est l'interlocuteur du Data Steward chaque mois en revue. Sans son arbitrage, les indicateurs ne se traduisent jamais en décision.
Le troisième niveau est celui du CDO ou du Data Quality Manager, qui pilote la démarche transverse. Son rôle n'est pas de regarder chaque indicateur, mais de garantir que le dispositif fonctionne dans tous les domaines, que les pratiques sont cohérentes, et que les sujets structurants remontent au COMEX. Il porte aussi la révision annuelle des indicateurs eux-mêmes : ce qui était pertinent il y a deux ans peut être obsolète aujourd'hui.
L'IT et le Data Engineering interviennent en support technique. Ils implémentent les contrôles, automatisent les calculs, garantissent la fiabilité des indicateurs eux-mêmes. Ils ne sont pas responsables des seuils, ni des décisions, ni de l'interprétation. Cette frontière est essentielle : confondre les rôles techniques et les rôles métiers est l'une des causes majeures d'échec des démarches qualité.
Trois rituels structurent le pilotage par les indicateurs :
Sans ces rituels, les indicateurs n'ont aucune valeur de pilotage. Ils existent dans l'outil, mais ils ne déclenchent rien. C'est la différence entre un tableau de bord et un tableau de bord utilisé. Ces rituels s'inscrivent dans une démarche plus large de maintien de la qualité des données dans la durée, qui combine contrôles, responsabilités et amélioration continue.
👉 À lire aussi : Audit qualité des données : méthode et indicateurs clés