Aller au contenu
Fact Crashing, Fact Crashing™, Discovery, Solutions iDiscovery, eDiscovery, Collecte de données, Collecte, Données, Fiabilité des données

La compréhension des données est requise pour une analyse correcte

Ceci est le neuvième volet d'une série de blogs sur Fact Crashing™, l'accélération de la prise en compte des données ACTION (Ambient, Contextual, Transactional, IoT, Operational, Navigational) au profit de la résolution des litiges.

Il y a 9 principes de Crash de faits™. Les blogs précédents couvraient : 

Principe 1 : Les données sont des preuves et sont détectables

Principe 2 : Les données doivent être traitées tôt

Principe 2 : Analyse approfondie

Principe 3 : Définir les problèmes de cas comme des requêtes centrées sur les données

Principe 4 : Identifier, qualifier et hiérarchiser les sources de données

Principe 5 : Les données sont soumises aux obligations de conservation et de protection

Principe 6 : La fiabilité des données commence par une collecte appropriée

Maintenant, regardons le septième principe.


Pour vraiment comprendre les données, vous devez les considérer comme un tabouret à trois pieds : administrateur système (par exemple, informatique) ; Propriétaire de l'entreprise (par exemple, les ventes) et utilisateur final (par exemple, le vendeur).  Avoir ces trois perspectives aidera à découvrir certaines nuances dans la réponse à des questions telles que :

  • Les utilisateurs utilisent-ils le système comme prévu ?
  • Le service informatique est-il conscient de la manière dont l'entreprise utilise le système (réalité versus conception) ?
  • Quelles modifications ont été apportées par nécessité commerciale ?

Ce sont toutes des situations simples et pourtant trop courantes que nous avons vues se produire sans la faute de personne, juste une réalité des affaires. Par exemple, les utilisateurs décident eux-mêmes d'utiliser un champ ou un flux de travail d'une manière différente de celle prévue parce que "c'était simplement plus facile". Il est important que ce processus se concentre sur la compréhension des réalités des données, et non sur le jugement de l'entreprise quant à la "Pourquoi." 

Jambes manquantes

Il n'est pas rare d'être dans une situation où il vous manque des jambes (par exemple, la personne des RH qui connaît cet ancien système ne fait plus partie de l'entreprise).  Cela ne signifie pas que vous ne pouvez pas continuer; cela signifie simplement que vous devez le faire en comprenant que vous êtes en équilibre sur deux jambes. 

En passant, un client m'a dit récemment, « Je n'ai pas de jambes. Zut, je n'ai pas de tabouret.  Bien que cela ne soit pas courant, cela arrive de temps en temps. Ici, vous devrez peut-être poser plus de questions sur les données plutôt que sur les personnes.  (Astuce : il est toujours utile de poser les questions ci-dessous en rapport avec les données, ce qui aidera à son tour à vérifier ce que les gens disent).

  • Les données de ce champ correspondent-elles à ce que j'attendais ?
  • La gamme/variété de données correspond-elle à ce à quoi je m'attendais ?
  • Y a-t-il une quantité inhabituelle ou inattendue de valeurs « NULL » ?

Profiler les données

Comme indiqué dans le principe 6, il existe des moyens efficaces d'établir rapidement des KPI de base pour la validation. Il en va de même pour le profilage d'une source de données pour une meilleure compréhension. Certains points de données fréquents qui aident à établir ce profil incluent :

  • Nombre d'enregistrements
  • Plage de dates (et éventuels écarts)
  • Plage de valeurs
  • Valeur moyenne (et valeurs aberrantes)
  • Valeurs communes)

Cela fournit les connaissances nécessaires pour analyser les données, et fournit également une couche supplémentaire de validation via ce «contrôle de cohérence» consistant à examiner les données à partir de quelques perspectives standard.

Apprentissage actif continu

"Apprenez continuellement - il y a toujours "une chose de plus" à apprendre ! "~ Steve Jobs

Chaque interaction que vous avez avec les données peut vous apprendre quelque chose (confirmez ce que vous attendiez ou donnez des indices de l'inattendu).  Je ne peux pas vous dire combien de fois nous entendons le "Oh oui, j'ai oublié de te dire..." parce que lorsque vous regardez des années en arrière dans un ensemble de données, ces nuances ne sont pas toujours en tête. Si ces nuances ne sont pas prises en compte dans le cadre de l'analyse, vos résultats peuvent être faussés. 

Cherchez à en savoir plus sur ces types de scénarios dans votre ensemble de données.

Il y a eu un échec de rétention à un moment donné car le transfert de données vers le serveur d'archives a échoué pendant quelques semaines avant que nous ne l'attrapions.

Nous avons cessé d'utiliser le champ A pour X et avons commencé à utiliser les champs D et E l'année dernière.

Nous utilisons généralement le champ M pour déclarer et exécuter la paie, mais les données brutes se trouvent dans les champs Q, R, S et T.

Il y a tellement de nuances qui arrivent aux données dans le cours normal des affaires qu'il est raisonnable de supposer qu'il y en aura dans vos données. Cherchez à l'apprendre et à le comprendre tout au long de votre entreprise.


iDS fournit des solutions de données consultatives aux entreprises et aux cabinets d'avocats du monde entier, leur donnant un avantage décisif - à la fois dans et hors de la salle d'audience. Nos experts en la matière et nos stratèges de données se spécialisent dans la recherche de solutions aux problèmes de données complexes, garantissant que les données peuvent être exploitées comme un atout et non comme un handicap.

fr_FRFR