Aller au contenu
Fact Crashing, Fact Crashing™, Discovery, iDiscovery Solutions, eDiscovery, Data Collection, Collection, Data, Data Reliablity

La fiabilité des données commence par une collecte appropriée

Ceci est le huitième volet d'une série de blogs sur Fact Crashing™, l'accélération de la prise en compte des données ACTION (Ambient, Contextual, Transactional, IoT, Operational, Navigational) au profit de la résolution des litiges.

Il y a 9 principes de Crash de faits™. Les blogs précédents couvraient : 

Principe 1 : Les données sont des preuves et sont détectables

Principe 2 : Les données doivent être traitées tôt

Principe 2 : Analyse approfondie

Principe 3 : Définir les problèmes de cas comme des requêtes centrées sur les données

Principe 4 : Identifier, qualifier et hiérarchiser les sources de données

Principe 5 : Les données sont soumises aux obligations de conservation et de protection

Examinons maintenant le sixième principe.


"Donnez-moi six heures pour abattre un arbre et je passerai les quatre premières à aiguiser la hache."

~ Abraham Lincoln

Ce concept est absolument vrai lorsqu'il s'agit de collecter des données - planifiez et préparez-vous avant les efforts de force brute. Tout au long du processus de collecte, la documentation est essentielle. Aucun détail n'est trop petit.

Étape 1 : Comprendre les points de collecte possibles

Il est important de comprendre les différents points de collecte, souvent identifiés dans le cadre de Principe 3 (Identifier et hiérarchiser) mais pas toujours vérifié pour la défense de la collection. Vous pouvez vous retrouver à poser des questions simples comme "Quels sont tous les points d'accès, les points de rapport, les rapports par défaut/préparés disponibles, etc." Parfois, le point de collecte le plus simple peut être un rapport déjà disponible, tandis que d'autres fois, il nécessite une requête personnalisée et/ou un accès via l'interface de programmation d'application (API). 

Quel que soit le point de collecte, il y a quelques éléments que vous souhaitez documenter dans le cadre du processus de collecte.

  • Identifier tous les points d'accès (par exemple, où/comment pouvez-vous obtenir les données)
  • Déterminer le meilleur point d'accès utilisé pour la collecte
  • Critères de documentation utilisés (par exemple, plage de dates, filtre(s), etc.)
  • Si rapport, version de ce rapport
  • S'il s'agit d'une requête personnalisée, documentez cette requête
  • Enregistrer la ou les personnes impliquées dans la collecte

N'oubliez pas que tous les points d'accès ne sont pas créés de la même manière et, par conséquent, vous devez toujours comprendre ce qui peut être disponible via un point d'accès mais pas un autre.

Étape 2 : Échantillon de données

Bien qu'il puisse être tentant d'« aller de l'avant et d'exécuter simplement le rapport », exécutez un exemple d'exportation/rapport qui vous permettra d'évaluer l'exactitude de la collecte avant d'avoir un impact potentiel sur l'entreprise. Par exemple, si vous avez une période de trois ans en question, choisissez un mois ou deux qui ont le plus de systèmes en commun et demandez les données pour ce mois. Voici quelques domaines dans lesquels des exemples de données peuvent être utiles :

  • jeidentifier les champs supplémentaires qui doivent être inclus
  • Identifier les anomalies de données inattendues dans certains champs
  • Identification des valeurs de recherche supplémentaires qui doivent être définies
  • Récemment, nous avons effectué cet exercice précis, en choisissant un seul mois contenant des données de tous les systèmes disponibles en question. Cela nous a permis non seulement de valider les requêtes de collecte, mais également d'évaluer comment les analyses potentielles seraient effectuées afin que nous puissions hiérarchiser davantage les efforts.

Étape 3 : Collecter (c'est-à-dire extraire)

Maintenant, il est temps d'obtenir toutes les données. Avant d'appuyer sur le gros bouton vert GO, gardez toujours à l'esprit que des requêtes plus volumineuses peuvent avoir un impact sur les opérations commerciales. Par conséquent, la prise en compte du moment de la collecte doit toujours faire partie de votre processus. 

Avant de collecter l'intégralité de l'ensemble de données, chaque fois qu'il est disponible, établissez tout KPI qui peut vous aider à valider l'exportation (voir ci-dessous pour des suggestions). Alors que de nombreux systèmes peuvent fournir ces informations et/ou des rapports d'erreurs, tous ne sont pas construits de cette façon, donc être en mesure de valider devient une étape critique.

N'oubliez pas de documenter l'ensemble du processus afin que, si nécessaire, il puisse être répété. Pouvoir répéter une collecte n'est pas seulement bon pour la justesse, mais est également souvent utilisé lorsque des critères mis à jour sont fournis (par exemple, une plage de dates étendue). 

Étape 4 : Valider et vérifier

C'est à ce moment-là que nous posons des questions telles que « Qu'espérons-nous obtenir ? Avons-nous obtenu ce que nous attendions ? Le client nous a-t-il envoyé ce qu'il pense nous avoir envoyé ? »

Le but ici est de valider les attentes par rapport à la réalité. Certaines routines très complexes peuvent être utilisées, mais même les plus simples peuvent aider à détecter les ajustements simples qui doivent être effectués avant l'analyse. Tenez compte des points suivants lorsque vous cherchez à valider une collection.

  • Plage de dates
  • Nombre d'enregistrements
  • Nombre de champs
  • Nombre d'entités
  • Somme de contrôle

Si la validation consiste à s'assurer que vous avez correctement transmis les informations d'un point A à un point B, la vérification consiste à s'assurer que vous disposez des bonnes données. La comparaison des données avec des rapports contemporains (par exemple, gérer un solde de compte) ou historiques (par exemple, des états financiers de fin d'année) peut garantir que vous n'avez pas trop ou pas assez de données collectées. C'est aussi pourquoi il peut être plus utile de collecter dans une portée suffisante pour confirmer par rapport à ces types de rapports, puis d'effectuer un filtrage supplémentaire à partir du corpus d'extraction initial.

Vous devez documenter ces attentes avant la collecte. N'oubliez pas que la documentation est un élément clé des collections appropriées.

Étape 5 : Inventaire et magasin

Trop souvent, nous voyons l'analyse commencer immédiatement, mais vous devez d'abord documenter l'inventaire de tout ce qui est reçu, ainsi que maintenir cet inventaire dans votre système d'enregistrement avec une copie « originale » des données stockées pour le dossier.


iDS fournit des solutions de données consultatives aux entreprises et aux cabinets d'avocats du monde entier, leur donnant un avantage décisif - à la fois dans et hors de la salle d'audience. Nos experts en la matière et nos stratèges de données se spécialisent dans la recherche de solutions aux problèmes de données complexes, garantissant que les données peuvent être exploitées comme un atout et non comme un handicap.

fr_FRFR