saltar al contenido
Fact Crashing, Fact Crashing™, Discovery, Soluciones iDiscovery, eDiscovery, Recopilación de datos, Recopilación, Datos, Confiabilidad de datos

La confiabilidad de los datos comienza con la recopilación adecuada

Esta es la octava entrega de una serie de blogs sobre Fact Crashing™, la aceleración de la consideración de datos de ACCIÓN (ambiental, contextual, transaccional, IoT, operacional, de navegación) en beneficio de la resolución de disputas.

Hay 9 Principios de Choque de hechos™. Blogs anteriores cubrieron: 

Principio 1: Los datos son evidencia y son detectables

Principio 2: los datos deben abordarse temprano

Principio 2: inmersión profunda

Principio 3: Enmarcar los problemas de casos como consultas centradas en datos

Principio 4: Identificar, calificar y priorizar las fuentes de datos

Principio 5: Los Datos Están Sujetos a Obligaciones de Conservación y Protección

Ahora, echemos un vistazo al sexto principio.


“Dame seis horas para cortar un árbol y pasaré las primeras cuatro afilando el hacha”.

~Abraham Lincoln

Este concepto es absolutamente cierto cuando se trata de recopilar datos: planifique y prepárese antes de los esfuerzos de fuerza bruta. A lo largo del proceso de recolección, la documentación es fundamental. Ningún detalle es demasiado pequeño.

Paso 1: comprender los posibles puntos de recogida

Es importante comprender los diversos puntos de recolección, a menudo identificados como parte de Principio 3 (Identificar y Priorizar) pero no siempre examinada para defender la colección. Es posible que se encuentre haciendo preguntas simples como "¿Cuáles son todos los puntos de acceso, puntos de informes, informes predeterminados/enlatados disponibles, etc.?" A veces, el punto de recopilación más fácil puede ser un informe que ya está disponible, mientras que otras veces requiere una consulta personalizada y/o acceso a través de la interfaz de programación de aplicaciones (API). 

Independientemente del punto de recolección, hay algunos elementos que desea documentar como parte del proceso de recolección.

  • Identifique todos los puntos de acceso (p. ej., dónde/cómo puede obtener los datos)
  • Determinar el mejor punto de acceso utilizado para la recolección
  • Criterios de documentos utilizados (p. ej., intervalo de fechas, filtro(s), etc.)
  • Si Informe, versión de ese Informe
  • Si es una consulta personalizada, documente esa consulta
  • Registre la(s) persona(s) involucrada(s) en la recolección

Recuerde, no todos los puntos de acceso se crean de la misma manera y, por lo tanto, siempre debe comprender qué puede estar disponible a través de un punto de acceso pero no de otro.

Paso 2: datos de muestra

Si bien puede ser tentador "continuar y simplemente ejecutar el informe", ejecute una exportación/informe de muestra que le permitirá evaluar la precisión de la recopilación antes de que tenga un impacto potencial en el negocio. Por ejemplo, si tiene un período de tiempo de tres años en cuestión, elija uno o dos meses que tengan la mayoría de los sistemas en común y solicite los datos de ese mes. Algunas áreas en las que los datos de muestra pueden ayudar incluyen:

  • Iidentificar campos adicionales que deben incluirse
  • Identificar anomalías de datos inesperadas en ciertos campos
  • Identificar valores de búsqueda adicionales que deben definirse
  • Recientemente, realizamos este mismo ejercicio, eligiendo un solo mes que tuviera datos de todos los sistemas disponibles en cuestión. Esto nos permitió no solo validar las consultas de recopilación, sino también evaluar cómo se realizarían los análisis potenciales para que pudiéramos priorizar aún más los esfuerzos.

Paso 3: Recolectar (también conocido como Extraer)

Ahora es el momento de obtener todos los datos. Antes de presionar el botón verde grande GO, siempre tenga en cuenta que las consultas más grandes pueden afectar las operaciones comerciales. Por lo tanto, la consideración del momento de la recolección siempre debe ser parte de su proceso. 

Antes de recopilar todo el conjunto de datos, siempre que esté disponible, establezca cualquier KPI que pueda ayudarlo a validar la exportación (consulte las sugerencias a continuación). Si bien muchos sistemas pueden proporcionar esta información y/o informes de errores, no todos están construidos de esa manera, por lo que poder validar se convierte en un paso crítico.

Recuerde, documente todo el proceso para que, si es necesario, pueda repetirse. Ser capaz de repetir una colección no solo es bueno para la defensa, sino que también se usa a menudo cuando se proporcionan criterios actualizados (p. ej., rango de fechas ampliado). 

Paso 4: validar y verificar

Aquí es cuando hacemos preguntas como “¿Qué esperamos obtener? ¿Conseguimos lo que esperábamos? ¿El cliente nos envió lo que cree que nos envió?”

El objetivo aquí es validar la expectativa frente a la realidad. Hay algunas rutinas muy complejas que se pueden usar, pero incluso las más simples pueden ayudar a detectar ajustes simples que deben realizarse antes del análisis. Considere lo siguiente cuando busque validar una colección.

  • Rango de fechas
  • Número de registros
  • Recuento de campos
  • Recuento de entidades
  • Suma de comprobación

Si la validación garantiza que transmitió correctamente la información del punto A al punto B, la verificación garantiza que tiene los datos correctos. La comparación de datos con informes contemporáneos (es decir, ejecutar un saldo de cuenta) o históricos (por ejemplo, finanzas de fin de año) puede brindarle la confianza de que no tiene datos recopilados por encima o por debajo. Esta es también la razón por la que puede ser más valioso recopilar en un alcance suficiente para confirmar este tipo de informes y luego realizar un filtrado adicional del corpus de extracción inicial.

Debe tener estas expectativas documentadas antes de la recolección. Recuerde… la documentación es un elemento clave de las colecciones adecuadas.

Paso 5: Inventario y Tienda

Con demasiada frecuencia, vemos que el análisis comienza de inmediato, pero primero debe documentar el inventario de todo lo recibido, así como mantener ese inventario en su sistema de registro con una copia "original" de los datos almacenados para el archivo.


iDS proporciona soluciones de datos de consulta a corporaciones y bufetes de abogados de todo el mundo, lo que les otorga una ventaja decisiva, tanto dentro como fuera de la sala del tribunal. Nuestros expertos en la materia y estrategas de datos se especializan en encontrar soluciones a problemas de datos complejos, lo que garantiza que los datos se puedan aprovechar como un activo y no como un pasivo.

es_ESES