saltar al contenido
Fact Crashing™, Soluciones iDiscovery, Fact Crashing, Datos no estructurados, Datos estructurados, Datos, iDS,

Usar datos para dar forma a otros descubrimientos

Esta es la décima entrega de una serie de blogs sobre Fact Crashing™, la aceleración de la consideración de datos de ACCIÓN (ambiental, contextual, transaccional, IoT, operacional, de navegación) en beneficio de la resolución de disputas.

Hay 9 Principios de Choque de hechos™. Blogs anteriores cubrieron: 

Principio 1: Los datos son evidencia y son detectables

Principio 2: los datos deben abordarse temprano

Principio 2: inmersión profunda

Principio 3: Enmarcar los problemas de casos como consultas centradas en datos

Principio 4: Identificar, calificar y priorizar las fuentes de datos

Principio 5: Los Datos Están Sujetos a Obligaciones de Conservación y Protección

Principio 6: la confiabilidad de los datos comienza con la recopilación adecuada

Principio 7: la comprensión de los datos es necesaria para un análisis adecuado

Ahora, echemos un vistazo al principio ocho.


Una de las cosas interesantes de los datos estructurados es que los costos de tratar con datos estructurados son muy diferentes a los de los datos no estructurados.

La curva de costos de los datos no estructurados

Con datos no estructurados (correos electrónicos y documentos) estamos acostumbrados a una curva de costos lineal. Cada documento tiene un costo similar: el costo de la revisión humana. Las eficiencias tecnológicas pueden cambiar la pendiente del costo (menos costo por documento) o la duración del costo (terminar antes la revisión), pero, por lo demás, el costo de la revisión (y la revisión privilegiada) es lineal.


Ejemplo de la Curva de Costo para Datos No Estructurados

Para empeorar aún más la revisión de documentos, no es inusual en un litigio no saber, inicialmente, qué custodios, qué eventos, qué fechas son de mayor interés. Esta es la “niebla del litigio”. Para navegar por este desconocido, las partes tradicionalmente hacen lo que mejor saben hacer: revisar documentos y registros. Navegan a través del conocimiento institucional de la empresa registrado en correos electrónicos y revelado a través de entrevistas. Si bien es tradicional, este enfoque es costoso. No solo por el costo lineal de la revisión documental, sino por el amplio alcance inicial con el que se inician muchas investigaciones y litigios. Este costo lineal, más un amplio alcance, crea un doble impacto.

La curva de costos de los datos estructurados

Sin embargo, los datos estructurados tienen un perfil de costos muy diferente. Los datos estructurados cuestan más que los datos no estructurados en el front-end para garantizar que comprenda lo que representan los datos. Al mismo tiempo, después de esa inicialización, los datos estructurados cuestan mucho menos que los datos no estructurados sobre una base marginal (registro por registro).

Esto se debe, en parte, a que los registros de datos estructurados suelen ser muy consistentes de un registro a otro. No en el contenido, que puede variar de un registro a otro, sino en su formato, los tipos de valores que contienen y el rango de valores que pueden contener (dominio) o el espectro completo de valores que contienen (rango).

Una vez que se comprende la forma en que se completa y utiliza un campo en particular, esas características se pueden anticipar fácilmente y extrapolar rápidamente a registros adicionales. Por lo tanto, el costo marginal puede ser cercano a cero.

Sin embargo, el aprendizaje inicial de la forma de población, la aplicación, el tipo de datos, el formato, el dominio y el rango puede ser costoso. Por lo tanto, el costo inicial puede ser alto.

Por esta razón, el perfil de costos es una pendiente rápidamente descendente con un costo de bajo a cero por cada registro adicional. Tratar con 10.000 registros no es mucho menos costoso que tratar con 1.000.000, al menos desde una base de gestión y evaluación de datos.

Ejemplo de la Curva de Costo para Datos Estructurados

Como resultado del perfil de costos diferente, es económicamente atractivo tratar primero con datos estructurados y luego usar datos estructurados para refinar y aclarar el alcance y la relevancia de los datos no estructurados.

Por ejemplo, los datos de nómina y la codificación de horas a veces pueden aclarar mejor un período de clase para un caso de horas extras no pagadas. De manera similar, los miembros de clase putativos para un asunto de responsabilidad de productos podrían identificarse mejor a través de registros de ventas reales que a través de comunicaciones internas por correo electrónico.

Además, en algunos casos, los datos estructurados no solo pueden iluminar los límites del caso mejor que los datos no estructurados, sino que también pueden definir mejor qué datos no estructurados deben considerarse o revisarse.

Considere lo siguiente: imagine un caso de sincronización del mercado en el que el equipo del caso revisa cientos de miles de correos electrónicos. Luego usan esos correos electrónicos para determinar en qué transacciones bursátiles deben profundizar. El costo de revisar esos cientos de miles de correos electrónicos puede ser de millones de dólares. El enfoque alternativo de Fact Crashing es examinar las transacciones bursátiles, incluso cientos de millones de transacciones, para determinar qué transacciones son de interés y luego revisar los correos electrónicos más estrechamente relacionados con esas transacciones. Al priorizar los datos estructurados frente a los datos no estructurados, el costo (y la velocidad) de encontrar e investigar transacciones de interés, e incluso resolver la disputa, puede verse afectado drásticamente.

Debido a que el perfil de costos de los datos estructurados es tan diferente, el costo por registro es insignificante, pero el valor por registro no lo es. Como tal, los conjuntos de registros de alto volumen se convierten en un beneficio en lugar de un detrimento. Es un beneficio porque cada registro individual tiene un valor potencial y porque grandes colecciones de registros pueden revelar tendencias, cronologías, variaciones estadísticas y otras métricas de formas que los datos estructurados no pueden.

“The Smoking Gun es ahora la tendencia de fumar”

Como resultado, los datos estructurados se pueden usar para definir o dar forma a muchas de las dimensiones de un litigio determinado, que incluyen:

  • el periodo de clases
  • Los supuestos miembros de la clase
  • La exposición potencial
  • Las transacciones particulares en cuestión
  • Empleados potenciales (o custodios) de interés
  • Qué modelos de productos pueden ser defectuosos o problemáticos
  • Las fechas clave de las comunicaciones de interés
  • Etc. Etc. Etc.

A cambio, estas dimensiones, cuando se usan como filtros, pueden conducir a una gran eficiencia en la recopilación, el procesamiento, la categorización y la revisión de datos no estructurados de memorandos, correos electrónicos, mensajes de texto, mensajería instantánea, documentos y redes sociales.

En resumen, dado que los datos estructurados tienen una curva de costos (y una curva de beneficios) diferente a la de los datos no estructurados, no solo suele ser más económico tratar de resolver toda la disputa con los datos estructurados, incluso cuando no puede, es posible que pueda resolver una parte. de la disputa, y es posible que pueda limitar (moldear) el tamaño, la complejidad y los costos del descubrimiento de su documento.


iDS proporciona soluciones de datos de consulta a corporaciones y bufetes de abogados de todo el mundo, lo que les otorga una ventaja decisiva, tanto dentro como fuera de la sala del tribunal. Nuestros expertos en la materia y estrategas de datos se especializan en encontrar soluciones a problemas de datos complejos, lo que garantiza que los datos se puedan aprovechar como un activo y no como un pasivo.

es_ESES