Gestión de Datos Maestros (MDM)

Introducción

El enlace de registro o vinculación de registro (también conocido como cotejo de datos, resolución de entidad, y muchos otros términos) es la tarea de encontrar registros "Registro (base de datos)") en un conjunto de datos que se refieren a la misma entidad en diferentes fuentes de datos (p. ej., archivos de dato, libros, sitios web, y bases de datos). La vinculación de registro es necesario cuando se unen diferentes conjuntos de datos basados en entidades que pueden o no puede compartir un identificador común (p. ej., clave de base de datos, URI, número de identificación nacional), lo que puede deberse a diferencias en la forma del registro, la ubicación de almacenamiento, o el estilo de conservación o preferencia. Un conjunto de datos que se ha sometido a una reconciliación RL-orientada puede denominarse entrecruzado. La vinculación de registro se conoce también como vinculación de datos en muchas jurisdicciones, pero los dos son el mismo proceso.

Convenio de denominación

"Vinculación de registro" es el término utilizado por estadísticos, epidemiólogos e historiadores, entre otros, para describir el proceso de unión de los registros de una fuente de datos con otra que describe la misma entidad. Sin embargo, se utilizan muchos otros términos para este proceso. Desgraciadamente, esta profusión terminológica ha dado lugar a pocas referencias cruzadas entre estas comunidades de investigación.[1][2].

Los informáticos suelen referirse a ello como "cotejo de datos" o como el "problema de la identidad de los objetos". Las aplicaciones comerciales de correo y bases de datos lo denominan "procesamiento de fusión/purga" o "lavado de listas". Otros nombres utilizados para describir el mismo concepto son: "resolución de correferencia/entidad/identidad/nombre/registro", "desambiguación/vinculación de entidades")", "coincidencia difusa", "detección de duplicados", "deduplicación", "coincidencia de registros", "reconciliación (de referencias)", "identificación de objetos", "integración de datos/información" y "conflagración".

Aunque comparten nombres similares, la vinculación de registros y los Datos enlazados son dos enfoques distintos para el procesamiento y la estructuración de datos. Aunque ambos implican la identificación de entidades coincidentes en diferentes conjuntos de datos, la vinculación de registros equipara de forma estándar las "entidades" con los individuos humanos; en cambio, los Datos Enlazados se basan en la posibilidad de interconectar cualquier recurso web entre conjuntos de datos, utilizando un concepto de identificador correspondientemente más amplio, a saber, un URI.

Gestión de Datos Maestros (MDM)

Navegación

Gestión de Datos Maestros (MDM)

Introducción

Convenio de denominación

Gestión de Datos Maestros (MDM)

Introducción

Convenio de denominación

Historia

Métodos

Preprocesamiento de datos

Resolución de entidades

Cotejo de datos

Vinculación determinista de los registros

Fusión de registro probabilisticos

Modelo Matemático

Aplicaciones