Gerenciamento de dados mestres (MDM)

Introdução

Em geral

vinculação de registro ou vinculação de registro (também conhecida como correspondência de dados, resolução de entidade e muitos outros termos) é a tarefa de encontrar registros de "registro (banco de dados)" em um conjunto de dados que se referem à mesma entidade em diferentes fontes de dados (por exemplo, arquivos de dados, livros, sites e bancos de dados). A vinculação de registros é necessária ao unir diferentes conjuntos de dados baseados em entidades que podem ou não compartilhar um identificador comum (por exemplo, chave de banco de dados, URI, número de identificação nacional), o que pode ser devido a diferenças na forma de registro, local de armazenamento ou estilo ou preferência de retenção. Um conjunto de dados que passou por reconciliação orientada a RL pode ser chamado de ligação cruzada. A vinculação de registros também é conhecida como vinculação de dados em muitas jurisdições, mas os dois são o mesmo processo.

Convenção de nomenclatura

"Ligação de registros" é o termo usado por estatísticos, epidemiologistas e historiadores, entre outros, para descrever o processo de união de registros de uma fonte de dados a outra que descreve a mesma entidade. No entanto, muitos outros termos são usados para este processo. Infelizmente, esta profusão de terminologia levou a poucas referências cruzadas entre estas comunidades de investigação.[1][2].

Os cientistas da computação costumam se referir a isso como “correspondência de dados” ou “problema de identidade do objeto”. Os aplicativos comerciais de correio e banco de dados chamam isso de "processamento de mesclagem/eliminação" ou "limpeza de lista". Outros nomes usados para descrever o mesmo conceito são: "correferência/entidade/identidade/nome/resolução de registro", "desambiguação/vinculação de entidade"), "correspondência difusa", "detecção de duplicatas", "desduplicação", "correspondência de registros", "reconciliação (referência)", "identificação de objeto", "integração de dados/informações" e "conflagração".

Embora compartilhem nomes semelhantes, a vinculação de registros e os dados vinculados são duas abordagens diferentes para processamento e estruturação de dados. Embora ambos envolvam a identificação de entidades correspondentes em diferentes conjuntos de dados, a ligação de registos iguala normalmente “entidades” a indivíduos humanos; O Linked Data baseia-se, em vez disso, na possibilidade de interligar qualquer recurso web entre conjuntos de dados, utilizando um conceito correspondentemente mais amplo de identificador, nomeadamente um URI.

Gerenciamento de dados mestres (MDM)

Navegación

Gerenciamento de dados mestres (MDM)

Introdução

Em geral

Convenção de nomenclatura

Gerenciamento de dados mestres (MDM)

Introdução

Em geral

Convenção de nomenclatura

História

Métodos

Pré-processamento de dados

Resolução de entidade

Correspondência de dados

Vinculação determinística de registros

Fusão de log probabilístico

Modelo Matemático

Aplicativos