Ao comparar pacientes com base em dados demográficos, existem recomendações sobre quais campos devem corresponder para que o paciente seja o "Mesmo Paciente"?
Sei que os algoritmos serão diferentes para diferentes implementações, só estou curioso para saber se existem práticas recomendadas ou recomendações sobre esse processo.
First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip
etc?
Respostas:
Há este ótimo ensaio (em espanhol, desculpe), escrito por Pablo Pazos, um engenheiro de CS do Uruguai que trabalha com TI em saúde desde 2006 e fez algumas grandes contribuições para o campo, no qual ele descreve um algoritmo para fazer isso.
Você pode executar o artigo através de um tradutor, mas o essencial é que as informações básicas para determinar a identidade de uma pessoa são seus nomes e sobrenomes (de pai e mãe), sexo e data de nascimento. Curiosamente, ele exclui especificamente números de identificação como SSN de seus algoritmos de correspondência de identidade, já que "qualquer tipo de identificador NÃO faz parte de sua identidade" (acho que esse ponto pode ser discutível). Além disso, ele exclui atributos como endereço, números de telefone etc. porque eles não estão realmente relacionados à identidade de alguém, não estão associados a "quem realmente é".
Além disso, ele atribui "pesos" diferentes a cada um dos atributos anteriores, assim:
Com as correspondências encontradas em cada um desses atributos, ele descreve uma metodologia para obter um "índice de correspondência de concordância" composto com o qual as comparações entre registros podem ser possíveis. Além disso, são possíveis correspondências "parciais" nos atributos de nome usando algoritmos como a distância de Levenshtein .
Boa leitura, IMO. Desculpe, está em espanhol, mas espero ter conseguido transmitir suas principais idéias.
fonte
Não existe um algoritmo mágico único para a correspondência de pacientes, e duvido que exista.
Para iniciantes, existem variações regionais. Como MMattoli apontou, o que funciona bem em um hospital urbano dos Estados Unidos provavelmente não se encaixará bem em uma clínica rural australiana que trata de aborígines.
Além disso, sites individuais têm visões diferentes sobre tolerância a falhas. Se você correspondesse apenas quando tinha absoluta certeza , obteria muitas partidas perdidas. Isso causa registros duplicados de pacientes, o que cria um conjunto totalmente diferente de problemas. A maioria dos sites estará disposta a se certificar com certeza , mas com que certeza é suficiente? Peça a 10 pessoas e você receberá 12 respostas.
Portanto, o "melhor" algoritmo será configurável, para que seus clientes possam ajustá-lo para atender às suas necessidades.
Ao considerar uma correspondência, diferentes campos oferecem diferentes graus de confiança.
Os identificadores específicos da área de saúde oferecem mais confiança, pois seu objetivo é identificar exclusivamente a pessoa no sistema de saúde. Os hospitais geralmente se esforçam para garantir que eles não sejam duplicados.
Exemplos:
Outros identificadores de pacientes também podem oferecer alta confiança, dependendo do sistema. Por exemplo, uma identificação militar é provavelmente muito relevante em um hospital militar.
Exemplos:
Na ausência de identificadores únicos, é preciso recorrer a informações demográficas. É desaconselhável para corresponder em qualquer um campo, mas o jogo de campo mais demográfica, mais confiante a partida.
As coisas sobre uma pessoa que muitas vezes não mudam são boas para correspondência:
Porém, informações ainda mais maleáveis podem ser consideradas na partida para aumentar a confiança:
fonte
Também vale a pena conferir os sobrenomes anteriores, pois eles costumam mudar.
fonte
Além das combinações óbvias das três seguintes, apresentadas na sua pergunta
Eu pensaria em adicionar
phone number (Home and/or Cell)
à lista. Hoje em dia é bastante comum e todos terão um número único e, mesmo que algumas vezes as pessoas alterem seus números de telefone, os números de telefone mais antigos são lembrados pela maioria das pessoas, portanto podem ser úteis.Descobrimos que o endereço geralmente sofre várias grafias e várias formas de renderização, especialmente em países como a Índia, onde as pessoas usam um idioma local e os softwares de gerenciamento de pacientes 'ainda' usam o inglês.
fonte
O gênero nos registros parece freqüentemente derivado do primeiro nome. Vi uma variação crescente de gênero para estrangeiros, quando não podemos derivar o gênero do nome.
Na Alemanha, temos algumas variações adicionais de nomes que contêm o 'Umlaute' como 'äöü', que às vezes é substituído por 'ae oe ue'.
fonte
Meu pensamento está na ordem abaixo 1). SSN, Sobrenome e primeiros 5 caracteres do primeiro nome 2). SSN, data de nascimento e primeiros 5 caracteres do primeiro nome 3). SSN, data de nascimento e sobrenome 4). SSN, Sexo, Data de nascimento 5). Sobrenome, primeiros 5 caracteres do primeiro nome, cidade e CEP
fonte
Este é um problema muito difícil nos EUA. Os nomes não são únicos e geralmente mudam durante a vida de uma pessoa ou são apresentados de maneira diferente (Rob versus Robert, por exemplo), portanto nunca podem ser usados para identificar o paciente, exceto em conjunto com algumas informações mais confiáveis. O número e o provedor do seguro de saúde mudam com muito mais frequência e podem ser os mesmos para vários membros da família. O SSN é supostamente único, mas há uma fraude em torno dele. O mesmo acontece com o número de liscense do motorista, que é claro que nem todos terão.
Pessoalmente, eu começaria com o número da apólice de seguro e a combinação de data de nascimento e nome, depois ssn e combinação de data de nascimento e nome. Eu verificaria o endereço e o telefone para me dar uma garantia adicional quando combinados, mas não muito peso se não combinassem. Additonally, eu usaria o tipo sanguíneo como fator de exclusão, se for conhecido (e todos sabemos que os vampiros do hospital estarão colhendo amostras de sangue), pois isso não muda. A correspondência de nomes teria que ser uma correspondência difusa devido ao problema de varição de nomes. Geralmente, outras coisas devem procurar uma correspondência exata, primeiro, uma correspondência difusa se a confiança do nome for realmente alta (poderia ter sido um erro de digitação no SSN).
fonte