Artigo traducido por un sistema de tradución automática. Máis información aquí.

O ‘data lake’ sanitario de España e outros proxectos de lago de datos no mundo

España apóiase nos Fondos de Recuperación Europeos paira crear o primeiro data lake mundial que reúna os datos sanitarios de todo un país
Por Natalia L. Pevida 16 de Febreiro de 2022
datos sanitarios
Imagen: Karolina Grabowska

A aplicación do big data en medicamento paira recompilar, analizar e tratar a información promete un cambio de paradigma paira investigar, previr e tratar diferentes enfermidades. España ten previsto a creación dun data lake ou lago de datos que promete situar ao país na vangarda da investigación. Analizamos en que consiste este proxecto pioneiro e vemos as propostas doutros países como China, Reino Unido ou Estados Unidos, ademais da idea europea.

O ‘data lake’ sanitario de España

Neste contexto, o Goberno de España, a través do Plan de Recuperación, Transformación e Resiliencia, ten previsto destinar 100 millóns de euros paira a creación do primeiro data lake mundial que reúna os datos sanitarios de todo un país. Un proxecto paira o que os expertos coinciden en sinalar á historia clínica electrónica, una ferramenta coa que España foi pioneira no mundo, como a principal fortaleza respecto da maioría de países europeos, onde as historias clínicas seguen sendo rexistradas en papel.

Este proxecto basearase no machine learning (ferramentas de aprendizaxe automática), esa subdisciplina dentro da intelixencia artificial definida como a capacidade que teñen as máquinas paira chegar a conclusións a partir do algoritmo. No caso do sistema sanitario español, o machine learning permitirá procesar os datos das historias clínicas paira establecer predicións, talles como o efecto dun tratamento no perfil dun paciente antes de que lle sexa fornecido, reducindo as probabilidades de erros e neglixencias, así como paira detectar factores de risco e emitir diagnósticos.

Paira procesar toda a información recompilada, utilizarase o Procesamiento da Linguaxe Natural (PNL), válido tanto paira construír bases de datos a partir de documentos médicos, como paira detectar e eliminar automaticamente información de identidade de historias clínicas paira así xerar conxuntos de datos anónimos. En definitiva, un novo ecosistema formado desde a integración do sistema sanitario cos investigadores e os axentes sociais paira o mellor coñecemento sobre a saúde e a enfermidade.

Outras experiencias no mundo

O proxecto español é pioneiro, pero a intelixencia artificial xa se emprega, desde hai uns anos, en diferentes proxectos por todo o mundo. Os grandes volumes de datos que manexan as institucións sanitarias dos países industrializados han inaugurado una tendencia no sector denominada Valuebased Healthcare (a atención da saúde baseada no valor), un paradigma centrado no valor que achegan ao paciente os sistemas de información capaces de intercambiar coñecemento.

Uno dos proxectos máis relevantes é o iniciado en China en 2017 e que aglutina 280 millóns de datos pertencentes á National Scientific Data Sharing Platform for Population and Health (NSDSPPH) categorizados en biomedicina, medicamento básico, medicamento clínico, saúde pública, medicamento tradicional chinesa, farmacoloxía, poboación e medicamento reprodutivo.

Pola súa banda, en EE. UU. dátalos lakes impulsan neste momento multitude de proxectos destinados ao medicamento personalizado. Uno deles é o levado a cabo nun hospital de Arizona, onde un proxecto baseado na intelixencia artificial ha permitido monitorizar as lesións renais derivadas do uso de certos medicamentos e desenvolver así un algoritmo que permite dosificar estes fármacos doutra maneira paira evitar ditas contraindicaciones.

Reino Unido tamén conta con proxectos senlleiros nesta área, como o chamado DataLoch. Este proxecto, desenvolvido na zona de Edimburgo, baséase en intercambiar e cruzar información integrada en tres fontes: sanidade pública, sanidade privada e asociacións de coidados. Creado tras a pandemia, o seu obxectivo é impulsar a investigación e a innovación a través do uso de datos.

A resposta europea: una base única

Tan importante como un data lake sanitario é o seu desenvolvemento dentro dun marco normativo que garanta os dereitos de privacidade e a protección de datos. Desde Bruxelas avógase por eliminar a compartimentación de datos sanitarios entre rexións, suprimindo as fronteiras sanitarias.

Una das súas aspiracións é que un cidadán poida adquirir en calquera farmacia europea un medicamento pautado en calquera país membro, sen recorrer a ningún procedemento burocrático, algo que xa é posible entre Finlandia e Eslovenia.

Con este fin, os Estados membros lanzaban en 2018 a Rede Europea de Datos e Evidencia de Saúde (EDHEN) paira crear en 2024 una rede federada de grandes datos paira estandarizar 100 millóns de datos médicos europeos, mediante a aplicación dun modelo que asegura que todas as bases de datos teñen a mesma maneira de estruturalos e etiquetarlos coa finalidade de que os investigadores poidan enviar a mesma pregunta de datos á vez. Por exemplo: “Cantas persoas con diabetes tipo 2, maiores de 55 anos, que toman certo tipo de medicamentos desenvolveron una complicación cardiovascular nos últimos 12 meses?”.