Article traduït per un sistema de traducció automàtica. Més informació, aquí.

El ‘data lake’ sanitari d’Espanya i altres projectes de llac de dades en el món

Espanya se secunda en els Fons de Recuperació Europeus per crear el primer data lake mundial que reuneixi les dades sanitàries de tot un país
Per Natalia L. Pevida 16 de febrer de 2022
datos sanitarios
Imagen: Karolina Grabowska

L’aplicació del big data en medicina per recopilar, analitzar i tractar la informació promet un canvi de paradigma per investigar, prevenir i tractar diferents malalties. Espanya té previst la creació de un data lake o llac de dades que promet situar a el país en la avantguarda de la recerca . Analitzem en què consisteix aquest projecte pioner i veiem les propostes d’altres països com Xina, Regne Unit o Estats Units, a més de la idea europea.

El ‘data lake’ sanitari d’Espanya

En aquest context, el Govern d’Espanya, a través del Pla de Recuperació, Transformació i Resiliència, té previst destinar 100 milions d’euros per la creació del primer data lake mundial que reuneixi les dades sanitàries de tot un país . Un projecte pel que els experts coincideixen en assenyalar a la història clínica electrònica , una eina amb la que Espanya va ser pionera en el món, com la principal fortalesa respecte a la majoria de països europeus, on les històries clíniques segueixen sent registrades en paper.

Aquest projecte es basarà en el machine learning (eines d’aprenentatge automàtic), aquesta subdisciplina dins de la intel·ligència artificial definida com la capacitat que tenen les màquines per arribar a conclusions a partir de l’algorisme. En el cas del sistema sanitari espanyol, el machine learning permetrà processar les dades de les històries clíniques per establir prediccions, com ara l’efecte d’un tractament en el perfil d’un pacient abans que li sigui subministrat, reduint les probabilitats d’errors i negligències, així com per detectar factors de risc i emetre diagnòstics.

Per processar tota la informació recopilada, es utilitzarà el Processament de el Llenguatge Natural ( PNL ) , vàlid tant per construir bases de dades a partir de documents mèdics, com per detectar i eliminar automàticament informació d’identitat d’històries clíniques per així generar conjunts de dades anònimes. En definitiva, un nou ecosistema format des de la integració del sistema sanitari amb els investigadors i els agents socials pel millor coneixement sobre la salut i la malaltia.

Altres experiències en el món

El projecte espanyol és pioner, però la intel·ligència artificial ja s’empra, des de fa uns anys, en diferents projectes per tot el món. Els grans volums de dades que manegen les institucions sanitàries dels països industrialitzats han inaugurat una tendència en el sector denominada Valuebased Healthcare (l’atenció de la salut basada en el valor), un paradigma centrat en el valor que aporten al pacient els sistemes d’informació capaces d’intercanviar coneixement.

Un dels projectes més rellevants és l’iniciat en Xina en 2017 i que aglutina 280 milions de dades pertanyents a la National Scientific Data Sharing Platform for Population and Health (NSDSPPH) categoritzats en biomedicina, medicina bàsica, medicina clínica, salut pública, medicina tradicional xinesa, farmacologia, població i medicina reproductiva.

Per part seva, en EUA els dates lakes impulsen en aquest moment multitud de projectes destinats a la medicina personalitzada. Un d’ells és el dut a terme en un hospital d’Arizona, on un projecte basat en la intel·ligència artificial ha permès monitorar les lesions renals derivades de l’ús de certs medicaments i desenvolupar així un algorisme que permet dosar aquests fàrmacs d’una altra manera per evitar aquestes contraindicacions.

Regne Unit  també conta amb projectes capdavanters en aquesta àrea, com l’anomenat DataLoch. Aquest projecte, desenvolupat en la zona d’Edimburg, es basa en intercanviar i creuar informació integrada en tres fonts: sanitat pública, sanitat privada i associacions de cures. Creat rere la pandèmia, el seu objectiu és impulsar la recerca i la innovació a través de l’ús de dades.

La resposta europea: una base única

Tan important com un data lake sanitari és el seu desenvolupament dins d’un marc normatiu que garanteixi els drets de privacitat i la protecció de dades. Des de Brussel·les s’advoca per eliminar la compartimentació de dades sanitàries entre regions, suprimint les fronteres sanitàries .

Una de les seves aspiracions és que un ciutadà pugui adquirir en qualsevol farmàcia europea un medicament pautat en qualsevol país membre , sense recórrer a cap procediment burocràtic, una cosa que ja és possible entre Finlàndia i Eslovènia.

A aquest efecte, els Estats membres llançaven en 2018 la Xarxa Europea de Dades i Evidència de Salut (EDHEN) per crear en 2024 una xarxa federada de grans dades per estandarditzar 100 milions de dades mèdiques europees, mitjançant l’aplicació d’un model que assegura que totes les bases de dades tenen la mateixa manera d’estructurar-los i etiquetar-los amb la finalitat de què els investigadors puguin enviar la mateixa pregunta de dades alhora. Per exemple: “Quantes persones amb diabetis mena 2, majors de 55 anys, que prenen certa mena de medicaments han desenvolupat una complicació cardiovascular en els últims 12 mesos?”.