TEMA 1. BIG DATA EN SALUD. HACIA UNA SALUD PREDICTIVA Y PERSONALIZADA


1. INTRODUCCIÓN AL BIG DATA

Gracias al avance de la tecnología y la disponibilidad cada vez mayor de grandes volúmenes de datos, se está produciendo un cambio en la forma en que abordamos la atención sanitaria. Este cambio se está impulsando por el poder del big data en salud, que nos abre las puertas hacia una era de salud predictiva y personalizada.

El big data, que se refiere a la capacidad de recopilar, procesar y analizar grandes cantidades de información, está transformado numerosos ámbitos, y el de la salud no es una excepción. La recopilación masiva de datos de salud, a partir de historias clínicas electrónicas y registros de pacientes hasta imágenes médicas o incluso datos genómicos, está generando una valiosa fuente de información que puede ser utilizada para crear nuevo conocimiento y obtener una comprensión más profunda de la salud y las enfermedades.

En esta nueva era, la salud predictiva y personalizada puede convertirse en un objetivo alcanzable gracias a la utilización de big data. Los avances en la inteligencia artificial y el aprendizaje automático nos permiten analizar estos grandes conjuntos de datos de manera eficiente, identificar patrones (que los profesionales no somos capaces de detectar), descubrir correlaciones y, lo que es más importante, predecir riesgos y resultados de salud con una precisión cada vez mayor. Imaginemos poder detectar enfermedades en etapas tempranas, antes de que se manifiesten los primeros síntomas, o recibir un tratamiento específicamente diseñado para un perfil genético concreto de una persona.

Sin embargo, este cambio hacia una salud predictiva y personalizada también plantea desafíos importantes. El manejo y la protección de la privacidad de los datos de salud, la interpretación de los resultados de los algoritmos y la equidad en el acceso a la atención médica basada en datos son solo algunos de los aspectos éticos y prácticos que deben abordarse para garantizar un uso responsable y beneficioso del big data en salud.

2. APLICACIONES ACTUALES DEL BIG DATA

Una vez que podemos hacernos una idea de qué es el Big Data y de las innumerables fuentes de donde pueden proceder los datos que recoge, nos podemos hacer una idea de su envergadura. Pero ¿para qué sirve?, ¿por qué se le está dando tanta importancia en los últimos años?

A partir del Big Data podemos extraer perfiles (de comportamiento, de consumo, de riesgo, de rendimiento físico, de competitividad... o de cualquier otra característica que podamos imaginar) y estos patrones los podemos relacionar con algunos comportamientos determinados. Cuando esta relación ocurre en unas decenas o miles de casos puede ser explicada por el azar, ¿pero podremos decir lo mismo si este mismo patrón se mantiene constante en trillones de ocasiones? ¿o será una relación que ocurre por determinantes que pueden estar fuera de nuestro conocimiento pero que representan una realidad? 

Existen numerosos ejemplos de aplicaciones de Big Data en el sector empresarial, que se utilizan fundamentalmente para conocer a su público diana objetivo, para la selección de personal o solución de conflictos en una empresa. Conocer los patrones de consumo puede ser fácil para una determinada empresa a través de diferentes estrategias para conocer el comportamiento de consumo de un grupo determinado (grupo de edad, vecinos de un barrio o de una ciudad...) obteniendo, por ejemplo, los datos de compra a través de tarjetas de fidelización. Con estas tarjetas, aparentemente inofensivas o incluso generadoras de beneficios (descuentos, promociones...), estamos ofreciendo de forma gratuita información tremendamente valiosa a la empresa (hay que recordar que normalmente no hay nada gratis y cuando nos ofrecen algo, siempre estamos dando algo a cambio, normalmente información).

Se utiliza la tecnología Big Data para incrementar la seguridad frente a ciberataques de las organizaciones, en vigilancia y seguridad de fronteras, lucha contra el terrorismo y crimen organizado, contra el fraude, planes de seguridad ciudadana o planeamiento táctico de misiones e inteligencia militar. Ya hay sistemas predictivos de crímenes utilizando Big Data como el proyecto Crime Hot Spots (con una precisión del 70%) o un proyecto DDS (Decision Support System) del Cuerpo Nacional de Policía y de la Universidad de Granada, que puede predecir cuántos delitos y de qué tipo se van a producir en el próximo turno policial. ¿Llegaremos a la situación, como una famosa película que nos parecía de ciencia ficción, de poder hacer detenciones preventivas pre-crimen?  

3. APLICACIONES EN SALUD

Posiblemente las aplicaciones en salud sean unas de las más importantes que actualmente tiene el Big Data y sea aún un campo por explorar. El ámbito sanitario supone un gran reto para estas empresas por tres motivos principales:

  • Es un espacio por ahora no explorado y con gran potencial de negocio. En salud se generan gran cantidad de datos complejos de todo tipo (estructurado, semiestructurado y no estructurado) procedentes de múltiples fuentes.
  • La aplicación de la Big Data a la salud obtiene un beneficio intangible que es la mejora de la salud de los ciudadanos, que no se obtiene con la aplicación de estos procesos a otros campos del conocimiento.
  • Existen numerosos campos sanitarios y experiencias en los que se ha demostrado que la aplicación de técnicas Big Data pueden suponer beneficios sanitarios y las podemos clasificar en aplicaciones asistenciales, de gestión y de investigación.

En la asistencia de la práctica clínica la gestión de los datos a través de técnicas de Big Data nos puede ofrecer aplicaciones tanto en salud poblaciones (salud pública) como individual.

4. BENEFICIOS DEL USO DEL BIG DATA EN SALUD

Podemos establecer los siguientes beneficios y ventajas relacionados con el uso de Big Data en salud.

  • Optimización del almacenamiento de datos
  • Mejora de la gestión clínica
  • Herramienta de investigación
  • Reducción de costes
  • Adelanto de soluciones y previsión de posibles problemas

5. MIEDOS Y RIESGOS POTENCIALES

Se pueden plantear los siguientes miedos y riesgos potenciales del uso de Big Data:

  • El problema de la privacidad: la generación de datos en salud hasta ahora se producía de manera exclusiva por el sanitario de forma directa o indirecta. 
  • La falta de consentimiento informado: El uso del Big Data en salud puede plantear desafíos en términos de obtener un consentimiento informado adecuado de los individuos cuyos datos se están utilizando. 
  • La discriminación y el sesgo: El análisis de Big Data puede llevar a la discriminación y el sesgo si no se maneja correctamente. 
  • La seguridad de los datos: El manejo de grandes volúmenes de datos en salud conlleva riesgos de seguridad. 
  • La falta de transparencia y explicabilidad: Los modelos de Big Data en salud a menudo son complejos y difíciles de entender para las personas no expertas. 
  • El riesgo de dependencia excesiva: Si bien el uso del Big Data en salud puede tener beneficios significativos, existe el riesgo de depender demasiado de los datos y algoritmos, descuidando otros aspectos importantes de la atención médica, como la relación médico-paciente, el juicio clínico y la experiencia profesional. 

6. USO DE DATA LAKES EN SALUD

Un data lake es un repositorio centralizado diseñado para almacenar, procesar y proteger grandes cantidades de datos estructurados, semiestructurados o no estructurados. Puede almacenar datos en su formato nativo y procesar cualquier variedad de datos, ignorando los límites de tamaño.

En España, existen varios proyectos y organizaciones que están trabajando en el desarrollo y utilización de data lakes en el ámbito de la salud como el Instituto de Salud Carlos III (ISCIII) que a través de su Plataforma de Recursos Biomoleculares y Bioinformáticos (PRB2) gestiona una infraestructura que permite el almacenamiento y análisis de datos biomédicos para la investigación en salud. La red de Recursos Biomoleculares y Bioinformáticos, PRB2-ISCIII, incluye 5 plataformas: Plataforma en Red de Proteómica (ProteoRed), Centro Nacional de Genotipado (CeGen), Instituto Nacional de Bioinformática (INB) y Banco Nacional de ADN (BNADN) y Banco Nacional de Líneas Celulares (BNLC). El Instituto Nacional de Estadística (INE) es el organismo encargado de la recopilación y análisis de datos estadísticos en España.