El sector de la salud es uno de los ámbitos que genera más volumen de datos: los registros médicos, las pruebas clínicas, las informaciones genéticas, los objetos conectados o las bases de datos son solo algunos ejemplos de las incontables fuentes de información que produce este sector. Ahora bien, ¿cuáles son los principales beneficios de la ciencia de datos para la salud? Agnès Pérez Millan y Laia Subirats Maté, profesoras e investigadoras de los Estudios de Informática, Multimedia y Telecomunicación de la UOC, lo analizan en este artículo.
1. Mejor calidad de servicio de los sistemas de salud
Hace años que se acuñó el término medicina 4P, que quiere decir predictiva, preventiva, personalizada y participativa, y la ciencia de datos puede hacer que la medicina sea más 4P. En cuanto a la predicción, puede ser útil para crear sistemas que realicen diagnósticos más precoces para que así se puedan curar antes las enfermedades. Del mismo modo, la ciencia de datos puede mejorar en gran medida la prevención de las enfermedades. Por ejemplo, el uso de sistemas de monitorización de la alimentación, el ejercicio físico o el sueño ha provocado una explosión de datos, los llamados big data, y la ciencia de datos permite analizar todo ese alud de información.
La ciencia de datos también ayuda a que la medicina sea más participativa; así, la línea conocida como ciencia ciudadana aplicada a la salud hace a los ciudadanos partícipes de su salud en primera persona. En estas iniciativas los ciudadanos pueden compartir datos y participar en proyectos científicos realizando tareas como, por ejemplo, anotar imágenes médicas. Todo ello hace que los ciudadanos entiendan mejor su salud y que, por tanto, puedan tomar decisiones más informadas sobre lo que les va bien y lo que no en materia de salud, además de permitir que conozcan más iniciativas científicas.
2. Medicina personalizada
En cuanto a la personalización, un ejemplo sería la información genómica de las personas, con la que se pueden personalizar todavía más los tratamientos; no solo tenemos más cantidad de datos, sino también algoritmos de recomendación que permiten ajustar mejor los tratamientos.
La inteligencia artificial (IA), tan de moda actualmente, también entra en juego y nos permite estudiar a los pacientes a nivel individual gracias a los datos históricos que se han ido recopilando a lo largo de los años; de esta manera, en un futuro podremos ofrecer un tratamiento específico según sus características. Sin embargo, debe tenerse en cuenta la ética que implican estos procesos y que los algoritmos necesitan estar muy entrenados porque no podemos asumir errores cuando tratamos la salud de las personas, como explicaremos con más detalle en otros puntos del artículo.
Para que la medicina sea personalizada se requieren una gran cantidad de datos y saber cómo tratarlos, de ahí la importancia de la ciencia de datos hoy en día.
3. Diferencias entre pacientes en una misma enfermedad
Actualmente gana peso la idea de que la definición de una enfermedad suele ser un nombre, pero eso no quiere decir que no haya subtipos dentro de cada una. Por ejemplo, si diagnostican cáncer a alguien, todo el mundo pregunta ¿de qué? Hemos asumido que no todos son iguales, pero cuando se ha respondido y tenemos un diagnóstico más concreto, eso no quiere decir que todas las personas que lo sufren sean iguales. Por ejemplo, en algunos casos son más agresivos y en otros menos. Aquí la ciencia de datos juega un papel importante.
Tener acceso a los datos y saber estudiarlos nos puede permitir identificar subtipos de pacientes que sufren una misma patología, ya que la gran cantidad de datos nos puede ayudar a detectar ciertas diferencias entre pacientes que pueden agruparlos en subtipos dentro de una patología para así definir un perfil más concreto.
4. Reducción de costes y pruebas en los sistemas de salud
Otra línea donde tiene impacto la ciencia de datos es la reducción de costes de los sistemas de salud, por diferentes motivos: mejora de la asignación de recursos, mejora de la ingeniería de procesos, tratamientos más eficientes y reutilización del conocimiento por medio de estándares internacionales y la representación formal de la información.
El acceso a miles de datos, ya sean actuales o históricos, permite estudiar si todas las pruebas que se realizan son necesarias. La ciencia nos permite valorar si se llegaría a las mismas decisiones clínicas con datos históricos, sin usar todo el conjunto de datos que se utilizaron. Eso haría posible detectar si todos eran necesarios o si con menos datos habríamos llegado al mismo punto.
Así pues, detectar pruebas que no son necesarias tiene dos grandes ventajas: el paciente no se tiene que someter a tantas pruebas y, por otra parte, para la Administración implica una reducción de costes en sanidad. Este hecho solo es posible gracias al aumento de datos que se ha producido en la actualidad, consecuencia del trabajo que se ha sido realizando durante todos estos años y que está haciendo que crezca la ciencia de datos.
5. Reducción de sesgos y desigualdades para la globalización de los modelos
La ciencia de datos también puede hacer que se reduzcan los sesgos y las desigualdades en medicina. Por ejemplo, hay toda una línea en la ciencia de datos de diseño de algoritmos justos que contribuye a que se reduzcan los sesgos. También existen iniciativas de catálogos de sesgos, así como iniciativas para describir los metadatos cuidadosamente y establecer los procesos necesarios para evitar los sesgos en medicina. No podemos olvidar a las poblaciones minoritarias, históricamente infrarrepresentadas tanto por lo que respecta a las enfermedades minoritarias, la etnia, el sexo y el género como la clase social.
Actualmente, nos encontramos ante un interés creciente, en todos los ámbitos, por entrenar algoritmos de IA que apoyen en la clínica, ya sea en el diagnóstico, la reducción de listas de espera, los costes, etc. En esta línea, la ciencia de datos desempeña un gran papel. Por un lado, para crear y entrenar los algoritmos necesarios a fin de lograr estos objetivos. Y, por el otro, por una cuestión muy importante: para poner sobre la mesa algunos aspectos que se deben tener en cuenta, como la necesidad de entrenar esos algoritmos con una cantidad elevada de datos para que sean fiables y reproducibles.
Si queremos que funcionen esos algoritmos con una alta fiabilidad y que se puedan acabar de implementar se necesita diversidad en los datos empleados: de sexos, de etnias, de países, etc. En resumen, necesitamos conjuntos de datos heterogéneos, que dificultan el entrenamiento de los algoritmos pero que son la única solución para lograr algoritmos fiables y reproducibles.