banner

Blog

May 28, 2023

Cómo la privacidad arquitectónica

Fuente: Getty Images

31 de agosto de 2023: el análisis de datos es fundamental para mejorar la calidad de la atención médica y los avances médicos, pero proteger los datos de los pacientes debe ser una prioridad durante todo el proceso.

Las tecnologías de mejora de la privacidad (PET) son herramientas críticas que las organizaciones de atención médica pueden aprovechar para la privacidad y seguridad de los datos. Los PET se pueden dividir en tres categorías: algorítmicos, arquitectónicos y de aumento. Para respaldar los análisis de atención médica, se recomienda una combinación de estos tipos.

Esta es la segunda entrega de una serie que analiza cada categoría de PET y sus casos de uso en atención médica, luego de una inmersión profunda en los PET algorítmicos.

Aquí, HealthITAnalytics explorará el segundo tipo: PET arquitectónicos.

A diferencia de los PET algorítmicos, que alteran la forma en que se representan los datos para proteger la privacidad, los PET arquitectónicos se ocupan de la estructura de los datos o de los entornos informáticos. Estos PET se centran en el intercambio confidencial de información sin compartir los datos subyacentes.

El aprendizaje federado es un enfoque que se utiliza a menudo en el desarrollo de modelos de inteligencia artificial (IA) y aprendizaje automático (ML).

IBM conceptualiza el aprendizaje federado como un método para ayudar a entrenar estos modelos sin que nadie tenga acceso a los datos que sustentan el modelo en sí:

“Bajo el aprendizaje federado, varias personas comparten de forma remota sus datos para entrenar de forma colaborativa un único modelo de aprendizaje profundo, mejorándolo de forma iterativa, como una presentación o informe de equipo. Cada parte descarga el modelo desde un centro de datos en la nube, generalmente un modelo básico previamente entrenado. Lo entrenan con sus datos privados, luego resumen y cifran la nueva configuración del modelo. Las actualizaciones del modelo se envían de regreso a la nube, se descifran, se promedian y se integran en el modelo centralizado. Iteración tras iteración, el entrenamiento colaborativo continúa hasta que el modelo está completamente entrenado”.

Las investigaciones indican que la mayoría de las aplicaciones de aprendizaje federado para datos biomédicos se centran en radiología y oncología. Algunos casos de uso incluyen imágenes cerebrales, diagnóstico de COVID-19, detección de tumores, predicción de biomarcadores de cáncer y aplicaciones de Internet of Healthcare Things (IoHT). Los investigadores también han propuesto un marco de aprendizaje federado para mejorar la equidad en las herramientas de detección basadas en IA.

Investigadores de la Facultad de Medicina Perelman de la Universidad de Pensilvania (Penn) llevaron a cabo la primera aplicación del aprendizaje federado en datos de imágenes médicas del mundo real en 2018.

El estudio que describe estos esfuerzos se publicó en 2019 y demuestra que un modelo de aprendizaje profundo entrenado mediante aprendizaje federado podría segmentar con precisión imágenes de tumores cerebrales, logrando el 99 por ciento del rendimiento del mismo modelo cuando se entrenó mediante métodos tradicionales de intercambio de datos.

El trabajo ayudó a establecer la viabilidad de utilizar el aprendizaje federado para abordar los desafíos de adquisición, etiquetado e intercambio de datos típicamente asociados con la investigación de análisis de imágenes.

Ese mismo año, los investigadores del Centro de Computación y Análisis de Imágenes Biomédicas (CBICA) de Penn recibieron una subvención federal de tres años y 1,2 millones de dólares para desarrollar un marco de aprendizaje federado centrado en la segmentación de tumores.

La subvención hizo que Penn encabezara una colaboración de 29 instituciones de todo el mundo para avanzar en estos esfuerzos.

Los beneficios potenciales de las aplicaciones de atención médica federadas basadas en el aprendizaje incluyen mejorar la privacidad de los datos, lograr un equilibrio entre precisión y utilidad, permitir la capacitación en datos de salud de bajo costo y reducir la fragmentación de los datos. El enfoque también permite transmisiones asincrónicas, lo que puede reforzar la colaboración y comunicación multiinstitucional.

Dado que el aprendizaje federado permite a los usuarios mover el modelo a los datos, en lugar de viceversa, el entrenamiento del modelo local no requiere que cada usuario duplique datos médicos de alta dimensión y con un almacenamiento intensivo. Los investigadores indican que esto ayuda a que el modelo escale de forma natural con un conjunto de datos en crecimiento sin aumentar los requisitos de almacenamiento de datos.

El aprendizaje federado también se puede combinar con otros PET, como la privacidad diferencial y la computación multipartita segura, para cumplir requisitos adicionales de protección de datos en la investigación médica. Para ello, los expertos están trabajando para comparar estrategias en el aprendizaje federado de datos biomédicos.

Sin embargo, existen algunos desafíos notables en la aplicación del aprendizaje federado en el análisis de atención médica.

Al igual que otros PET, el aprendizaje federado es computacionalmente intensivo y requiere un gran ancho de banda de comunicación.

La transparencia es otra cuestión. Mantener privados los datos de entrenamiento utilizados en un modelo de aprendizaje federado requiere el uso de un sistema para probar la precisión, la equidad y el posible sesgo dentro de los resultados del modelo. Pero la novedad de la tecnología significa que dicho sistema aún debe desarrollarse y adoptarse ampliamente.

Los investigadores están trabajando para abordar estos desafíos, como lo muestra una propuesta reciente de una arquitectura novedosa para abordar los valores faltantes, la armonización de datos y los problemas del esquema de "tareas de aprendizaje" presentes en los esfuerzos de aprendizaje federados en el espacio biomédico.

La computación multipartita segura es una PET arquitectónica que, al igual que el aprendizaje federado, permite a las partes compartir datos para los cálculos sin revelarlos, razón por la cual los dos a menudo se usan juntos.

Los expertos subrayan que la computación multipartita segura es una herramienta importante para desarrollar aplicaciones a gran escala que preserven la privacidad, ya que “permite a un grupo realizar un cálculo conjunto sin revelar las aportaciones privadas de ningún participante. Los participantes acuerdan una función para calcular y luego pueden usar un protocolo [de computación multipartita] para calcular conjuntamente la salida de esa función en sus entradas secretas sin revelarlas”.

Una computación multipartita segura y exitosa también requiere que las partes interesadas se adhieran a cinco procesos: privacidad, corrección, independencia de las entradas, resultados garantizados y equidad.

La privacidad requiere que ninguna de las partes involucradas obtenga información sobre otras partes, y cada parte debe recibir solo el resultado calculado, y la corrección ayuda a garantizar que el resultado sea exacto. La independencia de los insumos dicta que los insumos necesarios deben ser proporcionados de forma independiente por cada parte, mientras que la producción garantizada indica que todas las partes deben recibir los resultados. Pero también requiere que las partes estén dispuestas a respetar el resultado.

Finalmente, la justicia sostiene que cada parte debe recibir resultados calculados sólo si todas las demás partes reciben los suyos.

Se está evaluando la computación segura entre múltiples partes para reforzar la investigación del genoma y la estratificación del riesgo de los pacientes. Los investigadores también están investigando cómo la computación multipartita segura puede respaldar el análisis de datos de atención médica que preserva la privacidad y el desarrollo de herramientas seguras basadas en computación multipartita para la investigación biomédica.

El uso de este PET en otras industrias pone de relieve algunos de sus principales beneficios. Un estudio que evaluó el uso de computación multipartita segura en la industria automotriz encontró que la herramienta permite nuevas estrategias para el control basado en tecnología, reduce la necesidad de confianza entre organizaciones y evita la pérdida de ventaja competitiva debido a la fuga de datos.

A pesar de estos beneficios, existen múltiples limitaciones en el uso de la computación multipartita segura.

El PET requiere que las partes interesadas confíen en la tecnología, lo que supone un desafío en el sector sanitario, ya que los médicos y las partes interesadas en el sector sanitario pueden dudar a la hora de comprar una herramienta de "caja negra".

El enfoque también puede introducir nuevos riesgos de uso indebido de datos. La computación segura entre múltiples partes requiere un cierto nivel de comunicación entre las partes, y la naturaleza del PET crea la posibilidad de que dos partes se confabulen para determinar los datos de un tercero.

Básicamente, si las dos primeras partes están dispuestas a compartir sus datos entre sí, les es posible deducir los datos del tercero al hacerlo. Para evitar esto, es necesario que las partes interesadas tengan una estrategia informática multipartita sólida y segura e implementen ciertos protocolos, como zonas de privacidad.

Las zonas de privacidad se pueden configurar mediante el uso de múltiples dominios o servidores, cada uno de los cuales contiene conjuntos de restricciones de privacidad. El uso del marco de la zona de privacidad permite a partes separadas participar en cálculos multipartitos seguros mientras se protegen los datos, ya que ninguno de esos datos se almacena en los mismos servidores ni se encuentra dentro de los mismos dominios.

Blockchain no siempre se considera un PET por sí solo, pero puede serlo cuando se combina con enfoques como la computación multipartita segura, el cifrado homomórfico y las pruebas de conocimiento cero para proteger la privacidad de los datos.

Las redes Blockchain son tecnologías de contabilidad distribuida, lo que significa que permiten a las partes interesadas registrar, rastrear, compartir y sincronizar información sin una entidad central. Como resultado, cada intercambio realizado en una cadena de bloques es transparente, inmutable y permanente.

Cada intercambio o transacción se registra como un "bloque" de datos con un identificador único en forma de "hash". Este hash cambia si la información dentro del bloque lo hace.

Luego, los bloques se conectan con los de antes y después mediante una "cadena" que garantiza que el bloque no pueda modificarse. La cadena también garantiza que no se pueda insertar otro bloque entre dos ya existentes.

En el sector sanitario, la cadena de bloques se ha utilizado para superar las barreras de la TI y puede combinarse con la IA para impulsar el análisis de big data. Las aplicaciones blockchain propuestas para la atención médica incluyen la interoperabilidad de EHR, la mejora de la seguridad de los datos y la computación en la niebla para Internet de las cosas (IoT).

Las organizaciones de ciencias biológicas también han aprovechado blockchain para proteger los datos de fertilidad de los pacientes, un caso de uso potencialmente valioso a medida que la atención médica reconsidera la privacidad del paciente luego de la revocación de Roe v. Wade y los expertos presionan para que se compartan datos de atención médica para proteger la privacidad del paciente.

Las cadenas de bloques tienen la ventaja de utilizar a menudo redes de arquitectura descentralizada, que dependen de múltiples servidores que pueden actuar como servidores "maestros" individuales para gestionar los datos. En el sector sanitario, estas redes pueden ayudar a respaldar la fluidez de los datos y romper los silos de datos.

Pero para aprovechar blockchain de manera efectiva, las organizaciones de atención médica deben comprender cómo afecta potencialmente la seguridad de los datos de atención médica y otras medidas. Algunas de las consideraciones más importantes, junto con la seguridad, son la confidencialidad, el almacenamiento de datos y la disponibilidad de los datos.

Hacer que blockchain cumpla con la privacidad en todos los sectores también ha sido un desafío, particularmente en el sector de la salud.

La investigación en esta área sugiere que un desafío radica en analizar las vulnerabilidades a los ataques dentro de cada capa de la arquitectura blockchain para evitar violaciones de datos. El uso de blockchain junto con otros PET puede ayudar a minimizar algunos de estos riesgos. Pero los expertos indican que cada PET tiene sus propias deficiencias, lo que requiere que las partes interesadas tengan una sólida estrategia de mitigación de riesgos para estos, además de apoyar el desarrollo de nuevos PET.

APRENDIZAJE FEDERADOCOMPUTACIÓN MULTIPARTE SEGURACADENA DE BLOQUE
COMPARTIR