Page 45 - Revista FIUDE 2018
P. 45

Revista de la Facultad de Ingeniería, Año 5, Número 1

            Los datos pueden ser estructurados (responden a un esquema), semi estructurados
            (responden  a  una  estructura  jerárquica,  por  ejemplo:  html  y  json),  o  no
            estructurados  (documentos,  videos  y  audios,  entre  otros).    Tal  variedad  de  datos
            presenta un reto importante para los prestadores de salud al momento de identificar
            patrones o tendencias a partir de ellos.  El procesamiento del lenguaje natural (NLP),
            la  búsqueda  de  correlaciones,  la  descripción  de  agrupamientos  y  determinar
            tendencias, son, en contextos en los cuales se generan datos en "forma tradicional",
            métodos  que  resultan  difíciles  de  aplicar  y  extraer  conocimiento  de  utilidad  (nos
            referimos a "forma tradicional" de generar datos cuando estos se pueden almacenar
            en bases de datos relacionales).  Si el escenario consiste en aplicar dichas técnicas a
            diferentes tipos de datos, que generan grandes datasets, las dificultades aumentan.
            El segundo nivel de desafío implica, si la analítica se pretende hacer a nivel nacional,
            la integración de los datos de todos los prestadores de Salud.  A las dificultades que
            se presentan a nivel local de cada institución, se agrega la diversidad de origen de
            los  datos.    En  este  nivel,    el  volumen,  velocidad  y  variabilidad  de  los  datos
            implicarían  incursionar  en  Big  Data  para  su  análisis,  debiéndose considerar  varios
            aspectos.

            La colección de los datos deberá ser atendida considerando el volumen y velocidad
            de  creación.    Puede  ocurrir  que  los  datos  pudieran  transportarse  a  un  storage
            central  (considerando  el  bajo  costo  del  almacenamiento,  en  la  actualidad,  y  la
            tendencia  a  la  reducción  prevista  de  sus  precios  en  el  futuro).    Este  escenario
            implicaría un costo de transporte que puede transformarse en un "cuello de botella",
            característico en Big Data.  Si los datos permanecen en las instituciones (que sería la
            opción  más  adecuada),  se  deberá  llevar  el  procesamiento  a  los  datos  a  través  de
            modelos  computacionales  desarrollados  a  tal  fin.    El  modelo  más  adecuado  sigue
            siendo  Map  Reduce.    Los  servidores  o  commodities  que  aporta  cada  institución
            médica es una estación que efectuaría operaciones Map.  Luego, se debe contar con
            un equipo centralizado que hará la operativa Reduce (considerando la cantidad de
            centros asistenciales en Uruguay y comenzando con un prototipo, un equipo sería
            suficiente, previendo que se deba escalar en caso de un aumento de la demanda de
            los servicios prestados).






























            Figura 1. Esquema de un diagrama de flujo para la integración de datos para una arquitectura de Big
            Data aplicada a las prestaciones del sistema de salud.





            44
   40   41   42   43   44   45   46   47   48   49   50