IFindIT Analytics
En términos generales IFINDIT, como plataforma de analítica basada en búsqueda avanzada, además de estar orientada a Big data (permite operar millones de registros por hora) permite llevar a cabo, entre otros, los siguientes procesos:
Carga: Incluye los conectores desplegados y listos para utilizar la entidad debe suministrar los datos a procesar a través de una vista generalizada (tabla de hechos) a la que IFINDIT se conectará vía VPN site to site mediante alguno de estos mecanismos:
- Conexión a diversos tipos de sistemas de bases de datos tales como: SQL, MySQL, Oracle, DB2, Postgres, Informix, Casandra, MariaDB, MongoDB, y otras bases de datos a través de JDBC.
- Datos estructurados en archivos txt, Raw, xls, csv, parquet files.
Arquitectura de procesamiento: IFindIT está basada en arquitectura Kappa porque es necesario contar con una arquitectura de procesamiento de datos diseñada para proporcionar un sistema escalable, tolerante a fallas y flexible para procesar grandes cantidades de datos tanto en tiempo real como en batch.
Kappa utiliza un único sistema de procesamiento de datos para manejar cargas de trabajo de procesamiento tanto en flujos como en batch; esto permite procesamiento de datos más ágil y simple y a la vez, proporcionar un acceso rápido y confiable a los resultados de las consultas.
Almacenamiento en formato columnar: Esto significa que solo carga las columnas necesarias para una consulta en específico, esto permite mejorar la velocidad de las consultas que recuperan solo unas pocas columnas y agregaciones (Ej: cuántas personas con qué características, en qué periodo de tiempo, etc.).
Sistema distribuido escalable: La plataforma permite crecer de manera elástica, dada la alta demanda de información solicitada, es necesario contemplar operaciones que pueden incluir la carga de datos a una velocidad de millones de registros por minuto y a la vez atender consultas que generan resultados en pocos segundos.
Procesamiento masivamente paralelo: La plataforma recibe requerimientos que pueden incluir cientos de millones de datos en una sola consulta, por esto es necesario que la plataforma este en capacidad de procesar cada consulta en paralelo en todo el clúster.
Reportes: Permite generar reportes, datos agregados, columnas, conteos, consultas tipo SQL
Creación de consultas o reportes tipo Wizard: Permite a personas que no tengan un elevado nivel técnico, crear reportes de tal forma que sea posible dividir la carga de trabajo para atender requerimientos rápidamente.
Salida de datos:
La plataforma entregará datos en algunas de las siguientes presentaciones:
- Datos sin agregar: xls, csv, txt, Json, XML
- Datos en masa: permite extraer datos en paquetes de millones de registros de decenas de columnas cada uno
- Visualización: La plataforma está en capacidad de desplegar datos con características visuales tipo tableros de control, tanto para datos agregados como no agregados y con capacidad de ser mostrados tanto en equipos de escritorio como en dispositivos móviles
Seguridad: La plataforma provee mecanismos de autenticación y control de acceso basados en roles. Se integra con el Directorio Activo, pero también permite la creación de usuarios locales a la plataforma.
Robustez: IFindIT está en capacidad de ser utilizada por miles de usuarios de manera simultánea, respondiendo a requerimientos SIN impactar los sistemas de información donde están contenidos los datos, estos impactos son evidentes en particular en Bases de datos, donde el consumo de memoria es muy alto en caso de concurrencia.