Bases de datos orientada a grafos en la integración de datos para fines estadísticos, el caso del sistema de datos integrados del ISTAC
Autor
Rodríguez Pérez, JaímeFecha
2021Resumen
El objetivo de este Trabajo de Fin de Grado es el estudio de la
viabilidad y beneficios del uso de un modelo de datos orientado
a grafos para el Sistema de Datos Integrados (iDatos) utilizado
en el banco de datos del ISTAC. Se analizan los registros y
relaciones existentes entre fuentes administrativas así como
otras posibles externas. Se pretende obtener el modelo de
datos basado en grafos y la implementación del mismo en una
prueba de concepto con un conjunto de datos reales o
simulados en los casos en que estos no sean publicables. En
concreto, la construcción de esta BDD se hará sobre Neo4j,
producto open-source implementado en java y con una amplia
comunidad. The objective of this Final Degree Project is to study the
feasibility and benefits of using a graph-oriented data model for
the Integrated Data System (iDatos) used in the ISTAC
database. The records and existing relationships between
administrative sources as well as other possible external
sources are analyzed. It is intended to obtain the data model
based on graphs and its implementation in a proof of concept
with a set of real or simulated data in cases where these are not
publishable. The possibility of obtaining relationships that are
not explicit in the tables in the ISTAC iDatos system, but that
can be inferred thanks to the use of the graph-oriented
database, is also studied. Specifically, the construction of this
BDD will be done on Neo4j, an open-source product
implemented in Java and with a large community.