Herramienta para el análisis y la experimentación con datos cuantitativos
Autor
Godoy Orozco, Ana MaríaFecha
2019Resumen
El trabajo consiste principalmente en dise˜nar una herramienta visual que sea
capaz de realizar an´alisis estad´ıstico de datos cuantitativos haciendo uso del
lenguaje de programaci´on Python y diversas librer´ıas.
Para ello, hemos trabajado en varias tareas simult´aneamente. En primer
lugar, creamos las ventanas gr´aficas necesarias para la aplicaci´on haciendo
uso del paquete Tkinter y, en relaci´on al an´alisis estad´ıstico, busc´abamos que
la aplicaci´on realizara los siguientes estudios: comparar datos cuantitativos
continuos y discretos y predecir para resumir la relaci´on entre variables. El
usuario introduce los datos que desea estudiar y elige las columnas y el an´alisis
a realizar. En la herramienta esto est´a implantado mediante tests estad´ısticos
y funciones de las que se obtienen las tablas con los resultados requeridos para
lo cual hemos utilizado los m´odulos Stats de Scipy, Statsmodels y algunos
comandos espec´ıficos de Pandas. A la hora de elegir los tests distinguimos
entre el n´umero de grupos a estudiar, el tama˜no del menor de ´estos, el tipo
de dato y el tama˜no de la muestra. Debido a la estructura para el uso de un
test frente a otro y a las librer´ıas de estad´ıstica utilizadas hemos logrado una
herramienta cuyo desenlace fue el esperado.
La aplicaci´on que hemos conseguido desarrollar, a la cual hemos denominado
T-Qube, es apta para realizar comparaciones de datos cuantitativos discretos
y continuos y predicciones sobre los datos. Los resultados que aportamos son
veros´ımiles, sin embargo, se mencionan tambi´en algunos aspectos a mejorar
e ideas para proseguir con el trabajo. The work consists mainly of designing a visual tool that is able of performing statistical analysis of quantitative data using the programming language
Python and some libraries.
For this, we have worked on several tasks simultaneously. First, we created the
necessary graphic windows for the application using the package Tkinter and,
in relation to the statistical analysis, we looked for the application to carry
out the following studies: compare continuous and discrete quantitative data
and predict according to the population. The user introduces the data that
he wants to study and chooses the columns and the analysis to be performed.
In the tool, this is implemented through statistical tests and functions from
which the tables with the required results are obtained, for which we have used
the modules Stats from Scipy, Statsmodels and some specific commands from
Pandas. When choosing the tests we pick out between the number of groups
to study, the size of the smallest of these, the type of data and the size of the
sample. Due to the structure for the use of one test against another and to
the statistical libraries used, we have achieved a tool whose outcome was as
expected.
The application that we have been able to develop, which we have called TQube, is apt to make comparisons of discrete and continuous quantitative data
and predictions about the data. The results we provide are credible, however,
some aspects to improve and ideas to continue with the assignment are also
mentioned