Aprendizaje automático aplicado al sector hotelero
Autor
Embarec Riadi, AlienFecha
2020Resumen
El objetivo de este trabajo ha sido estudiar el fenómeno de la ocupación en
la industria hotelera. Concretamente, disponemos de dos fuentes de datos
[1], representativas de la actividad de reservas en dos hoteles ubicados en
Portugal. Esta información viene complementada con una serie de variables
adicionales que ayudan a entender cómo varía la demanda en los dos
hoteles.
La información disponible, pues, cubre información de reservas,
cancelaciones, edades de los clientes, tarifa diaria abonada por el
alojamiento, categoría de habitaciones contratadas, etc.
El objetivo de este proyecto es, aprovechando las herramientas del
Aprendizaje Automático, estudiar varios problemas comunes de la industria,
como predecir el precio diario de alojamiento dadas unas variables que
influyen como la antelación, el número de noches contratadas, la probabilidad
de cancelación de una reserva, entre otras.
Otra de las metas de este proyecto es crear un modelo que prediga las
reservas donde es más plausible la cancelación. El repositorio de datos
cuenta con una variable is_canceled que indica si la reserva ha sido
cancelada o no.
Esta variable, cotejada con otros datos de los que depende, como los
recargos aplicados a algunas habitaciones, las peticiones especiales de los
clientes, el efecto de las reservas hechas con mucha antelación, entre otros
factores, puede contribuir a construir un modelo clasificador con un alto grado
de fiabilidad, que dado un conjunto de datos de entrada, etiquete los registros
más propensos a cambios y anulaciones. The aim of this work has been to study the phenomenon of occupation in
the hotel industry. Specifically, we have two data sources [1], representative
of the activity of reservations in two hotels located in Portugal. This information
is complemented by a series of additional variables that help to understand
how demand varies in the two hotels.
The available information therefore covers information on reservations,
cancellations, customer ages, daily rate paid for accommodation, category of
rooms contracted, etc.
The aim of this project is, making use of the tools of Machine Learning, study
several common problems of the industry, such as predicting the daily price
of accommodation given some variables that influence as the anticipation, the
number of nights contracted, the probability of cancellation of a reservation,
among others.
Another goal of this project is to create a model that predicts the reserves
where cancellation is more plausible. The data repository has a variable
is_canceled that indicates whether the reservation has been cancelled or not.
This variable, compared with other data it depends on, such as the surcharges
applied to some rooms, special requests from customers, the effect of
reservations made well in advance, among other factors, can help build a
classification model with a high degree of reliability, which given a set of input
data, label the records most likely to change and cancellations.