A probabilistic deep learning model to distinguish cusps and cores in dwarf galaxies
Autor
Expósito Márquez, JulenFecha
2022Resumen
Numerical simulations within a cold dark matter (DM) cosmology form halos with a characteristic
density profile with a logarithmic inner slope of -1. Various methods, such as Jeans and Schwarzschild
modelling, have been used in an attempt to determine the inner density of observed dwarf galaxies,
in order to test this theoretical prediction. Here, we develop a convolutional mixture density neural
network (CMDNN) to derive a posterior distribution of the inner density slopes of DM halos. We train
the CMDNN on a suite of simulated galaxies from the NIHAO and AURIGA projects, inputting line-ofsight velocities and 2D spatial information of the stars within simulated galaxies. The output of the
CMDNN is a probability density function representing the posterior probability of a certain slope to be
the correct one, thus producing accurate and complex information on the uncertainty of the predictions.
The model recovers accurately the correct inner slope of dwarfs: ∼82%of the galaxies have a derived
inner slope within ±0.1 of their true value, while ∼98% within ±0.3. We then apply our model to
four Local Group dwarf spheroidal galaxies and find similar results to those obtained with the Jeans
modelling based code GravSphere. Fornax dSph has a strong indication of possessing a central DM
core, Carina and Sextans have cusps (although the latter with a large uncertainty), while Sculptor shows
a double peaked PDF indicating that a cusp is preferred, but a core can not be ruled out.
Our results show that simulation-based inference with neural networks provide a innovative and
complementary method for the determination of the inner DM profiles in galaxies.
Keywords: galaxies: dwarf - evolution - formation - haloes - dark matter - simulations - NIHAO - slope
- NFW
machine learning: convolutional - neural - network - posterior - probability - distribution El modelo cosmológico ΛCDM ha producido resultados muy satisfactorios a la hora de explicar la
estructura a gran escala del universo y las propiedades básicas de las galaxias que lo conforman (Guo
et al. 2016; Planck Collaboration 2016). Sin embargo, las observaciones en sistemas a escala galáctica
han mostrado varias discrepancias con las predicciones del modelo (Bullock and Boylan-Kolchin 2017).
En la literatura, estos problemas se han denominado tradicionalmente los problemas a pequeña escala
del modelo ΛCDM.
Uno de los principales y más antiguos de estos problemas es el llamado problema cusp/core. Las
simulaciones numéricas dentro del modelo ΛCDM forman halos de materia oscura (en los que habitan
las galaxias) con un perfil de densidad de masa característico que presenta una pendiente interna en
escala logarítmica de 𝛾 ∼ −1. Este perfil no concuerda con las observaciones de algunas galaxias
con curvas de rotación bien medidas, que prefieren ajustes con pendientes internas de densidad menos
fuertes, de 𝛾 ∼ −0.5 - 0 (p.ej. J. I. Read, Iorio et al. 2017; Simon et al. 2005; de Blok et al. 2008; Moore
1994). Tradicionalmente se ha llamado core a la parte interna de los perfiles de densidad con pendientes
internas más llanas, y cusp a la parte interna de los perfiles de densidad con las grandes pendientes
predecidas por el modelo ΛCDM.
Se ha demostrado que los cores pueden explicarse en el paradigma ΛCDM al considerar el efecto
que los bariones tienen sobre la materia oscura. Si una galaxia enana acreta lentamente gas y posteriormente este se elimina repentinamente a través de procesos como los vientos estelares o explosiones de
supernovas, la materia oscura se expande, disminuyendo la densidad de la misma en la parte central del
halo en la que se encuentra la galaxia y pudiendo llegar a formar un core si se dan ciertas condiciones
razonables (p.ej. Navarro, Eke et al. 1996; Gnedin and Zhao 2002; J. I. Read and Gilmore 2005; Pontzen
and Governato 2012). Este proceso ha sido exitosamente modelado en simulaciones hidrodinámicas de
galaxias que toman en consideración este feedback bariónico.
Aún así, existe mucha controversia dentro de la investigación del problema cusp/core, principalmente debido a la dificultad de obtener mediciones precisas de la distribución de materia oscura del
halo de las galaxias observadas, siendo habitual que las técnicas tradicionalmente utilizadas para inferir los perfiles de densidad, como la modelización de Jeans (p.ej. Marel 1994; Battaglia, Helmi et al.
2008; Collins et al. 2021; J. I. Read, Walker et al. 2019), no permitan constreñir el valor de la pendiente
interna de manera que pueda descartarse o asegurarse la presencia de un core.
En este trabajo presentamos un modelo novedoso para determinar la pendiente interna del perfil de
densidad de los halos de materia oscura con una cuantificación robusta de la incertidumbre, haciendo
uso para ello de técnicas de Machine Learning. El objetivo de este trabajo es poder inferir las pendientes
internas de las galaxias utilizando únicamente información posicional y espectroscópica de sus estrellas.
Nuestro método utiliza redes neuronales convolucionales de densidad mixta (Convolutional Mixture
Density Neural Networks, CMDNNs) para modelar la subestructura compleja de las galaxias. Una red
neuronal supervisada puede ser entrenada con datos de simulaciones de galaxias, de las cuales conocemos ya la pendiente interna de su perfil de densidad. Una vez entrenada, la red puede inferir la
pendiente interna de datos observacionales, haciendo uso del aprendizaje automático que ha realizado
al estudiar previamente las simulaciones.
Entrenamos nuestro modelo utilizando un gran conjunto de simulaciones hidrodinámicas de galaxias
enanas con halos con masas de 109
a 1011.5 M⊙ procedentes de los proyectos NIHAO y AURIGA (Wang
et al. 2015; A. A. Dutton et al. 2020; Grand et al. 2017), hasta un total de 183 galaxias diferentes. El
uso de diferentes modelos y parámetros físicos empleados en dichas simulaciones nos permite tener
un amplio rango de perfiles de densidad en galaxias con masas similares, incluyendo tanto cores como
cusps.
Hacemos únicamente uso de las velocidades y posiciones de las estrellas encontradas en las galaxias
enanas simuladas para construir funciones de densidad de probabilidad (Probability Density Function,
PDF) continuas de la distribución de dichas estrellas en dos espacios bidimensionales distintos:
• El espacio de fases de las distancias de las estrellas al centro de la galaxia y su velocidad en la línea
de visión, que presenta información sobre la relación entre la distancia al centro gravitacional y
la velocidad orbital asociada al perfil de densidad de materia oscura.
• El espacio de posiciones de las estrellas en el plano del cielo (x,y), que da cuenta de la forma y
tamaño de la galaxia.
Estos PDF bidimensionales, con los cuales definimos las galaxias que queremos evaluar, son los
inputs de nuestra red neuronal. La red va aplicando transformaciones a los PDF en diferentes capas
sucesivas con el objetivo de ir encontrando características de ordenes cada vez superiores según se
alcanzan profundidades mayores en la red. Finalmente se llega a una última capa que construye una
distribución de probabilidad, dando pues una función que indica la probabilidad de que la galaxia evaluada tenga una u otra pendiente interna.
Dichas transformaciones son alteradas y desarrolladas iterativamente durante el entrenamiento de
la red con las simulaciones, hasta llegar a un punto en el que se finaliza la construcción del modelo
cuando la red es capaz de inferir correctamente la pendiente interna de las simulaciones con las que
ha sido alimentada, dando fin así al entrenamiento. Dicho modelo es después capaz de evaluar datos
nuevos que nunca haya visto e inferir la pendiente interna para los mismos.
La pendiente interna de las galaxias simuladas es predecida por nuestro modelo con una desviación
media respecto al valor real de 𝜇 = 0.055. El modelo predice correctamente el valor de la pendiente
interna con un error por debajo de 0.1 (0.3) para el 82% (98%) de las galaxias del set de datos. Estas
predicciones presentan, además, incertidumbres con una desviación estándar media de 𝜎 = 0.108. La
precisión conseguida es suficientemente pequeña como para poder distinguir con claridad entre cores
y cusps en más del 95% de los casos.
Hemos también aplicado el modelo a cuatro galaxias enanas esféricas, obteniendo valores de pendientes internas consistentes con los resultantes del uso del código de modelización de Jeans GravSphere.
Concretamente, encontramos que Fornax dSph presenta un fuerte indicio de tener un core, Carina y Sextans tienen cusps (aunque esta última con una gran incertidumbre), y Sculptor muestra una distribución
de probabilidad con un doble pico que otorga mayor probabilidad a la presencia de un cusp, pero sin
poder descartar la posibilidad de un core. Estos resultados son consistentes con varias pendientes internas derivadas previamente para estas galaxias (p.ej. Goerdt, Moore, J. I. Read et al. 2006; Agnello and
Evans 2012; C. B. Brook and Di Cintio 2015; Walker and Peñarrubia 2011; Richardson and Fairbairn
2014; J. I. Read, Walker et al. 2019).
A la luz de estos resultados, queda claro que nuestro nuevo modelo es una herramienta prometedora
para el estudio de las propiedades de las galaxias enanas, y que la inferencia mediante el uso de redes
neuronales entrenadas con datos simulacionales proporciona un método innovador y complementario
a los ya existentes para la determinación de los perfiles de densidad de materia oscura en las galaxias