Deriving Star Formation Histories of Galaxies with Bayesian Deep Learning
Fecha
2024Resumen
investigating the properties of these stars, such as their ages, masses, and metallicities, we can gain insights
into the underlying physical processes that drive the growth and transformation of galaxies over cosmic time,
in particular, the triggers and quenching mechanisms of star formation. For this purpose, we explore an
amortized implicit inference approach to estimate the posterior distribution of metallicity and non-parametric
star formation histories (SFHs) of galaxies, i.e. star formation rate as a function of cosmic time, using their
optical spectra. Fed with the spectroscopic predictions of the MILES stellar population models, we generate a
sample of synthetic SFHs to train and test our model. We show that our approach is capable of reliably
estimating the mass assembly of an integrated stellar population given its optical absorption spectrum with,
crucially, well-calibrated uncertainties. Specifically, we achieve 94% accuracy for the time at which a given
galaxy formed 50% of its stellar mass. We apply our pipeline to real observations of very massive elliptical
galaxies and show that it recovers ranges of SFR(t) consistent with the spectra, as well as the expected
relation between age and velocity dispersion, demonstrating a good generalization to data. Not only being
able to address a large number of galaxies, but also performing a thick sampling of the posteriors, it allows us
to estimate both the deterministic trends and the inherent uncertainty of this highly degenerated inversion
problem, so far inaccessible for more traditional methods. For this reason, we believe that our framework, a
machine-learning-based implicit inference applied to full spectral fitting, is remarkably promising to deal with
the size and complexity of upcoming massive spectroscopic surveys such as DESI, WEAVE or 4MOST El espectro de una galaxia, es decir, el flujo de energía en función de la longitud de onda, nos proporciona
información de sus poblaciones estelares. Al investigar las propiedades de estas estrellas, como sus edades,
masas y metalicidades, podemos inferir los procesos físicos que impulsan el crecimiento y la transformación de
las galaxias a lo largo del tiempo, en particular, los mecanismos desencadenantes y reguladores de la formación
estelar. De hecho, la evolución de las galaxias es un equilibrio entre procesos que fomentan la formación
estelar, y otros que tienden a impedirla expulsando o calentando el gas. Poder reconstruir con precisión las
historias de formación estelar, es decir, la tasa de formación de estrellas en función del tiempo, es un paso
imprescindible para comprender estos mecanismos. Sin embargo, inferirlas a partir de los espectros observados
para una muestra estadísticamente significativa de galaxias es un problema complejo de inversión, sujeto a un
gran número de degeneraciones no bien comprendidas, siendo la degeneración entre la edad y la metalicidad
una de las más destacables.
Una herramienta comúnmente empleada para determinar las historias de formación estelar es el ajuste
espectral. Este procedimiento consiste en comparar iterativamente los modelos con los espectros de galaxias
observados, maximizando la semejanza entre los datos y los modelos. El éxito y la fiabilidad de este método
dependen de la calidad de los espectros ‘plantilla’ y de la robustez del algoritmo de ajuste. En la última década,
los métodos han evolucionado en el marco bayesiano hacia técnicas como los métodos Montecarlo basados en
cadenas de Markov, permitiendo explorar eficientemente las degeneraciones asociadas al gran espacio de
parámetros. Simultáneamente, los modelos basados en el aprendizaje automático se están haciendo cada vez
más populares en la astronomía, proporcionando soluciones fiables y novedosas en múltiples ámbitos y
disciplinas.
En esta línea, exploramos un enfoque de inferencia implícita amortizada para estimar la distribución
‘posterior’ de la metalicidad y de las historias de formación estelar de las galaxias utilizando sus espectros
ópticos de absorción. Basándonos en los espectros de los modelos de poblaciones estelares MILES, generamos
una muestra sintética de historias de formación estelar no paramétricas para entrenar y validar nuestro
modelo. En particular, nos limitamos, dentro de los espectros de MILES, a una función de masa inicial (IMF
por sus siglas en inglés) tal y como se observa en la Vía Láctea, a isocronas BaSTI y a unos modelos de
enriquecimiento de elementos α escalados al entorno solar. Por otro lado, teniendo en cuenta las fuertes
imposiciones sobre las medidas que genera emplear historias de formación estelar paramétricas (exponenciales,
deltas, gaussianas, etc.), utilizamos el módulo GP-SFH para generar curvas no paramétricas basadas en
modelos semi-analíticos, simulaciones hidrodinámicas y realizaciones estocásticas, minimizando así el efecto
del ‘prior’ intrínseco en el conjunto de entrenamiento en las predicciones de nuestro modelo. Generamos
espectros sintéticos de galaxias como combinación lineal de espectros de poblaciones estelares simples de
MILES, donde los pesos vienen dados por las curvas de masa no paramétricas, y luego los normalizamos por
su mediana. Así, obtenemos 150.000 galaxias sintéticas para las cuales conocemos su espectro, metalicidad e
historia de formación estelar. Un 90% de estas galaxias se emplea para entrenar al modelo, mientras que el
10% restante, 15.000 galaxias, se emplea para evaluar su rendimiento.
Nuestro modelo consta de dos partes, un codificador del espectro y un estimador neuronal de densidad. La
primera parte es indispensable para lidiar con la alta dimensión de los espectros (∼ 4.000 puntos), empleando
una red neuronal convolucional y un módulo de atención para comprimir el espectro en una representación
latente de 16 componentes, que preserva la información específicamente asociada a las propiedades físicas que
queremos predecir, en particular la metalicidad y el tiempo en formar el 10%, 20%, ... 90% de la masa estelar
total de la galaxia ( 9 percentiles de masa estelar). En el trabajo se demuestra que la distribución de estos
vectores latentes está íntimamente relacionada con características del espectro empleadas en la literatura para
realizar medidas similares, como las líneas de la serie de Balmer o el triplete de magnesio, y que además están
optimizados para, de forma no lineal, capturar las historias de formación estelar y metalicidad.