Liao2026CosmologyOneGalaxy

March 12, 2026

Brief #

eq1 和 eq7 描述了金属丰度对于宇宙学参数 Om 的依赖性，在不同 simulation 中受到的不同强度 feedback 作用体现在参数 $k_\mathrm{sim}$ 上
- 分别对应基准 dataset 以及 extended dataset
- 具体来说先应用在 TNG z=0 的数据上，再进行 project/redshift 维度的推广
使用 CAMELS 作为 framework，其中包含了 TNG/EAGLE 等一共 4 个 project
可以算作 SR practice 方面的一篇参考

CAMELS 前期的 ML work 标明宇宙学参数和单个星系性质之间存在关联
- this work 要做的是解释这种关联，或者说给出这种关联的 physical origin

CAMELS 包括了 16k simulation，同时涉及宇宙学参数和 sub-grid physics 的改变
- size 是 25 h-1 Mpc，红移从 127 演化至 0
第一部分基准数据集包括 Om, ss8 以及 SN/AGN feedback 强度参数的改变，其他参数保持固定不变
- 参数空间的采样使用 Latin Hypercube
- 包括 IllustrisTNG, SIMBA, ASTRID, Swift-EAGLE 四个 project
第二部分扩展数据包括更广阔的参数空间：5 个宇宙学参数和 23 个天体物理参数
- 采样方法用 Sobol low-discrepancy sequence 代替 Latin hypercube
用 symbolic regression 得到 Om 和星系属性之间的关系，具体的迭代过程类似生物的演化、繁殖、变异
- SR 中可用的 operator 是有限的，在普通的算子之外还加入了 sigmoid function，可以代表现实世界中的一类调节关系
- loss function 除了衡量准确度的 MSE 之外还包括了对复杂度的惩罚，以及设定了 max size/depth 上限
首先在 z=0 的 IllustrisTNG 数据上训练，然后对高红移数据拟合一个依赖于红移的演化因子

eq1 给出了 Om 和星系物理之间的关联，其中 sigma 代表 sigmoid function
- 作为参数的星系物理变量包括金属丰度、恒星/重子质量之比、描述星系引力强度的无量纲参数 $S_\mathrm{core}$、星系形态学致密参数 $R_\mathrm{compact}$
- 还包括一些随 simulation project 改变的系数
得到 eq1 之后固定其结构，然后针对其他 project 重新拟合某些参数，最终结果列在 tab3 中
- 目的是证明 eq1 不是对单个 project/data 的过拟合
fig2 展示了四个 project 中的拟合优度，对角线是最理想情况
- SIMBA/EAGLE 中表现稍差，解释为反馈更强、星系属性随机性更大
在 z=0 的基础上，对高红移数据进行拟合，得到 eq1 随着红移的演化趋势
- 发现 $c_0^\mathrm{sim}$ 不随红移变化
- TNG/ASTRID 给出的红移演化因子幂律指数相似，而对 SIMBA/EAGLE 的拟合效果仍然不理想

星系 MZR 会受到 SN/AGN feedback 强度的调控
- TNG 中影响最大的 feedback 参数是 SN1，更强的反馈会导致金属丰度的降低，物理原因是 SN 会将星系中的金属吹走从而抑制化学增丰
- 在 ASTRID 中 AGN/SN 发挥了同等重要的作用（fig4 right panel 好像不太看得出来明显的 AGN 作用），都体现为对金属丰度的压低
  - 此外 MZR scatter 相比 TNG 更小
Eq1 的组成中
- 第一项 $Z_\star / M_\star$ 来自 MZR
- 第二项 $\Omega_bV_\mathrm{eff}^3 / GH_0$ 用于描述动力学速度 $V_\mathrm{eff}$ 所对应的（重子）特征质量
- 第三项 $\Omega_b /k_\mathrm{sim}$ 变化描述了各个 simulation 中由于 feedback 强度不同导致的重子的留存率差异
理论的重子质量由 term2 给出，然后 term3 决定多少比例可以存留下来，term1 是最终观测到的 MZR
- sigmoid function 的作用可以解释为当星系处于 MZR 关系的某一端时，内部状态和 Om 的关联不大
- 这么来看把 term1 写到等式的左边逻辑关系会更清晰？
White 1993 认为通过 cluster 中重子比例就可以得到宇宙的重子比例，因为 cluster 引力势阱很深，几乎所有物质都处于引力束缚下

在参数空间更大的 TNG-S28 上进行 SR，得到的结果是 eq7
- 这里的 $x$ 类似之前 eq1 term 1/2/3 因子的乘积，但是存在差异
预测的效果由 fig5 给出，当真实 Om 太大之后预测效果很差，可能由参数简并性导致
SR 中给出的 $E(Z_\star,f_\star)$ 可以和 gas regulation model 建立联系
- 这个模型给出了考虑星系中气体流入/流出/SF 之后的动态平衡的金属丰度 $Z_\mathrm{eq}=yR$，其中 y 代表产率，R 代表 retention fraction

其实得到一个非常简单的等式可以描述复杂的关联就是不现实的，得到一个复杂的等式又相比其他的 NN 没有太大优势
- 但是如果公式中的各项都是 physically 可解释的，相比黑箱 NN 肯定是更好的
是不是应该在四个 project 上都做这样的 SR，然后对比形式的一致性呢？
- 在 p8 有解释
相当于建立了一个 Om 和 MZR 之间的关系，而这个关系受到 feedback 强度的约束需要加一个补偿因子
具体的拟合过程是在 1000 个 simulation 中各挑出 30 个星系，拟合星系属性和 Om 之间的关系
各个 simulation 通常用固定的参数（最佳的宇宙学参数、和观测适配最好的 sub-grid 参数）运行少量几次，CAMELS 相当于牺牲了 box size 换取了 simulation 在不同参数组合下的多次运行
- Salcedo2025CosmologicalConstraintsDark 也用到了类似的 framework