Liao2026CosmologyOneGalaxy

  • gemini https://aistudio.google.com/prompts/1SV421JiRAbSCPzX2Jmi_0YGihnE5zrHw
  • 简单来说就是除了大量星系的统计信息之外单个星系的物理性质也可以用于宇宙学,逻辑是 Om 决定星系引力的强度,又进一步地决定了星系重子比例和化学性质

Brief #

  • eq1 和 eq7 描述了金属丰度对于宇宙学参数 Om 的依赖性,在不同 simulation 中受到的不同强度 feedback 作用体现在参数 $k_\mathrm{sim}$ 上
    • 分别对应基准 dataset 以及 extended dataset
    • 具体来说先应用在 TNG z=0 的数据上,再进行 project/redshift 维度的推广
  • 使用 CAMELS 作为 framework,其中包含了 TNG/EAGLE 等一共 4 个 project
  • 可以算作 SR practice 方面的一篇参考

Intro #

  • CAMELS 前期的 ML work 标明宇宙学参数和单个星系性质之间存在关联
    • this work 要做的是解释这种关联,或者说给出这种关联的 physical origin

Method #

  • CAMELS 包括了 16k simulation,同时涉及宇宙学参数和 sub-grid physics 的改变
    • size 是 25 h-1 Mpc,红移从 127 演化至 0
  • 第一部分基准数据集包括 Om, ss8 以及 SN/AGN feedback 强度参数的改变,其他参数保持固定不变
    • 参数空间的采样使用 Latin Hypercube
    • 包括 IllustrisTNG, SIMBA, ASTRID, Swift-EAGLE 四个 project
  • 第二部分扩展数据包括更广阔的参数空间:5 个宇宙学参数和 23 个天体物理参数
    • 采样方法用 Sobol low-discrepancy sequence 代替 Latin hypercube
  • 用 symbolic regression 得到 Om 和星系属性之间的关系,具体的迭代过程类似生物的演化、繁殖、变异
    • SR 中可用的 operator 是有限的,在普通的算子之外还加入了 sigmoid function,可以代表现实世界中的一类调节关系
    • loss function 除了衡量准确度的 MSE 之外还包括了对复杂度的惩罚,以及设定了 max size/depth 上限
  • 首先在 z=0 的 IllustrisTNG 数据上训练,然后对高红移数据拟合一个依赖于红移的演化因子

Results #

  • eq1 给出了 Om 和星系物理之间的关联,其中 sigma 代表 sigmoid function
    • 作为参数的星系物理变量包括金属丰度、恒星/重子质量之比、描述星系引力强度的无量纲参数 $S_\mathrm{core}$、星系形态学致密参数 $R_\mathrm{compact}$
    • 还包括一些随 simulation project 改变的系数
  • 得到 eq1 之后固定其结构,然后针对其他 project 重新拟合某些参数,最终结果列在 tab3 中
    • 目的是证明 eq1 不是对单个 project/data 的过拟合
  • fig2 展示了四个 project 中的拟合优度,对角线是最理想情况
    • SIMBA/EAGLE 中表现稍差,解释为反馈更强、星系属性随机性更大
  • 在 z=0 的基础上,对高红移数据进行拟合,得到 eq1 随着红移的演化趋势
    • 发现 $c_0^\mathrm{sim}$ 不随红移变化
    • TNG/ASTRID 给出的红移演化因子幂律指数相似,而对 SIMBA/EAGLE 的拟合效果仍然不理想

Interpretation #

  • 星系 MZR 会受到 SN/AGN feedback 强度的调控
    • TNG 中影响最大的 feedback 参数是 SN1,更强的反馈会导致金属丰度的降低,物理原因是 SN 会将星系中的金属吹走从而抑制化学增丰
    • 在 ASTRID 中 AGN/SN 发挥了同等重要的作用(fig4 right panel 好像不太看得出来明显的 AGN 作用),都体现为对金属丰度的压低
      • 此外 MZR scatter 相比 TNG 更小
  • Eq1 的组成中
    • 第一项 $Z_\star / M_\star$ 来自 MZR
    • 第二项 $\Omega_bV_\mathrm{eff}^3 / GH_0$ 用于描述动力学速度 $V_\mathrm{eff}$ 所对应的(重子)特征质量
    • 第三项 $\Omega_b /k_\mathrm{sim}$ 变化描述了各个 simulation 中由于 feedback 强度不同导致的重子的留存率差异
  • 理论的重子质量由 term2 给出,然后 term3 决定多少比例可以存留下来,term1 是最终观测到的 MZR
    • sigmoid function 的作用可以解释为当星系处于 MZR 关系的某一端时,内部状态和 Om 的关联不大
    • 这么来看把 term1 写到等式的左边逻辑关系会更清晰?
  • White 1993 认为通过 cluster 中重子比例就可以得到宇宙的重子比例,因为 cluster 引力势阱很深,几乎所有物质都处于引力束缚下

Extended cosmology #

  • 在参数空间更大的 TNG-S28 上进行 SR,得到的结果是 eq7
    • 这里的 $x$ 类似之前 eq1 term 1/2/3 因子的乘积,但是存在差异
  • 预测的效果由 fig5 给出,当真实 Om 太大之后预测效果很差,可能由参数简并性导致
  • SR 中给出的 $E(Z_\star,f_\star)$ 可以和 gas regulation model 建立联系
    • 这个模型给出了考虑星系中气体流入/流出/SF 之后的动态平衡的金属丰度 $Z_\mathrm{eq}=yR$,其中 y 代表产率,R 代表 retention fraction

Thoughts #

  • 其实得到一个非常简单的等式可以描述复杂的关联就是不现实的,得到一个复杂的等式又相比其他的 NN 没有太大优势
    • 但是如果公式中的各项都是 physically 可解释的,相比黑箱 NN 肯定是更好的
  • 是不是应该在四个 project 上都做这样的 SR,然后对比形式的一致性呢?
    • 在 p8 有解释
  • 相当于建立了一个 Om 和 MZR 之间的关系,而这个关系受到 feedback 强度的约束需要加一个补偿因子
  • 具体的拟合过程是在 1000 个 simulation 中各挑出 30 个星系,拟合星系属性和 Om 之间的关系
  • 各个 simulation 通常用固定的参数(最佳的宇宙学参数、和观测适配最好的 sub-grid 参数)运行少量几次,CAMELS 相当于牺牲了 box size 换取了 simulation 在不同参数组合下的多次运行