Tian2026PhotometricRedshiftPDFs

Brief #

  • binning method 将 ML photo-z 从 regression 转换为了 classification,自然地得到了 PDF
    • 优化目标设定为两个 CDF 之间的差值平方加和

Intro #

  • photo-z 方法主要包括 template 和 ML
    • template 的问题是真实星系相对于 template 的偏离,或者说 template 很可能是错误的
    • ML 一般将 photo-z 视作一个 regression task,仅仅给出单点估计,缺陷在于
      • 无法给出不确定性
      • 无法应对 bimodal PDF 情形,也就是颜色和红移存在 degeneracy
      • 估计值会偏向于训练样本密度更高的区域(通常是低红移)
    • binning 方法是一种比较 promising 的方法
  • DESI DR1 涵盖了 9k deg2 并且红移覆盖到了 0.8
  • this work 是一种 NN classification 方法,首先将红移空间离散化为多个 bin,通过优化 CRPS 生成良好的 PDF 估计
    • 应用在 LS DR10 以及 Pan-STARRS DR2,前者更深,后者天区覆盖更广

Data #

  • spec-z 来自 SDSS DR19 以及 DESI DR1
    • SDSS DR19 包括了 main galaxy、BOSS 以及 eBOSS 样本
    • DESI DR1 中使用了 BGS、LRG 以及 ELG
    • 对于 spec-z 的筛选包括 spec-z 质量标记、对 QSO 的筛查、Delta chi2
    • 最终 spec-z 样本数量是 11.4m
  • photometric data 来自 LS DR10 以及 Pan-STARRS DR2
    • 在 DESI LS 数据基础上整合了 unWISE 红外数据,最终的波段覆盖是 griz 以及 W1/2
      • 采用了 star-galaxy separation 以及 SNR 限制
    • Pan STARRS 覆盖北天区的 30k deg2
  • 使用 TOPCAT 对 spec/photo 进行匹配,然后按照 8-1-1 比例划分训练、验证和测试集
  • fig1/2 展示了红移 histogram 以及 color-z 分布
    • fig2 bottom panel 说明光谱数据主要集中在 bright end,在 faint end 覆盖不足
      • 或者说不能相信 spec-z 的观测选择是无偏的(至少在亮度上)
    • fig2 中间 panel 似乎可以看到 red sequence 形状

Method #

  • binning 方法通过划分 bin 将回归问题转换为了 classification 问题
    • 在划分 bin 之后,ML 要给出的目标是 N 维向量描述真实红移位于每一个 bin 的概率,并且分量之和必须为 1
      • 可以解决 bimodal 等问题
    • NN 架构使用 MLP(包括四个隐藏层),并且借鉴了 ResNet 中的 residual connection 的概念
    • 具体来说在 0, 2 之间划分了 400 个 bin
  • 优化的目标是 CRPS,定义为模型给出的 CDF 和真实光谱红移 CDF(单点阶跃函数)之间的平方差的积分(分 bin 之后应该是简单加和?)
    • 如果使用 classification 常用的 cross-entropy 会导致对偏离 1 个 bin 和偏离 100 个 bin 的惩罚趋同
    • 可以同时避免模型「过于自信」和「不够自信」的问题
  • 最终单点红移估计为所有 bin 根据概率加权的平均,而不是 PDF peak
  • feature 选用全部波段上的 magnitude 及其误差
    • 在 LS DR10 上用了六个波段的 tractor magnitude 以及误差共 12 个特征
    • 在 PS1 DR2 中使用了 grizy 五个波段的三种 magnitude(Kron, PSF 以及 Aperture)及误差一共 30 个特征
      • 模型有机会从 PSF 和 Kron 的差异中得到一些形态/尺寸信息
    • MLP 可以很容易学习到 color 信息,所以改为输入 color 提升不大
  • 一些 ML 的实验设置:AdamW optimizer、参数设置、防止过拟合、学习率的自动控制
  • photo-z 评估指标包括 outlier fraction(超过 0.15)、bias 和 scatter、nMAD

Results #

  • LS 结果是 nMAD=0.015,outlier fraction 为 0.50% 并且几乎没有 bias
    • 对于 DESI ELG 误差很大,并且 outlier fraction 超过 10%,可能因为 ELG 更暗并且 star-forming galaxy具有颜色-红移简并
      • 可能需要依靠图像信息解决问题
  • PS1 的性能低很多:nMAD=0.028,outlier fraction 为 0.62%
    • 加入 unWISE 信息之后有很大的提升(但是还是相比 LS 更差),说明对于中等红移的星系 mid-IR 信息非常重要
  • 仅使用 SDSS 的两个指标是 0.0175 以及 0.73%,仅使用 DESI 的指标和 all data 的指标类似
  • fig5 给出了 PDF 估计的六个例子
    • panel c 展示了处理 bimodal 的能力
    • panel d 失败的原因是 blending,也就是颜色混合了一个红星系和一个蓝星系的信息
    • panel e 失败的原因是受到了周围 bright star 的影响
    • panel f 的原因是 over split,也就是 catalog 中的两个 object 实际上是同一个源
  • fig6 对应于 PIT 图,说明这里给出的预测比较保守(会给出一个偏大的 scatter)
    • 可以通过 temperature scaling 进行 calibration,调整之后 PIT 更像是一个 uniform 分布
  • 相比其他应用在 LS 上的 Random Forest、XGBoost 以及 ANN 等方法具有一定优势
    • 对比 LS official photo-z 以及 Wen&Han 2024 也有一定优势

Discussion #

  • DESI DR1 的样本选择是为了 cosmology 服务的,所以在 mag-color 空间中不具有足够的代表性
  • 使用 SHAP 探究了 LS 相比 PS1(即使加入 unWISE 后)的优势
    • 在 LS 中最重要的 feature 来自 r 和 W1,模型的行为是从这些 mag 中提取 SED 特征
    • 在 PS1 中模型给 g_kron 以及 sigma_g_PSF 这些特征赋予了很高的权重,说明 SNR 太低需要依赖其他的特征

Photo-z catalog #

  • 针对数据的不完备性进行分级退避策略,对于数据完备性最高的区域使用 LS griz+unWISE W1/2,对于质量最差的区域使用 PS1 photometry
  • 最终得到的 photo-z 具有 552m 数目的星系,其中 341m 是使用优先级最高的 photometry 得到的
  • catalog 和源代码都开源
  • 实际的 catalog 以 40 的 bin number 存储

Thoughts #

  • fig2 在单个平面上绘制多个单色 colormap 叠加的方式可以参考
  • 分 bin 的另外一个 justification 是:即使计算出了更高分辨率的 PDF 也很难完整存储
  • photo-z 评估仅针对具有 spec-z 的星系,而实际使用场景(比如 weak lensing 或者 cluster detection 依赖于 faint galaxy photo-z)的可靠性和性能很难评估
    • 解决办法可能是 COSMOS 天区的长时间 photo/spec 观测提供 faint 样本,或者从 SOM 中把没有足够 spec-z 数据的网格去掉