Tian2026PhotometricRedshiftPDFs

May 24, 2026

Brief #

binning method 将 ML photo-z 从 regression 转换为了 classification，自然地得到了 PDF
- 优化目标设定为两个 CDF 之间的差值平方加和

photo-z 方法主要包括 template 和 ML
- template 的问题是真实星系相对于 template 的偏离，或者说 template 很可能是错误的
- ML 一般将 photo-z 视作一个 regression task，仅仅给出单点估计，缺陷在于
  - 无法给出不确定性
  - 无法应对 bimodal PDF 情形，也就是颜色和红移存在 degeneracy
  - 估计值会偏向于训练样本密度更高的区域（通常是低红移）
- binning 方法是一种比较 promising 的方法
DESI DR1 涵盖了 9k deg2 并且红移覆盖到了 0.8
this work 是一种 NN classification 方法，首先将红移空间离散化为多个 bin，通过优化 CRPS 生成良好的 PDF 估计
- 应用在 LS DR10 以及 Pan-STARRS DR2，前者更深，后者天区覆盖更广

spec-z 来自 SDSS DR19 以及 DESI DR1
- SDSS DR19 包括了 main galaxy、BOSS 以及 eBOSS 样本
- DESI DR1 中使用了 BGS、LRG 以及 ELG
- 对于 spec-z 的筛选包括 spec-z 质量标记、对 QSO 的筛查、Delta chi2
- 最终 spec-z 样本数量是 11.4m
photometric data 来自 LS DR10 以及 Pan-STARRS DR2
- 在 DESI LS 数据基础上整合了 unWISE 红外数据，最终的波段覆盖是 griz 以及 W1/2
  - 采用了 star-galaxy separation 以及 SNR 限制
- Pan STARRS 覆盖北天区的 30k deg2
使用 TOPCAT 对 spec/photo 进行匹配，然后按照 8-1-1 比例划分训练、验证和测试集
fig1/2 展示了红移 histogram 以及 color-z 分布
- fig2 bottom panel 说明光谱数据主要集中在 bright end，在 faint end 覆盖不足
  - 或者说不能相信 spec-z 的观测选择是无偏的（至少在亮度上）
- fig2 中间 panel 似乎可以看到 red sequence 形状

binning 方法通过划分 bin 将回归问题转换为了 classification 问题
- 在划分 bin 之后，ML 要给出的目标是 N 维向量描述真实红移位于每一个 bin 的概率，并且分量之和必须为 1
  - 可以解决 bimodal 等问题
- NN 架构使用 MLP（包括四个隐藏层），并且借鉴了 ResNet 中的 residual connection 的概念
- 具体来说在 0, 2 之间划分了 400 个 bin
优化的目标是 CRPS，定义为模型给出的 CDF 和真实光谱红移 CDF（单点阶跃函数）之间的平方差的积分（分 bin 之后应该是简单加和？）
- 如果使用 classification 常用的 cross-entropy 会导致对偏离 1 个 bin 和偏离 100 个 bin 的惩罚趋同
- 可以同时避免模型「过于自信」和「不够自信」的问题
最终单点红移估计为所有 bin 根据概率加权的平均，而不是 PDF peak
feature 选用全部波段上的 magnitude 及其误差
- 在 LS DR10 上用了六个波段的 tractor magnitude 以及误差共 12 个特征
- 在 PS1 DR2 中使用了 grizy 五个波段的三种 magnitude（Kron, PSF 以及 Aperture）及误差一共 30 个特征
  - 模型有机会从 PSF 和 Kron 的差异中得到一些形态/尺寸信息
- MLP 可以很容易学习到 color 信息，所以改为输入 color 提升不大
一些 ML 的实验设置：AdamW optimizer、参数设置、防止过拟合、学习率的自动控制
photo-z 评估指标包括 outlier fraction（超过 0.15）、bias 和 scatter、nMAD

LS 结果是 nMAD=0.015，outlier fraction 为 0.50% 并且几乎没有 bias
- 对于 DESI ELG 误差很大，并且 outlier fraction 超过 10%，可能因为 ELG 更暗并且 star-forming galaxy具有颜色-红移简并
  - 可能需要依靠图像信息解决问题
PS1 的性能低很多：nMAD=0.028，outlier fraction 为 0.62%
- 加入 unWISE 信息之后有很大的提升（但是还是相比 LS 更差），说明对于中等红移的星系 mid-IR 信息非常重要
仅使用 SDSS 的两个指标是 0.0175 以及 0.73%，仅使用 DESI 的指标和 all data 的指标类似
fig5 给出了 PDF 估计的六个例子
- panel c 展示了处理 bimodal 的能力
- panel d 失败的原因是 blending，也就是颜色混合了一个红星系和一个蓝星系的信息
- panel e 失败的原因是受到了周围 bright star 的影响
- panel f 的原因是 over split，也就是 catalog 中的两个 object 实际上是同一个源
fig6 对应于 PIT 图，说明这里给出的预测比较保守（会给出一个偏大的 scatter）
- 可以通过 temperature scaling 进行 calibration，调整之后 PIT 更像是一个 uniform 分布
相比其他应用在 LS 上的 Random Forest、XGBoost 以及 ANN 等方法具有一定优势
- 对比 LS official photo-z 以及 Wen&Han 2024 也有一定优势

DESI DR1 的样本选择是为了 cosmology 服务的，所以在 mag-color 空间中不具有足够的代表性
使用 SHAP 探究了 LS 相比 PS1（即使加入 unWISE 后）的优势
- 在 LS 中最重要的 feature 来自 r 和 W1，模型的行为是从这些 mag 中提取 SED 特征
- 在 PS1 中模型给 g_kron 以及 sigma_g_PSF 这些特征赋予了很高的权重，说明 SNR 太低需要依赖其他的特征

fig2 在单个平面上绘制多个单色 colormap 叠加的方式可以参考
分 bin 的另外一个 justification 是：即使计算出了更高分辨率的 PDF 也很难完整存储
photo-z 评估仅针对具有 spec-z 的星系，而实际使用场景（比如 weak lensing 或者 cluster detection 依赖于 faint galaxy photo-z）的可靠性和性能很难评估
- 解决办法可能是 COSMOS 天区的长时间 photo/spec 观测提供 faint 样本，或者从 SOM 中把没有足够 spec-z 数据的网格去掉