Zhang2025PhotometricRedshiftEstimation

May 5, 2026

Brief #

DP1 包括了共计 15 deg2 的六个天区，主要追求和 Euclid 和 Chandra 等的重合
- 使用的相机是 LSSTComCam (Commissioning Camera) 而不是正式的 LSSTCam
flux 定义选择了 Gaap1p0 (1 arcsec aperture flux)
- 筛选条件是 i-band flux SNR 大于 5 以及 g/r band extendedness 大于 0.5
- ECDFS 天区的 5sigma 极限大约是 26-27 之间（zy band 略差）
用于参考的红移样本来自 spec-z, grism-z 以及高质量的 photo-z（fig1/2）
- 对于具有多个红移的对象取 best redshift
- 匹配的 tolerance 用了 0.75 arcsec
- 和 photometric catalog 进行匹配，要求所有波段都有观测、SNR 大于 20
  - 前一个条件可能导致一些高红移 drop-out 被筛选出去
- 将参考样本划分为 70% 训练集和 30% 测试集，大致数目是 7k/3k
- 训练样本普遍比 photometric catalog 更亮
此外引入了 DESI DR1 和 Euclid 作为 external reference
- Euclid 的作用在于增加了近红外波段的测光

template 选择了 BPZ 和 LePhare
- 模板来自 Ilbert 2009，是 Polletta 2007 和 BC03 的组合
- LePhare 对尘埃的处理更细致
- template 方法的好处是外推时有更强的稳定性，缺点是模板不一定能代表真实星系
ML 方法包括 TPZ、FlexZBoost、kNN、CMNN、GPz、DNF
- Team2026RedshiftAssessmentInfrastructure 中没有介绍 tpz，是一种基于 random forest 的算法
RAIL projects 可以根据用户定义的 flaxor 自动生成配置文件，这里使用了三种 flabor
- 用 ECDFS 6band 数据训练，在同一天区进行测试
- 用 ECDFS 4band 数据训练，在另外一个只有 4band 数据的 SV_38_7 天区测试
- 用 6band+YJH 数据训练，以研究近红外数据带来的提升
基于相对红移偏差 $\Delta$ 定义 bias、scatter 和 catastrophic outlier rate
- 最后一个指标定义为偏差超过 0.15 的比例

flux 定义的选择上：Gaap1p0、cmodel 以及 sersic flux 相差不大，最终选择了 Gaap1p0
为不同算法定义了合适的超参数
fig4 给出了八个算法的表现，y=x 两侧的虚线表示 outlier 的边界
- template 方法的共同问题是将 1.5-3.0 红移的星系错误认作 0.5 以下的低红移星系（对应 panel 右下角），可能是因为将 Lyman break 识别为了 Balmer break
- tab2: 八个算法的 bias 和 nmad 都符合要求（分别是 0.005 和 0.1），并且 FlexZBoost 和 DNF 表现最好
  - outlier rate 大约在 10% 左右
所有算法都在 0.3-1.2 的红移区间和亮于 22.5 等的星等区间表现最佳（fig5）
- 在低/高红移系统性高/低估是全部算法都有的趋势
- template 相比 ML 算法整体具有更高的 scatter
fig6 给出了全部方法的 PIT QQ plot
- CMNN 对于 PDF 宽度过于自信
- BPZ 和 LePhare 会倾向于高估红移（？）
加入 Euclid YJH 之后 FlexZBoost 在高红移提升显著（fig7）
fig8 对应于各个算法给出 nz distribution 的性能
- 六个波段的表现很好，除了 z=0.2 处有一个额外的 peak
- 四个波段（还包括在训练和测试阶段应用不同的天区）的表现稍差
  - 最终的 nz 分布表现出 training imprints
  - DNF 表现相对较好