Zhang2025PhotometricRedshiftEstimation
Brief
#
- 将 RAIL 框架应用到了真实 DP1 数据上进行比较
- 比较的 metric 包括 $\Delta$ 分布、衡量 PDF 差别的 PIT QQ plot 以及 nz 分布的差别
- 结果比较乐观:当前的方法都可以达到 LSST 对 bias/scatter 的要求
- fig5 的左上 panel 值得注意:photo-z 算法会存在系统性的对低/高红移星系高/低估红移的问题
- 8 个方法中 FlexZBoost 和 DNF 表现更好
Intro
#
Data
#
- DP1 包括了共计 15 deg2 的六个天区,主要追求和 Euclid 和 Chandra 等的重合
- 使用的相机是 LSSTComCam (Commissioning Camera) 而不是正式的 LSSTCam
- flux 定义选择了 Gaap1p0 (1 arcsec aperture flux)
- 筛选条件是 i-band flux SNR 大于 5 以及 g/r band extendedness 大于 0.5
- ECDFS 天区的 5sigma 极限大约是 26-27 之间(zy band 略差)
- 用于参考的红移样本来自 spec-z, grism-z 以及高质量的 photo-z(fig1/2)
- 对于具有多个红移的对象取 best redshift
- 匹配的 tolerance 用了 0.75 arcsec
- 和 photometric catalog 进行匹配,要求所有波段都有观测、SNR 大于 20
- 前一个条件可能导致一些高红移 drop-out 被筛选出去
- 将参考样本划分为 70% 训练集和 30% 测试集,大致数目是 7k/3k
- 训练样本普遍比 photometric catalog 更亮
- 此外引入了 DESI DR1 和 Euclid 作为 external reference
Method
#
- template 选择了 BPZ 和 LePhare
- 模板来自 Ilbert 2009,是 Polletta 2007 和 BC03 的组合
- LePhare 对尘埃的处理更细致
- template 方法的好处是外推时有更强的稳定性,缺点是模板不一定能代表真实星系
- ML 方法包括 TPZ、FlexZBoost、kNN、CMNN、GPz、DNF
- RAIL projects 可以根据用户定义的 flaxor 自动生成配置文件,这里使用了三种 flabor
- 用 ECDFS 6band 数据训练,在同一天区进行测试
- 用 ECDFS 4band 数据训练,在另外一个只有 4band 数据的 SV_38_7 天区测试
- 用 6band+YJH 数据训练,以研究近红外数据带来的提升
- 基于相对红移偏差 $\Delta$ 定义 bias、scatter 和 catastrophic outlier rate
Results
#
- flux 定义的选择上:Gaap1p0、cmodel 以及 sersic flux 相差不大,最终选择了 Gaap1p0
- 为不同算法定义了合适的超参数
- fig4 给出了八个算法的表现,y=x 两侧的虚线表示 outlier 的边界
- template 方法的共同问题是将 1.5-3.0 红移的星系错误认作 0.5 以下的低红移星系(对应 panel 右下角),可能是因为将 Lyman break 识别为了 Balmer break
- tab2: 八个算法的 bias 和 nmad 都符合要求(分别是 0.005 和 0.1),并且 FlexZBoost 和 DNF 表现最好
- 所有算法都在 0.3-1.2 的红移区间和亮于 22.5 等的星等区间表现最佳(fig5)
- 在低/高红移系统性高/低估是全部算法都有的趋势
- template 相比 ML 算法整体具有更高的 scatter
- fig6 给出了全部方法的 PIT QQ plot
- CMNN 对于 PDF 宽度过于自信
- BPZ 和 LePhare 会倾向于高估红移(?)
- 加入 Euclid YJH 之后 FlexZBoost 在高红移提升显著(fig7)
- fig8 对应于各个算法给出 nz distribution 的性能
- 六个波段的表现很好,除了 z=0.2 处有一个额外的 peak
- 四个波段(还包括在训练和测试阶段应用不同的天区)的表现稍差
- 最终的 nz 分布表现出 training imprints
- DNF 表现相对较好
Thoughts
#
- fig2 里面为什么 spec-z 可以延伸到 i-mag 25 的地方?
- 有关 LePhare 很多的 citation 来自 IIbert
- fig4 里面图片其实可以给 0-1/2 更多的权重