Zhang2025PhotometricRedshiftEstimation

Brief #

  • 将 RAIL 框架应用到了真实 DP1 数据上进行比较
  • 比较的 metric 包括 $\Delta$ 分布、衡量 PDF 差别的 PIT QQ plot 以及 nz 分布的差别
  • 结果比较乐观:当前的方法都可以达到 LSST 对 bias/scatter 的要求
  • fig5 的左上 panel 值得注意:photo-z 算法会存在系统性的对低/高红移星系高/低估红移的问题
  • 8 个方法中 FlexZBoost 和 DNF 表现更好

Intro #

Data #

  • DP1 包括了共计 15 deg2 的六个天区,主要追求和 Euclid 和 Chandra 等的重合
    • 使用的相机是 LSSTComCam (Commissioning Camera) 而不是正式的 LSSTCam
  • flux 定义选择了 Gaap1p0 (1 arcsec aperture flux)
    • 筛选条件是 i-band flux SNR 大于 5 以及 g/r band extendedness 大于 0.5
    • ECDFS 天区的 5sigma 极限大约是 26-27 之间(zy band 略差)
  • 用于参考的红移样本来自 spec-z, grism-z 以及高质量的 photo-z(fig1/2)
    • 对于具有多个红移的对象取 best redshift
    • 匹配的 tolerance 用了 0.75 arcsec
    • 和 photometric catalog 进行匹配,要求所有波段都有观测、SNR 大于 20
      • 前一个条件可能导致一些高红移 drop-out 被筛选出去
    • 将参考样本划分为 70% 训练集和 30% 测试集,大致数目是 7k/3k
    • 训练样本普遍比 photometric catalog 更亮
  • 此外引入了 DESI DR1 和 Euclid 作为 external reference
    • Euclid 的作用在于增加了近红外波段的测光

Method #

  • template 选择了 BPZ 和 LePhare
    • 模板来自 Ilbert 2009,是 Polletta 2007 和 BC03 的组合
    • LePhare 对尘埃的处理更细致
    • template 方法的好处是外推时有更强的稳定性,缺点是模板不一定能代表真实星系
  • ML 方法包括 TPZ、FlexZBoost、kNN、CMNN、GPz、DNF
  • RAIL projects 可以根据用户定义的 flaxor 自动生成配置文件,这里使用了三种 flabor
    • 用 ECDFS 6band 数据训练,在同一天区进行测试
    • 用 ECDFS 4band 数据训练,在另外一个只有 4band 数据的 SV_38_7 天区测试
    • 用 6band+YJH 数据训练,以研究近红外数据带来的提升
  • 基于相对红移偏差 $\Delta$ 定义 bias、scatter 和 catastrophic outlier rate
    • 最后一个指标定义为偏差超过 0.15 的比例

Results #

  • flux 定义的选择上:Gaap1p0、cmodel 以及 sersic flux 相差不大,最终选择了 Gaap1p0
  • 为不同算法定义了合适的超参数
  • fig4 给出了八个算法的表现,y=x 两侧的虚线表示 outlier 的边界
    • template 方法的共同问题是将 1.5-3.0 红移的星系错误认作 0.5 以下的低红移星系(对应 panel 右下角),可能是因为将 Lyman break 识别为了 Balmer break
    • tab2: 八个算法的 bias 和 nmad 都符合要求(分别是 0.005 和 0.1),并且 FlexZBoost 和 DNF 表现最好
      • outlier rate 大约在 10% 左右
  • 所有算法都在 0.3-1.2 的红移区间和亮于 22.5 等的星等区间表现最佳(fig5)
    • 在低/高红移系统性高/低估是全部算法都有的趋势
    • template 相比 ML 算法整体具有更高的 scatter
  • fig6 给出了全部方法的 PIT QQ plot
    • CMNN 对于 PDF 宽度过于自信
    • BPZ 和 LePhare 会倾向于高估红移(?)
  • 加入 Euclid YJH 之后 FlexZBoost 在高红移提升显著(fig7)
  • fig8 对应于各个算法给出 nz distribution 的性能
    • 六个波段的表现很好,除了 z=0.2 处有一个额外的 peak
    • 四个波段(还包括在训练和测试阶段应用不同的天区)的表现稍差
      • 最终的 nz 分布表现出 training imprints
      • DNF 表现相对较好

Thoughts #

  • fig2 里面为什么 spec-z 可以延伸到 i-mag 25 的地方?
  • 有关 LePhare 很多的 citation 来自 IIbert
  • fig4 里面图片其实可以给 0-1/2 更多的权重