Yantovski-Barth2024CluMPRGalaxyClusterfinding

Brief #

  • 建立在已有的 photo-z 和 stellar mass 的 catalog 基础上,仅统计 cylinder 内的星系,概率来源于 photo-z 不确定性
  • 最重要的是校正观测条件随着红移的变化,包括
    • photo-z 误差随着红移升高而升高,所以高红移的 cylinder 更高
    • cylinder 计数的背景值值随着红移的变化(fig4)
    • stellar mass 依靠 Schechter function 进行校正,将低质量端 stellar mass 以补偿因子的形式加入高红移 cluster 的 stellar mass 估计中

Intro #

  • 介绍其他算法的时候提到了 redMaPPer、WaZP、WHL、AMICO、CFSFDP
    • WHL 确实在 HSC 上有应用,可以作为一个有用的 reference;还有在 DES 上的应用
  • CluMPR for Clusters from Masses and Photometric Redshifts
    • 主要追求 cluster catalog purity

Data #

  • 使用 DESI Legacy Survey 的测光数据(DR9),波段包括 grz+W1/W2(一般默认包括来自 unWISE 的红外数据)
    • 覆盖北天区大约 20k deg2
  • photo-z 和 stellar mass 都来自 Zhou 2023,具体的方法是 random forest
    • 假设 photo-z 概率分布服从 Gaussian 形式
  • galaxy 筛选包括 z-band 亮于 21、来自 Gaia 的 BSM、photo-z 超过 0.01

Method #

  • 筛选 BCG candidate 的方式是 stellar mass 高于 11.2,这个 threshold 的来源是经验性质的观察
  • 针对每一个 candidate 计算周围 cylinder 内的星系的数量
    • cylinder 半径采用 0.1、0.5 和 1Mpc,半高设定为两倍 $\sigma_z$
      • $\sigma_z$ 随着 z 的变化通过部分数据插值得到
    • 针对星系 photo-z Gaussian 分布,通过多次采样体现其红移不确定性,根据多次采样之后该星系落入 cylinder 的频率确定星系的成员概率
    • 背景的计算方式是:设定随机天区计算 cylinder 中的数量,然后根据 Poisson 分布设定 $B+k\times \sqrt{B}$ 作为阈值,$k$ 的取值是 1.2/1.8
      • 背景水平随着红移系统性变化,这是一个重要的参考
      • $k$ 其实是 SNR threshold
    • 将 0.5Mpc 内的重复探测合并为同一个,排序依据是纯粹的 stellar mass
    • 最后对于可能质量有问题的 cluster 进行 flag:处于巡天 footprint 边缘、周围存在前景亮星系
  • Eddington bias 会导致星系红移向红移 peak(大约在 0.4-0.6 位置)方向偏移
    • 通过统计 member 相对于 BCG 的红移偏差的不对称性来校准(fig5)
      • 通过加一个修正函数来让 member 在 BCG 红移两侧保持对称来修正 Eddington bias
  • 最终 richness 计算为全部星系概率加和减去背景,还计算了概率加权的总 stellar mass
    • 由于巡天是 flux limited,为了校正 Malmquist bias 需要加入一个红移演化的因子
      • 这一步在 redMaPPer 里面用 mstar - z 关系来校正
      • 这里的校正同样用到了 Schechter function(AppB),具体来说是仅用数据完备的高质量端拟合一个 Schechter function,然后计算 Schechter 在高质量端和 total integral 的大小之比作为补偿因子

Results #

  • 生成了 0.1-1.0 的总长度大约 300k 的 cluster catalog
    • fig7 展示了一些 cluster 的图像
    • fig8 对应红移-richness 分布:沿 x 轴的变化不明显体现了对 Malmquist bias 的修正
  • 最主要的对比是和 Zou 2021(CFSFDP)的比较
    • 匹配的 tolerance 是 5arcmin
    • 两边相对于另一边的 completeness 分别是 85% 和 58%,可以解释为 clumpr 这边丢弃了一些不显著的系统
    • fig9/10/11 对比了 recovery fraction 随不同参数的变化
      • clumpr 在高红移完备性更高(fig9)
  • 和 redMaPPer 的匹配结果是
    • clumpr 和 Zou 2021 都找到了 95% 以上的 redMaPPer cluster
      • 主要因为 LS 相比 SDSS 的质量提升?
      • 可能也有 5arcmin 比较简单
    • 和 redMaPPer richness 有很好的相关性(fig12)
      • 为什么没有对比 richness?
  • fig13 对比了 cluster redshift 估计的性能,clumpr 是其中表现较好的
    • 所有方法在高红移都存在红移低估的现象,是因为更多的低红移星系把 cluster 的红移向 0.4-0.6 方向 drag

Thoughts #

  • 用 Lz 决定是否「落入」好像还是有问题的?即使一个 photo-z 的 PDF 全部位于 cylinder 中,也有很大概率不是成员
    • 其实可以直接按照 PDF 分配概率,比如类似 AMICO 的方式分配到不同的 slice 里面
  • 随红移变化的最主要效应就是探测极限会逐渐升高,这里用了超过一种方法校正这一效应
    • mag limit 的办法相当于对低红移 cluster 也做了公平考虑的削减
  • input galaxy catalog 的红移分布 peak 确实是存在的
  • redMaPPer 或者其他算法没有考虑「member 在 BCG 两侧红移分布的不对称性」
    • 不过这里其实也没有考虑两侧 shell 体积不一致所以红移分布应该具有一点点不对称(但是影响不大)
  • 这里的 Zou 2021 也出现在了 Chen2025ComparativeStudyHalo
  • 初始 stellar mass 的阈值和 massive galaxy catalog series 所做的事情非常类似