Yantovski-Barth2024CluMPRGalaxyClusterfinding

June 17, 2026

gemini https://aistudio.google.com/prompts/1TN4DdPpb9T_p_mFAwc6nGG-ZMHPosRBH

Brief #

建立在已有的 photo-z 和 stellar mass 的 catalog 基础上，仅统计 cylinder 内的星系，概率来源于 photo-z 不确定性
最重要的是校正观测条件随着红移的变化，包括
- photo-z 误差随着红移升高而升高，所以高红移的 cylinder 更高
- cylinder 计数的背景值值随着红移的变化（fig4）
- stellar mass 依靠 Schechter function 进行校正，将低质量端 stellar mass 以补偿因子的形式加入高红移 cluster 的 stellar mass 估计中

Intro #

介绍其他算法的时候提到了 redMaPPer、WaZP、WHL、AMICO、CFSFDP
- WHL 确实在 HSC 上有应用，可以作为一个有用的 reference；还有在 DES 上的应用
CluMPR for Clusters from Masses and Photometric Redshifts
- 主要追求 cluster catalog purity

Data #

使用 DESI Legacy Survey 的测光数据（DR9），波段包括 grz+W1/W2（一般默认包括来自 unWISE 的红外数据）
- 覆盖北天区大约 20k deg2
photo-z 和 stellar mass 都来自 Zhou 2023，具体的方法是 random forest
- 假设 photo-z 概率分布服从 Gaussian 形式
galaxy 筛选包括 z-band 亮于 21、来自 Gaia 的 BSM、photo-z 超过 0.01

Method #

筛选 BCG candidate 的方式是 stellar mass 高于 11.2，这个 threshold 的来源是经验性质的观察
针对每一个 candidate 计算周围 cylinder 内的星系的数量
- cylinder 半径采用 0.1、0.5 和 1Mpc，半高设定为两倍 $\sigma_z$
  - $\sigma_z$ 随着 z 的变化通过部分数据插值得到
- 针对星系 photo-z Gaussian 分布，通过多次采样体现其红移不确定性，根据多次采样之后该星系落入 cylinder 的频率确定星系的成员概率
- 背景的计算方式是：设定随机天区计算 cylinder 中的数量，然后根据 Poisson 分布设定 $B+k\times \sqrt{B}$ 作为阈值，$k$ 的取值是 1.2/1.8
  - 背景水平随着红移系统性变化，这是一个重要的参考
  - $k$ 其实是 SNR threshold
- 将 0.5Mpc 内的重复探测合并为同一个，排序依据是纯粹的 stellar mass
- 最后对于可能质量有问题的 cluster 进行 flag：处于巡天 footprint 边缘、周围存在前景亮星系
Eddington bias 会导致星系红移向红移 peak（大约在 0.4-0.6 位置）方向偏移
- 通过统计 member 相对于 BCG 的红移偏差的不对称性来校准（fig5）
  - 通过加一个修正函数来让 member 在 BCG 红移两侧保持对称来修正 Eddington bias
最终 richness 计算为全部星系概率加和减去背景，还计算了概率加权的总 stellar mass
- 由于巡天是 flux limited，为了校正 Malmquist bias 需要加入一个红移演化的因子
  - 这一步在 redMaPPer 里面用 mstar - z 关系来校正
  - 这里的校正同样用到了 Schechter function（AppB），具体来说是仅用数据完备的高质量端拟合一个 Schechter function，然后计算 Schechter 在高质量端和 total integral 的大小之比作为补偿因子

Results #

生成了 0.1-1.0 的总长度大约 300k 的 cluster catalog
- fig7 展示了一些 cluster 的图像
- fig8 对应红移-richness 分布：沿 x 轴的变化不明显体现了对 Malmquist bias 的修正
最主要的对比是和 Zou 2021（CFSFDP）的比较
- 匹配的 tolerance 是 5arcmin
- 两边相对于另一边的 completeness 分别是 85% 和 58%，可以解释为 clumpr 这边丢弃了一些不显著的系统
- fig9/10/11 对比了 recovery fraction 随不同参数的变化
  - clumpr 在高红移完备性更高（fig9）
和 redMaPPer 的匹配结果是
- clumpr 和 Zou 2021 都找到了 95% 以上的 redMaPPer cluster
  - 主要因为 LS 相比 SDSS 的质量提升？
  - 可能也有 5arcmin 比较简单
- 和 redMaPPer richness 有很好的相关性（fig12）
  - 为什么没有对比 richness？
fig13 对比了 cluster redshift 估计的性能，clumpr 是其中表现较好的
- 所有方法在高红移都存在红移低估的现象，是因为更多的低红移星系把 cluster 的红移向 0.4-0.6 方向 drag

Thoughts #

用 Lz 决定是否「落入」好像还是有问题的？即使一个 photo-z 的 PDF 全部位于 cylinder 中，也有很大概率不是成员
- 其实可以直接按照 PDF 分配概率，比如类似 AMICO 的方式分配到不同的 slice 里面
随红移变化的最主要效应就是探测极限会逐渐升高，这里用了超过一种方法校正这一效应
- mag limit 的办法相当于对低红移 cluster 也做了公平考虑的削减
input galaxy catalog 的红移分布 peak 确实是存在的
redMaPPer 或者其他算法没有考虑「member 在 BCG 两侧红移分布的不对称性」
- 不过这里其实也没有考虑两侧 shell 体积不一致所以红移分布应该具有一点点不对称（但是影响不大）
这里的 Zou 2021 也出现在了 Chen2025ComparativeStudyHalo
初始 stellar mass 的阈值和 massive galaxy catalog series 所做的事情非常类似