Rykoff2014RedMaPPerAlgorithmSDSS_new

October 26, 2025

Intro #

这里介绍了 redMaPPer 的优势
- 根据红移换用不同的颜色
- 从数据中学习 red sequence model
- 对 mask 的处理
- 有一个能够描述选择函数的 random
- 提供概率化的输出
- richness 和 mass 之间的关系足够紧密
red sequence 相对于 photo-z method 的优势在于暗弱星系的 photo-z 不是那么容易确定，而且 cluster 中的 galaxy population 是比较特殊的，普通的 photo-z 可能不一定适用
延伸阅读可以包括 R09、R12 以及 Rozo2010、Wen 的 photo-z 方法

包含了 SDSS DR8 的部分天区，大约 10000 deg2
mask 在默认的 BOSS bright star mask 基础上还补充了一些
对 photometric catalog 的处理
- 要求 i-band 比 21 等更亮
- cmodel 作为光度 mag、model 作为颜色 mag
- 剔除了三个 flag，但是保留了一些其他的 flag
- 最终包括 565m 个星系，也就是每 100 deg2 包括 5.6m 个星系
spec data 的处理
- 使用 SDSS DR9 spec 数据
- 在 calibration 阶段仅采用其中的 20%

3 总体来说 redMaPPer 划分为 calibration 和 finder 两个阶段
- calibration 是用具有 spec-z 的红色星系作为 seed 来进行的
- finder 阶段会将所有的星系都视作潜在中心，然后确定每一个 cluster 的成员和红移（还用到了 percolation）
  - cluster 红移和成员的选择也是迭代进行的

4 richness 的定义：每一个观测到的星系都属于 member 和 bkg 的其中一种
- 这里的 filter 由空间分布、光度分布和颜色分布组成，其中颜色分布用 chi2 描述
5 需要对 mask 进行精细的处理，包括 geometry mask 以及 depth map
- 具体来说，实际观测到的 richness 要乘一个怎样的补偿因子是由 Monte Carlo 计算结果决定的
- 最后的 mask 的效应由 scale factor 和 mask fraction 两个因子决定
6 实际的 calibration 过程需要用到很多没有光谱红移的暗弱星系
- 对 spec 数据进行 multi Gaussian 的拟合，仅保留红星系的样本
- 在 seed 周围寻找成员星系，然后将这些成员星系也用于模型的计算
- 用所有的红色星系来建立一个 red sequence model
- 以上两步迭代进行，迭代次数到 3 次左右效果就很好了，在第三次的 red sequence model 的基础上进行正式的 cluster finding

7 红移估计
- 对于单个星系，除了 chi2 之外还要乘一个体积先验，在此基础上还进行了一个 afterburner 修正，使得 $z_\mathrm{red}$ 相对于真实 spec-z 是无偏的
- 对于 cluster 的红移估计和成员的选取迭代进行
  - 小部分红移出错是由于 mis-centering 导致的
  - 最终可以给出一个红移的分布概率函数
8 centering
- 为每一个可能是 BCG 的星系计算一个中心概率
- 具体的计算是将星系分为三类：CG、satellite、bkg，然后根据各自的不同的 filter 分别计算似然概率
  - CG filter 的要求包括亮度、红移和 cluster 红移比较靠近、位于临近区域的密度峰值处
  - 这里的 filter 有很多参数，也是从数据中学习的
9 finder
- first pass
  - 首先要求颜色相符、足够亮的星系
  - 之后为每一个星系计算一个初步的 richness，低于 3 的候选者将会被剔除
  - 最后计算一个准确的红移
- likelihood sorting
  - 结合 richness 和 center likelihood 进行排序，但是主要由前者决定
- 根据 likelihood 的排序，进行 percolation 以解决归属和反复计数问题

对 cluster finder 的结果施加了 20 的 lambda 筛选、0.08-0.55 的红移筛选以及 mask fraction 小于 0.2 的筛选
- 20 的 lambda 大约对应 1e14 的 halo mass
最终得到了 25236 个 cluster
在 0.35 之前体积数密度是基本恒定的，在 0.35 之后有下降，主要是因为高红移的不完备性

optical 几乎不存在纯粹由噪声导致的 false positive 的影响，主要挑战是 projection effect
这里做法是注入一些具有已知 richness 的 mock cluster，然后看 redMaPPer 是否可以成功找回，以及 richness 测量是不是准确

这里在 10000 deg2 天区上的总星系数目是 560m，也就是平均 100deg2 的星系数目应该是 5.6m，好像自己搜寻的结果比这个低很多，可能是 HSC north 的星系就不是很多
- SDSS reproduction 的筛选前的星系数目是 0.98m（HSC north）
- HSC 筛选前星系数目是 5.4m
「带有很多补丁的脚手架」的感觉依然存在
这里的逻辑和实际运行的顺序完全不一样，非常难以理解
也许可以用 CAMIRA 的 cluster 中心红移作为 spec data 的输入？