Rykoff2014RedMaPPerAlgorithmSDSS

January 13, 2025

涉及算法细节的章节是 sec3~sec9

“自训练”的意思就是算法包括很多的参数，然后根据最后的结果调整这些参数，就像 R09 里面的 richness-radius 关系的参数：有点类似一个可解释的算法加上一点机器学习的优化？

Comment #

第三节给出了整体的 outline
- 用星系样本得到 red sequence 作为红移的函数，然后用 red sequence 识别图像中的 cluster
- 总之最后的结果就是 detect 到一些 cluster，副产品是一个作为红移的函数的 red sequence
很经常地使用迭代方法，但是迭代是否有效、最后能否收敛其实都是很脆弱的问题
- 本质上来说是一个统计信息处理和提取的过程，难道没有更优雅的方法吗？
这里 section 的顺序到底是按照什么来的？感觉逻辑很混乱
- sec3~9 应该合并到一起，作为算法原理
- 应该是 sec6 和 sec9 放在最前面，然后 4,5,7,8 作为这两节的 sub-section
- 作者的逻辑可能是 4/5 作为 6 的准备工作，7/8 作为 9 的准备工作

Abs #

一个 red sequence cluster finder，优点包括
- self-training
- 处理不同深度的 mask
- 以概率形式给出红移
- 以概率形式给出 BCG
应用在 10000 平方度的 SDSS DR8 上面，得到了 0.08~0.55 红移上的 25000 个 cluster 的目录
红移的中位误差在 0.02 左右

1 Intro #

主题是 photometric cluster finding

用星系团研究 DE: DES, Pan-STARRS, HSC, LSST

对于多波段数据，可以用算法研究角位置、颜色、红移空间中的 clustering, 算法包括两类
- 基于光度红移
- 基于 cluster red sequence
new photometric cluster finding algorithm 的必要性
- 一致性问题
  - 对于 photo-z, faint end 的误差会极大增加，因为没有很好的训练样本
  - 对于 red sequence，4000A break 的位置会随着红移变化，所以需要用不同的颜色来描述 red sequence 中统一的红色
- 算法应该具有 self training 的能力，因为先验参数的设置可能会导致系统误差
- numerical efficiency
- survey mask
- 这里的 random point 指的是 mock？
- 为每一个 cluster 生成红移的概率分布，以及 cluster 中心位置的概率分布
- 最小化 richness-mass 关系的 scatter
  - 在 R09 和 R12 中进行了探索，哪些改进是有效的，而哪些是不重要的
    - 为每一个星系估计 BCG 概率是重要的，而 hard color cut 是不好的
我们提出了 red-sequence Matched-filter Probabilistic Percolation (redMaPPer)
- 满足以上的要求（具体描述在 2012 年的文章中）
- 一个 personal bias 是：based on red-sequence，而不使用 photo-z
  - 二者的区别是使用颜色来确定视线方向上的 clustering，而不是直接使用红移空间
    - redMaPPer 也可以用于在红移空间中使用
  - 两种方法的对比
    - 我们不相信 photo-z 在 faint 环境下的效果，因为缺乏训练的样本
    - cluster 中的星系是特殊的，用整个 galaxy population 推测红移是不合理的
    - 过去的比较没有证明 red sequence 方法和 photo-z 哪个是更好的
    - 在足够高的红移下，red sequence 消失，只能使用 phot-z 方法
    - redMaPPer 也需要光谱 sample，但是不需要局部有代表性的样本，可以是各个红移上最亮的星系
- 只需要 photometric galaxy catalog multi-band 覆盖了对应红移的 4000A break
This work 介绍了将 redMaPPer 应用于 SDSS DR8 的结果作为示例
这里提到了 cosmology 的设置：h=1.0 means 全部距离都带有 $h^{-1}\ \mathrm{Mpc}$ 的单位

2 Data #

2011 年的 DR8 数据，覆盖了 14000 平方度

这里使用的星系 catalog 范围和 BOSS 一致（10500 平方度），bad/bright mask 也来自于 BOSS

BOSS 提供的 bright star mask 基于 Tycho catalog，是不完全的
- 和 Yale bright star catalog 对比，有 70/9000 的亮恒星是不在其中的
- 对 63 个 NGC 天体和以上 70 个亮恒星进行了 mask，除去了 36 平方度的面积
redMaPPer 需要非常干净的 galaxy catalog，所以需要严格筛选
- 这里的策略和 Sheldon12 类似
- 用 SDSS 默认策略进行 star/galaxy separation
- 限制 i 波段星等比 21 更亮
- 剔除具有 SATUR CENTER, BRIGHT, TOO MANY PEAKS, (NOT BLENDED OR NODEBLEND) 的对象
- 保留了 SATURATED, NOT CHECKED, and PEAK CENTER 的对象
  - 因为 cluster 中心可能会错误地带有这类标签
采用 i-band CMODEL MAG 作为 mag 的描述，但是采用 MODEL MAG 计算颜色
最后进行 extinction correction

需要使用光谱数据来校准 red sequence（但是算法是可以自训练的）并且验证测光红移

使用 SDSS DR9 光谱，20% 用于训练，80% 用于验证

3 Algorithm #

核心参数是：optimized richness estimator $\lambda$

算法分为两个阶段
- 校准阶段：校准 red sequence 作为红移的参数（其实是得到颜色作为红移的函数 $c(z)$？）
- finder 阶段：利用校准后的 red sequence（其实就是颜色-红移关系）识别 cluster 以及测量 richness
两个阶段互相迭代
- 最初的 cluster 来源于 color cut
- 最初的 red sequence 来源于一批具有光谱红移的 cluster 中心星系
- 用 cluster catalog 校准 red sequence, 用 red sequence 进行新的 cluster finding
用 cluster 确定 red sequence 的 calibration 过程也是迭代的
- 在 sec6 中详细介绍
- 首先用具有光谱红移的 training clusters 进行校准
  - 也就是得到 $c(z)$ 关系
  - 在 maxBCG 中使用的是 SDSS LRG
- 对于训练集的要求是：每 0.05 红移区间有 40 个具有光谱数据的 cluster
  - 对于 SDSS 能够满足，但是未来的高红移巡天（比如 DES）不一定可以满足
对于 this work
- 首先从光谱星系中选出一些红色的样本作为 seed, 寻找周围区域的相同颜色星系的 overdensity
  - 通过这种方式将已知的光谱红移扩展到成员星系上，之后可以更精确地确定 red sequence
- 然后将这些 over-density 视作 cluster 进行 red-sequence 的拟合
  - 这里包含了 tilt，也就是颜色和光度不是独立的
- 上面两步包含在 sec6 中
- 基于 red-sequence model 进行 cluster finding (sec9)
  - 将每一个星系假设为 cluster 中心
  - 用 red sequence 计算星系的测光红移 $z_\mathrm{red}$（sec7.1）作为红移的 initial guess
  - 基于红移计算 richness $\lambda$ 以及 likelihood（sec4）
  - 对 cluster member 和红移进行迭代的优化（sec7.2）
  - 根据 likelihood 对 cluster 进行排序，对于排序较高的 cluster 的周围 neighbor 进行 mask，这一过程称为 percolation（sec9.3），可以避免重复计数

4 Richness estimator #

基本和 R09 相同，相比 R12 从 single-color 变成了 multi-color

最基本的想法是对于给定的星系属性，观测到的投影分布是 cluster member 和 background 的相加，richness 应该满足

$$ \lambda = \sum p(\mathbf{x} | \lambda) = \sum_{R < R_c(\lambda)} \frac{\lambda u(\mathbf{x} | \lambda)}{\lambda u(\mathbf{x} | \lambda) + b(\mathbf{x})} $$

其实这个方程的本质就是：为测量到的 galaxy count 乘一个因子得到真正的 cluster member 数量，这个因子由 source 强度和 bkg 强度的比值决定
需要定义半径和光度的 cutoff, 这里 $R_c$ 由 radius-richness 关系给出，光度的截断定义为 $0.2L_\star$
- radius-richness 关系中有两个参数 $R_0$ 和 $\beta$，采用 R09 中的最佳参数（这里从 $\alpha$ 改成 $\beta$ 是为了和下面 luminosity function 中的参数作区分）
通过数值方法可以直接求解以上方程得到 richness（这一步应该属于 finder 过程），此外还可以得到一个半径的估计 $R_c$
星系的性质 $\mathbf{x}$ 包括到星系团中心的距离、星等、颜色（三个波段）
- 这里的颜色被压缩到一个 $\chi^2$ 变量中，用于描述 red sequence 的拟合 goodness，或者说是这个星系和模板之间的差距，详情见下面的 color filter 章节
- 星等分布用 Schechter function 描述，这里参数 $\alpha$ 取值为 1，$m_\star$ 用一个复杂的多项式表示
  - 在未来的 redMaPPer 中，使用 data 的测量值替代这些先验决定的参数

Color filter #

这里关于颜色的 filter function 不再是 Gaussian 形式，而是用 $\chi^2$ 分布来表征

理论 red sequence 模型可以用 $\mathbf{c}(z,m_i)$ 表示，也就是给定红移和星等存在一个唯一的颜色向量
- 这里考虑了 red sequence 的斜率
- 用一个协方差矩阵描述离散度
  - 因为颜色包含多个分量
  - 仅和红移有关，和星等无关
对于一个实际的星系来说，$\chi^2$ 的计算方式为 $\chi^2(z) = (\mathbf{c} - \langle \mathbf{c} | z, m_i \rangle) \left(\mathbf{C}{\mathrm{int}}(z) + \mathbf{C}{\mathrm{err}} \right)^{-1} (\mathbf{c} - \langle \mathbf{c} | z, m_i \rangle)$
- 这里误差包含 intrinsic 的以及测光的误差
如果星系是 cluster 成员，上面的 $\chi^2$ 应该服从 $\chi^2$ 分布
- 自由度 $\nu$ 为颜色的数量

Background #

假设背景是空间位置无关的，仅取决于星等、颜色和红移（颜色用 $\chi^2$ 描述）

5 Mask/Different Depth #

这一章在逻辑顺序上不是应该在最后吗？

两个限制因素：

在不同的区域上具有不同的 depth
- 也就是因为深度不足导致没有发现 cluster
存在一些因为 bright star 导致的 mask

估计由于以上因素导致的缺少的 cluster richness 比例，然后进行修正

5.1 Correction term #

将星系参数空间划分为无穷小的 pixel（用 $N_i$ 表示）就可以得到

$$ 1 = \sum_{i} N_i \frac{u(\mathbf{x}_i)}{\lambda u(\mathbf{x}_i) + b(\mathbf{x}_i)} $$

然后拆分为 in 和 out 两部分

$$ 1 = \sum_{\mathrm{in}} N_i \frac{u(\mathbf{x}_i)}{\lambda u(\mathbf{x}_i) + b(\mathbf{x}_i)} + \sum_{\mathrm{out}} N_i \frac{u(\mathbf{x}_i)}{\lambda u(\mathbf{x}_i) + b(\mathbf{x}_i)} $$

前者是实际的观测值，而后者是修正项 $C$

6 Calibration stage #

6.0 Summary #

iteration 0
- 从 SDSS 的光谱星系中选出一些红色的光谱星系
- 计算颜色-红移关系
iteration 1
- 以星系样本和颜色-红移关系为基础，进行周围成员星系的搜寻并且估计 richness（单色）
- 用这些星系作为样本得到 red sequence 的第一次估计
iteration n
运行 finder 然后再重新计算 red sequence model（在 sec9 中描述）
继续进行迭代，得到 cluster catalog 以及 multi-color membership
- 在后续迭代的过程中，使用 multi-color 代替第一次迭代中用到的 single color

这里其实包括了整个过程，只不过把基于 red sequence 运行 finder 的过程打包放到 sec9 了

6.1 Outline #

这里对应于第一个阶段也就是 calibration: 从已知红移的 cluster 目录得到 red sequence

这里 cluster 的作用是将中心星系的光谱红移扩展到周围的 member galaxy 上

如果有一个已知光谱红移的星系样本，就可以从中拟合出颜色-红移关系
- 但是存在限制条件：暗端的星系数据不完全，在校正 red sequence 的斜率上存在困难（很需要这个 tilt 吗？）
一个解决办法是 cluster 将成员星系和中心星系的红移联系起来，只需要一个已知光谱红移的 cluster catalog
- member galaxy 可能没有光谱数据，但是可以通过 cluster 的性质确定其红移
- 可以通过 X-ray 或者 SZ catalog 获得，或者用 redMaPPer 先找一些 cluster 出来，然后对其中心进行光谱观测
This work 中我们用现有的光谱星系作为 seed，先进行 cluster 的搜寻（通过寻找类似颜色的星系的 over-density），然后进行 red sequence 或者说颜色-红移关系的确定
- 这些光谱星系一定是 BCG 吗？一定是 cluster member 吗？

6.2 Selecting Seed Galaxies and the Initial Color Model #

calibration 的第一步是从 SDSS 光谱星系中选出作为 seed 的红色星系，这可以通过颜色 cut 来实现（在 0.35 以下用 g-r, 在 0.35 以上用 r-i，以保证跨越 4000A break）

筛选步骤具体来说是

首先把星系按照红移分组（宽度是 0.05）
- 在程序里面使用的是 0.1
然后估计 red sequence 的颜色平均值和 intrinsic scatter（使用 Gaussian Mixture Method），位于平均值附近 2sigma 以内的星系被认为是红星系
对于这些筛选出来的红色星系，计算颜色-红移关系作为对初始关系的校正
- 其实有点像 sigma clip
- 用 spline interpolation 进行拟合
估计 color-redshift 关系的 width，作为对初始 scatter 估计的校正
用更新之后的 mean 和 width 进行再一轮的筛选，筛选标准是 2sigma 以内

这里没有提到颜色和光度的关系

这里可以看出红移高于 0.35 之后，g-r 颜色不再变得更红，说明 4000A break 已经越过了 g-r 的窗口？

6.3 Single color member selection #

以上得到了 seed galaxy sample 和初步的 color-z 关系，下面用 single-color 进行周围 member galaxy 的筛选（仅在第一次迭代中使用 single color）

需要注意的是使用 galaxy color 可能在高红移带来噪声，所以这里以颜色-红移模型中的颜色作为 color box 的基准

对于一个 seed：

选取所有位于 seed 周围 $500h^{-1}$ kpc 之内、并且颜色不显著偏离模型颜色 $2\sigma$ 的星系（这里 $\sigma$ 用的是固定值？）
- 这里的 aperture 是固定的
以这些星系为样本对 red sequence 进行拟合
- 这里的拟合是为了之后计算 richness 吗？
测量 single-color cluster richness $\lambda$
对于 richness 超过 10 的 cluster，将光谱星系的红移赋予周围 membership 大于 0.7 的星系
- 这样就得到了更大的具有红移的星系样本
- 虽然这个样本是存在污染的（membership 低于 1），但是其污染程度可以被估计

初始的 seed (42000) 几乎都是较亮的星系，而最后的样本（600,000）中具有更暗的星系。这种向 fainter end 的延伸是依靠对 cluster member 红移的传播实现的。

6.4 Modeling the red sequence #

上面用分配红移的方法给一些没有光谱红移的成员星系分配了红移

虽然计算 cluster richness 的时候校准过一遍 red sequence，但是这里用新的星系样本进行再一次校准

red sequence 模型由星等-颜色关系来描述
- 这个关系同时也是红移的函数
- 除此之外还有 multi-color 对应的协方差矩阵，与单色情况下的 red sequence intrinsic scatter 对应
- 具有很多的自由参数，警惕过拟合
每次用一种颜色对红移进行校准，之后再拟合协方差矩阵的非对角元素
为了减弱 blue cluster galaxy 的影响，在拟合之前进行一次 color cut
- 作为弥补需要用截断的 Gaussian 来进行概率计算

6.4.1 Measuring the Model Mean and Color Scatter #

拟合的目标是 $\langle c|m,z\rangle$，也就是给定红移和星等处的平均颜色
首先找到一个中位星等作为 pivot point，然后校准某个红移处 red sequence 的斜率和截距
通过一定的颜色 cut 来避免蓝星系的影响
最后还计算了单一颜色对应的 scatter，用 $C_{jj}^{\mathrm{int}}(z)$ 表示
最后得到了更加精确的红移-颜色关系，如下图所示

6.4.2 Covariance matrix #

这个 section 的目标是计算协方差矩阵的非对角元素

每次计算两种颜色对应的矩阵元素
通过为不同颜色设定优先级顺序来保证矩阵的正定性质
协方差矩阵包括 intrinsic 和 photometric 两部分
- 前者仅包含一个 band 之间的相关系数 $r$ 作为未知数
  - 对两种颜色之间的相关系数 $r$ 进行一些先验的限制，具体来说是 $\pm0.45$
- 后者由测光本身的性质给出，其协方差系数来自于颜色计算的共享波段，比如 g-r 和 r-i 中共同的 r

6.5 Iterating the red-sequence model #

将 membership probability 和 red-sequence model 进行迭代的更新直至收敛，因为二者是互相依赖的

在得到 red sequence 参数之后，在测试数据集上运行 cluster finder
- 仅限于 seed 相关的星系团
- 最终得到了一个新的列表以及 multi-color 的 membership
然后重新估计 red sequence
对以上过程进行迭代
- 主要的提升来源于从单色到多色的转变
- 在多次迭代过程中，平均颜色以及斜率都会很快收敛（3 次）
- 判断收敛的依据是 richness 不再改变
计算多次迭代的误差变化，在第三次迭代之后偏差都小于 1%
最终用了第三次迭代的输出作为 final cluster catalog

7 Photometric redshift estimation #

在每次迭代的 finder 阶段需要对 cluster 红移进行初始猜测（$z_\mathrm{init}$），以给出 richness 和 membership 的估计

之后可以用全部成员星系对 red sequence 进行拟合，得到红移的更精确估计

7.1 的 $z_\mathrm{red}$ 是针对单个星系，而 7.2 的 $z_\lambda$ 是针对 cluster？

7.1 初始红移 #

对于 SDSS8 可以用多种方法得到 photo-z，但是具有一定的局限性
- 在 z>0.5 上，photo-z 所需的训练集不足
- 现有的工具一般目标是给出关于星系红移的统计数据，但是我们需要的是单个星系的红移估计
开发了自己的红移估计方法 $z_\mathrm{red}$
- 星系的颜色可以转化为 $\chi^2$ 统计量，概率分布和统计量之间的关系是 $P\propto\left(-\frac{1}{2} \chi^2 \right)$
  - 不考虑星系的光度吗？
- 还考虑了不同红移上的薄片体积大小不同，应该有 $P\propto \frac{\mathrm{d}V}{\mathrm{d}z}$
  - 这个因素类似先验估计，也就是认为星系的体积数密度是恒定的
- 寻找使以上概率最大的红移，即为红移的初始估计
- 误差的估计使用后验分布来进行
Fig 7 展示了这里 $z_\mathrm{red}$ 的效果
- 使用了 training galaxy sample
- 存在一个较小的红移 bias（低估了实际红移）
- 上面计算出的 error 比实际的 error 更大（蓝线比红线高）
- 进行修正：将上面的 offset 补偿给原始的估计
  - 感觉有点简陋
  - 仍然存在的 residual 是由于 filter transition

7.2 精确的红移估计 #

实际是上述方法的扩展

在每次迭代中用上一次迭代的红移计算 cluster richness 以及 membership，然后用新的 membership 计算新的红移

在后一步中需要用到一个 likelihood；相比之前的 likelihood，这里还加入了协方差矩阵的行列式以及一次 soft cut

$$ \ln \mathcal{L} = \sum -\frac{w \left[ \chi^2 + \ln |\mathbf{C}| \right]}{2} $$

这里 w 是一个 soft cut 参数（约定以总 richness 的 70% 作为一个截断的阈值）

$$ w(p_{\mathrm{mem}}) = \frac{1}{\exp \left[ (p_{70} - p_{\mathrm{mem}}) / 0.04 \right] + 1} $$

最后可以得到 cluster 红移的后验分布，用高斯拟合这个分布以得到红移估计的误差

在此基础上还进行了基于训练集的校正，以保证红移的估计是无偏的
最后的红移估计结果中存在一些虽然小但是具有较高可信度的偏差（Fig 9）
4000A break 切换颜色的效应体现在红移 0.35~0.45 之间，这也比较接近 SDSS8 的测光深度极限
一些显著较大的偏差是因为 cluster center 的问题
- 在创建一个 clean sample（14%）之后这些 large offset 消失了（Fig10）
Fig12 中展示了红移的概率分布
- 适当考虑红移概率分布而非简单的估计值之后，红移估计的分布和光谱红移的分布拟合更好

8 Cluster centering #

为星系团确定中心是重要的，因为错误的中心是测量质量和速度弥散的误差的重要来源

这里假设：cluster 中心都有一个 red, bright&dominant galaxy

如果中心星系是 cool-core 的，具有很强的恒星形成，则颜色可能会偏离红色，这是 redMaPPer 的一个已知缺陷
- 对于 group 更常见，而在 cluster 中比例较低
- 这个问题可以通过取消对 BCG 的红色限制条件来解决，但是中心定位的效果会下降
- 另一个方法是用亮度和质量加权平均，但是效果也不好
目前的 centering 成功率大概是 85%

8.1 Basic framework #

不去确定中心的位置，而是计算每一个星系成为 cluster 的概率，从而将中心位置的不确定性也纳入统计的考量

（就算用概率应该也是离散的吧？）

假设 cluster 中的星系分为三类：Central, satellite, unassociated (前景或者背景)
用 filter function 描述三类星系的分布，然后计算星系属于 CG 的 Bayesian 概率
还需要考虑到“cluster 只具有一个 CG”的条件

8.2 Centering filters #

介绍三种星系的 filter function 如何定义

星系的性质用星等、红移、权重来描述
- 权重用于描述周围星系的密度
- 前面用到的星系性质 vertor $\mathbf{x}$ 都是位置、颜色、星等
  - 用红移代替了颜色，因为红移受到的干扰更小
  - 用权重替代了位置
对于 CG
- 星等用一个 Gaussian 定义，其中星等的均值依赖于红移
  - 这里的 $m_\star(z)$ 是 Schechter 函数的参数
- 红移也用一个 Gaussian 定义
  - 这里 $z_\mathrm{red}$ 是星系测光红移，而 $z_\lambda$ 是 cluster 红移
  - 衡量星系和 cluster 之间的红移差距
- 权重 w 由周围的星系的贡献相加得到
  - 对于 richness 和红移不存在依赖
  - 同样使用一个 Gaussian filter function
对于 satellite 来说 filter function 基本和 CG 相同，除了——
- 更合适的 weight 参数（为什么 satellite 也要考虑周围的星系密度？）
- 光度函数采用 Schechter function
对背景来说，filter function 由平均密度乘角度区域的大小得到

8.3 Implementation #

需要确定以上函数中的参数

用迭代方法同时限制 center 和 red sequence model

8.4 Blue central galaxy #

如果中心星系颜色比较蓝，那么 redMaPPer 会错误地将周围的红色星系作为 CG

一个例子是 Abell 1835

这种情况的比例低于 2%

9 Cluster finder #

大概明白了，也就是 sec 4,5 作为 6 的 ingredient, 而 7,8 作为 9 的 ingredient

前面讨论了一个 finder 的全部组分，现在开始组装

具体的步骤是：

估计一个红移 $z_\mathrm{red}$，寻找周围的 over-density
计算每一个 over-density 属于 cluster 的概率
对星系团进行 percolate

9.1 First pass #

就是先粗略过一遍

用非常宽松的条件减少需要检查的星系数量（56m -> 23m）
计算潜在 CG 的红移 $z_\mathrm{red}$ 以及 richness $\lambda$，排除 richness 太低的星系
- 这一步拒绝了 60% 的星系
基于 7.2 的方法校准更精确的红移

9.2 Likelihood sorting #

基于通过 pass 的星系 catalog 计算 richness，然后计算 lambda likelihood

完整的 likelihood 由 lambda 和 center 两部分组成，后者由 sec8 给出

前一个 likelihood 占据主导地位

9.3 Percolation #

将星系分配给 cluster，同时避免重复计数

具体的过程是：对每一个星系

由于 catalog 中已经有被排除的星系，对潜在的 CG 重新计算红移和 richness
确定 cluster 中心（sec8）
基于新确定的中心重新计算红移和 richness
从 catalog 中移除已经被归类到 cluster 中的星系

9.3.1 Masking #

在对 catalog 进行逐一检查的过程中，一个星系属于前面已经检验过的 cluster 的概率会逐渐增加，这会导致星系属于其他 cluster 的概率下降，这体现在后续 cluster 的 richenss 计算过程中

假设一个星系有 0.3 的概率属于前面的一个星系团，它在计算后续排序的时候就只能用 0.7 的概率分配给其他的 cluster

如果 cluster 彼此之间重叠程度很小，以上的修正影响不大

9.3.2 Extent of Clusters and Percolation Radius #

this work 使用了和 richness 相关的 aperture radius

另一个有意义的半径是 percolation radius，这个值和宇宙学参数 $R_\mathrm{200}$ 有关

R12 中研究了 maxBCG catalog，发现 $R_\mathrm{200}\approx1.5R_C(\lambda)$，所以在这里使用了 $1.5R_C(\lambda)$ 作为 percolation radius

9.4 A sample #

一个 z=0.23 的星系团，这里给出了 SDSS 图像、位置分布、到 cluster 中心的距离、membership probability 的分布

星系密度的分布符合 NFW distribution

10 Catalog #

对 cluster catalog 进行了一些红移、richness 以及 mask fraction 的限制

最终 catalog 包含 25236 个 cluster

在 0.35 以下是 volume limited 的

11 Purity&completeness #

用一些 mock 方法进行检测

12 Cluster masks #

用 mock 探寻 bright star 的影响

可以用 random cluster point 来绘制探测能力 map

cluster mask 和 galaxy mask 之间的差异？

13 Summary #

redMaPPer 在将来可以用于 DES 和 LSST

richness $\lambda$ 被证明是一种很好的 mass proxy
redMaPPer 需要训练光谱作为输入，但是需求量不大
给出 cluster 的位置的概率分布，适用于统计研究

下一篇 paper 比较了这里的 catalog 和 SZ/X-ray catalog 的区别