Rykoff2014RedMaPPerAlgorithmSDSS_new

Intro #

  • 这里介绍了 redMaPPer 的优势
    • 根据红移换用不同的颜色
    • 从数据中学习 red sequence model
    • 对 mask 的处理
    • 有一个能够描述选择函数的 random
    • 提供概率化的输出
    • richness 和 mass 之间的关系足够紧密
  • red sequence 相对于 photo-z method 的优势在于暗弱星系的 photo-z 不是那么容易确定,而且 cluster 中的 galaxy population 是比较特殊的,普通的 photo-z 可能不一定适用
  • 延伸阅读可以包括 R09、R12 以及 Rozo2010、Wen 的 photo-z 方法

Data #

  • 包含了 SDSS DR8 的部分天区,大约 10000 deg2
  • mask 在默认的 BOSS bright star mask 基础上还补充了一些
  • 对 photometric catalog 的处理
    • 要求 i-band 比 21 等更亮
    • cmodel 作为光度 mag、model 作为颜色 mag
    • 剔除了三个 flag,但是保留了一些其他的 flag
    • 最终包括 565m 个星系,也就是每 100 deg2 包括 5.6m 个星系
  • spec data 的处理
    • 使用 SDSS DR9 spec 数据
    • 在 calibration 阶段仅采用其中的 20%

Method #

  • 3 总体来说 redMaPPer 划分为 calibration 和 finder 两个阶段
    • calibration 是用具有 spec-z 的红色星系作为 seed 来进行的
    • finder 阶段会将所有的星系都视作潜在中心,然后确定每一个 cluster 的成员和红移(还用到了 percolation)
      • cluster 红移和成员的选择也是迭代进行的

Calibration #

  • 4 richness 的定义:每一个观测到的星系都属于 member 和 bkg 的其中一种
    • 这里的 filter 由空间分布、光度分布和颜色分布组成,其中颜色分布用 chi2 描述
  • 5 需要对 mask 进行精细的处理,包括 geometry mask 以及 depth map
    • 具体来说,实际观测到的 richness 要乘一个怎样的补偿因子是由 Monte Carlo 计算结果决定的
    • 最后的 mask 的效应由 scale factor 和 mask fraction 两个因子决定
  • 6 实际的 calibration 过程需要用到很多没有光谱红移的暗弱星系
    • 对 spec 数据进行 multi Gaussian 的拟合,仅保留红星系的样本
    • 在 seed 周围寻找成员星系,然后将这些成员星系也用于模型的计算
    • 用所有的红色星系来建立一个 red sequence model
    • 以上两步迭代进行,迭代次数到 3 次左右效果就很好了,在第三次的 red sequence model 的基础上进行正式的 cluster finding

Finder #

  • 7 红移估计
    • 对于单个星系,除了 chi2 之外还要乘一个体积先验,在此基础上还进行了一个 afterburner 修正,使得 $z_\mathrm{red}$ 相对于真实 spec-z 是无偏的
    • 对于 cluster 的红移估计和成员的选取迭代进行
      • 小部分红移出错是由于 mis-centering 导致的
      • 最终可以给出一个红移的分布概率函数
  • 8 centering
    • 为每一个可能是 BCG 的星系计算一个中心概率
    • 具体的计算是将星系分为三类:CG、satellite、bkg,然后根据各自的不同的 filter 分别计算似然概率
      • CG filter 的要求包括亮度、红移和 cluster 红移比较靠近、位于临近区域的密度峰值处
      • 这里的 filter 有很多参数,也是从数据中学习的
  • 9 finder
    • first pass
      • 首先要求颜色相符、足够亮的星系
      • 之后为每一个星系计算一个初步的 richness,低于 3 的候选者将会被剔除
      • 最后计算一个准确的红移
    • likelihood sorting
      • 结合 richness 和 center likelihood 进行排序,但是主要由前者决定
    • 根据 likelihood 的排序,进行 percolation 以解决归属和反复计数问题

Results #

  • 对 cluster finder 的结果施加了 20 的 lambda 筛选、0.08-0.55 的红移筛选以及 mask fraction 小于 0.2 的筛选
    • 20 的 lambda 大约对应 1e14 的 halo mass
  • 最终得到了 25236 个 cluster
  • 在 0.35 之前体积数密度是基本恒定的,在 0.35 之后有下降,主要是因为高红移的不完备性

Purity and completeness #

  • optical 几乎不存在纯粹由噪声导致的 false positive 的影响,主要挑战是 projection effect
  • 这里做法是注入一些具有已知 richness 的 mock cluster,然后看 redMaPPer 是否可以成功找回,以及 richness 测量是不是准确

Mask #

  • 通过 random injection 可以绘制出 mask,也就是可以对 selection function 进行建模

Appendix (probably most important) #

  • appendix A 介绍了对于红移的 afterburner 修正
  • B 量化了 spec 数据的最低要求:对于 0.05 的红移区间只需要 40 个光谱数据就可以
    • 这里竟然选用的是 richest,那肯定效果好啊
  • C 对比了 photo-z 的精度,对比的对象是 SDSS 提供的 photo-z 数据
  • D 计算成本:对于 10000 deg2 的数据,全部过程需要 500 个 cpu hour
  • E 验证了 scale factor 的有效性
  • F 对比了多色和单色 lambda 的区别

Thoughts #

  • 这里在 10000 deg2 天区上的总星系数目是 560m,也就是平均 100deg2 的星系数目应该是 5.6m,好像自己搜寻的结果比这个低很多,可能是 HSC north 的星系就不是很多
    • SDSS reproduction 的筛选前的星系数目是 0.98m(HSC north)
    • HSC 筛选前星系数目是 5.4m
  • 「带有很多补丁的脚手架」的感觉依然存在
  • 这里的逻辑和实际运行的顺序完全不一样,非常难以理解
  • 也许可以用 CAMIRA 的 cluster 中心红移作为 spec data 的输入?