Castignani2016NewMethodAssign

Brief #

  • 相比 cluster detection 更 focus 在「计算一个精确的 Pmem」任务上,cluster 红移和半径都是已知项
  • 模拟数据来自 N-body simulation + SAM,红移上限很高
  • 概率定义见 eq10,由红移-mag 空间中的 overdensity 项和两个 PDF 乘积的积分项相乘得到,最后还有一步和 ideal maximum value 相除的 calibration 步骤
    • 从 overdensity/number count 的角度出发确实可以很自然地包含很多效应
  • 真实 halo mass、真实 richness、概率相加得到的 richness 之间的 scatter 关系大致是 $0.20^2=0.14^2+0.14^2$

Intro #

  • cluster 具有星系物理和 cosmology 两方面的意义,两个方面都需要可靠的成员身份确认
    • 星系物理的关注点在于 red sequence、galaxy quenching 等
    • cosmology 方面主要是使用 cluster 约束 Halo Mass Function

Motivation #

  • 光谱观测除了成本问题之外,还存在一个问题是对于 z>1 的星系很多关键 feature 位移到光学波段之外(redshift desert)
  • 测光确定红移的挑战来自 projection effect,除了 photo-z 自身的不确定度(典型值是 0.03-0.05)之外还包括了 RSD 视向拉长效应(大约对应 0.001 的红移相对误差)的影响
    • 对 RSD 的校正的一种常见方法是 caustic method
    • 最近的一些进展包括近红外数据的覆盖、测光红移的进步以及 photo-z calibration 策略的进步

Data #

  • 模拟数据(light cone catalog)是为 Euclid 开发的,覆盖面积是 20.4 deg2
    • N-body simulation 来自 Guo 2013(对应文章把 Millenium 平移到了 WMAP 宇宙学下?)
      • 边长 500 hMpc,红移从 127 演化到 0
    • SAM 使用 GALFORM
    • 最终包括了每个星系的测光信息(包括光学波段和 Euclid YJH)、三维位置和速度以及和 host DM halo 的真实相关性
  • 需要在真实 catalog 的基础上添加一些误差模拟观测
    • photo-z 从以真实红移为均值的 Gaussian 中抽样得到,误差为 0.03
      • 处理比较简化,没有考虑 catastrophic failure 以及误差随亮度/星系类型的变化
    • magnitude cut 采用 H-band 的 $m_\mathrm{star}+1.5$,大致对应 $0.25 L_\mathrm{star}$
      • H-band 在近红外波段,适用于 z>1 cluster
      • 主要考虑的是 photo-z 误差
  • 对于 DM halo 做类似的处理
    • 将所有周围星系的质心作为中心以模拟实际观测,并且根据质心赋予红移
    • 剔除位于边界的 halo,并且做质量(大于 1e13)和 richness(多于 10 个)的截断
  • 最终 catalog 包括 1208 个 DM halo,红移范围 0.05-2.58
    • 质量范围是 13.29-14.80

Method #

  • 「We have been inspired by the work of R12 and by their subsequent studies」
  • 使用一种非参数化的方法,根据星系和 cluster 的位置、红移等信息计算一个 probability
    • 对于星系的光度/径向分布不做假设,因为不一定符合 z>1 的 clsuter
  • photo-z 的不确定度远大于 cluster 视向的位置分布,也高于其他的观测不确定度
  • 对于红移参数空间
    • 首先星系的测光红移并不是对称的 Gaussian 分布,因为有 $1+z_\mathrm{spec}$ 作分母,会额外带来几个 percent 的误差(fig2)
    • PDF 本身应该再乘一个先验信息 $N(z)$ 对应于小范围内的 shell 体积变化,但是这里将其视作一个常数
    • 将 photo-z PDF 分解到 0.01 宽度的 slice 中
    • 假定 cluster 红移 PDF 和单个星系的 PDF 有相同大小的不确定性
  • 在测光空间
    • 定义一个 Gaussian 分布以模拟 magnitude 测量的不确定性,宽度是 $\Delta m=0.1$
    • 不使用任何颜色信息(虽然计算 photo-z 的时候已经用到过了)
  • 定义 local/global 两种背景,前者在周围 3-5Mpc annulus 中计算(global 应该经过了某种 source mask?)
    • f-factor 定义为 local/global bkg level ratio,分布的 median 在 1.09 左右,体现了 halo bias/clustering
    • 用 running mean 的方式进行平滑避免 shot noise
  • 此外还计算 cluster 周围的星系数目,参数包括 magnitude、红移、距离 cluster 中心的半径
    • 假设在计算之前已经知道了 cluster 红移以及半径 r200
  • 成员概率由两部分组成,相当于对 cluster 可能的红移进行了遍历
    • 在 cluster 已知的情况下成员星系属于 cluster 的概率定义为 number count excess,也就是用 1 减去 local bkg 和总数密度的比值
      • 两个数密度的维度都是 mag、红移、半径
    • 最终的(相对)概率表达式变为 eq10:成员概率等于 local count excess 和两个 PDF 乘积的红移积分
  • 用相对概率除以理想情况下相对概率最大值,以得到具有实际意义的绝对概率定义
    • fig4 对应的因子产生于在 z=0 附近产生的红移分布不对称性

Results #

  • fig5 展示了 ROC (receiver operating characteristic) 曲线,对应 purity-completeness 之间的 trade-off
    • 通过修改 Pmem 的阈值以实现曲线上位置的移动
    • 一个典型值是 0.03 误差对应 80% completeness 和 65% purity
    • 最后选择了 20% 作为 Pmem threshold,对应 56% purity 以及 93% completeness
    • photo-z 精度对最终结果的影响很大
  • fig7 给出了 Pmem 的 bimodal 分布
    • 20% 是一个很合适的 threshold
  • fig8 给出了 Pmem 作为「概率」的检验:在所有 Pmem=0.8 的星系中应该确实有 80% 属于真实 member
    • 整体的偏离不大,但是在 Pmem 大于 60% 的地方存在系统性高估,尤其对于高红移来说
      • 主要来自于 cluster 外围区域的估计误差(fig9)(可以通过减小 r 来解决?)
  • 计算 local bkg 的时候移除周围的已知结构反而会导致 Pmem 系统性偏高,说明这种因素已经被 implicitly 包含在方法内部
  • 相比 George 2011 实现了更好的效果
  • 尝试用其他方式替代相对/绝对概率计算步骤,没有实现更好的效果
  • 使用 global/local bkg 不会造成很大的差异,但是仍然推荐使用 local

Richness #

  • 存在两种 richness 估计方法:高于一定 threshold 的星系的数目、全部星系的 membership probability 相加
  • fig10 对比了两种 richness 和真实 number 的关系:前者会导致高估,而后者几乎无偏
    • 二者 scatter 类似,都在 0.15 dex 左右
  • 和真实的 halo mass 对比的结果是
    • 真实 richness 和 halo mass 之间也存在 0.14 dex 的 scatter,属于 intrinsic scatter
    • 观测到的 richness 和 halo mass 之间的 scatter 大约是 0.20 dex,可以分解为 $0.14^2+0.14^2$
    • 仅使用 high mass cluster 会极大地降低 scatter

Thoughts #

  • 虽然这里强调并非一个 cluster detection 算法,但是其实 cluster detection 的核心就是计算每一对 pair 的 contribution 然后相加、排序
  • 用 number count excess 定义 member probability 确实非常 elegant,包括了很多难以直接计算的效应
  • 计算 color bkg 的过程有点类似 redMaPPer
  • 对 photo-z 的假设确实有点过于简化
  • 跳过了从颜色得到 photo-z 的过程
    • 没有使用 color likeness 而是从 density 的角度出发,membership probability 完全和 density excess 相关
  • 最后 eq10 给出的概率计算意义就是 magnitude+redshift 空间中的 over-density 和两个 PDF 相乘的积分的乘积
    • overdensity 的取值是 $1-N_\mathrm{bkg}/N_\mathrm{tot}$,所以上限为 1