Bellagamba2018AMICOOptimizedDetection

Brief #

  • sec2 和 sec3 对应数学原理和应对角空间重叠问题的 cleaning procedure
    • 数学原理没有完全理解,有继续细看的空间
  • sec4/5 分别在 ideal catalog 和 Millennium mock catalog 上进行了测试
  • 确实没有用到红移 slice/shell,而是用 photo-z PDF 把单个星系分散到不同红移上

Intro #

  • 现有的 cluster 分类是
    • 纯几何:包括 FoF 和 VT(可以参考 Soares-Santos2011VoronoiTessellationCluster
    • 基于 red sequence:maxBCG 和 redMaPPer 一系列
    • matched filter:将数据和一个理想的模型进行匹配,这个模型一般包括径向位置分布以及光度 Schcheter 分布
      • 默认不会用到颜色的信息(?)
  • AMICO 的原理是 optimal filtering,在背景均匀的前提下等同于 matched filtering
    • 可以利用星系的光度、颜色、形态信息

Theory #

  • 观测到的数据可以建模为信号和噪声的叠加,其中信号具有 amplitude A
    • $D=A\times M+N$
    • 其中模型 M 是先验确定的
    • 振幅 A 可以看作 richness/mass 的一个 proxy
    • 公式中的 m 可以 generalize 到其他属性,比如 morphological type
    • 来自信号处理的结论:能够最大化信噪比的 filter function 的形式是 M/N(optimal filter 的含义),假设 noise 是各处平均的情况下变为 M
      • 振幅 A 计算为这个最优 filter 乘 data 然后减去背景
  • sec 2.2 之后需要的时候可以细看
  • 振幅 A 的误差来自背景的不确定性以及信号本身的 shot noise
  • 振幅 A 可以分解为每一个成员星系的贡献的叠加
  • 似然函数 $L$ 正比于 $A^2$
  • mask 的处理比较简单,仅在没有 mask 的区域执行各项计算,相应地信噪比会低一些
  • local bkg 通过 post correction 进行处理:在每个红移上用 kernel 卷积方式得到大致的大尺度分布,然后用一个因子对振幅、似然等进行补偿
  • 一个通用的 cluster model 包括多个组分,每个组分都包括一个径向分布和一个 magnitude 分布函数;这里的默认简单模型是 BCG 和 satellite 的叠加
    • BCG 的位置位于 cluster 中心区域,其 magnitude 遵循一个 Gaussian 分布
    • 卫星星系径向服从 NFW 分布,星等服从 Schechter 分布

Selection #

  • sec2 的结果是一个作为三维空间位置函数的 amplitude map,从 map 向 list 的转化核心是 cleaning procedure
    • summary 中介绍了这里的 cleaning procedure 和 redMaPPer percolation 的区别
  • 具体来说是
    • 首先去掉 SNR 低于一定阈值的点,将剩余 cluster 按照 likelihood 排序
    • 将大/显著星系团以及成员概率从数据中移除,重新计算 map 并进入下一次迭代
      • 成员概率和 redMaPPer 中类似,计算为 cluster 信号和 cluster+background 信号之比
      • 使用 field probability 实现类似 redMaPPer 中 pfree 的作用,也就是起始为 1,之后逐渐地分配给不同的星系
      • fig1 给出了一个清理和重新计算的过程 example,中间和下面 panel 分别代表移除一个和全部移除之后的 map
    • 迭代结束于没有任何点的 SNR 超过阈值

Tests on ideal mocks #

  • mock data 来自 millennium 模拟,星系通过 SAM 添加
  • 没有使用原始的 mock catalog,而是从 massive DM halo 周围以及没有任何 halo 的地方提取了 cluster 和 noise 模型,然后构建了一个 more ideal mock catalog
    • cluster 模型基于质量在 13.8-14.2 之间的 halo 内部星系的径向分布以及 magnitude 分布
      • fig2 展示了对两个分布的解析拟合(NFW 以及 Schechter 分布)
    • noise 来自不包括任何超过 0.5e14 质量 halo 的地方
    • magnitude 仅包括 i-band 信息
  • 将 cluster 按照网格排布(fig3)以测试算法对于 isolated cluster 的探测能力
    • 涵盖了不同的红移和 amplitude,并且模拟了 photo-z error
    • fig5/6/7/8 分别对应对探测 completeness、amplitude 测量、cluster 红移测量以及成员概率的复现 performance
    • fig9 展示了 fake positive 的情况
  • 通过构建红移和振幅相同的 cluster pair 测试对于 blending cluster 的处理能力
    • de-blending 成功概率随着 pair 间距变大而提升
    • blending effect 体现在高 SNR cluster 的振幅升高,而低 SNR cluster 振幅降低
  • 另外一个 de-blending 测试是让两个 cluster 在视向上重叠,但是具有不同的红移
    • de-blending 表现随着红移差增大而变好
    • projection effect 体现在两个 cluster 的红移都偏高(fig13)

Tests on cosmological mocks #

  • 将 AMICO 直接应用在 Millennium mock catalog 上,相比 sec4 中的 ideal mock 增加了更多的不确定性和多样性
  • fig14 和 fig15 分别对应 completeness 以及红移测量方面的表现
    • 红移误差大致是单个星系的 photo-z error 的 0.5 倍
  • 进一步分析了 amplitude 和 halo mass 之间的关系
    • MOR 的截距在各个红移上都是 0
    • 固定质量下的 MOR scatter 在 0.13-0.15 水平
  • mis-centering 都比较小(60-120 kpc/h)
  • 此外还分析了成员概率以及 fake positive 上的表现

Summary #

  • 对比了这里的 cleaning 和 redMaPPer percolation
  • 未来的提升可能在于加入从数据中提取 cluster model 的能力

Thoughts #

  • matched filter 不应该作为单独的一类?因为 redMaPPer 也用到了类似的方法
  • Bayesian Cluster Finder 值得了解一下
  • 有很多信号处理的概念/方法可以借用到天文的数据处理中
  • 需要建立这样的直觉:信噪比的计算就是 A 和 error of A 的比值
  • 对于单个 cluster 有很多不是互相完全独立的属性:amplitude, SNR, likelihood
    • 其中 amplitude 更接近 richness 一些
  • 每次重新计算 amplitude map 应该具有计算方面的优化空间
  • ~~不直接在 mock catalog 上运行可能导致 model 选择方面的潜在问题不体现在最后结果中~~
  • 其实没有将三个维度等同,位置 2D 和红移 1D 还是完全分开的
    • 位置的分布体现在 NFW 分布上,红移分布的信息体现在根据 PDF 将星系散步到不同红移上
    • 但是 NFW 还是三维的形式?核心在于用 $(\theta,z)$ 还是用 $(r)$ 表示位置
  • 应该可以找到 AMICO 在真实 survey 上应用的文章