Bellagamba2018AMICOOptimizedDetection

March 3, 2026

Brief #

现有的 cluster 分类是
- 纯几何：包括 FoF 和 VT（可以参考 Soares-Santos2011VoronoiTessellationCluster）
- 基于 red sequence：maxBCG 和 redMaPPer 一系列
- matched filter：将数据和一个理想的模型进行匹配，这个模型一般包括径向位置分布以及光度 Schcheter 分布
  - 默认不会用到颜色的信息（？）
AMICO 的原理是 optimal filtering，在背景均匀的前提下等同于 matched filtering
- 可以利用星系的光度、颜色、形态信息

观测到的数据可以建模为信号和噪声的叠加，其中信号具有 amplitude A
- $D=A\times M+N$
- 其中模型 M 是先验确定的
- 振幅 A 可以看作 richness/mass 的一个 proxy
- 公式中的 m 可以 generalize 到其他属性，比如 morphological type
- 来自信号处理的结论：能够最大化信噪比的 filter function 的形式是 M/N（optimal filter 的含义），假设 noise 是各处平均的情况下变为 M
  - 振幅 A 计算为这个最优 filter 乘 data 然后减去背景
sec 2.2 之后需要的时候可以细看
振幅 A 的误差来自背景的不确定性以及信号本身的 shot noise
振幅 A 可以分解为每一个成员星系的贡献的叠加
似然函数 $L$ 正比于 $A^2$
mask 的处理比较简单，仅在没有 mask 的区域执行各项计算，相应地信噪比会低一些
local bkg 通过 post correction 进行处理：在每个红移上用 kernel 卷积方式得到大致的大尺度分布，然后用一个因子对振幅、似然等进行补偿
一个通用的 cluster model 包括多个组分，每个组分都包括一个径向分布和一个 magnitude 分布函数；这里的默认简单模型是 BCG 和 satellite 的叠加
- BCG 的位置位于 cluster 中心区域，其 magnitude 遵循一个 Gaussian 分布
- 卫星星系径向服从 NFW 分布，星等服从 Schechter 分布

sec2 的结果是一个作为三维空间位置函数的 amplitude map，从 map 向 list 的转化核心是 cleaning procedure
- summary 中介绍了这里的 cleaning procedure 和 redMaPPer percolation 的区别
具体来说是
- 首先去掉 SNR 低于一定阈值的点，将剩余 cluster 按照 likelihood 排序
- 将大/显著星系团以及成员概率从数据中移除，重新计算 map 并进入下一次迭代
  - 成员概率和 redMaPPer 中类似，计算为 cluster 信号和 cluster+background 信号之比
  - 使用 field probability 实现类似 redMaPPer 中 pfree 的作用，也就是起始为 1，之后逐渐地分配给不同的星系
  - fig1 给出了一个清理和重新计算的过程 example，中间和下面 panel 分别代表移除一个和全部移除之后的 map
- 迭代结束于没有任何点的 SNR 超过阈值

mock data 来自 millennium 模拟，星系通过 SAM 添加
没有使用原始的 mock catalog，而是从 massive DM halo 周围以及没有任何 halo 的地方提取了 cluster 和 noise 模型，然后构建了一个 more ideal mock catalog
- cluster 模型基于质量在 13.8-14.2 之间的 halo 内部星系的径向分布以及 magnitude 分布
  - fig2 展示了对两个分布的解析拟合（NFW 以及 Schechter 分布）
- noise 来自不包括任何超过 0.5e14 质量 halo 的地方
- magnitude 仅包括 i-band 信息
将 cluster 按照网格排布（fig3）以测试算法对于 isolated cluster 的探测能力
- 涵盖了不同的红移和 amplitude，并且模拟了 photo-z error
- fig5/6/7/8 分别对应对探测 completeness、amplitude 测量、cluster 红移测量以及成员概率的复现 performance
- fig9 展示了 fake positive 的情况
通过构建红移和振幅相同的 cluster pair 测试对于 blending cluster 的处理能力
- de-blending 成功概率随着 pair 间距变大而提升
- blending effect 体现在高 SNR cluster 的振幅升高，而低 SNR cluster 振幅降低
另外一个 de-blending 测试是让两个 cluster 在视向上重叠，但是具有不同的红移
- de-blending 表现随着红移差增大而变好
- projection effect 体现在两个 cluster 的红移都偏高（fig13）

将 AMICO 直接应用在 Millennium mock catalog 上，相比 sec4 中的 ideal mock 增加了更多的不确定性和多样性
fig14 和 fig15 分别对应 completeness 以及红移测量方面的表现
- 红移误差大致是单个星系的 photo-z error 的 0.5 倍
进一步分析了 amplitude 和 halo mass 之间的关系
- MOR 的截距在各个红移上都是 0
- 固定质量下的 MOR scatter 在 0.13-0.15 水平
mis-centering 都比较小（60-120 kpc/h）
此外还分析了成员概率以及 fake positive 上的表现

matched filter 不应该作为单独的一类？因为 redMaPPer 也用到了类似的方法
Bayesian Cluster Finder 值得了解一下
有很多信号处理的概念/方法可以借用到天文的数据处理中
需要建立这样的直觉：信噪比的计算就是 A 和 error of A 的比值
对于单个 cluster 有很多不是互相完全独立的属性：amplitude, SNR, likelihood
- 其中 amplitude 更接近 richness 一些
每次重新计算 amplitude map 应该具有计算方面的优化空间
~~不直接在 mock catalog 上运行可能导致 model 选择方面的潜在问题不体现在最后结果中~~
其实没有将三个维度等同，位置 2D 和红移 1D 还是完全分开的
- 位置的分布体现在 NFW 分布上，红移分布的信息体现在根据 PDF 将星系散步到不同红移上
- 但是 NFW 还是三维的形式？核心在于用 $(\theta,z)$ 还是用 $(r)$ 表示位置
应该可以找到 AMICO 在真实 survey 上应用的文章