Castignani2016NewMethodAssign

May 12, 2026

来自 Collaboration2026EuclidPreparationCosmoPostProcess 提到的 galaxy-cluster pair 概率赋值
gemini https://aistudio.google.com/prompts/1BDd23pxgs4nAX8ftvop6ljF7w-_OZI2m

Brief #

相比 cluster detection 更 focus 在「计算一个精确的 Pmem」任务上，cluster 红移和半径都是已知项
模拟数据来自 N-body simulation + SAM，红移上限很高
概率定义见 eq10，由红移-mag 空间中的 overdensity 项和两个 PDF 乘积的积分项相乘得到，最后还有一步和 ideal maximum value 相除的 calibration 步骤
- 从 overdensity/number count 的角度出发确实可以很自然地包含很多效应
真实 halo mass、真实 richness、概率相加得到的 richness 之间的 scatter 关系大致是 $0.20^2=0.14^2+0.14^2$

Intro #

cluster 具有星系物理和 cosmology 两方面的意义，两个方面都需要可靠的成员身份确认
- 星系物理的关注点在于 red sequence、galaxy quenching 等
- cosmology 方面主要是使用 cluster 约束 Halo Mass Function

Motivation #

光谱观测除了成本问题之外，还存在一个问题是对于 z>1 的星系很多关键 feature 位移到光学波段之外（redshift desert）
测光确定红移的挑战来自 projection effect，除了 photo-z 自身的不确定度（典型值是 0.03-0.05）之外还包括了 RSD 视向拉长效应（大约对应 0.001 的红移相对误差）的影响
- 对 RSD 的校正的一种常见方法是 caustic method
- 最近的一些进展包括近红外数据的覆盖、测光红移的进步以及 photo-z calibration 策略的进步

Data #

模拟数据（light cone catalog）是为 Euclid 开发的，覆盖面积是 20.4 deg2
- N-body simulation 来自 Guo 2013（对应文章把 Millenium 平移到了 WMAP 宇宙学下？）
  - 边长 500 hMpc，红移从 127 演化到 0
- SAM 使用 GALFORM
- 最终包括了每个星系的测光信息（包括光学波段和 Euclid YJH）、三维位置和速度以及和 host DM halo 的真实相关性
需要在真实 catalog 的基础上添加一些误差模拟观测
- photo-z 从以真实红移为均值的 Gaussian 中抽样得到，误差为 0.03
  - 处理比较简化，没有考虑 catastrophic failure 以及误差随亮度/星系类型的变化
- magnitude cut 采用 H-band 的 $m_\mathrm{star}+1.5$，大致对应 $0.25 L_\mathrm{star}$
  - H-band 在近红外波段，适用于 z>1 cluster
  - 主要考虑的是 photo-z 误差
对于 DM halo 做类似的处理
- 将所有周围星系的质心作为中心以模拟实际观测，并且根据质心赋予红移
- 剔除位于边界的 halo，并且做质量（大于 1e13）和 richness（多于 10 个）的截断
最终 catalog 包括 1208 个 DM halo，红移范围 0.05-2.58
- 质量范围是 13.29-14.80

Method #

「We have been inspired by the work of R12 and by their subsequent studies」
使用一种非参数化的方法，根据星系和 cluster 的位置、红移等信息计算一个 probability
- 对于星系的光度/径向分布不做假设，因为不一定符合 z>1 的 clsuter
photo-z 的不确定度远大于 cluster 视向的位置分布，也高于其他的观测不确定度
对于红移参数空间
- 首先星系的测光红移并不是对称的 Gaussian 分布，因为有 $1+z_\mathrm{spec}$ 作分母，会额外带来几个 percent 的误差（fig2）
- PDF 本身应该再乘一个先验信息 $N(z)$ 对应于小范围内的 shell 体积变化，但是这里将其视作一个常数
- 将 photo-z PDF 分解到 0.01 宽度的 slice 中
- 假定 cluster 红移 PDF 和单个星系的 PDF 有相同大小的不确定性
在测光空间
- 定义一个 Gaussian 分布以模拟 magnitude 测量的不确定性，宽度是 $\Delta m=0.1$
- 不使用任何颜色信息（虽然计算 photo-z 的时候已经用到过了）
定义 local/global 两种背景，前者在周围 3-5Mpc annulus 中计算（global 应该经过了某种 source mask？）
- f-factor 定义为 local/global bkg level ratio，分布的 median 在 1.09 左右，体现了 halo bias/clustering
- 用 running mean 的方式进行平滑避免 shot noise
此外还计算 cluster 周围的星系数目，参数包括 magnitude、红移、距离 cluster 中心的半径
- 假设在计算之前已经知道了 cluster 红移以及半径 r200
成员概率由两部分组成，相当于对 cluster 可能的红移进行了遍历
- 在 cluster 已知的情况下成员星系属于 cluster 的概率定义为 number count excess，也就是用 1 减去 local bkg 和总数密度的比值
  - 两个数密度的维度都是 mag、红移、半径
- 最终的（相对）概率表达式变为 eq10：成员概率等于 local count excess 和两个 PDF 乘积的红移积分
用相对概率除以理想情况下相对概率最大值，以得到具有实际意义的绝对概率定义
- fig4 对应的因子产生于在 z=0 附近产生的红移分布不对称性

Results #

fig5 展示了 ROC (receiver operating characteristic) 曲线，对应 purity-completeness 之间的 trade-off
- 通过修改 Pmem 的阈值以实现曲线上位置的移动
- 一个典型值是 0.03 误差对应 80% completeness 和 65% purity
- 最后选择了 20% 作为 Pmem threshold，对应 56% purity 以及 93% completeness
- photo-z 精度对最终结果的影响很大
fig7 给出了 Pmem 的 bimodal 分布
- 20% 是一个很合适的 threshold
fig8 给出了 Pmem 作为「概率」的检验：在所有 Pmem=0.8 的星系中应该确实有 80% 属于真实 member
- 整体的偏离不大，但是在 Pmem 大于 60% 的地方存在系统性高估，尤其对于高红移来说
  - 主要来自于 cluster 外围区域的估计误差（fig9）（可以通过减小 r 来解决？）
计算 local bkg 的时候移除周围的已知结构反而会导致 Pmem 系统性偏高，说明这种因素已经被 implicitly 包含在方法内部
相比 George 2011 实现了更好的效果
尝试用其他方式替代相对/绝对概率计算步骤，没有实现更好的效果
使用 global/local bkg 不会造成很大的差异，但是仍然推荐使用 local

Richness #

存在两种 richness 估计方法：高于一定 threshold 的星系的数目、全部星系的 membership probability 相加
fig10 对比了两种 richness 和真实 number 的关系：前者会导致高估，而后者几乎无偏
- 二者 scatter 类似，都在 0.15 dex 左右
和真实的 halo mass 对比的结果是
- 真实 richness 和 halo mass 之间也存在 0.14 dex 的 scatter，属于 intrinsic scatter
- 观测到的 richness 和 halo mass 之间的 scatter 大约是 0.20 dex，可以分解为 $0.14^2+0.14^2$
- 仅使用 high mass cluster 会极大地降低 scatter

Thoughts #

虽然这里强调并非一个 cluster detection 算法，但是其实 cluster detection 的核心就是计算每一对 pair 的 contribution 然后相加、排序
用 number count excess 定义 member probability 确实非常 elegant，包括了很多难以直接计算的效应
计算 color bkg 的过程有点类似 redMaPPer
对 photo-z 的假设确实有点过于简化
跳过了从颜色得到 photo-z 的过程
- 没有使用 color likeness 而是从 density 的角度出发，membership probability 完全和 density excess 相关
最后 eq10 给出的概率计算意义就是 magnitude+redshift 空间中的 over-density 和两个 PDF 相乘的积分的乘积
- overdensity 的取值是 $1-N_\mathrm{bkg}/N_\mathrm{tot}$，所以上限为 1