Soares-Santos2011VoronoiTessellationCluster
Brief
#
- Voronoi Tessellation 是对 matched filter 的替代,优势在于自由参数更少
- 原理是将星系分布的 density 转化为 Voronoi cell 的面积,进一步可以为每一个星系得到周围 density 的一个量化指标
- 直接将 photo-z 作为输入参数,考虑了所有的(蓝色/红色)星系
- 对红移分层以进行 2D VT 划分
- 在基于 SAM 的 mock catalog 上进行了测试,performance 随着质量增加和 photo-z error 降低而变好
- selection function 可以计算为 completeness 除以 purity
Intro
#
- 展望未来的 survey 包括 DES/PS/LSST
- 宇宙学研究需要 cluster finder 提供一个准确的 selection function
- SDSS 出现之后,cluster finder 的分类包括 this work 用到的 VT、基于 color/overdensity 的方法(maxBCG 一系)、matched filter、C4(在位置和颜色空间中的 overdensity)
- VT 的基本思想是将二维空间根据星系位置分割成尺寸可变的单元,单元的 size 随着密度增加而减小,而 cluster 定义为多个 Voronoi cell 的集合
Algorithm
#
- 输入 catalog 就包括 photo-z(及其误差),所以这里没有经过特殊的 photo-z 处理
- 没有用到「cluster 包含一个 BCG」或者「cluster 中的星系呈现一条紧密的 red sequence」假设
- 传统的 VT 假设点是随机分布的,这里假设了一个 power law 的两点相关函数
- VT 构建的原理是:每个星系都对应一个 cell,cell 中的每一个点到星系的距离都比到其他星系的距离更近
- 其实就是把每个 point pair 的中垂线连接在一起?
- 假设 angular correlation function 具有 power law 的形式,作为参数的幅度和斜率可以直接从数据中得到
- 在这样的相关函数形式下,cell 面积的分布应该是一个 Gamma 分布,并且 Gamma 分布的参数和 power law 的参数存在确定的关系
- 定义密度为 Voronoi cell 面积的倒数,cluster 这种 over-density 结构在 VT 中表现为具有相对较小的 cell 面积或者较大的密度
- 密度的阈值定义为 Gamma 分布的某个分位点,对应参数是 $scl$
- 超过密度阈值的若干个相邻 cell 组成作为 cluster candidate
- 对于 cluster candidate,可以计算其出自纯粹背景涨落的概率/显著性,按照密度排序逐步减少 cell 直到 candidate 显著度达到要求,最后将 cell area 最小的星系定义为中心星系
- 根据二阶矩可以计算 a/b/PA 等形状参数
- 对于以上得到的每一个 cluster,在原始数据中提取周围星系的三维分布运行第二轮(二维的)VT 算法
- 这一步可以避免 edge effect 和 projection effect
- mock catalog 来自 ADDGALS (SAM),对应的 N-body simulation 是 Hubble volume simulation,这个 SAM 将星系填充进 DM halo 的过程是
- 根据已知的 LF 给星系分配光度
- Eq7 描述了星系光度和 DM halo mass 的匹配关系
- 根据星系的星等和 local density 赋予 SDSS 观测中类似星系的颜色
- 对 BCG 进行特殊的处理
- 最后在 mock catalog 中引入 photo-z 误差、incompleteness 以及 contamination
- 将 VT algorithm 的输出结果和真实 halo 进行匹配是基于 shared member galaxy 的,shared fraction threshold 是 50%
- 3.2 节还描述了两边的 ranking 方法以及一个恒星质量分布的经验公式
- completeness 定义为某个红移/质量区间内 detected halo 和所有 halo 的数目之比,purity 定义为某个红移/质量区间内 detected cluster 有多少实际对应 halo
Result/Discussion
#
- fig3 展示了 completeness/purity 的分布,从上到下的 panel 按照红移 error 分组
- 自然的结论是 performance 随着质量增大和 error 降低而变好
- 算法在红移 0.4-1.1 表现比较稳定
- 低红移的问题可能在于 cluster 在角空间中 span 很大
- 密度阈值 $scl$ 是一个关键的自由参数(类似 deblending 强度),可能导致 over split 或者 over blend 问题
- 参数最好通过 performance 自适应地确定,并且允许随红移变化
- fig4 原始的和从 cluster catalog 中恢复出的 halo mass function 存在一致性
- cluster 数目经过了基于选择函数的修正:将探测到的数量除以 completeness 然后乘 purity
Appendix
#
- 对于完全随机的点分布,VT cell 面积的分布是具有常数值(两个参数都取 4)的 Gamma 分布(Kiang 1966)
- 这里 AppA 的推导是为了证明在 power law 相关函数下 cell 面积的分布也是 Gamma 分布
- 实际上并不是推导,而是参数拟合发现 area 分布可以被 Gamma 分布描述
Thoughts
#
- 这里的 cluster finder 分类应该可以有更准确的表述
- VT 所做的事情是用一种特殊的方式将(二维)点状分布转化为连续的密度分布,相当于替换了 matched filter 的作用
- 确实相比 matched filter 更具有简洁性,需要 tune 的参数数量减少了很多
- 可以考虑作为 matched filter 的一个非参数版本的 alternative
- 和 redMaPPer 的另外一个区别是这里不区分红色/蓝色星系,全部纳入 over-density 的计算输入
- redMaPPer 的经验是仅包含稳定的红色星系的情况下 photo-z 的性能会更优秀一些,所以舍弃蓝色星系是值得的
- 用 shell 的方式处理 LOS 方向的分布会丢失一些信息?
- 第二轮运行避免 edge effect 的作用有限,存在 cluster 因为被切开在第一轮就没有被探测到的情况
- 3.2 的 ranking 应该另开一个 sub section?
- VT 应该可以直接应用到三维吧?