Grishin2023YOLOCLGalaxyCluster

March 10, 2026

gemini https://aistudio.google.com/prompts/1jnpdGb_hvxChG7Z6xfwSqQFE9Rw6NqAr
YOLO for CLuster detection
用 ML 方法进行 cluster detection 的 another work，之前的一篇是 Tian2025COSMICGalaxyCluster
- 不需要测光信息，而是直接看彩色图像

Brief #

用 YOLOv3、以 redMaPPer R14 catalog 为训练集进行 cluster detection
- 没有把模型应用到 general 图像上进行 detection（或者叫作 blind survey），而是给定 redMaPPer cluster 和空白图像判断「图像中是否存在一个 cluster」，模型在区分 cluster 和 field image 上做得很好
- 在 completeness/purity 上优化到了 95-98% 的水平
和 redMaPPer 以及 MCXC 进行了对比，在以后者为参照的对比中表现比 redMaPPer 更好
作者 claim 新方法的优势是不会受到复杂数据处理流程的系统误差的影响

Intro #

红移高于 1.5 之后，cluster 产生的 X-ray 和 SZ 信号会变得非常弱
YOLO 所做的事情包括目标边界框定位和类型的识别
- this work 用的版本是 v3

Data #

SDSS 观测用的是 APO 的一台 2.5m 的望远镜
使用 R14 redMaPPer catalog 作为训练集
- 首先剔除了低红移（z<0.2）的 cluster，剩余了 24406 clusters（fig1）
- 使用来自 SDSS DR16 CAS 的对应 cluster 图像，将 gri 图像合成为彩色图
fig2 提供了 YOLO 对其中一个 cluster 的识别效果

YOLO-CL #

R-CNN（或者 fast R-CNN）将定位和分类任务区分开，但是 YOLO 采用了更加集成/统一的框架，将两个步骤划归到一个单一回归问题中，好处是速率提升以及预测可以结合 global context
YOLO 算法简单来说是将图像划分为一些 grid cell，在每个 cell 中识别边界框、cell 包含物体的概率（objectness）以及类别概率（相加为 1）
- 损失函数包括预测边界框位置以及尺寸的奖励/惩罚、预测 objectness 的奖励/惩罚、分类的奖励/惩罚
- YOLO-v3 这个版本的关键 feature 是 Darknet-53 的 multi-scale 能力
针对原始 YOLO 的优化包括
- 不需要分类任务，直接将对应的 loss function 移除
- YOLO 计算边界框和真实框之间的「距离」的时候用的是 MSE 结合 IoU，但是 IoU 存在一些技术问题；解决办法是使用 generalized IoU 将其替换，这样即使预测框和真实框不重合也可以计算梯度并且提供优化方向
- 对 SDSS 的初始图像 cutout 进行压缩（2x2 和 4x4 两种压缩倍率）
- 如果两个边界框的重合度高于 gIoU=0.5 则认为两个对象是同一个，将具有更低概率的对象丢弃
ML 阶段的技术细节包括
- 训练集由 redMaPPer catalog 中的一半 cluster 以及同等数量的 SDSS random field image 构成
  - 为了防止模型学习到「cluster 位于图像中心」的特征，需要对原始图像进行裁剪、平移和翻转
- 训练包括 100 个 epoch，在 warm-up（4 epochs）期间学习率由 1e-8 增长到 1e-4，之后缓慢衰减到 1e-6
  - 在验证集上的 loss 下降情况展示在 fig3 中（左右 panel 对应不同的图像尺寸），没有出现过拟合情况
- 模型给出的是每一个 cluster 的概率，需要设置一个概率 threshold 以得到最终的 cluster catalog，这个 threshold 的设置是一个 purity/completeness 的 trade-off 问题（fig4）
  - threshold 最终确定为 purity=completeness 的交界点，对于小尺寸和大尺寸分别是 95% 和 98%
  - 两个图像尺寸得到的 cluster catalog 并不完全重合

Comparison #

redMaPPer #

fig5/6 completeness 相对红移和 richness 的变化关系，总体来说都很高
- 小尺寸图像在高红移完备性更高，大尺寸则相反
mis-centering 的平均值仅有个位数 kpc 量级
missing cluster 大部分是因为已经被另一个 richness 更大的 cluster 覆盖/排除了
找到的在 redMaPPer catalog 中没有的对象大部分是真实的 group 或者 crowded star field，甚至包括一个 GC

MCXC2021 #

同样是裁剪了 X-ray cluster 位置处的图像，然后问模型「这里是否存在一个 cluster」
fig9/10 给出了 redMaPPer 和 YOLO 以 X-ray catalog 作为参照的效果对比，YOLO 的表现基本是好于 redMaPPer 的
- 在低红移性能下降的原因是 2Mpc 对应的图片尺寸超出了 YOLO 输入层接收的极限
- YOLO 还有一个优势是 selection function 基本不随红移改变
fig11/12 还对比了 MaxBCG, GMBCG, AMF 以及 WHL12
- YOLO 发现的 redMaPPer 中不存在的大部分存在于 WHL12 中

Discussion #

相比 redMaPPer 这样的方法主要的优势是仅借助图像进行训练，不会受到可能存在于传统方法繁琐数据处理流程中每一步骤的系统误差的影响
之前的类似工作是基于 Faster R-CNN 的 Deep-CEE

Thoughts #

相比传统方法的潜在问题
- 基本无法应对多个 cluster 重叠在一起的情况，比如无法把交界处的星系细致地分别分配给 cluster A/B
- 边界框很难真正描述一个 cluster，cluster 分布更像是一个圆而不是矩形
- 怎么计算 richness 呢？
在低红移（z<0.3）找 cluster 就是比高红移更困难的？
2048x2048 是 SDSS 的原始尺寸吗？
进行 detection 的时候是要在所有 SDSS image 上检测，还是仅用 redMaPPer 的这些 image？
- 看起来是后者，模型的任务是判断给定的图像中是否存在一个 cluster 以及 cluster 位置在哪里
- 所以「找到 redMaPPer 没有找到的 cluster」至少在这里是不可行的，除非把这套方法应用到 SDSS 的所有图像上才能构成一个 cluster finder
  - 但是这对于 YOLO 来说应该是比较简单的迁移/扩展？因为 YOLO 的速度很快
既然不需要分类，那么 YOLO 相比 R-CNN 的优势也没那么重要了
改变 YOLO 的输入层尺寸限制是比较困难的事情吗？如果容许更大的图片输入的话也许可以单张图片找很多 cluster
总之 YOLO 和 cluster finding 这个任务的不兼容之处太多