密度感知倒角距离 Density-aware Chamfer Distance (Editing)
Editing密度感知Chamfer距离(Density-aware Chamfer Distance,DCD)是一种新的相似性度量方法,用于衡量两个点集之间的相似性。它是基于Chamfer距离(CD)的改进,具有更好的性能和特性。
Last updated
Editing密度感知Chamfer距离(Density-aware Chamfer Distance,DCD)是一种新的相似性度量方法,用于衡量两个点集之间的相似性。它是基于Chamfer距离(CD)的改进,具有更好的性能和特性。
Last updated
原文:
Chamfer Distance(CD)和Earth Mover's Distance(EMD)是衡量两个点集相似性的两个广泛采用的度量。然而,CD通常对不匹配的局部密度不敏感,而EMD通常受全局分布的支配,忽视了详细结构的保真度。此外,它们的无界值范围导致离群值产生严重影响。这些缺陷阻碍了它们提供一致的评估。为了解决这些问题,我们提出了一种名为密度感知Chamfer距离(DCD)的新相似性度量。它源于CD并具有以下几个理想特性:
1)它可以检测密度分布的差异,因此与CD相比是一个更密集的相似性度量;
2)它对详细结构要求更严格,比EMD计算效率高得多;
3)有界值范围鼓励在整个测试集上进行更稳定、合理的评估。
我们采用DCD来评估点云完成任务,实验结果显示DCD关注整体结构和局部几何细节,并在CD和EMD相互矛盾时提供更可靠的评估。我们还可以将DCD用作训练损失,与使用CD损失训练的相同模型相比,在所有三个指标上表现优越。此外,我们提出了一个新颖的点判别器模块,用于估计另一个引导下采样步骤的优先级,它在DCD下实现了显著的改进,并在CD和EMD方面取得了竞争性的结果。
点云作为一种基本的三维表示,因其高效、灵活以及与实际物体的3D扫描设备的直接连接而受到越来越多的关注。它已经在广泛的应用场景中应用,并针对各种任务进行研究[1,4,7,11,28,36,39,30,24,40,42]。合适的点云相似性度量对于指导训练过程和提供公平合理的评估至关重要。然而,考虑到数据无序、不规则以及点数的不同,这是一个具有挑战性的设计。
Chamfer Distance(CD)和Earth Mover's Distance(EMD)是各种点云任务中最普遍认可的两个度量。CD是一种基于最近邻的方法,因其对具有不同点数的点集的高效计算和灵活应用性而受益。EMD依赖于求解优化问题,以找到两个点集之间最低成本的一对一传输流。尽管有时认为EMD在视觉质量上比CD更忠实[1,14],但其计算成本要高得多。一个好的相似性度量的理想特性在不同的应用场景下可能会有所不同。
1)对于感知和注册,它应该对采样策略和噪声点的检测具有鲁棒性,以确定由离散点表示的连续表面之间的相似性。
2)对于建模和生成,它应该对局部点分布的质量要求更严格,这对视觉质量也至关重要。本文主要关注第二个方面。
仔细研究上述两个度量,Chamfer Distance(CD)的公式有时受到其固有缺陷的影响:对不同密度分布不敏感,而对离群值的影响很大[25]。特别地,我们专门研究一个与视觉质量密切相关的概念,即两个点集之间的匹配密度分布。这也可以被称为“平衡”,假设真实值是均匀分布的。我们通过点云补全任务在图1中对这个问题进行可视化: 1)在低噪声水平下,CD与不平衡比例几乎没有变化; 2)一旦噪声强度上升到一定程度,CD会急剧增加; 3)在高噪声水平下,较高的不平衡甚至会导致较低的CD,这将导致一种降低任务CD的棘手操作:增加已知区域的点密度以确保准确性,同时降低未知区域的点密度以降低异常点的风险。但严重的不平衡也会显著影响全局外观。
相反,EMD可以稳定地检测图1中分布的变化。然而,一对一映射的要求通常过于严格。因此,传输问题的最优解受全局分布的支配,而忽略了精细结构的局部细节[5],如第3节所述。因此,CD和EMD都不是理想的评估生成形状质量的方法。
在这项工作中,我们主要关注CD作为评估指标的不公平性,并提出一种名为密度感知Chamfer距离(DCD)的新相似度度量,以应对上述挑战。具体来说,DCD源自原始的CD,但通过查询频率的分数项获得更高的分布质量敏感度,并通过泰勒展开近似获得更高的异常值容忍度。在变化的点分布下,它与EMD具有类似的趋势,同时在计算效率和捕捉细节方面表现更好。此外,由于CD和EMD关注的焦点不同,它们在评估不同方法时经常出现分歧,使得它们作为一致性指标的可靠性降低,如第5节所示。我们经验性地观察到,DCD通常提供更一致、更可靠的评估,特别是在CD和EMD相互矛盾的结果时。请注意,所提出的度量对于处理具有非均匀分布的真实数据(如基于曲率的采样)也有益处,这将在补充材料中讨论。
此外,我们分析了DCD作为损失函数的属性,并将其与CD的L1和L2版本进行比较。我们为其引入关键的小调整,以获得更好的训练过程。然后,我们提议更好地利用上述查询频率的信息,并设计了一个基于MLP的点判别器,灵感来自最近隐式函数的成功[19,15,21]。它进一步整合到我们平衡设计的两阶段完成框架中,其中模块的输出可以视为每个点的“重要性”,并为后续的下采样步骤提供优先级。最后,引导下采样操作通过去除异常值和保留关键点而受益。
为点云补全任务的不同指标和方法之间的比较提供了广泛的研究。实验结果证实了所提出的指标,密度感知Chamfer距离,成功克服了CD的上述问题。在CD和EMD相互矛盾时,DCD可以提供更可靠的评估,并在第5节和补充材料中的用户研究中证明其对视觉质量的忠实度更高。我们在PCN [39]和VRCNet [18]上验证了其作为损失函数的能力,结果显示,它不仅有助于减小DCD本身,而且还显著降低了EMD指标,而且令人意外地与使用CD训练的网络相比,也减少了CD。我们提出的平衡设计在新指标下也取得了显著改进,CD和EMD的竞争结果以及实验中的优越视觉质量。
总之,密度感知Chamfer距离(DCD)作为一种新的相似度度量,成功解决了传统CD指标的局限性,提供了更可靠且一致的评估方法。在实验中,DCD表现出对整体结构和局部几何细节的关注,特别是当CD和EMD相互矛盾时。此外,将DCD用作训练损失时,它在所有三个指标上优于使用CD损失训练的相同模型。我们还提出了一个新颖的点判别器模块,用于估计另一个引导下采样步骤的优先级,同时在DCD下实现了显著改进,并在CD和EMD方面取得了竞争性结果。我们希望我们的工作能为更全面、实用的点云相似度评估铺平道路。我们的代码将在这个https URL 上提供。
点云补全:点云补全旨在根据部分观察结果恢复完整形状。早期的作品将形状表示为体素[3,6,23],而PCN[39]首次提出使用原始点数据,并利用编码器-解码器结构生成基于全局特征的粗糙形状,然后进行折叠式上采样[37]。后续的工作通过技术如注意力机制[31,18,17]、分层聚合[8,41]以及立方体特征采样的网格结构[35]等增强特征表示;解码过程也可以利用如树结构[26]、迭代细化[29,34]、多个补丁生成[14]或已观察和未观察部分的分开预测[41]等。这些作品使用CD或EMD进行评估,但由于它们的关注点不同,可能无法始终满足这两者,正如第5节所示,因此一个更全面的指标对于公平和可靠的比较至关重要。
点云距离:术语“距离”指的是衡量两个点集之间不相似性的非负函数。考虑到点云的无序结构,形状级距离通常来自基于某种分配策略的成对点级距离的统计。Chamfer Distance(CD)是基于最近邻(公式1)的最常用指标之一。它在训练[37,4]和其他类似形式的距离中有变体,如Hausdorff[9,2,32]。另一个普遍采用的指标是Earth Mover's Distance(EMD),它依赖于解决优化问题,以找到从一个集合到另一个集合的最佳映射函数。有时认为它比CD更合理[1,14],但计算代价要高得多。最近,Urbach等人[27]提出了DPDist,通过测量它们所采样的表面之间的距离来比较点云。然而,它是通过网络而不是数学公式来估计的,使得将其应用到各种任务中变得不方便且可能不稳定。另一个密切相关的工作是Nguyen等人[16]的工作,他们提出了切片Wasserstein距离,具有与EMD等价的属性和与CD类似的计算复杂性,涉及蒙特卡洛方法进行近似。相比之下,我们从相反的角度出发,基于CD推导新的公式并得出一个简洁明确的表达式。同样地,我们的DCD在许多情况下也具有EMD的属性(如图1所示),同时它比EMD更好地检测到了细节保留问题。
3.1 预备知识 定义两个点集S1和S2之间的Chamfer距离(Chamfer Distance)如下:
点集S1中的每个点x在S2中找到其最近邻,反之亦然。所有点级别的成对距离取平均值,得到形状级别的距离。这种简单、灵活的公式在许多任务中具有很好的泛化性能。推土距离(Earth Mover's Distance)定义如下:
它依赖于求解一个优化问题,找到一个一对一的双射映射φ:S1→S2,因此仅在|S1|=|S2|时适用。然后计算x和φ(x)之间的成对距离。由于计算最优映射在计算上代价昂贵,甚至难以承受,因此已经开发了几种近似方案[14,13]来减轻计算负担。
在本节中,我们介绍了一种新的相似度度量——Density-aware Chamfer Distance(DCD),旨在解决Chamfer Distance(CD)不公平的问题。CD在评估生成任务(例如点云补全)的视觉质量时,存在以下问题:1)平方操作使其受到异常值的影响很大,并且评估结果在数据集中变化很大;2)最近点查询操作使其对密度分布不匹配的问题不够敏感,因此导致对视觉质量的评估不够有区别性。因此,我们旨在提出一种新的度量,基于原始的Chamfer Distance公式,既保留了相似度度量的能力,又高度缓解了上述问题,即Density-aware Chamfer Distance(DCD)。
首先,Chamfer Distance随着点对距离的增加呈二次增长,这可能被最差情况所支配,从而忽视了其他情况。为了解决这个问题,我们引入了Taylor Expansion的一阶近似公式e z =∞ n=0 z n/n!,即e z ≈ 1 + z,其中z = −||x − y||2。由于最近邻分配,通常满足z ≈ 0的条件,因此近似是合理的。因此,我们有: