希威社 姐妹花 自动驾驶初度应用测试时斟酌!港大英伟达等新时间让AI边开边学,无东谈主车遇变谈安定嘱咐
当开车遭受变谈、加塞等场景时希威社 姐妹花,驾驶员常常会下订立地激活我方的"安全驾驶念念维",从而作念出激进的遁藏行动。
与之一样,自动驾驶汽车在上述场景中,更会发达得像个步步为营的"生手司机",这是因为模子的有筹谋常常依赖于工程师预设的固定例则,进而导致"不求无功,但求无过"的驾驶作风,但过多的无故急刹、过度躲避反而会激发异常的安全隐患。
针对上述问题,来自香港大学、英伟达和德国图宾根大学的相接团队提倡 Centaur(Cluster Entropy for Test-time trAining using UnceRtainty)法式,大致动态地改善驾驶计谋,通过在线的数据运行,解脱了对预设法则的依赖,大幅提高了自动驾驶汽车在不细目性场景中的合乎性与安全性。
科目三 裸舞Centaur 在测试推理历程中动态地调度模子权重,合乎 OOD 场景,普及泛化才调。模子运用 Cluster Entropy 手脚自监督信号,并初度将 Test-Time Training(TTT)应用于端到端自动驾驶,幸免手动法则和资本函数,及时减少不细目性并修订展望,借由在线数据运行已毕了轨迹展望的可推广性。
论文已上传 arXiv,代码、checkpoint 等行将开源。
独霸不细目性
时常来说,模子是如何估量我方输出不细目性的?一种直不雅的法式是不雅察模子输出的散播景况,并基于"固定采样下,模子的输出标的越集聚,越靠近模子的最高置信度"的假定,来斟酌模子输出的聚类进度,从而侧面估量出模子输出的不细目性。
Cluster Entropy 通过轨迹采样、聚类和熵斟酌来评估自动驾驶模子的不细目性。比较传统的法式,它联接了直行、细小右转、剧烈右转、细小左转和剧烈右转的行动聚类,使得不细目性预计更具可诠释性。举例,当模子濒临复杂的交叉路口时,Cluster Entropy 能直不雅响应不同驾驶有筹谋的不细目性,从而匡助优化自动驾驶系统的安全性。
边行驶边进化
TTT 在推理历程中运用 Cluster Entropy 手脚自监督主义,通过梯度优化让模子自合乎地调度特征表征,从而普及对 OOD 场景的合乎才调。
具体而言,模子通过斟酌 Cluster Entropy,判断面前环境的 OOD 级别。若是模子对面前环境的清晰较差,则触发 TTT 磨真金不怕火历程,通过梯度下跌对特征索要网罗进行小幅度更新,使其更合乎面前环境特征散播。这一法式使得 Centaur大致在推理时自合乎地优化自己,在 OOD 场景中保抓褂讪的感知和驾驶才调,而无需依赖固定例则或东谈主工遐想的资本函数。
实测接近东谈主类驾驶水平,安全性能全面普及
在 navtest 基准测试中,Centaur 的空洞连系与驾驶目的得分(PDMS)获得了92.6%的得益,远远超越了基于回退的法式,并接近东谈主类驾驶水平 。此外,Centaur 在碰撞幸免和碰撞时分等重要目的上亦发达出迥殊的性能。
为了更好地评估自动驾驶系统在安全重要场景中的发达,咱们提倡了navsafe 数据集,特意用于测试端到端驾驶法式的安全性和鲁棒性。它基于 navtest,并联接了真正的事故数据,通过细粒度的评分机制,量化了自动驾驶模子的不同驾驶才调,而不像 navtest 只提供合座分数。
此外,Cluster Entropy 手脚不细目性度量器具,已毕了 PDMS 的权臣普及,并在失败检测任务中, 获得了最好后果。
论文地址: https://arxiv.org/abs/2503.11650希威社 姐妹花