1. 问题描述 1.1 在使用官方代码进行训练的时候“success_once突然掉落到0” 简要说明你在使用官方 examples/baselines/ppo/baselines.sh 脚本训练 PickCube-v1 时,在 early stage(如前 50 k 步)指标正常、success_once 接近 1,但在后期(约 100 k 步以后)发现 success_once 连续多次为 0 的现象。可以附上一张示例图(如你之前贴的 eval/success_once 曲线):标明“100 k 步前后”这一时段,指标为什么会突然“塌陷”。