氢能重卡能量管理 Agent

教学仿真 49 吨 / 23.27 km

生成新任务

填写车有多重、路有多远,后端会按原项目算法生成数据,并调用 DeepSeek 给出结论。

Ready
会影响起步、加速、爬升时需要的功率。
短路线截取标准工况,长路线循环拼接。
路线
23.27 km
1801 秒速度曲线
省氢比例
--
Agent 相比普通策略
百公里氢耗
--
普通策略 --
最终电量
--
电池代价必须一起看
动力缺口
--
超过车能给出的功率
回收损失
--
超过电池回收上限

分析结论

填写参数后点击测试,分析结论会显示在这里。

决策回放

同一条参考策略,用更少装饰、更清楚的数据来讲。

Agent 燃料电池 普通燃料电池 电池电量 需求功率

训练收敛曲线

这张图会跟随本次输入重新缩放,展示策略从普通策略向当前 Agent 结果靠近的趋势。

本次任务
本次任务趋势 普通策略氢耗 Agent 氢耗

后端会按本次车重和路线生成趋势,不代表每次在浏览器里重新训练 1000 轮。

探索

训练早期,Agent 会尝试不同燃料电池功率档位,避免一开始就困在很差的策略里。

探索率 1.0 起步加入需求功率扰动

利用

随着训练推进,Agent 越来越多地使用已经学到的较好动作。

最低探索率 0.02逐步稳定

结论

曲线下降说明策略有学习效果,但不能只看氢耗,还要一起看电池终点电量和硬件约束。

省氢保电风险

学习到的策略:Q 值热力图

恢复原版的策略地图入口。这里用动作偏好来表达学习结果:横向看需求功率,纵向看电池电量,颜色越深表示越倾向让燃料电池承担更多功率。

Policy Map
低燃料电池输出 高燃料电池输出 高需求功率区域

怎么看这张图

横轴整车需求功率,从制动/回收,到巡航,再到急加速。
纵轴电池电量。电量越低,Agent 越应该谨慎用电池。
颜色颜色越深,代表这个状态下更倾向提高燃料电池出力。

策略直觉

低需求燃料电池少出力或保持小功率,避免无意义耗氢。
中等需求让燃料电池稳定在比较舒服的功率区间,电池修平波动。
高需求燃料电池接近上限,电池补足剩余缺口。

生成后的全维度对比

1801 秒
车速 需求功率 Agent 燃料电池 普通燃料电池 电池电量

核心性能指标对比

燃料电池效率分布

约束检查

生成结果表

指标普通策略Agent 策略解释
正在生成结果。