H2 DeepSeek Agent Workbench

生成新任务

填写车有多重、路有多远，后端会按原项目算法生成数据，并调用 DeepSeek 给出结论。

Ready

车重（吨）

会影响起步、加速、爬升时需要的功率。

路线长度（公里）

短路线截取标准工况，长路线循环拼接。

出发电量（%）

路线

23.27 km

1801 秒速度曲线

省氢比例

--

Agent 相比普通策略

百公里氢耗

--

普通策略 --

最终电量

--

电池代价必须一起看

动力缺口

--

超过车能给出的功率

回收损失

--

超过电池回收上限

分析结论

填写参数后点击测试，分析结论会显示在这里。

决策回放

同一条参考策略，用更少装饰、更清楚的数据来讲。

路况片段

Agent 燃料电池普通燃料电池电池电量需求功率

训练收敛曲线

这张图会跟随本次输入重新缩放，展示策略从普通策略向当前 Agent 结果靠近的趋势。

本次任务

本次任务趋势普通策略氢耗 Agent 氢耗

后端会按本次车重和路线生成趋势，不代表每次在浏览器里重新训练 1000 轮。

探索

训练早期，Agent 会尝试不同燃料电池功率档位，避免一开始就困在很差的策略里。

探索率 1.0 起步加入需求功率扰动

利用

随着训练推进，Agent 越来越多地使用已经学到的较好动作。

最低探索率 0.02逐步稳定

结论

曲线下降说明策略有学习效果，但不能只看氢耗，还要一起看电池终点电量和硬件约束。

省氢保电风险

学习到的策略：Q 值热力图

恢复原版的策略地图入口。这里用动作偏好来表达学习结果：横向看需求功率，纵向看电池电量，颜色越深表示越倾向让燃料电池承担更多功率。

Policy Map

低燃料电池输出高燃料电池输出高需求功率区域

怎么看这张图

横轴整车需求功率，从制动/回收，到巡航，再到急加速。

纵轴电池电量。电量越低，Agent 越应该谨慎用电池。

颜色颜色越深，代表这个状态下更倾向提高燃料电池出力。

策略直觉

低需求燃料电池少出力或保持小功率，避免无意义耗氢。

中等需求让燃料电池稳定在比较舒服的功率区间，电池修平波动。

高需求燃料电池接近上限，电池补足剩余缺口。

生成后的全维度对比

1801 秒

车速需求功率 Agent 燃料电池普通燃料电池电池电量

核心性能指标对比

燃料电池效率分布

约束检查

生成结果表

指标	普通策略	Agent 策略	解释
正在生成结果。

氢能重卡能量管理 Agent

生成新任务

分析结论

决策回放

训练收敛曲线

探索

利用

结论

学习到的策略：Q 值热力图

怎么看这张图

策略直觉

生成后的全维度对比

核心性能指标对比

燃料电池效率分布

约束检查

生成结果表