基于PRND-SAC强化学习的耙吸式挖泥船装舱系统控制*
DOI:
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

基金项目:

工信部高技术船舶项目(工信部装函【2019】360); 江苏科技大学校企合作项目(2175152102)


PRND-SAC reinforcement learning-based mud tank loading system control for trailing suction hopper dredger
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对现有耙吸式挖泥船装舱控制过程人员依赖性强和效率低下的问题,融合优先经验回放(PER)和随机网络蒸馏(RND)技术,提出一种基于优先回放和随机网络蒸馏柔性动作评价(PRND-SAC)的强化学习控制算法,通过设计相应的状态空间、动作空间和奖励函数,将PRND-SAC控制器与传统的SAC控制器进行对比,并基于全过程装舱阶段仿真环境将PRND-SAC控制器与实际疏浚数据进行对比试验。结果表明,设计的控制器能够快速且稳定地收敛;与传统的SAC控制器相比,所提出的PRND-SAC控制器不仅有效提高了控制过程的稳定性,还显著提升了装舱效率。

    Abstract:

    In view of the problem that current loading control processes of a trailing suction hopper dredger is high personnel dependence and low efficiency,prioritized experience replay (PER) and random network distillation (RND) are combined,and a reinforcement learning control algorithm is proposed on the basis of priority replay and random network distillation soft actor-critic (PRND-SAC).By designing appropriate state space,action space,and reward function,the PRND-SAC controller is compared with the traditional SAC controller.Furthermore,comparative experiments are conducted between the PRND-SAC controller and actual operational data on the basis of a full-process loading phase simulation environment.The results demonstrate that the proposed controller converges quickly and stably.Furthermore,compared to the traditional SAC controller,the PRND-SAC controller not only enhances the stability of the control process but also significantly increases loading efficiency.

    参考文献
    相似文献
    引证文献
引用本文

张云飞,苏 贞,王 伟.基于PRND-SAC强化学习的耙吸式挖泥船装舱系统控制*[J].水运工程,2025(6):186-193.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2025-06-19
  • 出版日期:
文章二维码