[1]陈富强,陈振庭,吴宪传.基于深度强化学习的柔性机械臂末端位置自动控制研究[J].机械与电子,2025,(05):30-35.
 CHEN Fuqiang,CHEN Zhenting,WU Xianchuan.Research on Automatic Control of Flexible Robotic Arm End Position Based on Deep Reinforcement Learning[J].Machinery & Electronics,2025,(05):30-35.
点击复制

基于深度强化学习的柔性机械臂末端位置自动控制研究()
分享到:

《机械与电子》[ISSN:1001-2257/CN:52-1052/TH]

卷:
期数:
2025年05期
页码:
30-35
栏目:
自动控制与检测
出版日期:
2025-05-23

文章信息/Info

Title:
Research on Automatic Control of Flexible Robotic Arm End Position Based on Deep Reinforcement Learning
文章编号:
1001-2257 ( 2025 ) 05-0030-06
作者:
陈富强陈振庭吴宪传
广州华商学院人工智能学院,广东 广州 511300
Author(s):
CHEN Fuqiang CHEN Zhenting WU Xianchuan
( School of Artificial Intelligence , Guangzhou Huashang College , Guangzhou 511300 , China )
关键词:
深度强化学习柔性机械臂末端位置自动控制奖励函数PPO 算法
Keywords:
deep reinforcement learning end position of flexible robotic arm auto-control reward function PPO algorithm
分类号:
TP241
文献标志码:
A
摘要:
柔性机械臂在工作过程中所遭受到的扰动会改变其动态特性,使得末端执行器位置变化具备不确定性,增加了控制难度,为此,对基于深度强化学习的柔性机械臂末端位置自动控制方法进行了研究。搭建了柔性机械臂末端运动学模型,利用该模型进行了机械臂末端位置定位。 PPO 算法结合末端位置与奖励函数设计了柔性机械臂末端自动控制目标函数,利用该函数实现了柔性机械臂末端位置自动控制。通过实验证明所提方法实现了机械臂末端位置自动控制,确保其在执行任务时准确到达指定点位,提高了机械臂的运动稳定性,降低了轨迹跟踪误差。
Abstract:
The disturbances experienced by flexible robotic arms during operation can alter their dynamic characteristics , leading to uncertainty in the position of the end effector and increasing control difficulty.Therefore , a deep reinforcement learning based automatic control method for the end effector position of flexible robotic arms has been studied.A kinematic model of the end effector of a flexible robotic arm was constructed , and the end effector position of the robotic arm was determined using this model.The PPO algorithm combined the end position and reward function to design the objective function for automatic control of the end effector of a flexible robotic arm , and used this function to achieve automatic control of the end effector position of the flexible robotic arm.Through experiments , it has been proven that the proposed method achieves automatic control of the end position of the robotic arm , ensuring that it accurately reaches the designated point during task execution , improving the motion stability of the robotic arm , and reducing trajectory tracking errors.

参考文献/References:

[ 1 ] 肖权,郭斌,向国菲,等 . 基于随机采样的多段柔性机械臂路径规 划[ J ] . 组 合机 床与 自 动化 加工 技 术,2023( 3 ): 28-34.

[ 2 ] 琚世杰,程良彦,闫安志 . 压电柔性机械臂振动模拟与 BP-PID 控制[ J ] . 河南理工大学学报(自然科学版),2022 , 41 ( 1 ): 107-113.
[ 3 ] 李小彭,周赛男,尹猛,等 . 双柔性机械臂伺服系统 PI控制策略[ J ] . 东北大学学报(自然科学版),2023 , 44( 5 ): 642-650 , 659.
[ 4 ] 管恋哲,张振山,崔国华,等 . 考虑关节摩擦的刚柔耦合机械臂末端抖动模拟与分析[ J ] . 机床与液压, 2022 , 50( 21 ): 54-58.
[ 5 ] 张彦泽,于斌超,马大智,等 . 自适应扩展卡尔曼滤波机械臂末端定位[ J ] . 组合机床与自动化加工技术, 2022(10 ): 150-153 , 158.
[ 6 ] YANG Y , SHI J , LIU Z , et al.Vibration and position tracking control for a flexible Timoshenko robot arm with disturbance rejection mechanism [ J ] .Assembly automation , 2022 , 42 ( 2 ): 248-257.
[ 7 ] 朱大昌,杜宝林,盘意华,等 . 基于轮廓误差补偿的机械臂自适应非奇异终端滑模控制[ J ] . 机床与液压, 2022 ,50 ( 8 ): 172-180.
[ 8 ] 尚东阳,李小彭,尹猛,等 . 采用 RBF 神经网络辨识的柔性机械臂抑振控制策略[ J ] . 西 安 交通大学学报,2022 , 56 ( 6 ): 76-84.
[ 9 ] 上官朝伟,李小彭,李泉,等 . 模糊 PI 控制器与干扰观测器相结合的空间柔性机械臂的转动控制策略[ J ] . 中南大学学报(自然科学版),2023 , 54 ( 12 ): 4687-4698.
[ 10 ] 肖湘,高三杰,蒋维宇,等 . 蒸汽发生器传热管涡流检验的三自由度检测机械臂运动学分析 与定 位求 解[ J ] . 核动力工程, 2023 , 44 ( 5 ): 151-155.
[ 11 ] 潘昌忠,罗晶,李智靖,等 . 平面欠驱动柔性机械臂的 PSO 轨迹优化与自抗扰振动抑制[ J ] . 振动与冲击,2022 , 41 ( 14 ): 181-189.
[ 12 ] 尤鑫烨,陈力 . 考虑摩擦特性的柔性关节空间机器人自适应 CMAC 神经网络鲁棒控制[ J ] . 计算力学学报,2022 , 39 ( 2 ): 192-197.
[ 13 ] 董经纬,姚尧,冯景祥,等 . 基于 PPO 的异构 UUV 集群任务分配算法[ J ] . 舰船科学技术,2024 , 46 ( 12 ):84-89.
[ 14 ] 方宝富,余婷婷,王浩,等 . 稀疏奖励场景下基于状态空间探索的多智能体强化学习算法[ J ] . 模式识别与人工智能,2024 , 37 ( 5 ): 435-446.
[ 15 ] 张仪,冯伟,王卫军,等 . 融合 LSTM 和 PPO 算法的移动机器人视觉导航 [ J ] . 电子测量与仪器学报,2022 , 36 ( 8 ): 132-140.

备注/Memo

备注/Memo:
收稿日期: 2024-09-02
基金项目:广州华商学院校内导师制科研基金资助项目( 2024HSDS06 )
作者简介:陈富强 ( 1995- ),男,湖北黄冈人,硕士,讲师,研究方向为云计算、图像处理、信息安全、机械制造及其自动化;陈振庭 ( 1993- ),男,广东汕头人,硕士,助教,研究方向为计算机视觉、数据分析与挖掘;吴宪传 ( 1981- ),男,广东广州人,硕士,讲师,研究方向为电子设计、自动化、机械设备。
更新日期/Last Update: 2025-06-13