对比研究:两篇基于强化学习算法的智能导航论文

第一篇是我本人于2023年7月上传arxiv的预印本论文(XXXXXXXXXXXXXXXXX/abs/2307.14038)

第二篇则是美国加州伯克利大学开发团队于2024年7月上传arixv的预印本论文(XXXXXXXXXXXXXXXXX/abs/2407.02539)

评价:两篇都是AI学科本科生的研究水平,均没有长篇的数学推导。都使用了AI学科强化学习领域的DQN算法作为自己新算法的开发框架,前者融合PID控制算法,试图以控制论的观点处理导航过程,利用负反馈机制消除导航过程中的误差增长。而后者融合PPO算法,试图创建策略更新机制,提升强化智能体学习的稳定性。就论文撰写而言,前一篇论文在图像绘制和可视化方面有待增强,而后一篇论文的亮点之一便是图像的绘制, 包括10*10网格环境的建立(智能体的学习环境);就算法的严谨性而言,前一篇论文缺乏数学机制的构建,更像是“碰运气”来解决导航误差消除(GNSS拒止)问题;而后一篇论文给出了至少三步的公式推导,便于从数学层面探讨和推广算法本身。


[修改于 4个月13天前 - 2024/07/12 22:02:18]

来自:计算机科学 / 软件综合航空航天 / 航天技术
10
已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:江苏
933955

上文DQM智能导航算法涉及的源代码和用论文给定数据集训练的AI模型:

attachment icon DQM.py 14.46KB PY 5次下载

attachment icon dqn.pth 332.10KB PTH 3次下载


引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:江苏
933956
学习AI算法必须要有较强的数学功底和直觉,否则只会停留在一个较低的层次。另外具体开发算法最好自己完成证明,否则算法在严谨性方面会大打折扣。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:江苏
933957

当下(2024年)人工智能领域主流的技术路线(人工神经网络算法及其衍生的大语言模型)就是在炼丹(行业自嘲),把要冶炼的“物品”(系统定义的自变量)随机设置条件加热反应,然后再不停地更换条件,目的就是让人工智能学习到最优的结果(训练和验证曲线收敛)

引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:江苏
933958
人工智能的计算本质是在模仿历史数据,神经网络的损失值最低就意味着AI程序最有可能给出符合现实的预测结果,人工智能本质仍然是经验性的,逻辑性不强
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:江苏
933959
DQM算法的论文后续要改进,因为论文最初训练的数据量少,AI模型应用于不同的飞行导航场景下的泛化能力会受到限制。还有就是完成相应的数学证明(这对我本人来讲是一个难题)。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:江苏
933960
无人机(包括其它智能载具)在飞行时的加速度和角速度等导航物理量的测量误差都出现了“爆炸式”的增长,此时把过程看作一个系统,可以用负反馈的算法修正误差的增长(正反馈增加),这样载具有望实现智能导航。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:江苏
933961
后续要考虑把论文涉及的AI模型烧录到嵌入式设备上面部署,推荐是无人机(论文研究的课题对标无人机的飞行过程,智能导航模型也可以尝试在探空火箭上部署)。需要的工具:STM32CubeMX,Keil;前者将AI模型文件转化为C/C++代码,与控制模块的代码结合后由后者负责烧录。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:北京
933962

载具部署智能导航模型对载具计算芯片的算力有一个最低的门槛要求,最低是树莓派芯片或者是CPU芯片,Jetson开发板亦可(很遗憾,STM32系列的单片机算力还是低了一些,无力作为ai模型推理的硬件设备),GPU推荐使用960ti显卡(考虑嵌入式设备的成本)。

引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月18天前 修改于 4个月13天前 IP:北京
933963
引用chenghangtian发表于5楼的内容
DQM算法的论文后续要改进,因为论文最初训练的数据量少,AI模型应用于不同的飞行导航场景下的泛化能力...


堆积数据量会增加ai训练成本,必须想办法蒸馏数据,否则个人和小团队无力负担高昂的费用(深度学习工作站设备年租2万到5万人民币)

引用
评论
1
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论
chenghangtian作者
4个月17天前 修改于 4个月13天前 IP:北京
933993

原始论文的效果差强人意(正式的研究清一色ros/ue5+飞行视频录制),需要得到实践反馈


引用
评论
1
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

chenghangtian
开除学籍
文章
5
回复
51
学术分
0
2022/08/14注册,4个月6天前活动

Artificial Intelligence

主体类型:个人
所属领域:无
认证方式:身份证号
IP归属地:江苏
文件下载
加载中...
{{errorInfo}}
{{downloadWarning}}
你在 {{downloadTime}} 下载过当前文件。
文件名称:{{resource.defaultFile.name}}
下载次数:{{resource.hits}}
上传用户:{{uploader.username}}
所需积分:{{costScores}},{{holdScores}}下载当前附件免费{{description}}
积分不足,去充值
文件已丢失

当前账号的附件下载数量限制如下:
时段 个数
{{f.startingTime}}点 - {{f.endTime}}点 {{f.fileCount}}
视频暂不能访问,请登录试试
仅供内部学术交流或培训使用,请先保存到本地。本内容不代表科创观点,未经原作者同意,请勿转载。
音频暂不能访问,请登录试试
支持的图片格式:jpg, jpeg, png
插入公式
评论控制
加载中...
文号:{{pid}}
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}