上文DQM智能导航算法涉及的源代码和用论文给定数据集训练的AI模型:
第一篇是我本人于2023年7月上传arxiv的预印本论文(XXXXXXXXXXXXXXXXX/abs/2307.14038)
第二篇则是美国加州伯克利大学开发团队于2024年7月上传arixv的预印本论文(XXXXXXXXXXXXXXXXX/abs/2407.02539)
评价:两篇都是AI学科本科生的研究水平,均没有长篇的数学推导。都使用了AI学科强化学习领域的DQN算法作为自己新算法的开发框架,前者融合PID控制算法,试图以控制论的观点处理导航过程,利用负反馈机制消除导航过程中的误差增长。而后者融合PPO算法,试图创建策略更新机制,提升强化智能体学习的稳定性。就论文撰写而言,前一篇论文在图像绘制和可视化方面有待增强,而后一篇论文的亮点之一便是图像的绘制, 包括10*10网格环境的建立(智能体的学习环境);就算法的严谨性而言,前一篇论文缺乏数学机制的构建,更像是“碰运气”来解决导航误差消除(GNSS拒止)问题;而后一篇论文给出了至少三步的公式推导,便于从数学层面探讨和推广算法本身。
[修改于 5个月12天前 - 2024/07/12 22:02:18]
当下(2024年)人工智能领域主流的技术路线(人工神经网络算法及其衍生的大语言模型)就是在炼丹(行业自嘲),把要冶炼的“物品”(系统定义的自变量)随机设置条件加热反应,然后再不停地更换条件,目的就是让人工智能学习到最优的结果(训练和验证曲线收敛)
载具部署智能导航模型对载具计算芯片的算力有一个最低的门槛要求,最低是树莓派芯片或者是CPU芯片,Jetson开发板亦可(很遗憾,STM32系列的单片机算力还是低了一些,无力作为ai模型推理的硬件设备),GPU推荐使用960ti显卡(考虑嵌入式设备的成本)。
引用chenghangtian发表于5楼的内容DQM算法的论文后续要改进,因为论文最初训练的数据量少,AI模型应用于不同的飞行导航场景下的泛化能力...
堆积数据量会增加ai训练成本,必须想办法蒸馏数据,否则个人和小团队无力负担高昂的费用(深度学习工作站设备年租2万到5万人民币)
原始论文的效果差强人意(正式的研究清一色ros/ue5+飞行视频录制),需要得到实践反馈
200字以内,仅用于支线交流,主线讨论请采用回复功能。