Dueling DQN 这种结构的神经网络每轮训练需要两次吗?
我说要有光2017/09/18软件综合 IP:河北
上面的是普通的神经网络,每轮训练通常只需要进行一次,但在遇到类似于 Dueling DQN 这种结构的神经网络时应该如何训练呢?

需要在1和2分别推一次?其中一条只需要推一半就好?或者是有什么神奇的函数可以把它们重新聚合起来之后一次推回去?

821593-20161002174635887-702539742.png

[修改于 7年4个月前 - 2017/09/18 05:14:07]

来自:计算机科学 / 软件综合
1
已屏蔽 原因:{{ notice.reason }}已屏蔽
{{notice.noticeContent}}
~~空空如也
novakon
7年4个月前 IP:美国
839604
正向:计算->计算->两个分叉分别计算->合并(相加或者concat)->计算
反向:梯度传递->两个分叉分别传递->合并(相加)->梯度传递->梯度传递
总结:没有什么特殊的,如果某一输出被用在两个地方,由这两个地方传回来的梯度相加就可以了。
引用
评论
加载评论中,请稍候...
200字以内,仅用于支线交流,主线讨论请采用回复功能。
折叠评论

想参与大家的讨论?现在就 登录 或者 注册

所属专业
所属分类
上级专业
同级专业
我说要有光
进士 学者 机友 笔友
文章
317
回复
5542
学术分
15
2008/03/06注册,2天3时前活动

Inspiration, Innovation, Discovery

主体类型:个人
所属领域:无
认证方式:手机号
IP归属地:未同步
插入公式
评论控制
加载中...
文号:{{pid}}
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

加载中...
详情
详情
推送到专栏从专栏移除
设为匿名取消匿名
查看作者
回复
只看作者
加入收藏取消收藏
收藏
取消收藏
折叠回复
置顶取消置顶
评学术分
鼓励
设为精选取消精选
管理提醒
编辑
通过审核
评论控制
退修或删除
历史版本
违规记录
投诉或举报
加入黑名单移除黑名单
查看IP
{{format('YYYY/MM/DD HH:mm:ss', toc)}}