论坛>计算机科学>软件综合>机器学习

文号833569

20663

现代神经网络发展

randomized2017/04/30软件综合 IP:广东

ReLU[1]与softplus[2]

图15ReLU与softplus的函数图像

ReLU可表示为

$ f(x)=max(0,x) $

而softmax可表示为：

$ f(x)=ln(1+e^x ) $

其导数为：

$ f^{'}(x)=e^x/(e^x+1)=1/(1+e^{-x} ) $

这一类的激活函数主要是为了拟合神经元的单侧抑制输出，它们可以加快神经网络的训练速度，更早地得到最终结果。

图16 ReLU对深度卷积神经网络错误率收敛的加速效果[3]

Dropout[4]

图16 Dropout模式图

Dropout 技术在于训练部分神经元去拟合识别模型，而使用全部的神经元来进行测试，可以有效地防止过拟合问题（对训练数据集的识别效果过好，以至于无法较好地识别测试数据）。在训练的过程中，随机以一定概率（1-r）忽视部分神经元，进行计算和训练，而在测试（或应用于生产环境）的时候，通过将权值乘以r来计算所有神经元的输出。

Maxout [5]

Maxout技术所作的改进主要将神经元的输出改变为（在激活函数前）：

$ h_i(x) =max_{j∈[1,k]}z_{ij} $

其中：

$ z_{ij}=x^T W_{...ij}+b_{ij} $

这种使用多个权值计算最后输出最大值的方法改进能够极好地拟合凹函数，对于图像识别等神经网络的非凸模型识别任务拥有极好的提升效果。

图17maxout对非线性性函数的拟合

Network In Network[6]

如图所示，普通的卷积神经网络的输出是直接传递到下一层：

图18普通卷积层

而该论文中的卷积层在传递过程中经过了一个两层的MLP（多层感知器），从而增强卷积层的分类能力。

图19多层感知器卷积层

图20Network In Network结构简图

使用图示结构的神经网络，配合dropout、maxout，它做到了0.45的MNIST错误率。

Reference:

[1] Nair V, Hinton G E. Rectified Linear Units Improve Restricted Boltzmann Machines[C]International Conference on Machine Learning. DBLP, 2010:807-814.

[2]Dugas C, Bengio Y, Belisle F, et al. Incorporating Second-Order Functional Knowledge for Better Option Pricing[C]. neural information processing systems, 2001: 472-478.

[3]KrizhevskyA,SutskeverI,Hinton G XXXXageNet Classification with Deep Convolutional Neural Networks[J].Advances in Neural Information Processing Systems,2012,25(2):2012.

[4] Srivastava N, Hinton G, Krizhevsky A, et al. Dropout: a simple way to prevent neural networks from overfitting[J]. Journal of Machine Learning Research, 2014, 15(1):1929-1958.

[5]Goodfellow I J, Wardefarley D, Mirza M, et al. MaxoutNetworks[J]. Computer Science, 2013:1319-1327.

[6] Lin M, Chen Q, Yan S. Network In Network[J]. Computer Science, 2014.

来自：计算机科学 / 软件综合

全部只看作者

已屏蔽原因：{{ notice.reason }}已屏蔽

屏蔽解除屏蔽编辑详情

~~空空如也

云中子3529

7年9个月前 IP:安徽

835063

1楼

感觉应该再说一下vgg的那几个模型的
最近看cnn的时候发现这两个模型很好用的说
用vgg的模型魔改照片简直一绝

引用

加载评论中，请稍候...

200字以内，仅用于支线交流，主线讨论请采用回复功能。

折叠评论

想参与大家的讨论？现在就登录或者注册。

所属专业

软件综合

所属分类

机器学习

上级专业

计算机科学

同级专业

计算机电子学

randomized

进士学者机友笔友

文章

学术分

2015/02/04注册，4年8个月前活动

暂无简介

主体类型：个人

所属领域：无

认证方式：手机号

IP归属地：江西

名片私信

作者最新文章

厦门大学成功发射“嘉庚一号”火箭

航天技术 randomized 5年11个月前

[科创A基金|CNNIC]阶段成果报告更宽模型、更少参数带来的更优效果

软件综合 randomized 7年3个月前

[科创A基金|SCSCN]款项去向变更说明及检讨

科创基金 randomized 7年8个月前

申请科创A基金|Sparse Convolution of Small CNN

科创基金 randomized 7年9个月前

申请科创A基金|Convolution of Small CNN(CSC)

科创基金 randomized 7年10个月前

现代神经网络发展

软件综合 randomized 7年11个月前

卷积神经网络实现

软件综合 randomized 8年6个月前

神经网络结构概览

软件综合 randomized 8年8个月前

CAD 火箭CH-1 新人求意见

喷气推进 randomized 10年2个月前

相似文章推荐

【XXXXXT】直接通过文件结构生成xls文件

软件综合 93° 15年10个月前

【分享】在不同DPI下设计和运行Windows Forms解决方案（不是高分屏也要看）

软件综合 acmilan 9年1个月前

[原创软件发布]UDP Fighter 科创论坛专版

软件综合 ldc 16年6个月前

OpenCV2.4.9 For Android + Android Studio （with gradle）配置教程

软件综合 4king 10年4个月前

【OCR】简单的做法 [XXXXXT CODE]

软件综合 93° 15年11个月前

【x86向量化】三种不同方式的AGC算法代码运行速度对比

软件综合 warmonkey 6年3个月前

【大囧之物，RF软件】RF验证码识别DEMO

软件综合 93° 16年6个月前

[基础编程]求π10000位（最简单算法）

软件综合 caoyuan9642 14年6个月前

Visual C++中的工作线程分离

软件综合 acmilan 9年10个月前

FIR与IIR低通滤波器的最简最快实现

软件综合 novakon 9年3个月前

插入公式

温馨提示

1. 公式行内显示(inline)：请使用 $....$ 或 $....$ 包裹代码

2. 公式独占一行显示(display)：请使用 $$....$$ 或 \[....\] 包裹代码

3. 插入的公式在编辑时不会渲染，请检查无误后再插入。

公式输入

公式预览

$\sum_{i=0}^N\int_{a}^{b}g(t,i)\text{d}t$

评论控制

加载中...

文号：{{pid}}

可查看、可评论

只可查看

不可查看、不可评论

投诉或举报

加载中...

请选择违规类型：

空空如也

提交成功！

加载中...

详情

推送到专栏从专栏移除

设为匿名取消匿名

查看作者

只看作者

加入收藏取消收藏

取消收藏

折叠回复

置顶取消置顶

评学术分

鼓励

设为精选取消精选

管理提醒

编辑

通过审核

评论控制

退修或删除

历史版本

违规记录

投诉或举报

加入黑名单移除黑名单

查看IP

笔记

{{fromNow(n.toc)}} {{n.status === noteStatus.disabled ? "已屏蔽" : ""}} {{n.status === noteStatus.unknown ? "正在审核" : ""}} {{n.status === noteStatus.deleted ? '已删除' : ''}}

编辑
删除
{{n.status === 'disabled' ? "解除屏蔽" : "屏蔽" }}

我也是有底线的