网站首页 > 文章精选 正文
线性整流函数(Rectified Linear Unit, ReLU),又称修正线性单元,是一种人工神经网络中常用的激活函数(activation function),通常指代以斜坡函数及其变种为代表的非线性函数。整流线性单元,激活部分神经元,增加稀疏性,当x小于0时,输出值为0,当x大于0时,输出值为x.
公式:
图:
relu
导数:
图:
ReLU的导函数
relu对比于sigmoid:
- sigmoid的导数,只有在0附近,具有较好的激活性,而在正负饱和区的梯度都接近于0,会造成梯度弥散;而relu的导数,在大于0时,梯度为常数,不会导致梯度弥散。
- relu函数在负半区的导数为0 ,当神经元激活值进入负半区,梯度就会为0,也就是说,这个神经元不会被训练,即稀疏性;
- relu函数的导数计算更快,程序实现就是一个if-else语句;而sigmoid函数要进行浮点四则运算,涉及到除法;
relu的缺点:
在训练的时候,ReLU单元比较脆弱并且可能“死掉”。举例来说,当一个很大的梯度,流过ReLU的神经元的时候,可能会导致梯度更新到一种特别的状态,在这种状态下神经元将无法被其他任何数据点再次激活。如果这种情况发生,那么从此所以流过这个神经元的梯度将都变成0。也就是说,这个ReLU单元在训练中将不可逆转的死亡,因为这导致了数据多样化的丢失。
如果学习率设置得太高,可能会发现网络中40%的神经元都会死掉(在整个训练集中这些神经元都不会被激活)。通过合理设置学习率,这种情况的发生概率会降低。
在神经网络中,隐含层的激活函数,最好选择ReLU。
- 上一篇: 5分钟理解RELU以及他在深度学习中的作用
- 下一篇: 一文明白超参数的定义及其各种类型
猜你喜欢
- 2025-01-15 从0开始实现目标检测——基于YOLOv5
- 2025-01-15 【人工智能】简单理解CNN卷积神经网络并python实现(带源码)
- 2025-01-15 Richard Sutton 直言卷积反向传播已经落后,AI 突破要有新思路:持续反向传播
- 2025-01-15 深入理解机器学习中的最大熵原理与Softmax函数
- 2025-01-15 技术干货!LLM工程师必读量化指南,可视化揭秘大模型如何压缩
- 2025-01-15 神经网络中的全连接层是什么?
- 2025-01-15 揭秘PyTorch神器:巧妙使用torch.nn.Linear提升深度学习模型
- 2025-01-15 深度学习:正向传播、反向传播
- 2025-01-15 Attention之SENet
- 2025-01-15 神经网络背后的数学原理:反向传播过程及公式推导
- 最近发表
- 标签列表
-
- newcoder (56)
- 字符串的长度是指 (45)
- drawcontours()参数说明 (60)
- unsignedshortint (59)
- postman并发请求 (47)
- python列表删除 (50)
- 左程云什么水平 (56)
- 计算机网络的拓扑结构是指() (45)
- 稳压管的稳压区是工作在什么区 (45)
- 编程题 (64)
- postgresql默认端口 (66)
- 数据库的概念模型独立于 (48)
- 产生系统死锁的原因可能是由于 (51)
- 数据库中只存放视图的 (62)
- 在vi中退出不保存的命令是 (53)
- 哪个命令可以将普通用户转换成超级用户 (49)
- noscript标签的作用 (48)
- 联合利华网申 (49)
- swagger和postman (46)
- 结构化程序设计主要强调 (53)
- 172.1 (57)
- apipostwebsocket (47)
- 唯品会后台 (61)
- 简历助手 (56)
- offshow (61)