建模之常见激活函数(Keras,tf2)
发布日期:2022-02-14 23:02:55 浏览次数:33 分类:技术文章

本文共 2166 字,大约阅读时间需要 7 分钟。

序号 激活函数 表达式 优点 缺点
1 sigmoid y = 1 1 + e − x = tanh ( x / 2 ) + 1 2 y=\frac{1}{1+e^{-x}}=\frac{\text{tanh}(x/2)+1}{2} y=1+ex1=2tanh(x/2)+1 属于 ( 0 , 1 ) (0, 1) (0,1),即指定区间,又属于累计概率范围 指数计算成本不低;梯度弥散&爆炸 keras.activations.sigmoid tf.nn.sigmoid
2 elu(指数线性单元) y = x i f x > 0 e l s e α × ( e x − 1 ) y=x \quad if \quad x \gt 0 \quad else \quad \alpha \times (e^x - 1) y=xifx>0elseα×(ex1) 避免梯度弥散;能得到负值输出 计算成本高;无法避免梯度爆炸;分段函数且线性(导数常值) keras.activations.elu tf.nn.elu
3 selu(扩展型指数线性单元) y = λ × x i f x > 0 e l s e λ × α × ( e x − 1 ) y=\lambda \times x \quad if \quad x \gt 0 \quad else \quad \lambda \times \alpha \times (e^x - 1) y=λ×xifx>0elseλ×α×(ex1) 避免梯度弥散和爆炸 新激活函数 keras.activations.selu tf.nn.selu
4 softplus y = log ( e x + 1 ) y=\text{log}(e^x + 1) y=log(ex+1) 避免梯度弥散 计算成本高;不能避免梯度爆炸 keras.activations.softplus tf.nn.softplus
5 softsign y = x ∣ x ∣ + 1 y=\frac{x}{\mid x \mid + 1} y=x+1x 计算成本低 梯度弥散 keras.activations.softsign tf.nn.softsign
6 ReLU(修正线性单元) y = maximum ( x , 0 ) y=\text{maximum}(x, 0) y=maximum(x,0) 计算成本低 存在梯度为0的情况;
不能避免梯度爆炸
keras.activations.relu tf.nn.relu
7 tanh y = tanh ( x ) y=\text{tanh}(x) y=tanh(x) 输出值y以0为中心 梯度弥散&爆炸 keras.activations.tanh tf.nn.tanh
8 softmax sigmoid的多分类形式 keras.activations.softmax tf.nn.softmax
9 hard_sigmoid y = clip ( x + 1 2 , 0 , 1 ) = maximum ( 0 , min ( 1 , x + 1 2 ) ) y=\text{clip}(\frac{x+1}{2}, 0, 1) = \text{maximum}(0, \text{min}(1, \frac{x+1}{2})) y=clip(2x+1,0,1)=maximum(0,min(1,2x+1)) 速度比 sigmoid 激活函数更快 keras.activations.hard_sigmoid
10 exponential y = e x y=e^x y=ex 计算成本高 keras.activations.exponential
11 linear y = x y=x y=x 输出等于输入 计算成本低 keras.activations.linear
12 Leaky ReLU(渗漏型修正线性单元) y = maximum ( α × x , x ) y=\text{maximum}(\alpha \times x, x) y=maximum(α×x,x) 避免梯度弥散;速度快(计算成本低) 分段函数且线性(导数常值);梯度爆炸 keras.layers.advanced_activations.LeakyReLU() tf.nn.leaky_relu
13 GELU y = 0.5 × x × ( 1 + tanh ( 2 / π × ( x + 0.044715 × x 3 ) ) ) y=0.5 \times x \times (1 + \text{tanh}(\sqrt{2 / \pi} \times(x + 0.044715 \times x^3))) y=0.5×x×(1+tanh(2/π ×(x+0.044715×x3))) 似乎是 NLP 领域的当前最佳;尤其在 Transformer 模型中表现最好;避免梯度消失 新激活函数
14 Swish y = x 1 + e − x y=\frac{x}{1 + e^{-x}} y=1+exx 输出可能下降,即使在输入值增大的情况下 新函数

转载地址:https://blog.csdn.net/fish2009122/article/details/108088120 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:统计功效(power)
下一篇:建模之常见模型评估指标(Keras, Sklearn, R)

发表评论

最新留言

哈哈,博客排版真的漂亮呢~
[***.90.31.176]2024年04月09日 09时14分54秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

学习的总结 2019-04-25
66天街欢抢节 北京长安天街 6.5-6.6 2019-04-25
武田中国创新挑战赛重磅启动,诚邀初创企业共赴数字医疗之途 2019-04-25
九巨龙集团安全大检查行动,践行“客户满意工程”牢筑安全防线! 2019-04-25
最好吃的8款粽子,看看有没有你家乡的! 2019-04-25
端午前后湿热当道,这些祛湿的好方法一定要收好 2019-04-25
最好吃的8款粽子,看看有没有你家乡的! 2019-04-25
端午前后湿热当道,这些祛湿的好方法一定要收好 2019-04-25
九巨龙集团被授予“2020年全市疫情防控慈善捐助企业楷模” 2019-04-25
清徐老陈醋签约盒马与数字乡村特色新品战略合作 2019-04-25
视听·封报丨5G发展带来哪些改变?“虚拟偶像”成为追星新潮流 2019-04-25
最好吃的8款粽子,看看有没有你家乡的! 2019-04-25
第10届上海尚品家居展实力来袭,优质生产型企业加持核心优势 2019-04-25
丁磊:高合汽车下个月交付过千,刷新纪录 2019-04-25
2021乌拉盖旅游推介会暨“爱上草原”云平台发布仪式 2019-04-25
博仲兴业力作——《爱的雨季》讲述爱情的奥秘 2019-04-25
墨斗互动公益助力山西大学 毕业季,青春无畏,逐梦扬威 2019-04-25
中品丝路:在重要场所讲好中国品牌故事 2019-04-25
夏日狂欢 — BODY JAZZ两周年庆典———若水,以柔见世界 2019-04-25
京东品牌联盟:618品牌狂欢盛典-品宣销售再创历史新高 2019-04-25