Go 新的函数调用惯例能快多少?
发布日期:2022-02-01 16:54:09 浏览次数:37 分类:技术文章

本文共 6316 字,大约阅读时间需要 21 分钟。

编译器和运行时的不断优化,能让 Go 程序的构建与运行更加丝滑。在 Go 1.18 的 release notes 中,菜刀发现 Go 新的函数调用惯例(基于寄存器)将扩展支持到 arm64 架构(已支持 amd64),且性能提升10% 以上,值得期待。

本文一起来看下函数调用惯例的改变能给 Go 带来多少收益。

e284933a2a32ce8226d7edb65a36573f.png

函数调用惯例

在一文中(建议不熟悉此块内容的读者先读此文),我们探讨过 Go 语言的函数调用惯例。

所谓函数调用惯例指的是函数调用方与被调用方中必须遵守的某种约定,主要包括函数的出入参传递方式、传递顺序等。

参数传递方式一般分为两种情况:寄存器传递和栈传递。

在 Go 1.17 之前,Go 语言为了避免不同 CPU 寄存器之间的差异,采用的栈传递。这种方式的最大优点是实现简单,让编译器易于维护。但缺点也显而易见:会牺牲一些性能。因为 CPU 访问寄存器的速度会远高于内存。

改变

基于性能考虑,寄存器的调用惯例,是大多数语言采纳的方式。Go 也准备做点改变,在 1.17 版本中,对于 linux/amd64, darwin/amd64, windows/amd64 系统,首先实现了新的基于寄存器的调用惯例。

package main//go:noinlinefunc add(i, j int) int { return i + j}func main() { add(100, 200)}

我们在 darwin/amd64 系统上,分别使用 Go 1.17 和 Go 1.16 的代码进行编译,得到它们的汇编语句分别如下。

Go 1.17 汇编语句

$ go versiongo version go1.17 darwin/amd64$ go tool compile -S main.go"".add STEXT nosplit size=4 args=0x10 locals=0x0 funcid=0x0 0x0000 00000 (main.go:4) TEXT "".add(SB), NOSPLIT|ABIInternal, $0-16 0x0000 00000 (main.go:4) FUNCDATA $0, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB) 0x0000 00000 (main.go:4) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB) 0x0000 00000 (main.go:4) FUNCDATA $5, "".add.arginfo1(SB) 0x0000 00000 (main.go:5) ADDQ BX, AX 0x0003 00003 (main.go:5) RET 0x0000 48 01 d8 c3                                      H..."".main STEXT size=54 args=0x0 locals=0x18 funcid=0x0 0x0000 00000 (main.go:8) TEXT "".main(SB), ABIInternal, $24-0 0x0000 00000 (main.go:8) CMPQ SP, 16(R14) 0x0004 00004 (main.go:8) PCDATA $0, $-2 0x0004 00004 (main.go:8) JLS 47 0x0006 00006 (main.go:8) PCDATA $0, $-1 0x0006 00006 (main.go:8) SUBQ $24, SP 0x000a 00010 (main.go:8) MOVQ BP, 16(SP) 0x000f 00015 (main.go:8) LEAQ 16(SP), BP 0x0014 00020 (main.go:8) FUNCDATA $0, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB) 0x0014 00020 (main.go:8) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB) 0x0014 00020 (main.go:9) MOVL $100, AX 0x0019 00025 (main.go:9) MOVL $200, BX 0x001e 00030 (main.go:9) PCDATA $1, $0 0x001e 00030 (main.go:9) NOP 0x0020 00032 (main.go:9) CALL "".add(SB) 0x0025 00037 (main.go:10) MOVQ 16(SP), BP 0x002a 00042 (main.go:10) ADDQ $24, SP 0x002e 00046 (main.go:10) RET 0x002f 00047 (main.go:10) NOP 0x002f 00047 (main.go:8) PCDATA $1, $-1 0x002f 00047 (main.go:8) PCDATA $0, $-2 0x002f 00047 (main.go:8) CALL runtime.morestack_noctxt(SB) 0x0034 00052 (main.go:8) PCDATA $0, $-1 0x0034 00052 (main.go:8) JMP 0 ...

Go 1.16 汇编语句

$ go1.16.4 versiongo version go1.16.4 darwin/amd64$ go1.16.4 tool compile -S main.go"".add STEXT nosplit size=19 args=0x18 locals=0x0 funcid=0x0 0x0000 00000 (main.go:4) TEXT "".add(SB), NOSPLIT|ABIInternal, $0-24 0x0000 00000 (main.go:4) FUNCDATA $0, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB) 0x0000 00000 (main.go:4) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB) 0x0000 00000 (main.go:5) MOVQ "".j+16(SP), AX 0x0005 00005 (main.go:5) MOVQ "".i+8(SP), CX 0x000a 00010 (main.go:5) ADDQ CX, AX 0x000d 00013 (main.go:5) MOVQ AX, "".~r2+24(SP) 0x0012 00018 (main.go:5) RET 0x0000 48 8b 44 24 10 48 8b 4c 24 08 48 01 c8 48 89 44  H.D$.H.L$.H..H.D 0x0010 24 18 c3                                         $.."".main STEXT size=71 args=0x0 locals=0x20 funcid=0x0 0x0000 00000 (main.go:8) TEXT "".main(SB), ABIInternal, $32-0 0x0000 00000 (main.go:8) MOVQ (TLS), CX 0x0009 00009 (main.go:8) CMPQ SP, 16(CX) 0x000d 00013 (main.go:8) PCDATA $0, $-2 0x000d 00013 (main.go:8) JLS 64 0x000f 00015 (main.go:8) PCDATA $0, $-1 0x000f 00015 (main.go:8) SUBQ $32, SP 0x0013 00019 (main.go:8) MOVQ BP, 24(SP) 0x0018 00024 (main.go:8) LEAQ 24(SP), BP 0x001d 00029 (main.go:8) FUNCDATA $0, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB) 0x001d 00029 (main.go:8) FUNCDATA $1, gclocals·33cdeccccebe80329f1fdbee7f5874cb(SB) 0x001d 00029 (main.go:9) MOVQ $100, (SP) 0x0025 00037 (main.go:9) MOVQ $200, 8(SP) 0x002e 00046 (main.go:9) PCDATA $1, $0 0x002e 00046 (main.go:9) CALL "".add(SB) 0x0033 00051 (main.go:10) MOVQ 24(SP), BP 0x0038 00056 (main.go:10) ADDQ $32, SP 0x003c 00060 (main.go:10) RET 0x003d 00061 (main.go:10) NOP 0x003d 00061 (main.go:8) PCDATA $1, $-1 0x003d 00061 (main.go:8) PCDATA $0, $-2 0x003d 00061 (main.go:8) NOP 0x0040 00064 (main.go:8) CALL runtime.morestack_noctxt(SB) 0x0045 00069 (main.go:8) PCDATA $0, $-1 0x0045 00069 (main.go:8) JMP 0

看到这么多汇编代码,不要紧张。这里我们需要留意的就以下这么几行

// Go 1.17 汇编参数调用代码"".add STEXT nosplit size=4 args=0x10 locals=0x0 funcid=0x0...0x0000 00000 (main.go:5) ADDQ BX, AX..."".main STEXT size=54 args=0x0 locals=0x18 funcid=0x0... 0x0014 00020 (main.go:9) MOVL $100, AX 0x0019 00025 (main.go:9) MOVL $200, BX 0x001e 00030 (main.go:9) PCDATA $1, $0 0x001e 00030 (main.go:9) NOP 0x0020 00032 (main.go:9) CALL "".add(SB)...// Go 1.16 汇编参数调用代码"".add STEXT nosplit size=19 args=0x18 locals=0x0 funcid=0x0... 0x0000 00000 (main.go:5) MOVQ "".j+16(SP), AX 0x0005 00005 (main.go:5) MOVQ "".i+8(SP), CX 0x000a 00010 (main.go:5) ADDQ CX, AX 0x000d 00013 (main.go:5) MOVQ AX, "".~r2+24(SP)..."".main STEXT size=71 args=0x0 locals=0x20 funcid=0x0... 0x001d 00029 (main.go:9) MOVQ $100, (SP) 0x0025 00037 (main.go:9) MOVQ $200, 8(SP) 0x002e 00046 (main.go:9) PCDATA $1, $0 0x002e 00046 (main.go:9) CALL "".add(SB)...

看出差异了吗?

在 Go 1.17 的汇编代码中,参数值 100 和 200 直接基于寄存器 AX 和 BX 来操作。而 Go 1.16 中,参数值是通过指向栈顶的栈指针寄存器SP的偏移量来表示和传递的。

在 Go 1.17 的release notes中,编译器的此项改变会让 Go 程序运行性能和二进制大小两个方面得到优化,

二进制大小

首先,我们比较编译后的二进制大小。

$ go build -o main1.17 main.go$ go1.16.4 build -o main1.16 main.go$ ls -al main1.17 main1.16-rwxr-xr-x  1 slp  staff  1200640 Dec 26 21:09 main1.16-rwxr-xr-x  1 slp  staff  1142208 Dec 26 21:09 main1.17

可以看出,Go 1.17 基于寄存器传递的函数调用惯例编译出的二进制,相较于 Go 1.16 基于栈传递的减少 4.8% 的大小。

性能

通过 benchmark 比较程序执行效率

// Go 1.17$ go test -bench=.goos: darwingoarch: amd64pkg: workspace/addcpu: Intel(R) Core(TM) i5-8279U CPU @ 2.40GHzBenchmarkIt-8    918887481          1.257 ns/opPASSok   workspace/add 1.299s// Go 1.16$ go1.16.4 test -bench=.goos: darwingoarch: amd64pkg: workspace/addcpu: Intel(R) Core(TM) i5-8279U CPU @ 2.40GHzBenchmarkIt-8    801041754          1.469 ns/opPASSok   workspace/add 1.336s

从 1.469 ns/op 提升至 1.257 ns/op,大约提升了 14%。

总结

我们常谈论到,Go 是在不断优化迭代的,我们值得期待与建设更好的 Go 语言。

为了降低基于栈传递的性能损耗,从 Go 1.17 起,引入了基于寄存器传递的编译改变,目前只支持 amd64 平台。但在 Go 1.18 中,将扩展对 arm64、ppc64、ppc64le 平台的支持。

如 Go 的 release notes 所述,新的函数调用惯例将会带来两个方面的提升:编译后的二进制大小会更小,执行效率得到提升。同时,为了保持与现有汇编函数的兼容性,编译器生成了在新旧调用约定之间进行转换的适配器函数。

往期推荐

6cabb98523443f0a336dcff385d57f40.png

机器铃砍菜刀

欢迎添加小菜刀微信

加入Golang分享群学习交流!

感谢你的点赞在看哦~

f88d2216c31e0c38135b74033324466d.gif

转载地址:https://blog.csdn.net/slphahaha/article/details/122183960 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:推荐几个干货公众号
下一篇:Go 大杀器之跟踪剖析 trace

发表评论

最新留言

留言是一种美德,欢迎回访!
[***.207.175.100]2024年03月27日 17时48分41秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

docker mysql开机自启动_Docker学习4-学会如何让容器开机自启服务【坑】 2019-04-21
在mysql中删除表正确的是什么_在MySQL中删除表的操作教程 2019-04-21
mysql有3个共同好友_共同好友mysql 2019-04-21
代理查询 mysql_查询数据库代理设置 2019-04-21
mysql dif_mysqldiff实现MySQL数据表比较 2019-04-21
mysql 允许其他主机访问权限_允许其他主机访问本机MySQL 2019-04-21
druid不能close mysql连接_alibaba druid mysql连接问题 2019-04-21
mysql 设置按天分表_MySQL 优化实战记录 2019-04-21
java连接mysql 不推荐_java连接mysql 2019-04-21
mysql数据库 quota_shell脚本抓取用户存储quota写道mysql并展现到grafana面板 2019-04-21
idea测试连接mysql报错08001_IDEA连接MySQL错误 2019-04-21
layui导入模板数据_layui表格-template模板的三种用法 2019-04-21
mysql分组显示行号_mysql 显示行号,以及分组排序 2019-04-21
MySQL常见的主从复制架构_如何搭建经典的MySQL 主从复制架构 2019-04-21
编写python程序、计算账户余额_小明有20w存款存在余额宝中,按余额宝年收益为3.35%计算,用Python编写程序计算,多少年后小明的存款达到30w?... 2019-04-21
python 公众号引流_公众号引流方法有哪些? 2019-04-21
java 减少内存_java中减少内存占用小技巧 2019-04-21
centos 7 mysql图形界面_centos7-vnstat图形界面搭建 2019-04-21
java 防渗透_「java、工程师工作经验怎么写」-看准网 2019-04-21
java中跳出当前循环怎么做_在java中,如何跳出当前的多重循环? 2019-04-21