Какво представлява Managed Language?
Какво представлява управляваният (managed) език?
Управляваният език е език, който, за разлика от неуправляваните езици – при които програмата се изпълнява без значително отклонение от логиката, зададена от програмиста – изпълнява по време на работа (runtime) процеси като GC (Garbage Collection), оптимизации на runtime, green threads, обработка на конкурентност и други, което освобождава потребителя от необходимостта да извършва рисковано управление на ниско ниво.
При такива езици съществува предимството, че разработчикът може да се концентрира единствено върху бизнес логиката, но от друга страна, поведението на реалната програма може да се разминава с интуицията на програмиста, което понякога налага прецизна настройка на runtime средата.
Първо, ще разгледаме езика Go, който сред управляваните езици е най-верен на минималистичната философия и чийто асемблерен код е най-прозрачен.
Бинарна структура на езика Go
| .text | .data | .gopclntab, .typelink и др. |
|---|---|---|
| Машинен код за изпълнение | Съхранявани данни | Секции на runtime на езика |
Тъй като Go не извършва директен превод 1:1 на машинния код спрямо въведеното от потребителя, логиката в секцията .text е тясно свързана със секциите на езиковия runtime.
Освен това, функции като runtime.printnl(), които потребителят не е писал ръчно, се добавят към асемблерния код в секцията .text.
Чрез това автоматично вмъкване на код, езикът Go помага на разработчика да се освободи от ръчното управление.
Преглед само на функцията main в Go
Първо, нека съставим прост примерен изходен код main.go и да разгледаме main функцията на AMD64 машина.
1package main
2
3func sayHello(msg string) {
4 println(msg)
5}
6
7func main() {
8 sayHello("Hello World")
9}
След това изпълняваме компилация по следния начин:
1go build main.go
Go поддържа go tool за лесно дебъгване на ниско ниво.
За да видим асемблерния код само за main функцията от main пакета в go tool, въвеждаме следната команда:
1go tool objdump -s "main\.main" ./main
Асемблерен код
1TEXT main.main(SB) /home/yjlee/compare-assembly/go/main.go
2 main.go:7 0x468f60 493b6610 CMPQ SP, 0x10(R14)
3 main.go:7 0x468f64 762f JBE 0x468f95
4 main.go:7 0x468f66 55 PUSHQ BP
5 main.go:7 0x468f67 4889e5 MOVQ SP, BP
6 main.go:7 0x468f6a 4883ec10 SUBQ $0x10, SP
7 main.go:8 0x468f6e 90 NOPL
8 main.go:4 0x468f6f e8cca3fcff CALL runtime.printlock(SB)
9 main.go:4 0x468f74 488d05da290100 LEAQ 0x129da(IP), AX
10 main.go:4 0x468f7b bb0b000000 MOVL $0xb, BX
11 main.go:4 0x468f80 e83bacfcff CALL runtime.printstring(SB)
12 main.go:4 0x468f85 e8f6a5fcff CALL runtime.printnl(SB)
13 main.go:4 0x468f8a e811a4fcff CALL runtime.printunlock(SB)
14 main.go:9 0x468f8f 4883c410 ADDQ $0x10, SP
15 main.go:9 0x468f93 5d POPQ BP
16 main.go:9 0x468f94 c3 RET
17 main.go:7 0x468f95 e8e6afffff CALL runtime.morestack_noctxt.abi0(SB)
18 main.go:7 0x468f9a ebc4 JMP main.main(SB)
- След сравнение чрез CMPQ дали текущият поток е влязъл, ако е така, се прескача към Entrypoint 0x468f95.
- Входната точка се вмъква в стека чрез
PUSHQ BP. - Началната точка на стека се задава при стартиране на функцията в регистъра SP, където най-скоро са били заредени данни, за да се фиксира входната точка при препратки към локални променливи.
- След това се резервира стек за локални променливи от 16 байта (
SUBQ $0x10, SP) и се използва NOPL за запълване на байтове с цел подравняване на CPU кеша. - Go Runtime извиква
runtime.printlock(SB), за да постави заключване върху изхода на буфера за низове. - Чрез командата LEAQ началният адрес на зададения низ се съхранява в AX, който е акумулатор, използван за съхранение на данни сред регистрите с общо предназначение.
- След това дължината на низа 11 се записва в регистъра BX, използван за помощни изчисления и временно съхранение на данни. (
MOVL $0Xb, BX) - Информацията от акумулатора се извежда към SB чрез runtime.printstring(SB).
- Един празен ред също се записва към SB чрез runtime.printnl(SB).
- Буферът за низове се освобождава чрез runtime.printunlock(SB).
- Заетата 16-байтова стекова памет се връща с ADDQ $0x10, SP. Тъй като първоначално входната точка е била поставена в стека за информация, сега тя се премахва оттам чрез POPQ BP и се изпраща сигнал за връщане.
- След това, както подобава на управляван език, чрез runtime.morestack_noctxt.abi0(SB) се заделя достатъчно стек и се настройва runtime средата, включително GC.
- Преминава се към адреса на управляваната main.main(SB).
Както се вижда, асемблерният код на бизнес логиката е доста ясен и към него е добавено само леко runtime управление.
При липса на оптимизация
Горната форма е резултат от автоматичното вграждане (inlining) на двете отделни функции от компилатора на Go. Въпреки това, за целите на обучението, в този случай ще предотвратим вграждането на sayHello.
За да направим това, компилираме изходния код със следния флаг:
1 go build -gcflags="-l" main.go
Ако изведем резултатите в обвивката (shell), ще открием дублиращ се асемблерен код.
1yjlee@elegant:~/compare-assembly/go$ go build -gcflags="-l" main.go
2
3go tool objdump -s "main\.sayHello" ./main
4TEXT main.sayHello(SB) /home/yjlee/compare-assembly/go/main.go
5 main.go:3 0x468f60 493b6610 CMPQ SP, 0x10(R14)
6 main.go:3 0x468f64 7636 JBE 0x468f9c
7 main.go:3 0x468f66 55 PUSHQ BP
8 main.go:3 0x468f67 4889e5 MOVQ SP, BP
9 main.go:3 0x468f6a 4883ec10 SUBQ $0x10, SP
10 main.go:5 0x468f6e 4889442420 MOVQ AX, 0x20(SP)
11 main.go:5 0x468f73 48895c2428 MOVQ BX, 0x28(SP)
12 main.go:4 0x468f78 e8c3a3fcff CALL runtime.printlock(SB)
13 main.go:4 0x468f7d 488b442420 MOVQ 0x20(SP), AX
14 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
15 main.go:4 0x468f87 e834acfcff CALL runtime.printstring(SB)
16 main.go:4 0x468f8c e8efa5fcff CALL runtime.printnl(SB)
17 main.go:4 0x468f91 e80aa4fcff CALL runtime.printunlock(SB)
18 main.go:5 0x468f96 4883c410 ADDQ $0x10, SP
19 main.go:5 0x468f9a 5d POPQ BP
20 main.go:5 0x468f9b c3 RET
21 main.go:3 0x468f9c 4889442408 MOVQ AX, 0x8(SP)
22 main.go:3 0x468fa1 48895c2410 MOVQ BX, 0x10(SP)
23 main.go:3 0x468fa6 e8d5afffff CALL runtime.morestack_noctxt.abi0(SB)
24 main.go:3 0x468fab 488b442408 MOVQ 0x8(SP), AX
25 main.go:3 0x468fb0 488b5c2410 MOVQ 0x10(SP), BX
26 main.go:3 0x468fb5 eba9 JMP main.sayHello(SB)
27yjlee@elegant:~/compare-assembly/go$ go tool objdump -s "main\.sayHello" ./main
28TEXT main.sayHello(SB) /home/yjlee/compare-assembly/go/main.go
29 main.go:3 0x468f60 493b6610 CMPQ SP, 0x10(R14)
30 main.go:3 0x468f64 7636 JBE 0x468f9c
31 main.go:3 0x468f66 55 PUSHQ BP
32 main.go:3 0x468f67 4889e5 MOVQ SP, BP
33 main.go:3 0x468f6a 4883ec10 SUBQ $0x10, SP
34 main.go:5 0x468f6e 4889442420 MOVQ AX, 0x20(SP)
35 main.go:5 0x468f73 48895c2428 MOVQ BX, 0x28(SP)
36 main.go:4 0x468f78 e8c3a3fcff CALL runtime.printlock(SB)
37 main.go:4 0x468f7d 488b442420 MOVQ 0x20(SP), AX
38 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
39OVQ 0x20(SP), AX
40 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
41 main.go:4 0x468f87 e834acfcff CALL runtime.printstring(SB)
42 main.go:4 0x468f8c e8efa5fcff CALL runtime.printnl(SB)
43 main.go:4 0x468f91 e80aa4fcff CALL runtime.printunlock(SB)
44 main.go:5 0x468f96 4883c410 ADDQ $0x10, SP
45 main.go:5 0x468f9a 5d POPQ BP
46 main.go:5 0x468f9b c3 RET
47 main.go:3 0x468f9c 4889442408 MOVQ AX, 0x8(SP)
48 main.go:3 0x468fa1 48895c2410 MOVQ BX, 0x10(SP)
49 main.go:3 0x468fa6 e8d5afffff CALL runtime.morestack_noctxt.abi0(SB)
50 main.go:3 0x468fab 488b442408 MOVQ 0x8(SP), AX
51 main.go:3 0x468fb0 488b5c2410 MOVQ 0x10(SP), BX
52 main.go:3 0x468fb5 eba9 JMP main.sayHello(SB)
53yjlee@elegant:~/compare-assembly/go$
Тоест потвърди се, че оптимизациите, извършвани от компилатора, са насочени към такива дублиращи се операции, неефективно разгръщане на цикли и други подобни.
Следващия път
Следващия път ще разгледаме if и switch конструкциите в езика Go. Ако остане време, ще анализираме и секциите на runtime в Go.