Co je to Managed Language?
Co je to managed language?
Managed language je jazyk, který na rozdíl od unmanaged jazyků – tedy takových, které pouze vykonávají logiku napsanou programátorem bez výrazných odchylek – za běhu (runtime) provádí operace, jako jsou GC, optimalizace runtime, green threads, zpracování souběžnosti a další, čímž uživatele zbavuje nutnosti provádět rizikovou správu na nízké úrovni.
V případě takových jazyků je výhodou možnost soustředit se výhradně na business logic a plně se ponořit do vývoje, avšak na druhou stranu se program může chovat odlišně od intuice programátora, což si občas vyžaduje sofistikovaný runtime tuning.
Nejprve se podíváme na jazyk Go, který ze všech managed jazyků nejdůsledněji dodržuje minimalistickou filozofii a jehož assembly je transparentní.
Binární struktura jazyka Go
| .text | .data | .gopclntab, .typelink atd. |
|---|---|---|
| Strojový kód k provedení | Ukládaná data | Sekce runtime jazyka |
Protože jazyk Go nepřekládá kód do strojového kódu v poměru 1:1 podle vstupu uživatele, logika v sekci .text je úzce spjata se sekcemi runtime jazyka.
Kromě toho jsou do assembly v sekci .text přidávány funkce jako například runtime.printnl(), které uživatel explicitně nenapsal.
Díky tomuto automatickému vkládání kódu pomáhá jazyk Go vývojářům zbavit se nutnosti manuální správy.
Pohled pouze na funkci main v Go
Nejprve vytvoříme jednoduchý vzorový zdrojový kód main.go a podíváme se na funkci main na stroji s architekturou AMD64.
1package main
2
3func sayHello(msg string) {
4 println(msg)
5}
6
7func main() {
8 sayHello("Hello World")
9}
Následně provedeme sestavení (build) tímto způsobem:
1go build main.go
Go podporuje go tool pro snadné ladění na nízké úrovni.
Abychom v go tool zobrazili pouze assembly odpovídající funkci main v hlavním balíčku, zadáme tento příkaz:
1go tool objdump -s "main\.main" ./main
Assembly
1TEXT main.main(SB) /home/yjlee/compare-assembly/go/main.go
2 main.go:7 0x468f60 493b6610 CMPQ SP, 0x10(R14)
3 main.go:7 0x468f64 762f JBE 0x468f95
4 main.go:7 0x468f66 55 PUSHQ BP
5 main.go:7 0x468f67 4889e5 MOVQ SP, BP
6 main.go:7 0x468f6a 4883ec10 SUBQ $0x10, SP
7 main.go:8 0x468f6e 90 NOPL
8 main.go:4 0x468f6f e8cca3fcff CALL runtime.printlock(SB)
9 main.go:4 0x468f74 488d05da290100 LEAQ 0x129da(IP), AX
10 main.go:4 0x468f7b bb0b000000 MOVL $0xb, BX
11 main.go:4 0x468f80 e83bacfcff CALL runtime.printstring(SB)
12 main.go:4 0x468f85 e8f6a5fcff CALL runtime.printnl(SB)
13 main.go:4 0x468f8a e811a4fcff CALL runtime.printunlock(SB)
14 main.go:9 0x468f8f 4883c410 ADDQ $0x10, SP
15 main.go:9 0x468f93 5d POPQ BP
16 main.go:9 0x468f94 c3 RET
17 main.go:7 0x468f95 e8e6afffff CALL runtime.morestack_noctxt.abi0(SB)
18 main.go:7 0x468f9a ebc4 JMP main.main(SB)
- Po porovnání pomocí CMPQ, zda jsme vstoupili do aktuálního vlákna, provedeme v případě shody skok na Entrypoint 0x468f95.
- Vstupní bod vložíme na zásobník pomocí
PUSHQ BP. - Nastavíme počátek zásobníku při zahájení funkce na registr SP, ve kterém jsou uložena nejnovější data, čímž zafixujeme vstupní bod pro odkazování na lokální proměnné.
- Následně rezervujeme 16 bajtů zásobníku pro lokální proměnné (
SUBQ $0x10, SP) a pomocí NOPL vyplníme několik bajtů pro zarovnání cache procesoru. - Runtime Go uzamkne výstup bufferu řetězce voláním
runtime.printlock(SB). - Pomocí instrukce LEAQ uložíme počáteční adresu alokovaného řetězce do AX, což je akumulátor používaný mezi obecnými registry k ukládání dat.
- Následně uložíme délku řetězce 11 do registru BX, který se používá pro pomocné operace a ukládání dočasných dat. (
MOVL $0Xb, BX) - Pomocí runtime.printstring(SB) vypíšeme informace z akumulátoru směrem k SB.
- Jednu prázdnou řádku rovněž zapíšeme do SB pomocí runtime.printnl(SB).
- Buffer řetězce uvolníme pomocí runtime.printunlock(SB).
- Pomocí ADDQ $0x10, SP vrátíme vypůjčených 16 bajtů paměti zásobníku. - Protože jsme na začátku vložili vstupní bod na zásobník, nyní jej pomocí POPQ BP ze zásobníku vyjmeme a odešleme signál návratu.
- Poté pomocí runtime.morestack_noctxt.abi0(SB), jak se na managed language sluší, alokujeme dostatečný zásobník a nastavíme runtime prostředí, jako je GC.
- Přesuneme se na spravovanou adresu main.main(SB).
Jak je vidět, assembly business logiky je poměrně jasná a je doplněna pouze o lehkou správu runtime.
V případě absence optimalizace
Výše uvedená podoba je výsledkem toho, že kompilátor Go automaticky provedl inlining dvou samostatně oddělených funkcí za účelem optimalizace. Pro účely našeho studia však v tomto případě sayHello optimalizovat (inlining) nebudeme.
Toho docílíme kompilací zdrojového kódu s následujícím příznakem:
1 go build -gcflags="-l" main.go
Pokud si výsledky vypíšeme v shellu, zjistíme přítomnost duplicitní assembly.
1yjlee@elegant:~/compare-assembly/go$ go build -gcflags="-l" main.go
2
3go tool objdump -s "main\.sayHello" ./main
4TEXT main.sayHello(SB) /home/yjlee/compare-assembly/go/main.go
5 main.go:3 0x468f60 493b6610 CMPQ SP, 0x10(R14)
6 main.go:3 0x468f64 7636 JBE 0x468f9c
7 main.go:3 0x468f66 55 PUSHQ BP
8 main.go:3 0x468f67 4889e5 MOVQ SP, BP
9 main.go:3 0x468f6a 4883ec10 SUBQ $0x10, SP
10 main.go:5 0x468f6e 4889442420 MOVQ AX, 0x20(SP)
11 main.go:5 0x468f73 48895c2428 MOVQ BX, 0x28(SP)
12 main.go:4 0x468f78 e8c3a3fcff CALL runtime.printlock(SB)
13 main.go:4 0x468f7d 488b442420 MOVQ 0x20(SP), AX
14 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
15OVQ 0x20(SP), AX
16 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
17 main.go:4 0x468f87 e834acfcff CALL runtime.printstring(SB)
18 main.go:4 0x468f8c e8efa5fcff CALL runtime.printnl(SB)
19 main.go:4 0x468f91 e80aa4fcff CALL runtime.printunlock(SB)
20 main.go:5 0x468f96 4883c410 ADDQ $0x10, SP
21 main.go:5 0x468f9a 5d POPQ BP
22 main.go:5 0x468f9b c3 RET
23 main.go:3 0x468f9c 4889442408 MOVQ AX, 0x8(SP)
24 main.go:3 0x468fa1 48895c2410 MOVQ BX, 0x10(SP)
25 main.go:3 0x468fa6 e8d5afffff CALL runtime.morestack_noctxt.abi0(SB)
26 main.go:3 0x468fab 488b442408 MOVQ 0x8(SP), AX
27 main.go:3 0x468fb0 488b5c2410 MOVQ 0x10(SP), BX
28 main.go:3 0x468fb5 eba9 JMP main.sayHello(SB)
29yjlee@elegant:~/compare-assembly/go$ go tool objdump -s "main\.sayHello" ./main
30TEXT main.sayHello(SB) /home/yjlee/compare-assembly/go/main.go
31 main.go:3 0x468f60 493b6610 CMPQ SP, 0x10(R14)
32 main.go:3 0x468f64 7636 JBE 0x468f9c
33 main.go:3 0x468f66 55 PUSHQ BP
34 main.go:3 0x468f67 4889e5 MOVQ SP, BP
35 main.go:3 0x468f6a 4883ec10 SUBQ $0x10, SP
36 main.go:5 0x468f6e 4889442420 MOVQ AX, 0x20(SP)
37 main.go:5 0x468f73 48895c2428 MOVQ BX, 0x28(SP)
38 main.go:4 0x468f78 e8c3a3fcff CALL runtime.printlock(SB)
39 main.go:4 0x468f7d 488b442420 MOVQ 0x20(SP), AX
40 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
41OVQ 0x20(SP), AX
42 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
43 main.go:4 0x468f87 e834acfcff CALL runtime.printstring(SB)
44 main.go:4 0x468f8c e8efa5fcff CALL runtime.printnl(SB)
45 main.go:4 0x468f91 e80aa4fcff CALL runtime.printunlock(SB)
46 main.go:5 0x468f96 4883c410 ADDQ $0x10, SP
47 main.go:5 0x468f9a 5d POPQ BP
48 main.go:5 0x468f9b c3 RET
49 main.go:3 0x468f9c 4889442408 MOVQ AX, 0x8(SP)
50 main.go:3 0x468fa1 48895c2410 MOVQ BX, 0x10(SP)
51 main.go:3 0x468fa6 e8d5afffff CALL runtime.morestack_noctxt.abi0(SB)
52 main.go:3 0x468fab 488b442408 MOVQ 0x8(SP), AX
53 main.go:3 0x468fb0 488b5c2410 MOVQ 0x10(SP), BX
54 main.go:3 0x468fb5 eba9 JMP main.sayHello(SB)
55yjlee@elegant:~/compare-assembly/go$
Potvrdilo se tedy, že kompilátor optimalizuje operace, jako je duplicitní výpočet nebo neefektivní rozbalování smyček (loop unrolling).
Příště
Příště se budeme věnovat příkazům if a switch v jazyce Go. Pokud nám v budoucnu vyjde čas, rozebereme i sekce runtime jazyka Go.