GoSuda

Co je to Managed Language?

By Lee Yunjin
views ...

Co je to managed language?

Managed language je jazyk, který na rozdíl od unmanaged jazyků – tedy takových, které pouze vykonávají logiku napsanou programátorem bez výrazných odchylek – za běhu (runtime) provádí operace, jako jsou GC, optimalizace runtime, green threads, zpracování souběžnosti a další, čímž uživatele zbavuje nutnosti provádět rizikovou správu na nízké úrovni.

V případě takových jazyků je výhodou možnost soustředit se výhradně na business logic a plně se ponořit do vývoje, avšak na druhou stranu se program může chovat odlišně od intuice programátora, což si občas vyžaduje sofistikovaný runtime tuning.

Nejprve se podíváme na jazyk Go, který ze všech managed jazyků nejdůsledněji dodržuje minimalistickou filozofii a jehož assembly je transparentní.

Binární struktura jazyka Go

.text.data.gopclntab, .typelink atd.
Strojový kód k provedeníUkládaná dataSekce runtime jazyka

Protože jazyk Go nepřekládá kód do strojového kódu v poměru 1:1 podle vstupu uživatele, logika v sekci .text je úzce spjata se sekcemi runtime jazyka.

Kromě toho jsou do assembly v sekci .text přidávány funkce jako například runtime.printnl(), které uživatel explicitně nenapsal. Díky tomuto automatickému vkládání kódu pomáhá jazyk Go vývojářům zbavit se nutnosti manuální správy.

Pohled pouze na funkci main v Go

Nejprve vytvoříme jednoduchý vzorový zdrojový kód main.go a podíváme se na funkci main na stroji s architekturou AMD64.

1package main
2
3func sayHello(msg string) {
4    println(msg)
5}
6
7func main() {
8    sayHello("Hello World")
9}

Následně provedeme sestavení (build) tímto způsobem:

1go build main.go

Go podporuje go tool pro snadné ladění na nízké úrovni. Abychom v go tool zobrazili pouze assembly odpovídající funkci main v hlavním balíčku, zadáme tento příkaz:

1go tool objdump -s "main\.main" ./main

Assembly

 1TEXT main.main(SB) /home/yjlee/compare-assembly/go/main.go
 2  main.go:7             0x468f60                493b6610                CMPQ SP, 0x10(R14)
 3  main.go:7             0x468f64                762f                    JBE 0x468f95
 4  main.go:7             0x468f66                55                      PUSHQ BP
 5  main.go:7             0x468f67                4889e5                  MOVQ SP, BP
 6  main.go:7             0x468f6a                4883ec10                SUBQ $0x10, SP
 7  main.go:8             0x468f6e                90                      NOPL
 8  main.go:4             0x468f6f                e8cca3fcff              CALL runtime.printlock(SB)
 9  main.go:4             0x468f74                488d05da290100          LEAQ 0x129da(IP), AX
10  main.go:4             0x468f7b                bb0b000000              MOVL $0xb, BX
11  main.go:4             0x468f80                e83bacfcff              CALL runtime.printstring(SB)
12  main.go:4             0x468f85                e8f6a5fcff              CALL runtime.printnl(SB)
13  main.go:4             0x468f8a                e811a4fcff              CALL runtime.printunlock(SB)
14  main.go:9             0x468f8f                4883c410                ADDQ $0x10, SP
15  main.go:9             0x468f93                5d                      POPQ BP
16  main.go:9             0x468f94                c3                      RET
17  main.go:7             0x468f95                e8e6afffff              CALL runtime.morestack_noctxt.abi0(SB)
18  main.go:7             0x468f9a                ebc4                    JMP main.main(SB)
  • Po porovnání pomocí CMPQ, zda jsme vstoupili do aktuálního vlákna, provedeme v případě shody skok na Entrypoint 0x468f95.
  • Vstupní bod vložíme na zásobník pomocí PUSHQ BP.
  • Nastavíme počátek zásobníku při zahájení funkce na registr SP, ve kterém jsou uložena nejnovější data, čímž zafixujeme vstupní bod pro odkazování na lokální proměnné.
  • Následně rezervujeme 16 bajtů zásobníku pro lokální proměnné (SUBQ $0x10, SP) a pomocí NOPL vyplníme několik bajtů pro zarovnání cache procesoru.
  • Runtime Go uzamkne výstup bufferu řetězce voláním runtime.printlock(SB).
  • Pomocí instrukce LEAQ uložíme počáteční adresu alokovaného řetězce do AX, což je akumulátor používaný mezi obecnými registry k ukládání dat.
  • Následně uložíme délku řetězce 11 do registru BX, který se používá pro pomocné operace a ukládání dočasných dat. (MOVL $0Xb, BX)
  • Pomocí runtime.printstring(SB) vypíšeme informace z akumulátoru směrem k SB.
  • Jednu prázdnou řádku rovněž zapíšeme do SB pomocí runtime.printnl(SB).
  • Buffer řetězce uvolníme pomocí runtime.printunlock(SB).
  • Pomocí ADDQ $0x10, SP vrátíme vypůjčených 16 bajtů paměti zásobníku. - Protože jsme na začátku vložili vstupní bod na zásobník, nyní jej pomocí POPQ BP ze zásobníku vyjmeme a odešleme signál návratu.
  • Poté pomocí runtime.morestack_noctxt.abi0(SB), jak se na managed language sluší, alokujeme dostatečný zásobník a nastavíme runtime prostředí, jako je GC.
  • Přesuneme se na spravovanou adresu main.main(SB).

Jak je vidět, assembly business logiky je poměrně jasná a je doplněna pouze o lehkou správu runtime.

V případě absence optimalizace

Výše uvedená podoba je výsledkem toho, že kompilátor Go automaticky provedl inlining dvou samostatně oddělených funkcí za účelem optimalizace. Pro účely našeho studia však v tomto případě sayHello optimalizovat (inlining) nebudeme.

Toho docílíme kompilací zdrojového kódu s následujícím příznakem:

1 go build -gcflags="-l" main.go

Pokud si výsledky vypíšeme v shellu, zjistíme přítomnost duplicitní assembly.

 1yjlee@elegant:~/compare-assembly/go$ go build -gcflags="-l" main.go
 2
 3go tool objdump -s "main\.sayHello" ./main
 4TEXT main.sayHello(SB) /home/yjlee/compare-assembly/go/main.go
 5  main.go:3             0x468f60                493b6610               CMPQ SP, 0x10(R14)
 6  main.go:3             0x468f64                7636                   JBE 0x468f9c
 7  main.go:3             0x468f66                55                     PUSHQ BP
 8  main.go:3             0x468f67                4889e5                 MOVQ SP, BP
 9  main.go:3             0x468f6a                4883ec10               SUBQ $0x10, SP
10  main.go:5             0x468f6e                4889442420             MOVQ AX, 0x20(SP)
11  main.go:5             0x468f73                48895c2428             MOVQ BX, 0x28(SP)
12  main.go:4             0x468f78                e8c3a3fcff             CALL runtime.printlock(SB)
13  main.go:4             0x468f7d                488b442420             MOVQ 0x20(SP), AX
14  main.go:4             0x468f82                488b5c2428             MOVQ 0x28(SP), BX
15OVQ 0x20(SP), AX
16  main.go:4             0x468f82                488b5c2428             MOVQ 0x28(SP), BX
17  main.go:4             0x468f87                e834acfcff             CALL runtime.printstring(SB)
18  main.go:4             0x468f8c                e8efa5fcff             CALL runtime.printnl(SB)
19  main.go:4             0x468f91                e80aa4fcff             CALL runtime.printunlock(SB)
20  main.go:5             0x468f96                4883c410               ADDQ $0x10, SP
21  main.go:5             0x468f9a                5d                     POPQ BP
22  main.go:5             0x468f9b                c3                     RET
23  main.go:3             0x468f9c                4889442408             MOVQ AX, 0x8(SP)
24  main.go:3             0x468fa1                48895c2410             MOVQ BX, 0x10(SP)
25  main.go:3             0x468fa6                e8d5afffff             CALL runtime.morestack_noctxt.abi0(SB)
26  main.go:3             0x468fab                488b442408             MOVQ 0x8(SP), AX
27  main.go:3             0x468fb0                488b5c2410             MOVQ 0x10(SP), BX
28  main.go:3             0x468fb5                eba9                   JMP main.sayHello(SB)
29yjlee@elegant:~/compare-assembly/go$ go tool objdump -s "main\.sayHello" ./main
30TEXT main.sayHello(SB) /home/yjlee/compare-assembly/go/main.go
31  main.go:3             0x468f60                493b6610               CMPQ SP, 0x10(R14)
32  main.go:3             0x468f64                7636                   JBE 0x468f9c
33  main.go:3             0x468f66                55                     PUSHQ BP
34  main.go:3             0x468f67                4889e5                 MOVQ SP, BP
35  main.go:3             0x468f6a                4883ec10               SUBQ $0x10, SP
36  main.go:5             0x468f6e                4889442420             MOVQ AX, 0x20(SP)
37  main.go:5             0x468f73                48895c2428             MOVQ BX, 0x28(SP)
38  main.go:4             0x468f78                e8c3a3fcff             CALL runtime.printlock(SB)
39  main.go:4             0x468f7d                488b442420             MOVQ 0x20(SP), AX
40  main.go:4             0x468f82                488b5c2428             MOVQ 0x28(SP), BX
41OVQ 0x20(SP), AX
42  main.go:4             0x468f82                488b5c2428             MOVQ 0x28(SP), BX
43  main.go:4             0x468f87                e834acfcff             CALL runtime.printstring(SB)
44  main.go:4             0x468f8c                e8efa5fcff             CALL runtime.printnl(SB)
45  main.go:4             0x468f91                e80aa4fcff             CALL runtime.printunlock(SB)
46  main.go:5             0x468f96                4883c410               ADDQ $0x10, SP
47  main.go:5             0x468f9a                5d                     POPQ BP
48  main.go:5             0x468f9b                c3                     RET
49  main.go:3             0x468f9c                4889442408             MOVQ AX, 0x8(SP)
50  main.go:3             0x468fa1                48895c2410             MOVQ BX, 0x10(SP)
51  main.go:3             0x468fa6                e8d5afffff             CALL runtime.morestack_noctxt.abi0(SB)
52  main.go:3             0x468fab                488b442408             MOVQ 0x8(SP), AX
53  main.go:3             0x468fb0                488b5c2410             MOVQ 0x10(SP), BX
54  main.go:3             0x468fb5                eba9                   JMP main.sayHello(SB)
55yjlee@elegant:~/compare-assembly/go$

Potvrdilo se tedy, že kompilátor optimalizuje operace, jako je duplicitní výpočet nebo neefektivní rozbalování smyček (loop unrolling).

Příště

Příště se budeme věnovat příkazům if a switch v jazyce Go. Pokud nám v budoucnu vyjde čas, rozebereme i sekce runtime jazyka Go.