Что такое managed language?
Что такое управляемый язык (managed language)?
Управляемый язык — это язык, который, в отличие от неуправляемого языка, где выполнение происходит без существенного отклонения от логики, написанной программистом, берет на себя выполнение таких задач, как GC (сборка мусора), оптимизация runtime, green threads и обработка конкурентности. Это избавляет пользователя от необходимости заниматься опасным низкоуровневым управлением ресурсами.
Такие языки обладают тем преимуществом, что позволяют разработчику сосредоточиться исключительно на бизнес-логике, однако, с другой стороны, программа может вести себя иначе, чем предполагает интуиция программиста, что иногда требует тонкой настройки runtime.
Прежде всего, рассмотрим язык Go, который из всех управляемых языков наиболее верен философии минимализма и чья архитектура assembly наиболее прозрачна.
Бинарная структура языка Go
| .text | .data | .gopclntab, .typelink и др. |
|---|---|---|
| Исполняемый машинный код | Хранимые данные | Секции runtime языка |
Поскольку язык Go не осуществляет перевод в машинный код в соотношении 1:1 в соответствии с тем, что ввел пользователь, логика в секции .text тесно связана с секциями runtime языка.
Кроме того, в assembly секции .text добавляются функции, подобные runtime.printnl(), которые пользователь явно не прописывал. Благодаря такому автоматическому внедрению кода язык Go помогает разработчику освободиться от ручного управления.
Анализ функции main в Go
Для начала создадим простой пример исходного кода main.go и рассмотрим его работу начиная с функции main на машине AMD64.
1package main
2
3func sayHello(msg string) {
4 println(msg)
5}
6
7func main() {
8 sayHello("Hello World")
9}
Далее выполняем сборку следующим образом:
1go build main.go
Для упрощения низкоуровневой отладки Go предоставляет инструмент go tool.
Чтобы просмотреть assembly только для функции main в main-пакете, используем следующую команду go tool:
1go tool objdump -s "main\.main" ./main
Assembly
1TEXT main.main(SB) /home/yjlee/compare-assembly/go/main.go
2 main.go:7 0x468f60 493b6610 CMPQ SP, 0x10(R14)
3 main.go:7 0x468f64 762f JBE 0x468f95
4 main.go:7 0x468f66 55 PUSHQ BP
5 main.go:7 0x468f67 4889e5 MOVQ SP, BP
6 main.go:7 0x468f6a 4883ec10 SUBQ $0x10, SP
7 main.go:8 0x468f6e 90 NOPL
8 main.go:4 0x468f6f e8cca3fcff CALL runtime.printlock(SB)
9 main.go:4 0x468f74 488d05da290100 LEAQ 0x129da(IP), AX
10 main.go:4 0x468f7b bb0b000000 MOVL $0xb, BX
11 main.go:4 0x468f80 e83bacfcff CALL runtime.printstring(SB)
12 main.go:4 0x468f85 e8f6a5fcff CALL runtime.printnl(SB)
13 main.go:4 0x468f8a e811a4fcff CALL runtime.printunlock(SB)
14 main.go:9 0x468f8f 4883c410 ADDQ $0x10, SP
15 main.go:9 0x468f93 5d POPQ BP
16 main.go:9 0x468f94 c3 RET
17 main.go:7 0x468f95 e8e6afffff CALL runtime.morestack_noctxt.abi0(SB)
18 main.go:7 0x468f9a ebc4 JMP main.main(SB)
- После проверки через CMPQ, вошел ли поток в текущий контекст, если проверка пройдена, происходит переход к точке входа 0x468f95.
- Точка входа помещается в стек через
PUSHQ BP. - При начале функции в регистре SP, где хранятся последние данные, задается точка начала стека, что фиксирует точку входа для обращения к локальным переменным.
- Затем резервируется 16 байт стека для локальных переменных (
SUBQ $0x10, SP), и используется NOPL для заполнения байтов с целью выравнивания кэша CPU. - Runtime Go вызывает
runtime.printlock(SB)для блокировки вывода строкового буфера. - С помощью команды LEAQ начальный адрес выделенной строки сохраняется в AX, который является аккумулятором, используемым среди регистров общего назначения для хранения данных.
- Затем в регистр BX, используемый для вспомогательных операций и временного хранения данных, записывается длина строки 11. (
MOVL $0xb, BX) - С помощью runtime.printstring(SB) информация аккумулятора выводится в сторону SB.
- Один пустой символ строки также записывается в SB через runtime.printnl(SB).
- Строковый буфер освобождается через runtime.printunlock(SB).
- ADDQ $0x10, SP возвращает заимствованные 16 байт памяти стека. Поскольку точка входа была заранее помещена в стек, теперь с помощью POPQ BP она извлекается, и отправляется сигнал возврата.
- После этого, как подобает управляемому языку, через runtime.morestack_noctxt.abi0(SB) выделяется достаточный стек и настраивается runtime, включая GC.
- Происходит переход к управляемому адресу main.main(SB).
Как видно из примера, assembly бизнес-логики довольно ясен и представляет собой форму, к которой добавлено лишь минимальное управление со стороны runtime.
При отсутствии оптимизации
Приведенная выше форма является результатом автоматической инлайнинг-оптимизации двух раздельных функций компилятором Go. Однако в учебных целях мы сделаем так, чтобы в данном случае sayHello не подвергалась инлайнингу.
Для этого скомпилируем исходный код с использованием следующего флага:
1 go build -gcflags="-l" main.go
Если вывести результаты в оболочке, можно обнаружить дублирующиеся фрагменты assembly.
1yjlee@elegant:~/compare-assembly/go$ go build -gcflags="-l" main.go
2
3go tool objdump -s "main\.sayHello" ./main
4TEXT main.sayHello(SB) /home/yjlee/compare-assembly/go/main.go
5 main.go:3 0x468f60 493b6610 CMPQ SP, 0x10(R14)
6 main.go:3 0x468f64 7636 JBE 0x468f9c
7 main.go:3 0x468f66 55 PUSHQ BP
8 main.go:3 0x468f67 4889e5 MOVQ SP, BP
9 main.go:3 0x468f6a 4883ec10 SUBQ $0x10, SP
10 main.go:5 0x468f6e 4889442420 MOVQ AX, 0x20(SP)
11 main.go:5 0x468f73 48895c2428 MOVQ BX, 0x28(SP)
12 main.go:4 0x468f78 e8c3a3fcff CALL runtime.printlock(SB)
13 main.go:4 0x468f7d 488b442420 MOVQ 0x20(SP), AX
14 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
15 main.go:4 0x468f87 e834acfcff CALL runtime.printstring(SB)
16 main.go:4 0x468f8c e8efa5fcff CALL runtime.printnl(SB)
17 main.go:4 0x468f91 e80aa4fcff CALL runtime.printunlock(SB)
18 main.go:5 0x468f96 4883c410 ADDQ $0x10, SP
19 main.go:5 0x468f9a 5d POPQ BP
20 main.go:5 0x468f9b c3 RET
21 main.go:3 0x468f9c 4889442408 MOVQ AX, 0x8(SP)
22 main.go:3 0x468fa1 48895c2410 MOVQ BX, 0x10(SP)
23 main.go:3 0x468fa6 e8d5afffff CALL runtime.morestack_noctxt.abi0(SB)
24 main.go:3 0x468fab 488b442408 MOVQ 0x8(SP), AX
25 main.go:3 0x468fb0 488b5c2410 MOVQ 0x10(SP), BX
26 main.go:3 0x468fb5 eba9 JMP main.sayHello(SB)
27yjlee@elegant:~/compare-assembly/go$ go tool objdump -s "main\.sayHello" ./main
28TEXT main.sayHello(SB) /home/yjlee/compare-assembly/go/main.go
29 main.go:3 0x468f60 493b6610 CMPQ SP, 0x10(R14)
30 main.go:3 0x468f64 7636 JBE 0x468f9c
31 main.go:3 0x468f66 55 PUSHQ BP
32 main.go:3 0x468f67 4889e5 MOVQ SP, BP
33 main.go:3 0x468f6a 4883ec10 SUBQ $0x10, SP
34 main.go:5 0x468f6e 4889442420 MOVQ AX, 0x20(SP)
35 main.go:5 0x468f73 48895c2428 MOVQ BX, 0x28(SP)
36 main.go:4 0x468f78 e8c3a3fcff CALL runtime.printlock(SB)
37 main.go:4 0x468f7d 488b442420 MOVQ 0x20(SP), AX
38 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
39OVQ 0x20(SP), AX
40 main.go:4 0x468f82 488b5c2428 MOVQ 0x28(SP), BX
41 main.go:4 0x468f87 e834acfcff CALL runtime.printstring(SB)
42 main.go:4 0x468f8c e8efa5fcff CALL runtime.printnl(SB)
43 main.go:4 0x468f91 e80aa4fcff CALL runtime.printunlock(SB)
44 main.go:5 0x468f96 4883c410 ADDQ $0x10, SP
45 main.go:5 0x468f9a 5d POPQ BP
46 main.go:5 0x468f9b c3 RET
47 main.go:3 0x468f9c 4889442408 MOVQ AX, 0x8(SP)
48 main.go:3 0x468fa1 48895c2410 MOVQ BX, 0x10(SP)
49 main.go:3 0x468fa6 e8d5afffff CALL runtime.morestack_noctxt.abi0(SB)
50 main.go:3 0x468fab 488b442408 MOVQ 0x8(SP), AX
51 main.go:3 0x468fb0 488b5c2410 MOVQ 0x10(SP), BX
52 main.go:3 0x468fb5 eba9 JMP main.sayHello(SB)
53yjlee@elegant:~/compare-assembly/go$
Таким образом, подтвердилось, что компилятор оптимизирует именно такие дублирующиеся операции, неэффективную развертку циклов (loop unrolling) и тому подобное.
В следующий раз
В следующий раз мы рассмотрим операторы if и switch в языке Go. Если позволит время, в будущем мы также проанализируем секции runtime языка Go.