2025-05-05 13:35:39 德国世界杯预选赛

【C 基础】C语言代码编译过程

从一个源文件(.c)到可执行程序到底经历了哪几步,我想大多数的人都知道,到时到底每一步都做了什么,我估计也没多少人能够说得清清楚楚,明明白白。

其实总的流程是这样的。

【第一步】编辑hello.c

1 #include

2 #include

3 int main()

4 {

5 printf("hello world!\n");

6 return 0;

7 }

【第二步】预处理

预处理过程实质上是处理“#”,将#include包含的头文件直接拷贝到hello.c当中;将#define定义的宏进行替换,同时将代码中没用的注释部分删除等

具体做的事儿如下:

(1)将所有的#define删除,并且展开所有的宏定义。说白了就是字符替换

(2)处理所有的条件编译指令,#ifdef #ifndef #endif等,就是带#的那些

(3)处理#include,将#include指向的文件插入到该行处

(4)删除所有注释

(5)添加行号和文件标示,这样的在调试和编译出错的时候才知道是是哪个文件的哪一行

(6)保留#pragma编译器指令,因为编译器需要使用它们。

gcc -E hello.c -o a.c可以生成预处理后的文件。通过查看文件内容和文件大小可以得知a.c讲stdio.h和stdlib.h包含了进来。

【第三步】编译

编译的过程实质上是把高级语言翻译成机器语言的过程,即对a.c做了这些事儿

(1)词法分析,

(2)语法分析

(3)语义分析

(4)优化后生成相应的汇编代码

从 高级语言->汇编语言->机器语言(二进制)

gcc -S hello.c -o a.s可以生成汇编代码

汇编代码如下。

1 .file "hello.c"

2 .section .rodata

3 .LC0:

4 .string "hello world!"

5 .text

6 .globl main

7 .type main, @function

8 main:

9 .LFB0:

10 .cfi_startproc

11 pushl %ebp

12 .cfi_def_cfa_offset 8

13 .cfi_offset 5, -8

14 movl %esp, %ebp

15 .cfi_def_cfa_register 5

16 andl $-16, %esp

17 subl $16, %esp

18 movl $.LC0, (%esp)

19 call puts

20 movl $0, %eax

21 leave

22 .cfi_restore 5

23 .cfi_def_cfa 4, 4

24 ret

25 .cfi_endproc

26 .LFE0:

27 .size main, .-main

28 .ident "GCC: (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3"

29 .section .note.GNU-stack,"",@progbits

gcc -c hello.c -o a.o将源文件翻译成二进制文件。类Uinx系统编译的结果生生成.o文件,Windows系统是生成.obj文件。

编译的过程就是把hello.c翻译成二进制文件

【第四步】链接

就像刚才的hello.c它使用到了C标准库的东西“printf”,但是编译过程只是把源文件翻译成二进制而已,这个二进制还不能直接执行,这个时候就需要做一个动作,

将翻译成的二进制与需要用到库绑定在一块。打个比方编译的过程就向你对你老婆说,我要吃雪糕。你只是给你老婆发出了你要吃雪糕的诉求而已,但是雪糕还没有到。

绑定就是说你要吃的雪糕你的老婆已经给你买了,你可以happy。

gcc hello.c -o a可以生成可执行程序。即gcc不带任何参数。ldd就可以看到你的可执行程序依赖的库。

可以看到a.o的大小是1.1k,毕竟他只是把源文件翻译成二进制文件。a却有7k,应该是他多了很多“绳子”吧。在运行的时候这些“绳子”就将对应的库函数“牵过来”。很形象的比喻是不是?哈哈。libc.so.6 中就对咱们用的printf进行了定义。

轻松掌握正则技巧:教你如何屏蔽纯数字,避免信息泄露风险
文武双全的谜语是什么(和文武双全有关的谜语)(4个)
top