文章目录
非常建议去看一下B站这个课程:基于VSCode和CMake实现C/C++开发 | Linux篇:
就是讲在不使用Visual Studio这种IDE的情况下,纯靠g++/gcc这样的命令行去逐步执行cpp程序的编译,链接,执行等操作。
另外,也可以看一下这篇文章,都有助于理解用编译器的命令行去执行cpp程序:
MacOS使用clang
1. c/cpp程序的执行
1.1 cpp程序的编译过程
这里复习一下本科的知识,
- 编译程序把高级语言写的源程序(source program,比如:
.cpp
后缀)转换为机器指令的目标程序(object program,比如:.o
后缀) - 编译时是以源程序文件(即.c或者.cpp)为对象进行的,分别对每个源程序文件进行
编译
得到相应的目标程序,再将这些目标程序链接
成为一个统一的二进制的可执行程序。 - 预处理指令和C++语句分开处理,前者由预处理器(或者也常称为预编译器)对预处理指令(
#
开头的,比如宏定义和include)进行预处理,详见 1.2 预处理指令。 - 把预处理得到的结果和程序剩下的部分一起,组成一个完整的,可以用来编译的最终的源程序,编译程序对该源程序正式进行编译,得到目标程序。
- 不同的编译系统除了会提供C/CPP规定的标准库函数外,有些编译系统还会提供自己的专门的函数/库函数。
C/CPP的编译过程:
- 编译自动包括预编译和正式编译两个阶段,编译得到本源文件的目标文件(Windows下一般是
.obj
的后缀,UNIX下一般是.o
的后缀)。 - 再通过链接把所有需要的目标文件链接在一起,就得到了最后的可执行程序(Executive program,Windows下一般是
.exe
的后缀,UNIX下一般没有后缀)- 即便程序只有一个源程序文件(一个X.cpp),编译后得到的目标函数也不能直接运行,也需要经过连接阶段,因为要与库函数链接,才能生成可执行程序。
参考:
- 【本质】你知道C语言编译的过程吗?
- C语言程序设计-谭浩强
- Introduction to C/C++ compilation in Linux os with gcc
- The C++ Compilation Model
1.2 预处理指令
#include<iostream>
这句话并不是C++语句,而是C++的一个预处理指令,以#
开头与常规的C++语句相区别,行的末尾没有分号。#include<iostream>
是个包含指令,将iostream
文件的内容包含到该命令所在的程序文件中,代替该指令。- 由于这类指令都放在程序开头,因此称为"头文件"(header file)
- 编译时,先对所有的预处理命令进行处理,将头文件的具体内容替换
#include
指令,然后再对该程序单元进行整体编译。
1.3 编译过程的细节
这个属于编译原理的内容了,可以看看 Alfred V. Aho,Monica S.Lam的编译原理,这里大概放个图:
代码的编译过程可以分为预处理,词法分析,语法分析,语义分析,目标代码,链接,生成可执行程序。
2. macOS下使用Clang看cpp程序的编译过程
2.1 示例
如果想看gcc的,可以看 【本质】你知道C语言编译的过程吗?这篇文章。
以下内容,大部分出自:MacOS使用clang
编译用的clang_demo.cpp 源码:
#include <iostream>
#define STR "Hello world"
int main(int argc, const char * argv[]) {
std::string a = STR;
std::cout << a << std::endl;
return 0;
}
查看编译步骤:
(由于是cpp语言,因此用clang++,就好像gcc命令是c语言,g++就是cpp一样)
> clang++ -ccc-print-phases clang_demo.cpp
0: input, "clang_demo.cpp", c++
1: preprocessor, {
0}, c++-cpp-output
2: compiler, {
1}, ir
3: backend, {
2}, assembler
4: assembler, {
3}, object
5: linker, {
4}, image
6: bind-arch, "x86_64", {
5}, image
可以看到,分为6步:
0.输入c++源码程序
1.预处理器,0是输入,输出是把`#`等包含指令解开后的cpp代码
2.编译器, 1是输入, 输出是中间代码IR(intermediate representation)
3.后端, 2是输入,输出是汇编代码
4.汇编器, 3是输入, 输出是目标文件(机器码,01二进制)
5.链接器, 4是输入,输出是image
6.bind-arch处理架构相关的内容
但是一般我们只会看到四步:预处理,编译,汇编和链接。
- 预处理,生成完整的cpp源文件
- 编译,cpp→生成汇编代码
- 汇编,汇编代码→机器码(0101)
- 链接,生成可执行文件
命令的解释详见2.2.1 常见使用部分,官方文档每个步骤生成文件的意义解释见:clang - the Clang C, C++, and Objective-C compiler
每一步的结果具体如下:
2.1.1 第一步 预处理器-preprocessor
把
#包含指令
的内容,和源文件其他C++语句组合成一个完整的源文件。
clang++ -E clang_demo.cpp -o clang_demo.i
运行上述指令后会得到一个clang_demo.i
,打开拉到最下面,就能看到之前写的该文件中的C++语句部分,另外两个#
语句,一个包含iostream库,另一个是定义了一个宏。
可以看到,宏的部分已经进行了替换。
另外,#include<iostream>
文件里,由于iostream又include别的库,因此一层一层去包括,导致整个包含进来非常长。
这样就形成了完整的一个源文件。
2.1.2 第二步 编译器-compiler
从输入的cpp源文件,生成对应的汇编语言程序
clang++ -S clang_demo.cpp -o clang_demo.s
很明显,这里输出的已经是汇编代码了。
复习一下汇编,下面的书比较老了
可能稍微新一点的: