`
329937021
  • 浏览: 122749 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

什么是编译器?

阅读更多
编译器

编译器是一种特殊的程序,它可以把以特定编程语言写成的程序变为机器可以运行的机器码。我们把一个程序写好,这时我们利用的环境是文本编辑器。这时我程序把程序称为源程序。在此以后程序员可以运行相应的编译器,通过指定需要编译的文件的名称就可以把相应的源文件(通过一个复杂的过程)转化为机器码了。

[编辑]编译器工作方法
首先编译器进行语法分析,也就是要把那些字符串分离出来。然后进行语义分析,就是把各个由语法分析分析出的语法单元的意义搞清楚。最后生成的是目标文件,我们也称为obj文件。再经过链接器的链接就可以生成最后的可执行代码了。有些时候我们需要把多个文件产生的目标文件进行链接,产生最后的代码。我们把一过程称为交叉链接。


一个现代编译器的主要工作流程如下:

   * 源程序(source code)→预处理器(preprocessor)→编译器(compiler)→汇编程序(assembler)→目标程序(object code)→连接器(链接器,Linker)→可执行程序(executables)

工作原理

编译是从源代码(通常为高级语言)到能直接被计算机或虚拟机执行的目标代码(通常为低级语言或机器言)。然而,也存在从低级语言到高级语言的编译器,这类编译器中用来从由高级语言生成的低级语言代码重新生成高级语言代码的又被叫做反编译器。也有从一种高级语言生成另一种高级语言的编译器,或者生成一种需要进一步处理的的中间代码的编译器(又叫级联)。

典型的编译器输出是由包含入口点的名字和地址以及外部调用(到不在这个目标文件中的函数调用)的机器代码所组成的目标文件。一组目标文件,不必是同一编译器产生,但使用的编译器必需采用同样的输出格式,可以链接在一起并生成可以由用户直接执行的可执行程序。


编译器种类

编译器可以生成用来在与编译器本身所在的计算机和操作系统(平台)相同的环境下运行的目标代码,这种编译器又叫做“本地”编译器。另外,编译器也可以生成用来在其它平台上运行的目标代码,这种编译器又叫做交叉编译器。交叉编译器在生成新的硬件平台时非常有用。“源码到源码编译器”是指用一种高级语言作为输入,输出也是高级语言的编译器。例如: 自动并行化编译器经常采用一种高级语言作为输入,转换其中的代码,并用并行代码注释对它进行注释(如OpenMP)或者用语言构造进行注释(如FORTRAN的DOALL指令)。


预处理器(preprocessor)

作用是通过代入预定义等程序段将源程序补充完整。


编译器前端(frontend)

前端主要负责解析(parse)输入的源程序,由词法分析器和语法分析器协同工作。词法分析器负责把源程序中的‘单词’(Token)找出来,语法分析器把这些分散的单词按预先定义好的语法组装成有意义的表达式,语句 ,函数等等。 例如“a = b + c;”前端词法分析器看到的是“a, =, b , +, c;”,语法分析器按定义的语法,先把他们组装成表达式“b + c”,再组装成“a = b + c”的语句。 前端还负责语义(semantic checking)的检查,例如检测参与运算的变量是否是同一类型的,简单的错误处理。最终的结果常常是一个抽象的语法树(abstract syntax tree,或 AST),这样后端可以在此基础上进一步优化,处理。


编译器后端(backend)

编译器后端主要负责分析,优化中间代码(Intermediate representation)以及生成机器代码(Code Generation)。


一般说来所有的编译器分析,优化,变型都可以分成两大类: 函数内(intraprocedural)还是函数之间(interprocedural)进行。很明显,函数间的分析,优化更准确,但需要更长的时间来完成。


编译器分析(compiler analysis)的对象是前端生成并传递过来的中间代码,现代的优化型编译器(optimizing compiler)常常用好几种层次的中间代码来表示程序,高层的中间代码(high level IR)接近输入的源程序的格式,与输入语言相关(language dependent),包含更多的全局性的信息,和源程序的结构;中层的中间代码(middle level IR)与输入语言无关,低层的中间代码(Low level IR)与机器语言类似。 不同的分析,优化发生在最适合的那一层中间代码上。


常见的编译分析有函数调用树(call tree),控制流程图(Control flow graph),以及在此基础上的变量定义-使用,使用-定义链(define-use/use-define or u-d/d-u chain),变量别名分析(alias analysis),指针分析(pointer analysis),数据依赖分析(data dependence analysis)等等。


上述的程序分析结果是编译器优化(compiler optimization)和程序变形(compiler transformation)的前提条件。常见的优化和变新有:函数内嵌(inlining),无用代码删除(Dead code elimination),标准化循环结构(loop normalization),循环体展开(loop unrolling),循环体合并,分裂(loop fusion,loop fission),数组填充(array padding),等等。优化和变形的目的是减少代码的长度,提高内存(memory),缓存(cache)的使用率,减少读写磁盘,访问网络数据的频率。更高级的优化甚至可以把序列化的代码(serial code)变成并行运算,多线程的代码(parallelized,multi-threaded code)。


机器代码的生成是优化变型后的中间代码转换成机器指令的过程。现代编译器主要采用生成汇编代码(assembly code)的策略,而不直接生成二进制的目标代码(binary object code)。即使在代码生成阶段,高级编译器仍然要做很多分析,优化,变形的工作。例如如何分配寄存器(register allocatioin),如何选择合适的机器指令(instruction selection),如何合并几句代码成一句等等。
分享到:
评论

相关推荐

    编译原理入门——什么是编译器?

    什么是编译器? 编译器告诉计算机该怎么去理解我们编写的代码。我们编写的高级语言大致分为两种: 解释型:像Python,可以写一句执行一句; 编译型:像C,需要经过编译成.exe文件才能运行。 因此,编译器又分两种: ...

    mars编译器1(mips汇编语言编译器)

    mars编译器(mips汇编语言编译运行),可进行mips汇编语言的编写,编译,调试,以及运行等事项。

    compiler:编译器原理,设计,实现和优化

    什么是编译器? 为什么要学习编译器? 如何学习? 编译器实现 列克西耶 解析器 参考 图书 语言实施模式 解析技术 先进的编译器设计与实现 优化现代架构的编译器 编程语言的实践基础 编程语言:应用程序和解释 编写...

    TC编译器TC编译器TC编译器

    TC编译器TC编译器TC编译器TC编译器TC编译器TC编译器TC编译器TC编译器TC编译器TC编译器TC编译器TC编译器

    nasm编译器nasm编译器nasm编译器

    汇编编译器 win32nasm编译器nasm编译器nasm编译器

    伟福编译器伟福编译器伟福编译器

    伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器伟福编译器

    NASM 编译器,NASM 编译器

    NASM 编译器NASM 编译器NASM 编译器NASM 编译器NASM 编译器NASM 编译器NASM 编译器NASM 编译器NASM 编译器

    海思编译器编译器编译器

    编译器 编译器编译器编译器编译器

    JavaScript 编译器Babel.rar

    那么为什么还需要babel语法编译器? babel是一门静态语法编译器,他并不是在程序运行时参与工作,而是在程序运行前先执行语法。需要babel的主要原因是ECMA规范的定制和落实的流程繁琐而漫长,在一个规范落地实现前...

    瑞萨CS+编译器资料_中文编译器

    瑞萨CS+编译器资料

    高级编译器设计与实现_编译原理_编译器_

    本书涵盖了现代微处理器编译器的设计和实现方面的所有高级主题。本书首先介绍编译器的结构、符号表管理、中间代码结构、运行时支持等问题,探讨过程内的控制流分析、数据流分析、依赖关系分析和别名分析的各种方法,...

    自己动手写编译器、链接器_编译器_

    本书讲述了一个真实编译器的开发过程源语言是以C语言为蓝本进行适当简化定义的一门新语言称之为SC语言(简化的C语言)目标语言是大家熟悉的Intelx86机器语言。在本书中读者将看到从 SC语言定义到SCC编译器开发的完整...

    delphi4编译器

    Delphi4编译器.Delphi4编译器.Delphi4编译器.Delphi4编译器.Delphi4编译器.

    小小C编译器源码小小C编译器源码小小C编译器源码小小C编译器源码

    小小C编译器源码小小C编译器源码小小C编译器源码小小C编译器源码小小C编译器源码小小C编译器源码小小C编译器源码小小C编译器源码

    asm编译器 汇编语言编译器

    一款asm编译器。还不错,推荐使用,一个汇编语言编译器

    编译器及编译器生成器

    此附件为编译器原理资料,不过是英文的。只有你能看完,或者是英文能力,或者是真正的理解编译器,总会有收获的

    tcc编译器-中文编译器

    tcc编译器是一个编译速度非常快的一个开源编译器。这是我修改后的,它可以用你的母语作标识符,我可以用中文写代码,这样很久以后打开我自己的代码。依然可以和容易就理解。别人识中文的人一样可以很容易理解。我没...

    编译器原理,帮你揭开编译器的内幕,彻底掌握编译器的行为

    编译器原理,帮你揭开编译器的内幕,彻底掌握编译器的行为,

    vs2015 msvc编译器

    vc2015编译器,免安装,解压缩就能用。双击MSVC2015命令行就能运行cl、nmake等所有命令

    64位Linux的ARM交叉编译器

    想从android代码里提取出64位交叉编译器,结果编译内核报错,才发现提取出来的交叉编译器中大部分是64位的,可objcopy却是32位的,我想不通为什么。 我只能找个64位的objcopy代替,好不容易找到了,替换成64位的...

Global site tag (gtag.js) - Google Analytics