浏览器原理之V8引擎

本文详细介绍了Google的V8 JavaScript引擎,包括其组成部分如Parser、Ignition和TurboFan的工作流程。V8通过惰性解析、字节码和即时编译实现高性能。Ignition解释器将AST转换为字节码执行,热点代码由TurboFan编译为机器码,优化执行。此外,文章还提到了内联优化、逃逸分析等优化技术,以提高JavaScript的运行效率。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

主流 JS 引擎

JavaScript 的主流引擎如下所示:

V8 之 what & why & when?

waht:V8是一个由Google开源的采用C++编写的高性能JavaScriptWebAssembly引擎,应用在 ChromeNode.js等中。它实现了ECMAScriptWebAssembly,运行在Windows 7及以上、macOS 10.12+以及使用x64、IA-32、ARMMIPS处理器的Linux系统上。 V8可以独立运行,也可以嵌入到任何C++应用程序中。

when:V8最初是由Lars Bak团队开发的,以汽车的V8发动机(有八个气缸的V型发动机)进行命名,预示着这将是一款性能极高的JavaScript引擎,在2008年9月2号chrome一同开源发布。

why:JavaScript代码最终要在机器中被执行,需要经过一系列的处理,将高级语言转换成二进制码指令,机器才可以识别和执行。而转换过程由 V8 负责完成

V8的发布流程

V8 团队使用 4 种 Chrome 发布渠道向用户推送新版本。

  • Canary releases 金丝雀版 (每天):最新 origin 也就是 master分支。
  • Dev releases 开发版 (每周)
  • Beta releases 测试版 (每 6 周)
  • Stable releases 稳定版 (每 6 周):branch-heads分支,作为生产环境应该使用的版本。

V8的组成部分

V8的内部有很多模块,其中最重要的4个如下:

  • Parser: 解析器,负责将源代码解析成AST;
  • Ignition: 解释器,负责将AST转换成字节码并执行,同时会标记热点代码;
  • TurboFan: 编译器,负责将热点代码编译成机器码并执行;
  • Orinoco: 垃圾回收器,负责进行内存空间回收;

以下是 V8 中这几个重要模块的具体工作流程图。接下来我们除垃圾回收器 Orinoco 之外逐个进行分析。

Parser 解析器

Parser解析器的转换过程有两个重要阶段:词法分析(Lexical Analysis)语法分析(Syntax Analysis)。

词法分析阶段是扫描输入的源代码字符串,生成一系列的词法单元 (tokens),这些词法单元包括数字,标点符号,运算符等。词法单元之间都是独立,该阶段并不关心代码的组合方式。

JavaScript中的token主要包含以下几种:

关键字:var、let、const等;

标识符:没有被引号括起来的连续字符,可能是一个变量,也可能是 if、else 这些关键字,又或者是 true、false 这些内置常量;

运算符: +、-、 *、/ 等;

数字:像十六进制,十进制,八进制以及科学表达式等;

字符串:变量的值等;

空格:连续的空格,换行,缩进等;

注释:行注释或块注释都是一个不可拆分的最小语法单元;

标点:大括号、小括号、分号、冒号等。

比如, const name = 'zedran'经过esprima词法分析后生成的tokens:

[
    {
        "type": "Keyword",
        "value": "const"
    },
    {
        "type": "Identifier",
        "value": "name"
    },
    {
        "type": "Punctuator",
        "value": "="
    },
    {
        "type": "String",
        "value": "'zedran'"
    }
]

语法分析阶段是将词法分析产生的token按照某种给定的形式文法转换成AST的过程。也就是把单词组合成句子的过程。在转换过程中会验证语法,语法如果有错的话,会抛出语法错误。 

上述const name = 'zedran'经过语法分析后生成的AST如下:

{
  "type": "Program",
  "start": 0,
  "end": 21,
  "body": [
    {
      "type": "VariableDeclaration",
      "start": 0,
      "end": 21,
      "declarations": [
        {
          "type": "VariableDeclarator",
          "start": 6,
          "end": 21,
          "id": {
            "type": "Identifier",
            "start": 6,
            "end": 10,
            "name": "name"
          },
          "init": {
            "type": "Literal",
            "start": 13,
            "end": 21,
            "value": "zedran",
            "raw": "'zedran'"
          }
        }
      ],
      "kind": "const"
    }
  ],
  "sourceType": "module"
}

主流的 JavaScript 引擎都采用了惰性解析(Lazy Parsing),因为源码在执行前如果全部完全解析的话,不仅会造成执行时间过长,而且会消耗更多的内存以及磁盘空间。

惰性解析就是指如果遇到并不是立即执行的函数,只会对其进行预解析(Pre-Parser),当函数被调用时,才会对其完全解析。

预解析时,只会验证函数的语法是否有效、解析函数声明以及确定函数作用域,并不会生成 AST,这项工作由 Pre-Parser 预解析器完成。

此后,经过Parser解析器生成的AST将交由Ignition解释器进行处理。

Ignition 解释器

Ignition 解释器负责AST转换成字节码(Bytecode)并执行。字节码是介于AST和机器码之间的一种代码,与特定类型的机器代码无关,需要通过解释器转换成机器码才可以执行。

聪明的你可能会问:为何不直接将AST转换成机器码直接运行呢?

V8的 5.9 版本之前是没有字节码的,而是直接将JS代码编译成机器码并将机器码存储到内存中,这样就占用了大量的内存,而早期的手机内存都不高,过度的占用会导致手机性能大大的下降;而且直接编译成机器码导致编译时间长,启动速度慢;再者直接将JS代码转换成机器码需要针对不同的CPU架构编写不同的指令集,复杂度很高。

5.9 版本以后引入了字节码,可以解决上述内存占用大、启动时间长、代码复杂度高这几个问题。

Ignition解释器的工作流程图:

AST需要先通过字节码生成器,再经过一系列的优化之后才能生成字节码。 其中的优化包括:

  • Register Optimizer:主要是避免寄存器不必要的加载和存储
  • Peephole Optimizer:寻找字节码中可以复用的部分,并进行合并
  • Dead-code Elimination: 删除无用的代码,减少字节码的大小

Ignition 解释器在执行字节码的过程中,会监视代码的执行情况并记录执行信息,如函数的执行次数、每次执行函数时所传的参数等。被执行多次的同一段代码,会被标记成热点代码,交给TurboFan编译器进行处理。

TurboFan 编译器

TurboFan 编译器拿到 Ignition 解释器标记的热点代码后,会先优先将优化后字节码编译成更高效的机器码存储起来。下次再次执行相同代码时,会直接执行相应的机器码,大大提升了代码的执行效率。即编译执行。

当一段代码不再是热点代码后,TurboFan会将优化编译后的机器码还原成字节码,将代码的执行权利交还给 Ignition 解释器。即解释执行。

现在我们来看一看具体的执行过程:以多次执行 sum = sum + arr[i] 为例,JS是动态类型的语言,每次的 sum 和 arr[i] 都有可能是不同的类型,在执行这段代码时,Ignition 每次都会检查 sum 和 arr[i] 的数据类型。其被标记为热点代码,交给 TurboFan 编译器直接以之前的几次执行确定 sum 和 arr[i] 的数据类型编译成机器码。

但如果在后续的执行过程中,arr[i] 的数据类型发生了改变,之前生成的机器码就不满足要求了,TurboFan 编译器会把之前生成的机器码丢弃,将执行权利再交给  Ignition 解释器,完成去优化的过程。

解释执行启动速度快,执行速度慢,而编译执行启动速度慢,执行速度快。这种将字节码与解释器(解释执行)和编译器(编译执行)结合的混合技术,就是我们通常所说的即时编译(JIT)

高性能的 JS 引擎不仅需要 TurboFan 这样高度优化的编译器,在编译器有机会开始工作之前的性能,也存在着大量的优化空间。于是在 2021 年,V8 引入新的编译管道 Sparkplug

内联优化

function add(a, b) {
  return a + b
}
function foo() {
  return add(2, 4)
}

如上代码所示,在 foo 函数中调用了函数 add,add 函数接收 a,b 两个参数,返回他们的和。如果不经过编译器优化,则会分别生成这两个函数所对应的机器码。

为了提升性能,TurboFan 优化编译器会将上面两个函数进行内联,然后再进行编译。内联优化后,编译生成的机器码会精简很多,执行效率也有很大的提升:

/** 因为 fooAddInlined 中 a 和 b 是确定值 */
function fooAddInlined() {
  return 6
}

逃逸分析

逃逸分析就是分析对象的生命周期是否仅限于当前函数,是则被认为是“未逃逸”的。

function add(a, b){
  const obj = { x: a, y: b }
  return obj.x + obj.y
}

可以将上面代码进行优化:

function add(a, b){
  const obj_x = a
  const obj_y = b
  return obj_x + obj_y
}

优化后,无需对象定义,可以直接将变量加载到寄存器上,不再需要从内存中访问对象属性。不仅减少了内存消耗,而且提升了执行效率。

其他优化

除了上述提到的各种优化方案和模块,V8 还有很多优化手段和核心模块,如:使用隐藏类快速获取对象属性、使用内联缓存提升函数执行效率、Orinoco 垃圾回收器、Liftoff WebAssembly 编译器

总结

V8 的执行过程:

  1. 源代码经过 Parser 解析器,经过词法分析和语法分析生成 AST;
  2. AST经过 Ignition 解释器生成字节码并执行;
  3. 在执行过程中,如果发现热点代码,将热点代码交给 TurboFan 编译器生成机器码并执行;
  4. 如果热点代码不再满足要求,进行去优化处理。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

薛定谔的猫96

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值