内存：代码与数据的 “临时住所”—— 寻址与存储规则

fyakm

已于 2025-08-25 20:17:18 修改

阅读量489

点赞数 23

CC 4.0 BY-SA版权

分类专栏：代码运行的奥秘文章标签： java linux 网络

于 2025-08-11 09:26:56 首次发布

本文链接：https://blog.csdn.net/qq_41803278/article/details/150206124

代码运行的奥秘专栏收录该内容

12 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

1.3 内存：代码与数据的 “临时住所”—— 寻址与存储规则

如果说 CPU 是程序运行的“大脑”，机器指令是“指令手册”，那么内存就是程序运行时的“临时住所”—— 所有代码（机器指令）和数据（变量、中间结果）都需要先加载到内存中，才能被 CPU 访问和处理。就像厨师需要把食材和菜谱放在工作台上才能做菜，CPU 也必须依赖内存这个“工作台”完成计算。

但内存的“住所规则”远比现实中的公寓复杂：它有严格的“地址编号”（寻址规则），数据存放有“格式要求”（存储规则），甚至不同类型的内容（代码、变量、临时数据）要住在不同的“区域”。这一节我们就拆解内存的工作原理：它如何为代码和数据分配“房间”？CPU 如何准确找到这些“房间”？数据在内存中又是如何“摆放”的？

内存的本质：由“存储单元”组成的“线性仓库”

内存（主存储器，通常指 DRAM）的物理结构是由亿万个“存储单元”组成的芯片，每个单元能存储 1 比特（bit）数据（0 或 1）。但程序访问内存时，不会按“比特” granularity 操作，而是按字节（Byte） 为基本单位——1 字节 = 8 比特，这是因为大多数数据（如字符、整数）的最小表示单位是字节。

可以把内存想象成一个“线性排列的仓库”：

每个“仓库格子”是 1 字节，有唯一的“格子编号”—— 这就是内存地址（Address），类似公寓的房间号；
地址从 0 开始递增，形成连续的“地址空间”，就像房间号从 0000 开始依次排列；
仓库的总容量就是内存大小，比如 8GB 内存意味着有 8×1024³ = 8,589,934,592 个字节格子。

地址的表示：为什么用十六进制？

内存地址通常用十六进制表示（如 0x00001234），而不是十进制。这并非程序员的“密码游戏”，而是因为十六进制与二进制的转换更高效——1 位十六进制数恰好对应 4 位二进制数（2⁴=16），而内存地址本质上是二进制电信号的编码。

例如，十进制地址 4660 转换为二进制是 1001001110100，而十六进制是 0x1234，显然后者更简洁，也更易与机器指令中的二进制操作数对应（呼应 1.2 节的机器指令构成）。

虚拟地址与物理地址：程序“看到的” vs 实际“存在的”

你可能会疑惑：程序中打印的内存地址（如 C 语言中 &x 输出的 0x7ffd8b8c）是内存的真实物理地址吗？答案是否定的。现代操作系统会通过虚拟内存技术，给程序“分配”一套独立的“虚拟地址空间”，而实际的物理内存地址由操作系统和 CPU 共同映射。

这就像：

程序看到的是“门牌号”（虚拟地址），比如 0x1000；
操作系统是“物业管理员”，负责把“门牌号”翻译成实际的“仓库格子号”（物理地址），比如 0x80001000；
这样做的好处是：程序无需关心物理内存的实际布局，不同程序的虚拟地址可以重复（如两个程序都用 0x1000），互不干扰（类似两个小区都有“1 栋 1 单元”，但实际位置不同）。

寻址规则：CPU 如何“找到”内存中的数据？

CPU 访问内存时，必须通过“地址”定位目标字节，这个过程称为寻址。寻址规则的核心是“地址的表示方式”和“范围限制”，直接影响 CPU 能访问的内存大小。

1. 地址总线与地址空间：CPU 的“视力范围”

CPU 与内存之间通过“地址总线”（Address Bus）传递地址信号，地址总线的位数决定了 CPU 能访问的最大内存范围——这就像“视力范围”：总线位数越多，能看到的“仓库格子”就越多。

32 位地址总线：最大可表示 2³² = 4,294,967,296 个地址，对应 4GB 内存（每个地址对应 1 字节）；
64 位地址总线：理论上可表示 2⁶⁴ 个地址（约 18EB），但实际操作系统会限制（如 64 位 Windows 通常支持到 256TB）。

这就是为什么 32 位操作系统无法充分利用 8GB 内存——它的“视力”只能覆盖前 4GB 的地址空间。

2. 常见寻址方式：从“直接点名”到“间接问路”

CPU 通过机器指令中的操作数指定内存地址（呼应 1.2 节），但地址的表示方式（寻址方式）有多种，就像找朋友的不同方式：直接说地址、说“他在我现在位置的前 3 米”、说“纸条上写着他的地址”等。

（1）直接寻址：直接给出“门牌号”

操作数就是内存地址本身，例如指令 MOV A, [0x1234] 表示“把地址 0x1234 处的字节数据加载到寄存器 A”。

类比：“去 0x1234 号房间拿东西”。

（2）间接寻址：通过“中间人”找地址

操作数是“存储地址的内存单元”，例如指令 MOV A, [[0x5678]] 表示“先从 0x5678 号房间取出一个地址（比如 0x1234），再去 0x1234 号房间拿东西”。

类比：“先去 0x5678 号房间拿一张纸条，纸条上写的地址就是目标房间”。

（3）相对寻址：基于“当前位置”偏移

操作数是“当前指令地址 + 偏移量”，例如指令 JMP +0x10 表示“跳转到当前指令地址加 0x10 的位置”。

类比：“从现在的位置往前走 16 个房间”。
用途：常用于循环、条件判断等代码（如 if 语句的跳转），无需硬编码绝对地址，方便代码复用。

（4）寄存器间接寻址：用寄存器存地址

操作数是寄存器编号，寄存器中存储的是内存地址，例如指令 MOV A, [R1] 表示“R1 中存的是地址（比如 0x1234），去这个地址拿数据”。

类比：“我的口袋（R1）里有张纸条，上面写着目标房间号”。
优势：寄存器访问速度远快于内存，这种方式比直接寻址更高效，是程序中最常用的寻址方式之一。

存储规则：数据在内存中如何“摆放”？

内存虽然是“线性仓库”，但数据的存放并非随意堆砌——不同类型的数据（如整数、浮点数、字符串）有固定的“摆放规则”，否则 CPU 会“读错”数据。核心规则包括字节序和数据对齐。

1. 字节序：数据的“排列方向”

当数据长度超过 1 字节（如 2 字节的短整数、4 字节的整数）时，字节在内存中的排列顺序有两种方式，称为字节序（Endianness）：

（1）小端序（Little-Endian）

低位字节存放在低地址，高位字节存放在高地址。

例子：16 位整数 0x1234（二进制 00010010 00110100），在小端序中存储为：
- 低地址（如 0x00）：0x34（低位字节）
- 高地址（如 0x01）：0x12（高位字节）

（2）大端序（Big-Endian）

高位字节存放在低地址，低位字节存放在高地址（类似人类读写数字的习惯，从高位到低位）。

例子：同样 0x1234，在大端序中存储为：
- 低地址（如 0x00）：0x12（高位字节）
- 高地址（如 0x01）：0x34（低位字节）

为什么会有字节序差异？

这是早期硬件设计的历史遗留问题：

英特尔 x86、ARM（默认）等架构用小端序；
网络协议（如 TCP/IP）、PowerPC（部分）等用大端序（称为“网络字节序”）。

当不同字节序的设备通信时（如手机与服务器），必须先转换为统一字节序，否则会出现“数据错乱”。例如，服务器按大端序发送 0x1234，小端序的手机若不转换，会读成 0x3412（即十进制 13330，而非实际的 4660）。

2. 数据对齐：让 CPU“读得舒服”

CPU 访问内存时，通常按“块”读取（如 4 字节、8 字节），而非单字节。如果数据的地址是“块大小的整数倍”，称为对齐数据，否则为未对齐数据。

例子：32 位 CPU 按 4 字节块访问内存，0x0004 是 4 的倍数（对齐），0x0005 不是（未对齐）。

为什么要对齐？

未对齐的数据需要 CPU 访问两次内存才能读完，而对齐数据只需一次，效率差异显著。

对齐访问：CPU 从 0x0004 读取 4 字节，一次完成；
未对齐访问：CPU 先读 0x0004-0x0007，再读 0x0008-0x000B，然后拼接出 0x0005-0x0008 的数据，耗时翻倍。

因此，编译器会自动调整变量的地址（如在变量间插入“填充字节”），确保数据对齐。例如，在 32 位系统中，一个 2 字节的 short 变量后面可能会加 2 字节填充，确保下一个 4 字节的 int 变量从 4 的倍数地址开始。

内存中的“区域划分”：代码与数据的“专属区域”

程序运行时，内存会被划分为多个区域（段），不同类型的内容存放在不同区域，就像公寓分为“卧室”“厨房”“客厅”：

区域名称	作用	特点	示例（C 程序）
代码段（Text）	存放机器指令（程序代码）	只读（防止意外修改）、可共享	`main` 函数的机器指令
数据段（Data）	存放全局变量、静态变量	编译时分配，程序启动时加载	`int global = 10;`（初始化的全局变量）
BSS 段	存放未初始化的全局/静态变量	编译时仅记录大小，启动时清零后分配	`int uninit_global;`
栈（Stack）	存放局部变量、函数调用信息	自动分配/释放（“先进后出”），大小固定	函数内的 `int x = 5;`
堆（Heap）	存放动态分配的内存	手动分配/释放（`malloc`/`free`），大小可变	`malloc(100)` 申请的 100 字节内存

实例：一个 C 程序的内存布局

#include <stdlib.h>

int global_init = 10;    // 数据段
int global_uninit;       // BSS 段

int main() {
    int local = 20;      // 栈
    int *heap_ptr = malloc(4);  // 堆
    *heap_ptr = 30;
    return 0;
}