在数据结构中,堆是一种树形结构,是一种完全二叉树,栈是一种线性结构,具有先进后出的特性。
而在操作系统中,栈(stack)是一个特殊的存储区域。栈通常由操作系统分配和回收,它用于局部变量和函数调用存储等地方,它的大小是固定的,因此,如果需要分配的空间大于栈的大小,就会发生栈溢出。堆(heap)由用户控制分配和回收,使用一些系统函数,以从系统中获取所需大小的分配空间,而其的存储方式则因系统而异。
这里我们主要阐述操作系统上的堆栈概念。
在早些年的操作系统中,程序直接访问和操作物理内存。这种形式不能保证系统的安全性和稳定性,具有高度破坏性;此外,很难同时运行多个程序。可以想象,同时使用一组存储,即使是最简单的同时运行多个程序的情况也将变得难以实现。而现在的计算机操作系统普遍采用了虚拟内存技术,基本思想是:通过对主存进行抽象,为每个进程提供独立的逻辑空间。
在之前的博客里已经说过了进程和线程的概念,我们都知道,进程是程序在数据集上动态执行的过程,是操作系统进行资源分配和调度的一个独立单位,而一个进程至少要有一个线程(主线程),进程是一个资源单位,而线程是它的一部分。所以,无论是进程还是线程都需要分配内存空间,而堆和栈就是两种内存管理。
栈由系统自动分配,例如申请一个int类型的局部变量,那么系统将自动在栈中为该局部变量分配空间,只要堆栈的剩余空间大于请求的空间,系统将为程序提供内存,否则将报告异常指示堆栈溢出。
而堆需要用户自己申请,并且分配大小,操作系统有一个记录可用内存地址的链接列表。当系统从程序接收到申请时,它将遍历链接列表以找到第一个空间大于请求空间的堆节点,然后从空闲节点列表中删除该节点,并将该节点的空间分配给程序。此外,对于大多数系统,此分配的大小将记录在该内存空间的第一个地址,这样,代码中的delete语句可以正确释放内存空间。此外,由于找到的堆节点的大小不一定完全等于应用程序的大小,系统将自动将额外的部分放回空闲链表中。
在Windows中,栈是一个连续的内存区域,是向低地址扩展的数据结构。这意味着栈顶部的地址和栈的最大容量由系统预先设置。在Windows下,栈的大小为2M(或1M,这是编译时确定的常数)。如果请求的空间超过栈的剩余空间,系统将提示溢出。因此,栈能获得的空间较小。
而堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。因此,堆获得的空间比较灵活,也比较大。
在函数调用时,第一个进栈的是主函数中后的下一条指令(函数调用语句的下一条可执行语句)的地址,然后是函数的各个参数,在大多数的C编译器中,参数是由右往左入栈的,然后是函数中的局部变量。注意静态变量是不入栈的。当本次函数调用结束后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是主函数中的下一条指令,程序由该点继续运行。
而堆一般是在堆的头部用一个字节存放堆的大小,其中的具体内容由用户自己安排。
所以,综上所述,用简短的语言地总结堆栈之间的区别:
申请方式:栈由系统自动分配,堆是用户自己申请分配。
申请的空间大小:栈能获得的空间较小,堆获得的空间比较灵活,也比较大。
存储内容:栈在函数调用时,函数调用语句的下一条可执行语句的地址第一个进栈,然后函数的各个参数进栈,其中静态变量是不入栈的。而堆是在头部用一个字节存放堆的大小,堆的具体内容由用户自己安排。