1. 内存分配⚓
1.1 如何分配内存⚓
malloc()
并不是系统调用,而是 C 库里的函数,用于动态分配内存。
malloc 申请内存的时候,会有两种方式向操作系统申请堆内存:
- 通过
brk()
系统调用从堆分配内存 - 通过
mmap()
系统调用在文件映射区域分配内存
malloc() 分配的是虚拟内存:
- 如果分配之后的虚拟内存没有被访问,那么就不会映射也不会占用物理内存了
- 如果被访问的话,操作系统通过查找页表,发现虚拟内存对应的页没有在物理内存中,就会触发缺页中断,然后操作系统会建立虚拟内存和物理内存之间的映射关系。
1.1.1 brk() 函数⚓
通过 brk() 函数将「堆顶」指针向高地址移动,获得新的内存空间。
1.1.2 mmap()函数⚓
通过 mmap() 系统调用中「私有匿名映射」的方式,在文件映射区分配一块内存,也就是从文件映射区“偷”了一块内存。
1.1.3 阈值⚓
malloc() 源码里默认定义了一个阈值:
- 如果用户分配的内存小于
128 KB
,则通过 brk() 申请内存; - 如果用户分配的内存大于
128 KB
,则通过 mmap() 申请内存;
Warning
不同的 glibc 版本定义的阈值也是不同的。
1.2 会分配多大的虚拟内存⚓
malloc() 在分配内存的时候,会预分配更大的空间作为内存池。
预分配多大的空间,跟 malloc 使用的内存管理器有关系,我们就以 malloc 默认的内存管理器(Ptmalloc2)来分析。
实验代码,glibc 库的版本是 2.17:
#include <stdio.h>
#include <malloc.h>
int main() {
printf("使用 cat /proc/%d/maps查看内存分配\n",getpid());
//申请 1 字节的内存
void *addr = malloc(1);
printf("此 1 字节的内存起始地址:%x\n", addr);
printf("使用 cat /proc/%d/maps查看内存分配\n",getpid());
//将程序阻塞,当输入任意字符时才往下执行
getchar();
//释放内存
free(addr);
printf("释放了 1 字节的内存,但 heap 堆并不会释放\n");
getchar();
return 0;
}
执行,输出:
# ./alloc_addr此 1 字节的内存起始地址:d73010
使用 cat /proc/3191/maps查看内存分配
查看进程的内存分布情况:
# cat /proc/3191/maps | grep d730
00d73000-00d94000 rw-p 00000000 00:00 0 [heap]
这个例子分配的内存小于 128 KB,所以是通过 brk()
系统调用向堆空间申请的内存,因此可以看到最右边有 [heap]
的标识。
如果是通过 mmap
以匿名映射的方式从文件映射区分配的匿名内存,最右边是没有 [head] 标志的。
可以看到,堆空间的内存地址范围是 00d73000-00d94000
,这个范围大小是 132KB,也就说明了 malloc(1) 实际上预分配 132K 字节的内存。
程序里打印的内存起始地址是 d73010
,而 maps 文件显示堆内存空间的起始地址是 d73000
,多出来的这 0x10
16 字节 是用来存储内存块信息的,通过向左偏移 16 字节就可以获取这块内存的信息。
1.3 free 释放内存⚓
- 通过 brk 方式申请的内存,通过 free 释放内存后,堆内存还是存在的,并没有归还给操作系统,而是缓存在 malloc 的内存池中,待下次使用。
- 通过 mmap 方式申请的内存,free 释放内存后就会归归还给操作系统。
malloc 返回给用户态的内存起始地址比进程的堆空间起始地址多了 16 字节,多出来的 16 字节就是保存了该内存块的描述信息,比如有该内存块的大小。
这样当执行 free() 函数时,free 会对传入进来的内存地址向左偏移 16 字节,然后从这个 16 字节的分析出当前的内存块的大小,就知道要释放多大的内存了。
1.4 全部使用 mmap 来分配内存?⚓
向操作系统申请内存,是要通过系统调用的,执行系统调用是要进入内核态的,然后在回到用户态,运行态的切换会耗费不少时间。
- 如果都用 mmap 来分配内存,等于每次都要执行系统调用。
- 因为 mmap 分配的内存每次释放的时候,都会归还给操作系统,于是每次 mmap 分配的虚拟地址都是缺页状态的,然后在第一次访问该虚拟地址的时候,就会触发缺页中断。
频繁通过 mmap 分配的内存话,不仅每次都会发生运行态的切换,还会发生缺页中断(在第一次访问虚拟地址后),这样会导致 CPU 消耗较大。
为了改进这两个问题,malloc 通过 brk() 系统调用在堆空间申请内存的时候,由于堆空间是连续的,所以直接预分配更大的内存来作为内存池,当内存释放的时候,就缓存在内存池中。
等下次在申请内存的时候,就直接从内存池取出对应的内存块就行了,而且可能这个内存块的虚拟地址与物理地址的映射关系还存在,这样不仅减少了系统调用的次数,也减少了缺页中断的次数,这将大大降低 CPU 的消耗。
1.5 全部使用 brk 来分配内存?⚓
如果连续申请了 10k,20k,30k 这三片内存,如果 10k 和 20k 这两片释放了,变为了空闲内存空间,如果下次申请的内存小于 30k,那么就可以重用这个空闲内存空间。
但是如果下次申请的内存大于 30k,没有可用的空闲内存空间,必须向 OS 申请,实际使用内存继续增大。
因此,随着系统频繁地 malloc 和 free,尤其对于小块内存,堆内将产生越来越多不可用的碎片,导致“内存碎片”。而这种“泄露”现象使用 valgrind 是无法检测出来的(Valgrind 是一个开源的内存调试和性能分析工具集,它主要用于帮助开发人员发现和调试程序中的内存错误、内存泄漏以及性能问题)。
另外,mmap 还可以用于将文件映射到内存中,这种方式可以实现文件和内存之间的直接读写,提高了 IO 性能。
所以,malloc 实现中,充分考虑了 brk 和 mmap 行为上的差异及优缺点,默认分配大块内存 (128KB) 才使用 mmap 分配内存空间。