详解 32 和 64

详解 32 和 64

关于 32 位和 64 位,这个概念一直让人比较懵。

在买电脑的时候,我们看到过32 位和 64 位 CPU

下软件的时候,我们也看到过32 位或 64 位的软件

就连装虚拟机的时候,我们也看过32 位和 64 位的系统

在写代码的时候,我们的数值,也可以定义为int32 或者 int64

一、从代码到可执行文件

当我们在代码编辑器中写入

1
2
3
4
5
6
7
8
9
10
11
// test.c
#include <stdio.h>

int main()
{
int i,j;
i = 3;
j = 2;
return i + j;
}

但这个代码是给人看的,机器可看不懂,于是这段代码,还会经过被编译器转成汇编码

汇编码就是我们大学的时候学的头秃的这种

1
2
3
4
5
6
7
8
9
10
11
12
13
14
// gcc -S test.c
pushq %rbp
.cfi_def_cfa_offset 16
.cfi_offset %rbp, -16
movq %rsp, %rbp
.cfi_def_cfa_register %rbp
movl $0, -4(%rbp)
movl $3, -8(%rbp)
movl $2, -12(%rbp)
movl -8(%rbp), %eax
addl -12(%rbp), %eax
popq %rbp
retq

而汇编,总归还是有各种 movl,pushq 这些符号,虽然确实不好看,但说到底还是给人看的,而机器 cpu 要的,说到底还是要 0101 这样的二进制编码,所以还需要使用汇编器将汇编转成二进制的机器码。我们可以看到下面内容分为 3 列,左边是指令地址, 右边是汇编码内容,中间的就是指令机器码,是 16 进制,可以转成二进制 01 串,这就是机器 cpu 能认识的内容了。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
// objdump -d test
0000000000001125 <main>:
1125: 55 push %rbp
1126: 48 89 e5 mov %rsp,%rbp
1129: c7 45 fc 03 00 00 00 movl $0x3,-0x4(%rbp)
1130: c7 45 f8 02 00 00 00 movl $0x2,-0x8(%rbp)
1137: 8b 55 fc mov -0x4(%rbp),%edx
113a: 8b 45 f8 mov -0x8(%rbp),%eax
113d: 01 d0 add %edx,%eax
113f: 5d pop %rbp
1140: c3 retq
1141: 66 2e 0f 1f 84 00 00 nopw %cs:0x0(%rax,%rax,1)
1148: 00 00 00
114b: 0f 1f 44 00 00 nopl 0x0(%rax,%rax,1)

image-20240704112015114

而机器码,最后会放在我们编译生成的可执行文件里。

也就是说我们平时写的代码,最后会变成一堆 01 机器码,放在可执行文件里,躺在磁盘上。

二、从可执行文件到进程

一旦我们执行以下命令

1
./可执行文件名

这个可执行文件就会加载进内存中,成为一个进程,运行起来。

可执行文件里的机器码也会被加载到内存中,它就像是一张列满 todo list 的清单,而 CPU 就对照着这张清单,一行行的执行上面的机器码。从效果上来看,进程就动起来了。

对 CPU 来说,它执行到某个特定的编码数值,就会执行特定的操作。比如计算 2+3,其实就是通过总线把数据 2 和 3 从内存里读入,然后放到寄存器上,再用加法器相加这两个数值并将结果放入到寄存器里,最后将这个数值回写到内存中,以此循环往复,一行行执行机器码直到退出。

image-20240704112214945

CPU 位数的含义

上面这个流程里,最重要的几个关键词,分别是CPU 寄存器,总线,内存

CPU 的寄存器,说白了就是个存放数值的小盒子,盒子的大小,叫位宽。32 位 CPU 能放入最大 2^32 的数值。64 位就是最大 2^64 的值。这里的 32 位位宽的 CPU 就是我们常说的 32 位 CPU,同理 64 位 CPU 也是一样。

CPU 跟内存之间,是用总线来进行信号传输的,总线可以分为数据总线,控制总线,地址总线。功能如其名,举个例子说明下他们的作用吧。在一个进程的运行过程中,CPU 会根据进程的机器码一行行执行操作。

比如现在有一行是将 A 地址的数据与 B 地址的数据相加,那么 CPU 就会通过控制总线,发送信号给内存这个设备,告诉它,现在 CPU 要通过地址总线在内存中找到A 数据的地址,然后取得 A 数据的值,假设是 100,那么这个 100,就会通过数据总线回传到 CPU 的某个寄存器中。B 也一样,假设 B=200,放到另一个寄存器中,此时 A 和 B 相加后,结果是 300,然后控制 CPU 通过地址总线找到返回的参数地址,再把数据结果通过数据总线传回内存中。这一存一取,CPU 都是通过控制总线对内存发出指令的。

image-20240704112311917

总线,也可以理解为有个宽度,比如宽度是 32 位,那么一次可以传 32 个 0 或 1 的信号,那么这个宽度能表达的数值范围就是 0 到 2^32 这么多。

32 位 CPU 的总线宽度一般是 32 位,因为刚刚上面提到了,CPU 可以利用地址总线在内存中进行寻址操作,那么现在这根地址总线,最大能寻址的范围,也就到 2^32,其实就是 4G。

64 位 CPU,按理说总线宽度是 64 位,但实际上是 48 位(也有看到说是 40 位或 46 位的,没关系,你知道它很大就行了),所以寻址范围能到 2^48 次方,也就是 256T。

系统和软件的位数的含义

上面提到了 32 位 CPU 和 64 位 CPU 的内存寻址范围,那么相应的操作系统,和软件(其实操作系统也能说是软件),也应该按 CPU 所能支持的范围去构建自己的寻址范围。

比方说下面这个图,在操作系统上运行一个用户态进程,会分为用户态和内核态,并设定一定的内存布局。操作系统和软件都需要以这个内存布局为基础运行程序。比如 32 位,内核态分配了 1 个 G,用户态分配了 3G,这种时候,你总不能将程序的运行内存边界设定在大于 10G 的地方。所以,系统和软件的位数,可以理解为,这个系统或软件内存寻址的范围位数。

image-20240704112342617

一般情况下,由于现在我们的 CPU 架构在设计上都是完全向前兼容的,别说 32 位了,16 位的都还兼容着,因此 64 位的 CPU 是能装上 32 位操作系统的。

同理,64 位的操作系统是兼容 32 位的软件的,所以 32 位软件能装在 64 位系统上。

但反过来,因为 32 位操作系统只支持 4g 的内存,而 64 位的软件在编译的时候就设定自己的内存边界不止 4 个 G,并且 64 位的 CPU 指令集内容比 32 位的要多,所以 32 位操作系统是肯定不能运行 64 位软件的。

同理,32 位 CPU 也不能装 64 位的操作系统的。

程序数值 int32 和 int64 的含义

这个我们平时写代码接触的最多,比较好理解了。int32 也就是用 4 个字节,32 位的内存去存储数据,int64 也就是用 8 个字节,64 位去存数据。这个数值就是刚刚 CPU 运行流程中放在内存里的数据。

那么问题又来了。

32 位的 CPU 能进行 int64 位的数值计算吗?

先说结论,。但比起 64 位的 CPU,性能会慢一些

如果说我用的是 64 位的CPU,那么我在计算两个 int64 的数值相加时,我就能将数据通过 64 位的总线,一次性存入到 64 位的寄存器,并在进行计算后返回到内存中。整个过程一步到位,一气呵成。

但如果我现在用的是 32 位的 CPU,那就憋屈一点了,我虽然在代码里放了个 int64 的数值,但实际上 CPU 的寄存器根本放不下这么大的数据,因此最简单的方法是,将 int64 的数值,拆成前后两半,现在两个 int64 相加,就变成了 4 个 int32 的数值相加,并且后半部分加好了之后,拿到进位,才能去计算前面的部分,这里光是执行的指令数就比 64 位的 CPU 要多。所以理论上,会更慢些。

三、系统位数会限制内存吗?

上面提到了 CPU 位数,系统位数,软件位数,以及数值位数之间的区别与联系。

现在,我们回到标题里提到的问题。

32 位 CPU 和系统插 8g 内存条,能用吗?

系统能正常工作,但一般用不到 8G,因为 32 位系统的总线寻址能力为 2 的 32 次方,也就是 4G,哪怕装了 8G 的内存,真正能被用到的其实只有 4g,多少有点浪费。

注意上面提到的是一般,为什么这么说,因为这里有例外,32 位系统里,有些是可以支持超过 4G 内存的,比如Windows Server 2003就能最大支持 64G 的内存,它通过使用 PAE (Intel Physical Address Extension)技术向程序提供更多的物理内存,PAE 本质上是通过分页管理的方式将 32 位的总线寻址能力增加到 36 位。因此理论上寻址能力达到 2 的 36 次方,也就是 64G。

image-20240704112529344

至于实现细节大家也不用关心,现在用到这玩意的机器也该淘汰的差不多了,而且都是 windows server,注意Windows Server 2003 名字里带个server,是用来做服务器的,我们一般也用不到,知道这件事,除了能帮助我们更好的装 x 外,就没什么作用了。

所以,你当 32 位系统最大只能用到 4G 内存,那也没毛病。

64 位 CPU 装 32 位操作系统,再插上 8g 的内存条,寻址能力还是 4G 吗?

上面提到 32 位 CPU 就算插上 8G 内存条,寻址能力也还是 4G,那如果说我现在换用 64 位的 CPU,但装了个 32 位的操作系统,这时候插入 8G 内存条,寻址能力能超过 4G 吗?

寻址能力,除了受到 cpu 的限制外,还受到操作系统的限制,如果操作系统就是按着 32 位的指令和寻址范围(4G)来编译的话,那么它就会缺少 64 位系统该有的指令,它在运行软件的时候就不能做到超过这个限制,因此寻址能力还会是 4G。

最后留下一个问题吧。

上面提到,我们平时写的代码(也就是 C,go,java 这些),先转成汇编,再转成机器码。最后 CPU 执行的是机器码,那么问题来了。

为什么我们平时写的代码不直接转成机器码,而要先转成汇编,这是不是多此一举?

四、总结

  • CPU 位数主要指的是寄存器的位宽,
  • 32 位 CPU 只能装 32 位的系统和软件,且能计算 int64,int32 的数值。内存寻址范围是 4G。
  • 64 位 CPU,同时兼容 32 位和 64 位的系统和软件,并且进行 int64 数值计算的时候,性能比 32 位 CPU 更好,内存寻址范围可以达到 256T。
  • 32 位 CPU 和操作系统,插入 8G 的内存,会有点浪费,因为总线寻址范围比较有限,它只能用上 4G 不到的内存。
  • 64 位 CPU,如果装上 32 位的操作系统,就算插上 8G 的内存,效果也还是只能用上 4G 不到的内存。

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!