第一次接触编程的小伙伴,几乎都会被这个问题绊倒:为什么数组要从0开始编号?
生活中我们数苹果,都是从1开始,这多自然!
为什么到了代码世界,就要从0这个看起来有点奇怪的数字开始呢?今天我们一起来解答这个问题!
历史起源:从Fortran到C语言的转折
事实上,早期的编程语言,比如诞生于1957年的Fortran,就采用了更符合人类直觉的1基索引。
然而,历史的车轮滚滚向前,十年后,C语言的先驱——B语言,大胆地引入了0基索引的概念。
这一设定被C语言继承,并随着Unix系统的蓬勃发展,逐渐成为编程世界的主流。
底层真相:内存寻址的效率
要理解0基索引的根本原因,我们需要了解一点计算机底层的工作原理。
在内存中,数组的元素是连续存储的。假设一个整型数组,每个元素占用4个字节的内存空间。
如果我们用0作为起始索引,那么第i个元素的内存地址就可以简单地计算为:首地址 + i × 4。
如果从1开始计数呢?那么计算第i个元素的地址就变成了:首地址 + (i-1) × 4。
看起来只是一个小小的差别,但在上世纪70年代,计算机资源极其宝贵,CPU的运算能力非常有限。
每一次内存访问都需要耗费宝贵的CPU时间,而这个小小的减法运算,就会让本来就捉襟见肘的CPU资源雪上加霜。
0基索引的出现,正是为了减少一次减法运算,提高程序的运行效率。
协调和美感:Dijkstra的数学论证
除了性能方面的考虑,0基索引还有其数学上的优雅性。
1982年,荷兰计算机科学家Edsger Dijkstra发表了一篇短文《Why numbering should start at zero》,用简洁的数学证明解释了0基索引的优势。
他指出,如果用左闭右开区间 [0, N) 来表示一个包含N个元素的数组,那么:
● 元素个数 = 上界 - 下界 (N - 0 = N)
● 相邻子区间可以无缝衔接(例如 [0, 5) 和 [5, 10))
● 空集可以表示为 [i, i),无需特殊处理
Edsger Dijkstra手稿
Edsger Dijkstra手稿
Edsger Dijkstra手稿
这种表示方法完美地解决了循环遍历时的边界问题,让代码更加简洁优雅。
想想Python里经典的循环:for i in range(0, len(arr)):,是不是觉得赏心悦目?
如果从1开始,就不得不写成 for i in range(1, len(arr) + 1):,是不是略显臃肿?
现代编程:0基索引的更多优势
从C语言扩散开来的0基索引,在新时代的编程实践中展现出了更多的优势,比如
1. 位运算优化
在哈希表等场景中,计算槽位时,index = hash % size 天然适配0基索引。
2. 多维数组计算
矩阵元素 arr[i][j] 的内存地址计算更加简洁。
3. 类型系统统一
指针偏移量(ptr + 0 指向第一个元素)与数组索引完全对应。
4. 切片语法糖
Python 中 arr[2:5] 表示第2到第4个元素,避免了 +1 或 -1 的混乱。
反观一些坚持使用1基索引的语言,例如Matlab,在处理图像RGB矩阵时,经常需要面对通道索引是 1-3 还是 0-2 的混乱,让人头疼不已。
少数派:坚持从1开始的语言
也有一些语言坚持使用1基索引,比如 Fortran、Lua 和 R,但这些语言往往活跃在特定领域。
Fortran 主要用于科学计算,更贴近数学家的习惯;
Lua 的设计者认为“定位第1个元素叫元素1更自然”;
R 则是因为统计学家更熟悉1基索引。
对于初学者来说,0基索引可能需要一段时间适应。
但一旦你理解了其背后的逻辑,就会发现它并非反直觉,而是一种更符合计算机底层逻辑的思维方式。
当我们说“数组的第0个元素”时,实际上指的是“距离起始位置偏移0个单位的元素”。
这种思维方式,正是编程思维与日常思维的差异所在。