[转]A20地址线问题

A20地址线并不是打开保护模式的关键，只是在保护模式下，不打开A20地址线，你将无法访问到所有的内存（具体参考下面的第5点）

用于80286与8086兼容
用于80286处于实模式下时，防止用户程序访问到100000h~10FFEFh之间的内存（高端内存）
8086模式，A20关闭的情况下，访问超过1MB内存时，会自动回卷
8086模式下，A20打开的情况下，访问超过1MB内存，就真实的访问
保护模式下，A20关闭（始终为0），则用户的地址只能是：0 - (1MB-1), 2 - (3MB-1), 4 - (5MB-1)，我们可以这样设想，A20为个位数（以1MB为单位），如果它始终为0，你永远不可能让这个数变成奇数。
保护模式下，A20开启，则可以访问全地址，没有奇偶MB的问题。

调用BIOS中断就可以实现A20 Gate的控制功能。
这个BIOS中断为 INT 15h,AX=2401h。被称为Fast A20。

下面转载一篇文档:
A20地址线问题

很多稀奇古怪的东西都是由于系统升级时，为了保持向下兼容而产生的，A20Gate就是其中之一。

在8086/8088中，只有20根地址总线，所以可以访问的地址是2^20=1M，但由于8086/8088是16位地址模式，能够表示的地址范围是0-64K，所以为了在8086/8088下能够访问1M内存，Intel采取了分段的模式：16位段基地址:16位偏移。其绝对地址计算方法为：16位基地址左移4位+16位偏移=20位地址。

但这种方式引起了新的问题，通过上述分段模式，能够表示的最大内存为：FFFFh:FFFFh=FFFF0h+FFFFh=10FFEFh=1M+64K-16Bytes（1M多余出来的部分被称做高端内存区HMA）。但8086/8088只有20位地址线，如果访问100000h~10FFEFh之间的内存，则必须有第21根地址线。所以当程序员给出超过1M（100000H-10FFEFH）的地址时，系统并不认为其访问越界而产生异常，而是自动从重新0开始计算，也就是说系统计算实际地址的时候是按照对1M求模的方式进行的，这种技术被称为wrap-around。

到了80286，系统的地址总线发展为24根，这样能够访问的内存可以达到2^24=16M。Intel在设计80286时提出的目标是，在实模式下，系统所表现的行为应该和8086/8088所表现的完全一样，也就是说，在实模式下，80286以及后续系列，应该和8086/8088完全兼容。但最终，80286芯片却存在一个BUG：如果程序员访问100000H-10FFEFH之间的内存，系统将实际访问这块内存，而不是象过去一样重新从0开始。

为了解决上述问题，IBM使用键盘控制器上剩余的一些输出线来管理第21根地址线（从0开始数是第20根），被称为A20Gate：如果A20 Gate被打开，则当程序员给出100000H-10FFEFH之间的地址的时候，系统将真正访问这块内存区域；如果A20Gate被禁止，则当程序员给出100000H-10FFEFH之间的地址的时候，系统仍然使用8086/8088的方式。绝大多数IBM PC兼容机默认的A20Gate是被禁止的。由于在当时没有更好的方法来解决这个问题，所以IBM使用了键盘控制器来操作A20 Gate，但这只是一种黑客行为，毕竟A20Gate和键盘操作没有任何关系。在许多新型PC上存在着一种通过芯片来直接控制A20 Gate的BIOS功能。从性能上，这种方法比通过键盘控制器来控制A20Gate要稍微高一点。

上面所述的内存访问模式都是实模式，在80286以及更高系列的PC中，即使A20Gate被打开，在实模式下所能够访问的内存最大也只能为10FFEFH，尽管它们的地址总线所能够访问的能力都大大超过这个限制。为了能够访问10FFEFH以上的内存，则必须进入保护模式。（其实所谓的实模式，就是8086/8088的模式，这种模式存在的唯一理由就是为了让旧的程序能够继续正常的运行在新的PC体系上）

A20 Gate inProtected Mode

从80286开始，系统出现了一种新的机制，被称为保护模式。到了80386，保护模式得到了进一步的完善和发展，并且对于80386以后的芯片，保护模式的变化就非常小了。

我们在上一节已经谈到，如果要访问更多的内存，则必须进入保护模式，那么，在保护模式下，A20Gate对于内存访问有什么影响呢？

为了搞清楚这一点，我们先来看一看A20的工作原理。A20，从它的名字就可以看出来，其实它就是对于20-bit（从0开始数）的特殊处理(也就是对第21根地址线的处理)。如果A20Gate被禁止，对于80286来说，其地址为24bit，其地址表示为EFFFFF；对于80386极其随后的32-bit芯片来说，其地址表示为FFEFFFFF。这种表示的意思是如果A20Gate被禁止，则其第20-bit在CPU做地址访问的时候是无效的，永远只能被作为0；如果A20 Gate被打开，则其第20-bit是有效的，其值既可以是0，又可以是1。

所以，在保护模式下，如果A20Gate被禁止，则可以访问的内存只能是奇数1M段，即1M,3M,5M…，也就是00000-FFFFF,200000-2FFFFF,300000-3FFFFF…。如果A20 Gate被打开，则可以访问的内存则是连续的。

How to Enable A20Gate

多数PC都使用键盘控制器（8042芯片）来处理A20Gate。

从理论上讲，打开A20Gate的方法是通过设置8042芯片输出端口（64h）的2nd-bit，但事实上，当你向8042芯片输出端口进行写操作的时候，在键盘缓冲区中，或许还有别的数据尚未处理，因此你必须首先处理这些数据。

流程如下：
　1. 禁止中断；
　2. 等待，直到8042 Inputbuffer为空为止；
　3. 发送禁止键盘操作命令到8042Input buffer；
　4. 等待，直到8042 Inputbuffer为空为止；
　5. 发送读取8042 OutputPort命令；
　6. 等待，直到8042 Outputbuffer有数据为止；
　7. 读取8042 Outputbuffer，并保存得到的字节；
　8. 等待，直到8042 Inputbuffer为空为止；
　9. 发送Write 8042Output Port命令到8042 Input buffer；
　10. 等待，直到8042 Inputbuffer为空为止；
　11. 将从8042 OutputPort得到的字节的第2位置1（OR 2），然后写入8042 Input buffer；
　12. 等待，直到8042 Inputbuffer为空为止；
　13. 发送允许键盘操作命令到8042Input buffer；
　14. 打开中断。

下面代码是一个相关实现：

enable_a20:
sti
callwait_input_empty
movb $0xAD, %al
outb $0x64 #disableKeyboard
callwait_input_empty
movb $0xD0, %al
outb $0x64 #command-read 8042 output port
callwait_output_full
inb $0x60 # got thevalue of 8042 output port and save it
pushb %al
callwait_input_empty
movb $0xD1, %al
outb $0x64 #command-write 8042 output port
callwait_input_empty
popb %al
orb $0x02, %al #enable A20 Gate
outb $0x60
callwait_input_empty
movb $0xAE, %al
outb $0x64 #enableKeyboard
cli
ret
wait_input_empty:
rp1: inb $0x64
testb %al, 0x02
jnz rp1
ret
wait_output_full:
rp2: inb $0x64
testb %al, 0x01
jz rp2
ret

以上描述的是一种和IBMPC完全兼容的，通过键盘控制器控制A20 Gate的方法。但是，正象我们在前面所提到的，A20 Gate与键盘操作完全没有关系，IBM之所以将A20Gate的功能控制放在键盘控制器上，完全是一种为了弥补Intel 80286与Intel8086/8088不完全兼容的缺陷，而采取的Hacker行为，所以在许多新型PC上存在着一种通过芯片来直接控制A20 Gate的BIOS功能，我们在RealMode下只需要调用BIOS中断就可以实现A20 Gate的控制功能。
这个BIOS中断为 INT 15h, AX=2401h。被称为Fast A20。
movw $0x2401, %ax
int $0x15

How to Detect ifA20 Gate has been Enabled?
我们在之前已经提到，如果A20Gate被打开了，则在实模式下，程序员可以直接访问100000H~10FFEFH之间的内存，如果A20Gate被禁止，则在实模式下，若程序员访问100000H~10FFEFH之间的内存，则会被硬件自动转换为0H~0FFEFH之间的内存，所以我们可以利用这个差异来检测A20Gate是否被打开。

# This routine testswhether or not A20 is enabled. If so, it
# exits with zf = 0.
# The memory addressused, 0x200, is the int $0x80 vector, which
# should be safe.
A20_TEST_ADDR =4*0x80
A20_TEST_LOOPS = 3
a20_test:
pushw %cx
pushw %ax
xorw %cx, %cx
movw %cx, %fs # Lowmemory
decw %cx
movw %cx, %gs # Highmemory area
movw$A20_TEST_LOOPS, %cx
movw%fs:(A20_TEST_ADDR), %ax
pushw %ax
a20_test_wait:
incw %ax
movw %ax,%fs:(A20_TEST_ADDR)
call delay #Serialize and make delay constant
cmpw%gs:(A20_TEST_ADDR+0x10), %ax
loope a20_test_wait
popw%fs:(A20_TEST_ADDR)
popw %ax
popw %cx
ret 
delay:
outb %al,$0x80
ret