提交 a0694a30 创建 作者: 赵鹏翀's avatar 赵鹏翀

Initial commit

上级
/*.img
/bochs
/Debug
/Release
*.o
*.lst
\ No newline at end of file
用于完成Linux内核的实验
\ No newline at end of file
; bootsect.s (C) 1991 Linus Torvalds
;
;
; bootsect.s 被bios-启动子程序加载至 0x7c00 (31k)处,并将自己移到了地
; 址0x90000 (576k)处,并跳转至那里。
;
; 它然后使用BIOS 中断将'setup'直接加载到自己的后面(0x90200)(576.5k),
; 并将system 加载到地址0x10000 处。
;
; 注意! 目前的内核系统最大长度限制为(8*65536)(512k)字节,即使是在将来这也应该
; 没有问题的。我想让它保持简单明了。这样512k 的最大内核长度应该足够了,
; 尤其是这里没有象 minix 中一样包含缓冲区高速缓冲。
;
; 加载程序已经做的够简单了,所以持续的读出错将导致死循环。只能手工重启。只要可能,
; 通过一次取取所有的扇区,加载过程可以做的很快的。
;
SYSSIZE equ 0x3000 ; SYS_SIZE 是要加载的节数(16 字节为1 节)。0x3000 共为0x30000 字节=
; 192 kB,对于当前的版本空间已足够了。
SETUPLEN equ 4 ; setup 程序的扇区数
BOOTSEG equ 0x07c0 ; bootsect 的原始地址(是段地址,以下同)
INITSEG equ 0x9000 ; 将bootsect 移到这里
SETUPSEG equ 0x9020 ; setup 程序从这里开始
SYSSEG equ 0x1000 ; system 模块加载到0x10000(64 kB)处
ENDSEG equ SYSSEG + SYSSIZE ; 停止加载的段地址
; 根文件系统设备使用与引导时同样的软驱设备;
ROOT_DEV equ 0x301
[section .s16]
[BITS 16]
_start:
mov ax,BOOTSEG ; 将ds 段寄存器置为0x7C0
mov ds,ax
mov ax,INITSEG ; 将es 段寄存器置为0x9000
mov es,ax
mov cx,256 ; 移动计数值=256 字
sub si,si
sub di,di
rep
movsw
jmp INITSEG:go ;间接跳转。这里INITSEG 指出跳转到的段地址
; 从下面开始,CPU移动到0x90000 位置处的代码中执行。这段代码设置几个段寄存器,
; 包括栈寄存器ss 和sp。栈指针sp 只要指向远大于512 字节偏移(即地址 0x90200)
; 处都可以。 因为从0x90200 地址开始处还要放置setup 程序,而此时setup 程序大约
; 为4个扇区,因此sp 要指向大于(0x200 + 0x200 * 4 + 堆栈大小)处。实际上BIOS
; 把引导扇区加载到0x7c00 处并把执行权交给引导程序,ss = 0x00,sp = 0xfffe。
go: mov ax,cs
mov ds,ax
mov es,ax
mov ss,ax
mov sp,0xFF00 ; 将堆栈指针sp 指向0x9ff00(即0x9000:0xff00)处
;
; 在 bootsect 程序块后紧跟着加载 setup模块的代码数据
; 注意es 已经设置好了。(在移动代码时es 已经指向目的段地址处0x9000)
; 【标号一】的用途是利用BIOS 中断INT 0x13 将setup 模块从磁盘第2 个扇区
; 开始读到0x90200 开始处,共读4 个扇区。如果读出错,则复位驱动器,并
; 重试,没有退路。
;
; INT 0x13 的使用方法如下:读扇区:
; ah = 0x02 - 读磁盘扇区到内存;al = 需要读出的扇区数量;
; ch = 磁道(柱面)号的低8 位; cl = 开始扇区(0-5 位),磁道号高2 位(6-7);
; dh = 磁头号; dl = 驱动器号(如果是硬盘则要置位7);
; es:bx ->指向数据缓冲区; 如果出错则CF 标志置位。
load_setup:
mov dx,0x0000
mov cx,0x0002
mov bx,0x0200
mov ax,0x0200+SETUPLEN
int 0x13 ;【标号一】
jnc ok_load_setup ; 读取成功
mov dx,0x0000
mov ax,0x0000 ; 读取失败,重试
int 0x13
jmp load_setup
ok_load_setup:
; 取磁盘驱动器的参数,特别是每道的扇区数量。
;
; INT 0x13 调用格式和返回信息如下:
; ah = 0x08 dl = 驱动器号(如果是硬盘则要置位7 为1)。
; 返回信息:
; 如果出错则CF 置位,并且ah = 状态码。
; ah = 0, al = 0, bl = 驱动器类型(AT/PS2)
; ch = 最大磁道号的低8 位,cl = 每磁道最大扇区数(位0-5),最大磁道号高2 位(位6-7)
; dh = 最大磁头数, dl = 驱动器数量,
; es:di -> 软驱磁盘参数表。
mov dl,0x00
mov ax,0x0800
int 0x13
mov ch,0x00
; seg cs ; 本条语句可要,也可以不要,因为本程序的所有段都在同一个段中。
mov [sectors],cx ; 保存每磁道扇区数
mov ax,INITSEG ; 因为上面去磁盘参数以改变es 的值,故重新赋值
mov es,ax
mov ah,0x03
xor bh,bh
int 0x10 ; 读光标位置
mov cx,24
mov bx,0x0007
mov bp,msg1
mov ax,0x1301
int 0x10 ; 输出字符串
; 现在开始将system 模块加载到0x10000(64k)处
mov ax,SYSSEG
mov es,ax ; es = 存放system 的段地址
call read_it ; 读磁盘上system 模块,es 为输入参数
call kill_motor ; 关闭驱动器马达,这样就可以知道驱动器的状态了
; 此后,我们检查要使用哪个根文件系统设备(简称根设备)。如果已经指定了设备(!=0)
; 就直接使用给定的设备。否则就需要根据BIOS 报告的每磁道扇区数来
; 确定到底使用/dev/PS0 (2,28) 还是 /dev/at0 (2,8)。
; 上面一行中两个设备文件的含义:
; 在Linux 中软驱的主设备号是2,次设备号 = type*4 + nr,其中 nr 为0-3 分别对应
; 软驱A、B、C 或D;type 是软驱的类型(2->1.2M 或7->1.44M 等)。
; 因为7*4 + 0 = 28,所以 /dev/PS0 (2,28)指的是1.44M A 驱动器,其设备号是0x021c
; 同理 /dev/at0 (2,8)指的是1.2M A 驱动器,其设备号是0x0208。
; seg cs
mov ax,[root_dev] ; 去508,509字节处的根设备号并判断是否已被定义
cmp ax,0
jne root_defined
; seg cs
; 取上面保存的每磁道扇区数。如果sectors=15
; 则说明是1.2Mb 的驱动器;如果sectors=18,则说明是
; 1.44Mb 软驱。因为是可引导的驱动器,所以肯定是A 驱。
mov bx,[sectors]
mov ax,0x0208 ; /dev/ps0 - 1.2Mb
cmp bx,15
je root_defined ; 如果等于,则ax 中就是引导驱动器的设备号
mov ax,0x021c ; /dev/PS0 - 1.44Mb
cmp bx,18
je root_defined ; 如果都不一样,则死循环(死机)
undef_root:
jmp undef_root
root_defined:
; seg cs
mov [root_dev],ax ; 将检查过的设备号保存起来
;
; 到此,所有程序都加载完毕,我们就跳转到被加载在bootsect 后面的setup 程序去。
jmp SETUPSEG:0
; 该子程序将系统模块加载到内存地址0x10000 处,并确定没有跨越64KB 的内存
; 边界。我们试图尽快地进行加载,只要可能,就每次加载整条磁道的数据。
;
; 输入:es – 开始内存地址段值(通常是0x1000)
;
sread: dw 1+SETUPLEN ; 当前磁道中已读的扇区数
head: dw 0 ; 当前磁头号
track: dw 0 ; 当前磁道号
read_it:
; 测试输入的段值。必须位于内存地址64KB 边界处,否则进入死循环。清bx 寄存器,
; 用于表示当前段内存放数据的开始位置。
mov ax,es
test ax,0x0fff
die: jne die ; es 值必须位于64KB 地址边界
xor bx,bx ; bx 为段内偏移位置
rp_read:
mov ax,es
cmp ax,ENDSEG ; 是否已经加载了全部数据?
jb ok1_read
ret
ok1_read:
; 计算和验证当前磁道需要读取的扇区数,放在ax 寄存器中。
; 根据当前磁道还未读取的扇区数以及段内数据字节开始偏移位置,计算如果全部读取这些未读扇区,所
; 读总字节数是否会超过64KB 段长度的限制。若会超过,则根据此次最多能读入的字节数(64KB – 段内
; 偏移位置),反算出此次需要读取的扇区数。
mov ax,[sectors] ; 取每磁道扇区数
sub ax,[sread] ; 减去当前磁道已读扇区数
mov cx,ax
shl cx,9 ; cx = cx * 512 字节。
add cx,bx ; cx = cx + 段内当前偏移值(bx)
jnc ok2_read ; 若没有超过64KB 字节,则跳转至ok2_read 处执行
je ok2_read
xor ax,ax ; 若加上此次将读磁道上所有未读扇区时会超过64KB,则计算
sub ax,bx ; 此时最多能读入的字节数(64KB – 段内读偏移位置),再转换
shr ax,9 ; 成需要读取的扇区数
ok2_read:
call read_track
mov cx,ax ; cx = 该次操作已读取的扇区数
add ax,[sread] ; 当前磁道上已经读取的扇区数
; seg cs
cmp ax,[sectors]
jne ok3_read ; 如果当前磁道上的还有扇区未读,则跳转到ok3_read 处
mov ax,1
sub ax,[head]
jne ok4_read ; 如果是0 磁头,则再去读1 磁头面上的扇区数据
inc word [track] ; 否则去读下一磁道
ok4_read:
mov [head],ax ; 保存当前磁头号
xor ax,ax ; 清当前磁道已读扇区数
ok3_read:
mov [sread],ax ; 保存当前磁道已读扇区数
shl cx,9 ; 上次已读扇区数*512 字节
add bx,cx ; 调整当前段内数据开始位置
jnc rp_read ; 若小于64KB 边界值,则跳转到rp_read处,继续读数据。! 否则调整当前段,为读下一段数据作准备。
mov ax,es
add ax,0x1000 ; 将段基址调整为指向下一个64KB 段内存
mov es,ax
xor bx,bx
jmp rp_read ; 跳转至rp_read处,继续读数据
; 读当前磁道上指定开始扇区和需读扇区数的数据到es:bx 开始处。
; int 0x13,ah=2 的说明。
; al – 需读扇区数;es:bx – 缓冲区开始位置。
read_track:
push ax
push bx
push cx
push dx
mov dx,[track] ; 取当前磁道号
mov cx,[sread] ; 取当前磁道上已读扇区数
inc cx ; cl = 开始读扇区
mov ch,dl ; ch = 当前磁道号
mov dx,[head] ; 取当前磁头号
mov dh,dl ; dh = 磁头号
mov dl,0 ; dl = 驱动器号(为0 表示当前驱动器)
and dx,0x0100 ; 磁头号不大于1
mov ah,2 ; ah = 2,读磁盘扇区功能号
int 0x13
jc bad_rt ; 若出错,则跳转至bad_rt
pop dx
pop cx
pop bx
pop ax
ret
; 执行驱动器复位操作
bad_rt: mov ax,0
mov dx,0
int 0x13
pop dx
pop cx
pop bx
pop ax
jmp read_track
; 这个子程序用于关闭软驱的马达,这样我们进入内核后它处于已知状态,以后也就无须担心它了
kill_motor:
push dx
mov dx,0x3f2
mov al,0
out dx,ax
pop dx
ret
sectors:
dw 0
msg1:
db 13,10
db "Loading system ..."
db 13,10,13,10
times 508-($-$$) db 0
root_dev:
dw ROOT_DEV
boot_flag:
dw 0xAA55
/*
* linux/boot/head.s
*
* (C) 1991 Linus Torvalds
*/
/*
* head.s contains the 32-bit startup code.
*
* NOTE!!! Startup happens at absolute address 0x00000000, which is also where
* the page directory will exist. The startup code will be overwritten by
* the page directory.
*/
/*
* head.s 含有32 位启动代码。
* 注意!!! 32 位启动代码是从绝对地址0x00000000 开始的,这里也同样是页目录将存在
* 的地方,因此这里的启动代码将被页目录覆盖掉。
*/
.text
.globl _idt,_gdt,_pg_dir,_tmp_floppy_area
_pg_dir: # 页目录将会存放在这里
.globl startup_11
startup_11: # 对于GNU 汇编来说,每个直接数要以'$'开始,否则是表示地址。
movl $0x10,%eax # 再次注意!!! 这里已经处于32 位运行模式,因此这里的$0x10 并不是把地址0x10 装入各个
# 段寄存器,它现在其实是全局段描述符表中的偏移值,或者更正确地说是一个描述符表项
# 的选择符。有关选择符的说明请参见setup.s 中的说明。这里$0x10 的含义是请求
# 特权级0(位0-1=0)、选择全局描述符表(位2=0)、选择表中第2 项(位3-15=2)。下面代码的
# 含义是:置ds,es,fs,gs 中的选择符为setup.s 中构造的数据段(全局段描述符表的第2 项)
# =0x10,并将堆栈放置在stack_start 指向的 user_stack 数组内,然后使用新的中断描述
# 符表和全局段描述表.新的全局段描述表中初始内容与setup.s 中的基本一样。仅将段限长
# 从 8MB 修改为 16MB。
mov %ax,%ds
mov %ax,%es
mov %ax,%fs
mov %ax,%gs
lss _stack_start,%esp # 表示_stack_start->ss:esp,设置系统堆栈。stack_start 定义在kernel/sched.c
call _setup_idt # 调用设置中断描述符表子程序。
call _setup_gdt # 调用设置全局描述符表子程序。
movl $0x10,%eax # reload all the segment registers
mov %ax,%ds # after changing gdt. CS was already
mov %ax,%es # reloaded in 'setup_gdt'
mov %ax,%fs # 因为修改了gdt,所以需要重新装载所有的段寄存器。
mov %ax,%gs # CS 代码段寄存器已经在setup_gdt 中重新加载过了。
lss _stack_start,%esp
# 下面用于测试A20 地址线是否已经开启。采用的方法是向内存地址0x000000 处写入任意
# 一个数值,然后看内存地址0x100000(1M)处是否也是这个数值。如果一直相同的话,就一直
# 比较下去,也即死循环、死机。表示地址A20 线没有选通,结果内核就不能使用1M 以上内存。
xorl %eax,%eax
1: incl %eax # check that A20 really IS enabled
movl %eax,0x000000 # loop forever if it isn't
cmpl %eax,0x100000
je 1b # '1b'表示向后(backward)跳转到标号1 去
# 若是'5f'则表示向前(forward)跳转到标号5 去
/*
* NOTE! 486 should set bit 16, to check for write-protect in supervisor
* mode. Then it would be unnecessary with the "verify_area()"-calls.
* 486 users probably want to set the NE (#5) bit also, so as to use
* int 16 for math errors.
*/
/*
* 注意! 在下面这段程序中,486 应该将位16 置位,以检查在超级用户模式下的写保护,
* 此后"verify_area()"调用中就不需要了。486 的用户通常也会想将NE(#5)置位,以便
* 对数学协处理器的出错使用int 16。
*/
# 下面这段程序(43-65)用于检查数学协处理器芯片是否存在。方法是修改控制寄存器CR0,在
# 假设存在协处理器的情况下执行一个协处理器指令,如果出错的话则说明协处理器芯片不存在,
# 需要设置CR0 中的协处理器仿真位EM(位2),并复位协处理器存在标志MP(位1)。
movl %cr0,%eax # check math chip
andl $0x80000011,%eax # Save PG,PE,ET
/* "orl $0x10020,%eax" here for 486 might be good */
orl $2,%eax # set MP
movl %eax,%cr0
call check_x87
jmp after_page_tables
/*
* We depend on ET to be correct. This checks for 287/387.
*/
/*
* 我们依赖于ET 标志的正确性来检测287/387 存在与否。
*/
check_x87:
fninit
fstsw %ax
cmpb $0,%al
je 1f /* no coprocessor: have to set bits */
movl %cr0,%eax # 如果存在的则向前跳转到标号1 处,否则改写cr0。
xorl $6,%eax /* reset MP, set EM */
movl %eax,%cr0
ret
.align 2 # 这里".align 2"的含义是指存储边界对齐调整。"2"表示调整到地址最后2 位为零,
# 即按4 字节方式对齐内存地址。
1: .byte 0xDB,0xE4 /* fsetpm for 287, ignored by 387 */
ret
/*
* setup_idt
*
* sets up a idt with 256 entries pointing to
* ignore_int, interrupt gates. It then loads
* idt. Everything that wants to install itself
* in the idt-table may do so themselves. Interrupts
* are enabled elsewhere, when we can be relatively
* sure everything is ok. This routine will be over-
* written by the page tables.
*/
/*
* 下面这段是设置中断描述符表子程序 setup_idt
*
* 将中断描述符表idt 设置成具有256 个项,并都指向ignore_int 中断门。然后加载中断
* 描述符表寄存器(用lidt 指令)。真正实用的中断门以后再安装。当我们在其它地方认为一切
* 都正常时再开启中断。该子程序将会被页表覆盖掉。
*/
# 中断描述符表中的项虽然也是8 字节组成,但其格式与全局表中的不同,被称为门描述符
# (Gate Descriptor)。它的0-1,6-7 字节是偏移量,2-3 字节是选择符,4-5 字节是一些标志。
_setup_idt:
lea ignore_int,%edx # 将ignore_int 的有效地址(偏移值)值->edx 寄存器
movl $0x00080000,%eax # 将选择符0x0008 置入eax 的高16 位中。
movw %dx,%ax /* selector = 0x0008 = cs */
# 偏移值的低16 位置入eax 的低16 位中。此时eax 含有
#门描述符低4 字节的值。
movw $0x8E00,%dx /* interrupt gate - dpl=0, present */
lea _idt,%edi # _idt 是中断描述符表的地址。
mov $256,%ecx
rp_sidt:
movl %eax,(%edi) # 将哑中断门描述符存入表中。
movl %edx,4(%edi)
addl $8,%edi # edi 指向表中下一项。
dec %ecx
jne rp_sidt
lidt idt_descr # 加载中断描述符表寄存器值。
ret
/*
* setup_gdt
*
* This routines sets up a new gdt and loads it.
* Only two entries are currently built, the same
* ones that were built in init.s. The routine
* is VERY complicated at two whole lines, so this
* rather long comment is certainly needed :-).
* This routine will beoverwritten by the page tables.
*/
/*
* 设置全局描述符表项 setup_gdt
* 这个子程序设置一个新的全局描述符表gdt,并加载。此时仅创建了两个表项,与前
* 面的一样。该子程序只有两行,“非常的”复杂,所以当然需要这么长的注释了。
*/
_setup_gdt:
lgdt gdt_descr # 加载全局描述符表寄存器(内容已设置好)。
ret
/*
* I put the kernel page tables right after the page directory,
* using 4 of them to span 16 Mb of physical memory. People with
* more than 16MB will have to expand this.
*/
/* Linus 将内核的内存页表直接放在页目录之后,使用了4 个表来寻址16 Mb 的物理内存。
* 如果你有多于16 Mb 的内存,就需要在这里进行扩充修改。
*/
# 每个页表长为4 Kb 字节,而每个页表项需要4 个字节,因此一个页表共可以存放1000 个表项,
# 如果一个表项寻址4 Kb 的地址空间,则一个页表就可以寻址4 Mb 的物理内存。
# 页表项的格式为:项的前0-11 位存放一些标志,如是否在内存中(P 位0)、读写许可(R/W 位1)、
# 普通用户还是超级用户使用(U/S 位2)、是否修改过(是否脏了)(D 位6)等;表项的位12-31 是
# 页框地址,用于指出一页内存的物理起始地址。
.org 0x1000 # 从偏移0x1000 处开始是第1 个页表(偏移0 开始处将存放页表目录)。
pg0:
.org 0x2000
pg1:
.org 0x3000
pg2:
.org 0x4000
pg3:
.org 0x5000 # 定义下面的内存数据块从偏移0x5000 处开始。
/*
* tmp_floppy_area is used by the floppy-driver when DMA cannot
* reach to a buffer-block. It needs to be aligned, so that it isn't
* on a 64kB border.
*/
/* 当DMA(直接存储器访问)不能访问缓冲块时,下面的tmp_floppy_area 内存块
* 就可供软盘驱动程序使用。其地址需要对齐调整,这样就不会跨越64kB 边界。
*/
_tmp_floppy_area:
.fill 1024,1,0 # 共保留1024 项,每项1 字节,填充数值0。
# 下面这几个入栈操作(pushl)用于为调用/init/main.c 程序和返回作准备。
# 前面3 个入栈指令不知道作什么用的,也许是Linus 用于在调试时能看清机器码用的。
after_page_tables:
pushl $0 # These are the parameters to main :-)
pushl $0
pushl $0
pushl $L6 # return address for main, if it decides to.
pushl $_start
jmp setup_paging
L6:
jmp L6 # main should never return here, but
# just in case, we know what happens.
/* This is the default interrupt "handler" :-) */
/* 下面是默认的中断“向量句柄”*/
int_msg:
.asciz "Unknown interrupt\n\r" # 定义字符串“未知中断(回车换行)”。
.align 2
ignore_int:
pushl %eax
pushl %ecx
pushl %edx
# 这里请注意!!ds,es,fs,gs 等虽然是16 位的寄存器,但入栈后
# 仍然会以32 位的形式入栈,也即需要占用4 个字节的堆栈空间。
push %ds
push %es
push %fs
movl $0x10,%eax # 置段选择符(使ds,es,fs 指向gdt 表中的数据段)。
mov %ax,%ds
mov %ax,%es
mov %ax,%fs
pushl $int_msg # 把调用printk 函数的参数指针(地址)入栈。
# 注意!若符号int_msg前不加‘$’,则表示把int_msg符号处的长字'Unkn'入栈
call _printk # '_printk'是printk 编译后模块中的内部表示法。
popl %eax
pop %fs
pop %es
pop %ds
popl %edx
popl %ecx
popl %eax
iret # 中断返回(把中断调用时压入栈的CPU 标志寄存器(32 位)值也弹出)。
/*
* Setup_paging
*
* This routine sets up paging by setting the page bit
* in cr0. The page tables are set up, identity-mapping
* the first 16MB. The pager assumes that no illegal
* addresses are produced (ie >4Mb on a 4Mb machine).
*
* NOTE! Although all physical memory should be identity
* mapped by this routine, only the kernel page functions
* use the >1Mb addresses directly. All "normal" functions
* use just the lower 1Mb, or the local data space, which
* will be mapped to some other place - mm keeps track of
* that.
*
* For those with more memory than 16 Mb - tough luck. I've
* not got it, why should you :-) The source is here. Change
* it. (Seriously - it shouldn't be too difficult. Mostly
* change some constants etc. I left it at 16Mb, as my machine
* even cannot be extended past that (ok, but it was cheap :-)
* I've tried to show which constants to change by having
* some kind of marker at them (search for "16Mb"), but I
* won't guarantee that's all :-( )
*/
/*
* 这个子程序通过设置控制寄存器cr0 的标志(PG 位31)来启动对内存的分页处理功能,
* 并设置各个页表项的内容,以恒等映射前16 MB 的物理内存。分页器假定不会产生非法的
* 地址映射(也即在只有4Mb 的机器上设置出大于4Mb 的内存地址)。
*
* 注意!尽管所有的物理地址都应该由这个子程序进行恒等映射,但只有内核页面管理函数能
* 直接使用>1Mb 的地址。所有“一般”函数仅使用低于1Mb 的地址空间,或者是使用局部数据
* 空间,地址空间将被映射到其它一些地方去 -- mm(内存管理程序)会管理这些事的。
*
* 对于那些有多于16Mb 内存的家伙 - 太幸运了,我还没有,为什么你会有?。代码就在这里,
* 对它进行修改吧。(实际上,这并不太困难的。通常只需修改一些常数等。我把它设置为
* 16Mb,因为我的机器再怎么扩充甚至不能超过这个界限(当然,我的机器很便宜的?)。
* 我已经通过设置某类标志来给出需要改动的地方(搜索“16Mb”),但我不能保证作这些
* 改动就行了)。
*/
.align 2
setup_paging: # 首先对5 页内存(1 页目录 + 4 页页表)清零
movl $1024*5,%ecx /* 5 pages - pg_dir+4 page tables */
xorl %eax,%eax
xorl %edi,%edi /* pg_dir is at 0x000 */
# 页目录从0x000 地址开始。
cld;rep;stosl
# 下面4 句设置页目录中的项,我们共有4 个页表所以只需设置4 项。
# 页目录项的结构与页表中项的结构一样,4 个字节为1 项。参见上面的说明。
# "$pg0+7"表示:0x00001007,是页目录表中的第1 项。
# 则第1 个页表所在的地址 = 0x00001007 & 0xfffff000 = 0x1000;
# 第1 个页表的属性标志 = 0x00001007 & 0x00000fff = 0x07,表示该页存在、用户可读写。
movl $pg0+7,_pg_dir /* set present bit/user r/w */
movl $pg1+7,_pg_dir+4 /* --------- " " --------- */
movl $pg2+7,_pg_dir+8 /* --------- " " --------- */
movl $pg3+7,_pg_dir+12 /* --------- " " --------- */
# 下面6 行填写4 个页表中所有项的内容,共有:4(页表)*1024(项/页表)=4096 项(0 - 0xfff),
# 也即能映射物理内存 4096*4Kb = 16Mb。
# 每项的内容是:当前项所映射的物理内存地址 + 该页的标志(这里均为7)。
# 使用的方法是从最后一个页表的最后一项开始按倒退顺序填写。一个页表的最后一项在页表中的
# 位置是1023*4 = 4092。因此最后一页的最后一项的位置就是$pg3+4092。
movl $pg3+4092,%edi # edi->最后一页的最后一项。
movl $0xfff007,%eax /* 16Mb - 4096 + 7 (r/w user,p) */
# 最后1 项对应物理内存页面的地址是0xfff000,
# 加上属性标志7,即为0xfff007.
std # 方向位置位,edi 值递减(4 字节)。
1: stosl /* fill pages backwards - more efficient :-) */
subl $0x1000,%eax # 每填写好一项,物理地址值减0x1000。
jge 1b # 如果小于0 则说明全添写好了。
# 设置页目录基址寄存器cr3 的值,指向页目录表。
xorl %eax,%eax /* pg_dir is at 0x0000 */ # 页目录表在0x0000 处。
movl %eax,%cr3 /* cr3 - page directory start */
# 设置启动使用分页处理(cr0 的PG 标志,位31)
movl %cr0,%eax
orl $0x80000000,%eax # 添上PG 标志。
movl %eax,%cr0 /* set paging (PG) bit */
ret /* this also flushes prefetch-queue */
# 在改变分页处理标志后要求使用转移指令刷新预取指令队列,这里用的是返回指令ret。
# 该返回指令的另一个作用是将堆栈中的main 程序的地址弹出,并开始运行/init/main.c 程序。
# 本程序到此真正结束了。
.align 2 # 按4 字节方式对齐内存地址边界。
.word 0 # 这里空出2字节,这样后面的长字是4字节对齐的。
#下面两行是lidt 指令的6 字节操作数:长度,基址。
idt_descr:
.word 256*8-1 # idt contains 256 entries
.long _idt
.align 2
.word 0
# 下面两行是lgdt 指令的6 字节操作数:长度,基址。
gdt_descr:
.word 256*8-1 # so does gdt (not that that's any
.long _gdt # magic number, but it works for me :^)
.align 8
_idt: .fill 256,8,0 # idt is uninitialized # 256 项,每项8 字节,填0。
# 全局表。前4 项分别是空项(不用)、代码段描述符、数据段描述符、系统段描述符,其中
# 系统段描述符linux 没有派用处。后面还预留了252 项的空间,用于放置所创建任务的
# 局部描述符(LDT)和对应的任务状态段TSS 的描述符。
# (0-nul, 1-cs, 2-ds, 3-sys, 4-TSS0, 5-LDT0, 6-TSS1, 7-LDT1, 8-TSS2 etc...)
_gdt: .quad 0x0000000000000000 /* NULL descriptor */
.quad 0x00c09a0000000fff /* 16Mb */ # 代码段最大长度16M。
.quad 0x00c0920000000fff /* 16Mb */ # 数据段最大长度16M。
.quad 0x0000000000000000 /* TEMPORARY - don't use */
.fill 252,8,0 /* space for LDT's and TSS's etc */ # 预留空间
;
; setup.s (C) 1991 Linus Torvalds
;
; setup.s 负责从BIOS 中获取系统数据,并将这些数据放到系统内存的适当地方。
; 此时setup.s 和system 已经由bootsect 引导块加载到内存中。
;
; 这段代码询问bios 有关内存/磁盘/其它参数,并将这些参数放到一个
;“安全的”地方:0x90000-0x901FF,也即原来bootsect 代码块曾经在
; 的地方,然后在被缓冲块覆盖掉之前由保护模式的system 读取。
;
; 注意:以下这些参数最好和bootsect.s 中的相同!
INITSEG equ 0x9000
SYSSEG equ 0x1000
SETUPSEG equ 0x9020
start:
; BIOS 中断0x10 的读光标功能号 ah = 0x03
; 输入:bh = 页号
; 返回:ch = 扫描开始线,cl = 扫描结束线,
; dh = 行号(0x00 是顶端),dl = 列号(0x00 是左边)。
mov ax,INITSEG ; 将ds 置成#INITSEG(0x9000)。这已经在bootsect 程序中设置过,但是现在是setup 程序,Linus 觉得需要再重新设置一下。
mov ds,ax
mov ah,0x03
xor bh,bh
int 0x10
mov [0],dx ; 将光标位置信息存放在0x90000 处,控制台初始化时会来取。
; BIOS 中断0x15,功能号ah = 0x88
; 返回:ax = 从0x100000(1M)处开始的扩展内存大小(KB)。
; 若出错则CF 置位,ax = 出错码。
mov ah,0x88
int 0x15
mov [2],ax ; 将扩展内存数值存在0x90002 处(1 个字)
; 取显示卡当前显示模式
; 调用BIOS 中断0x10,功能号 ah = 0x0f
; 返回:ah = 字符列数,al = 显示模式,bh = 当前显示页。
mov ah,0x0f
int 0x10
mov [4],bx ; 0x90004(1 字)存放当前页
mov [6],ax ; 0x90006 显示模式,,0x90007 字符列数
; 检查显示方式(EGA/VGA)并取参数
; 调用BIOS 中断0x10
; 功能号:ah = 0x12,bl = 0x10
; 返回:bh = 显示状态
; (0x00 - 彩色模式,I/O 端口=0x3dX)
; (0x01 - 单色模式,I/O 端口=0x3bX)
; bl = 安装的显示内存
; (0x00 - 64k, 0x01 - 128k, 0x02 - 192k, 0x03 = 256k)
; cx = 显示卡特性参数
mov ah,0x12
mov bl,0x10
int 0x10
mov [8],ax ; 0x90008 = ??
mov [10],bx ; 0x9000A = 安装的显示内存,0x9000B = 显示状态(彩色/单色)
mov [12],cx ; 0x9000C = 显示卡特性参数
; 取第一个硬盘的信息(复制硬盘参数表)
; 第1 个硬盘参数表的首地址竟然是中断向量0x41 的向量值!而第2 个硬盘
; 参数表紧接第1 个表的后面,中断向量0x46 的向量值也指向这第2 个硬盘
; 的参数表首址。表的长度是16 个字节(0x10)。
; 下面两段程序分别复制BIOS 有关两个硬盘的参数表,0x90080 处存放第1 个
; 硬盘的表,0x90090 处存放第2 个硬盘的表。
mov ax,0x0000
mov ds,ax
lds si,[4*0x41] ; 取中断向量0x41 的值,也即hd0 参数表的地址->ds:si
mov ax,INITSEG
mov es,ax
mov di,0x0080 ; 传输的目的地址: 0x9000:0x0080 -> es:di
mov cx,0x10 ; 共传输0x10 字节
rep
movsb
; 取得第二个硬盘的信息
mov ax,0x0000
mov ds,ax
lds si,[4*0x46] ; 取中断向量0x46 的值,也即hd1 参数表的地址->ds:si
mov ax,INITSEG
mov es,ax
mov di,0x0090
mov cx,0x10
rep
movsb
; 检查系统是否存在第2 个硬盘,如果不存在则第2 个表清零
; 利用BIOS 中断调用0x13 的取盘类型功能
; 功能号 ah = 0x15;
; 输入:dl = 驱动器号(0x8X 是硬盘:0x80 指第1 个硬盘,0x81 第2 个硬盘)
; 输出:ah = 类型码;00 --没有这个盘,CF 置位; 01 --是软驱,没有change-line 支持;
; 02 --是软驱(或其它可移动设备),有change-line 支持; 03 --是硬盘。
mov ax,0x01500
mov dl,0x81
int 0x13
jc no_disk1
cmp ah,3 ; 是硬盘吗?(类型= 3 ?)
je is_disk1
no_disk1:
mov ax,INITSEG ; 第2 个硬盘不存在,则对第2 个硬盘表清零。
mov es,ax
mov di,0x0090
mov cx,0x10
mov ax,0x00
rep
stosb
is_disk1:
; 从这里开始我们要进入保护模式了
cli ; 关中断
; 首先我们将system 模块移到正确的位置。
; bootsect 引导程序是将system 模块读入到从0x10000(64k)开始的位置。由于当时假设
; system 模块最大长度不会超过0x80000(512k),也即其末端不会超过内存地址0x90000,
; 所以bootsect 会将自己移动到0x90000 开始的地方,并把setup 加载到它的后面。
; 下面这段程序的用途是再把整个system 模块移动到0x00000 位置,即把从0x10000 到0x8ffff
; 的内存数据块(512k),整块地向内存低端移动了0x10000(64k)的位置。
mov ax,0x0000
cld
do_move:
mov es,ax ; es:di 是目的地址(初始为0x0000:0x0)
add ax,0x1000 ; 从0x1000 开始的64K开始移动
cmp ax,0x9000
jz end_move ; 已经把从0x8000 段开始的64k 代码移动完
mov ds,ax
sub di,di
sub si,si
mov cx,0x8000 ; 移动 64K 字节
rep
movsw
jmp do_move
; 此后,我们加载段描述符
;
; 从这里开始会遇到32 位保护模式的操作,因此需要Intel 32 位保护模式编程方面的知识了,
; 有关这方面的信息请查阅列表后的简单介绍或附录中的详细说明。这里仅作概要说明。
;
; lidt 指令用于加载中断描述符表(idt)寄存器,它的操作数是6 个字节,0-1 字节是描述符表的
; 长度值(字节);2-5 字节是描述符表的32 位线性基地址(首地址),其形式参见下面的说明。
; 中断描述符表中的每一个表项(8 字节)指出发生中断时
; 需要调用的代码的信息,与中断向量有些相似,但要包含更多的信息。
;
; lgdt 指令用于加载全局描述符表(gdt)寄存器,其操作数格式与lidt 指令的相同。全局描述符
; 表中的每个描述符项(8 字节)描述了保护模式下数据和代码段(块)的信息。其中包括段的
; 最大长度限制(16 位)、段的线性基址(32 位)、段的特权级、段是否在内存、读写许可以及
; 其它一些保护模式运行的标志.
end_move:
mov ax,SETUPSEG
mov ds,ax ; ds 指向本程序(setup)段
lidt [idt_48] ; 加载中断描述符表(idt)寄存器,idt_48 是6 字节操作数的位置. 前2 字节表示idt 表的限长,后4 字节表示idt 表! 所处的基地址。
lgdt [gdt_48] ; 加载全局描述符表(gdt)寄存器,gdt_48 是6 字节操作数的位置
; 上面的操作完成后, 我们将开启A20 地址线
call empty_8042 ; 等待输入缓冲器空, 只有当输入缓冲器为空时才可以对其进行写命令
mov al,0xD1 ; 0xD1 命令码-表示要写数据到8042 的P2 端口。
out 0x64,al ; P2 端口的位1 用于A20 线的选通。数据要写到0x60 口。
call empty_8042
mov al,0xDF ; 选通A20 地址线的参数
out 0x60,al
call empty_8042 ; 输入缓冲器为空,则表示A20 线已经选通
; 如果上面一切正常, 现在我们必须重新对中断进行编程
; 我们将它们放在正好处于intel 保留的硬件中断后面,在int 0x20-0x2F。
; 在那里它们不会引起冲突。不幸的是IBM 在原PC 机中搞糟了,以后也没有纠正过来。
; PC 机的bios 将中断放在了0x08-0x0f,这些中断也被用于内部硬件中断。
; 所以我们就必须重新对8259 中断控制器进行编程。
mov al,0x11 ; 0x11 表示初始化命令开始,是ICW1 命令字,表示边沿触发、多片8259 级连、最后要发送ICW4 命令字
out 0x20,al
dw 0x00eb,0x00eb ; 是jmp $+2, jmp $+2的机器码。 这两条指令的主要作用是延时,可以延时(14 - 20)个时钟周期
; 而NOP 的时钟周期是3个,若要达到相同的效果,则须写(5-7)次.
out 0xA0,al ; 再发送到8259A 从芯片
dw 0x00eb,0x00eb
mov al,0x20
out 0x21,al ; 送主芯片ICW2 命令字,起始中断号,要送奇地址
dw 0x00eb,0x00eb
mov al,0x28
out 0xA1,al ; 送从芯片ICW2 命令字,从芯片的起始中断号
dw 0x00eb,0x00eb
mov al,0x04 ; 送主芯片ICW3 命令字,主芯片的IR2 连从芯片INT
out 0x21,al
dw 0x00eb,0x00eb
mov al,0x02
out 0xA1,al ; 送从芯片ICW3 命令字,表示从芯片的INT 连到主芯! 片的IR2 引脚上
dw 0x00eb,0x00eb
mov al,0x01
out 0x21,al ; 送主芯片ICW4 命令字。8086 模式;普通EOI 方式,需发送指令来复位。初始化结束,芯片就绪。
dw 0x00eb,0x00eb
out 0xA1,al
dw 0x00eb,0x00eb
mov al,0xFF
out 0x21,al ; 屏蔽主芯片所有中断请求
dw 0x00eb,0x00eb
out 0xA1,al
; 这里设置进入32 位保护模式运行。首先加载机器状态字(lmsw - Load Machine Status Word),也称
; 控制寄存器CR0,其比特位0 置1 将导致CPU 工作在保护模式。
mov ax,0x0001 ; 保护模式比特位(PE)
lmsw ax ; 加载机器状态字
jmp 8:0 ; 跳转至cs 段8,偏移0 处
; 我们已经将system 模块移动到0x00000 开始的地方,所以这里的偏移地址是0。这里的段
; 值的8 已经是保护模式下的段选择符了,用于选择描述符表和描述符表项以及所要求的特权级。
; 段选择符长度为16 位(2 字节);位0-1 表示请求的特权级0-3,linux 操作系统只
; 用到两级:0 级(系统级)和3 级(用户级);位2 用于选择全局描述符表(0)还是局部描
; 述符表(1);位3-15 是描述符表项的索引,指出选择第几项描述符。所以段选择符
; 8(0b0000,0000,0000,1000)表示请求特权级0、使用全局描述符表中的第1 项,该项指出
; 代码的基地址是0,因此这里的跳转指令就会去执行system 中的代码。
; 下面这个子程序检查键盘命令队列是否为空。这里不使用超时方法 - 如果这里死机,
; 则说明PC 机有问题,我们就没有办法再处理下去了。
; 只有当输入缓冲器为空时(状态寄存器位2 = 0)才可以对其进行写命令。
empty_8042:
dw 0x00eb,0x00eb ; 延时操作
in al,0x64 ; 读AT 键盘控制器状态寄存器
test al,2 ; 测试位2,输入缓冲器满?
jnz empty_8042
ret
; 全局描述符表开始处。描述符表由多个8 字节长的描述符项组成。这里给出了3 个描述符项。第1 项无用,但须存在。第2 项是系统代码段
; 描述符,第3 项是系统数据段描述符。每个描述符的具体含义参见列表后说明。
gdt:
dw 0,0,0,0 ; 第1 个描述符,不用
; 这里在gdt 表中的偏移量为0x08,当加载代码段寄存器(段选择符)时,使用的是这个偏移值。
dw 0x07FF ; 8Mb - limit=2047 (2048*4096=8Mb)
dw 0x0000 ; base address=0
dw 0x9A00 ; 代码段为只读, 可执行
dw 0x00C0 ; 颗粒度为 4096,32 位模式
; 这里在gdt 表中的偏移量是0x10,当加载数据段寄存器(如ds 等)时,使用的是这个偏移值。
DATA_DESCRIPTOR:
dw 0x07FF ; 8Mb - limit=2047 (2048*4096=8Mb)
dw 0x0000 ; base address=0
dw 0x9200 ; 代码段为只读, 可执行
dw 0x00C0 ; 颗粒度为 4096,32 位模式
; 下面是加载中断描述符寄存器 idtr 的指令 lidt要求的6字节操作数。前2字节是gdt表的限长,
; 后4字节是idt 表的线性基地址。这里全局表长度设置为2KB(0x7ff即可),因为每8字节组成
; 一个段描述符项,所以表中共可以有256项。
idt_48:
dw 0 ; idt limit=0
dw 0,0 ; idt base=0L
gdt_48:
dw 0x800 ; gdt limit=2048, 256 GDT entries
dw 512+gdt,0x9 ; gdt base = 0X9xxxx
/*
* linux/fs/bitmap.c
*
* (C) 1991 Linus Torvalds
*/
/* bitmap.c contains the code that handles the inode and block bitmaps */
/* bitmap.c 程序含有处理 i 节点和磁盘块位图的代码 */
#include <string.h> // 字符串头文件。主要定义了一些有关字符串操作的嵌入函数。
// 主要使用了其中的memset()函数。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
//// 将指定地址(addr)处的一块内存清零。嵌入汇编程序宏。
// 输入:eax = 0,ecx = 数据块大小BLOCK_SIZE/4,edi = addr。
#define clear_block(addr) \
__asm__ __volatile__ ("cld\n\t" \
"rep\n\t" \
"stosl" \
::"a" (0),"c" (BLOCK_SIZE/4),"D" ((long) (addr)))
//// 置位指定地址开始的第nr 个位偏移处的比特位(nr 可以大于32!)。返回原比特位(0 或1)。
// 输入:%0 - eax(返回值),%1 - eax(0);%2 - nr,位偏移值;%3 - (addr),addr 的内容。
#define set_bit(nr,addr) ({\
register int res ; \
__asm__ __volatile__("btsl %2,%3\n\tsetb %%al": \
"=a" (res):"0" (0),"r" (nr),"m" (*(addr))); \
res;})
//// 复位指定地址开始的第nr 位偏移处的比特位。返回原比特位的反码(1 或0)。
// 输入:%0 - eax(返回值),%1 - eax(0);%2 - nr,位偏移值;%3 - (addr),addr 的内容。
#define clear_bit(nr,addr) ({\
register int res ; \
__asm__ __volatile__("btrl %2,%3\n\tsetnb %%al": \
"=a" (res):"0" (0),"r" (nr),"m" (*(addr))); \
res;})
//// 从addr 开始寻找第1 个0 值比特位。
// 输入:%0 - ecx(返回值);%1 - ecx(0);%2 - esi(addr)。
// 在addr 指定地址开始的位图中寻找第1 个是0 的比特位,并将其距离addr 的比特位偏移值返回。
#define find_first_zero(addr) ({ \
int __res; \
__asm__ __volatile__ ("cld\n" \
"1:\tlodsl\n\t" \
"notl %%eax\n\t" \
"bsfl %%eax,%%edx\n\t" \
"je 2f\n\t" \
"addl %%edx,%%ecx\n\t" \
"jmp 3f\n" \
"2:\taddl $32,%%ecx\n\t" \
"cmpl $8192,%%ecx\n\t" \
"jl 1b\n" \
"3:" \
:"=c" (__res):"c" (0),"S" (addr)); \
__res;})
//// 释放设备dev 上数据区中的逻辑块block。
// 复位指定逻辑块block 的逻辑块位图比特位。
// 参数:dev 是设备号,block 是逻辑块号(盘块号)。
void free_block(int dev, int block)
{
struct super_block * sb;
struct buffer_head * bh;
// 取指定设备dev 的超级块,如果指定设备不存在,则出错死机。
if (!(sb = get_super(dev)))
panic("trying to free block on nonexistent device");
// 若逻辑块号小于首个逻辑块号或者大于设备上总逻辑块数,则出错,死机。
if (block < sb->s_firstdatazone || block >= sb->s_nzones)
panic("trying to free block not in datazone");
// 从hash 表中寻找该块数据。若找到了则判断其有效性,并清已修改和更新标志,释放该数据块。
// 该段代码的主要用途是如果该逻辑块当前存在于高速缓冲中,就释放对应的缓冲块。
bh = get_hash_table(dev,block);
if (bh) {
if (bh->b_count != 1) {
printk("trying to free block (%04x:%d), count=%d\n",
dev,block,bh->b_count);
return;
}
bh->b_dirt=0; // 复位脏(已修改)标志位。
bh->b_uptodate=0; // 复位更新标志。
brelse(bh);
}
// 计算block 在数据区开始算起的数据逻辑块号(从1 开始计数)。然后对逻辑块(区块)位图进行操作,
// 复位对应的比特位。若对应比特位原来即是0,则出错,死机。
block -= sb->s_firstdatazone - 1 ;
if (clear_bit(block&8191,sb->s_zmap[block/8192]->b_data)) {
printk("block (%04x:%d) ",dev,block+sb->s_firstdatazone-1);
panic("free_block: bit already cleared");
}
// 置相应逻辑块位图所在缓冲区已修改标志。
sb->s_zmap[block/8192]->b_dirt = 1;
}
////向设备dev 申请一个逻辑块(盘块,区块)。返回逻辑块号(盘块号)。
// 置位指定逻辑块block 的逻辑块位图比特位。
int new_block(int dev)
{
struct buffer_head * bh;
struct super_block * sb;
int i,j;
// 从设备dev 取超级块,如果指定设备不存在,则出错死机。
if (!(sb = get_super(dev)))
panic("trying to get new block from nonexistant device");
// 扫描逻辑块位图,寻找首个0 比特位,寻找空闲逻辑块,获取放置该逻辑块的块号。
j = 8192;
for (i=0 ; i<8 ; i++)
if ((bh=sb->s_zmap[i]))
if ((j=find_first_zero(bh->b_data))<8192)
break;
// 如果全部扫描完还没找到(i>=8 或j>=8192)或者位图所在的缓冲块无效(bh=NULL)则 返回0,
// 退出(没有空闲逻辑块)。
if (i>=8 || !bh || j>=8192)
return 0;
// 设置新逻辑块对应逻辑块位图中的比特位,若对应比特位已经置位,则出错,死机。
if (set_bit(j,bh->b_data))
panic("new_block: bit already set");
// 置对应缓冲区块的已修改标志。如果新逻辑块大于该设备上的总逻辑块数,则说明指定逻辑块在
// 对应设备上不存在。申请失败,返回0,退出。
bh->b_dirt = 1;
j += i*8192 + sb->s_firstdatazone-1;
if (j >= sb->s_nzones)
return 0;
// 读取设备上的该新逻辑块数据(验证)。如果失败则死机。
if (!(bh=getblk(dev,j)))
panic("new_block: cannot get block");
// 新块的引用计数应为1。否则死机。
if (bh->b_count != 1)
panic("new block: count is != 1");
// 将该新逻辑块清零,并置位更新标志和已修改标志。然后释放对应缓冲区,返回逻辑块号。
clear_block(bh->b_data);
bh->b_uptodate = 1;
bh->b_dirt = 1;
brelse(bh);
return j;
}
//// 释放指定的i 节点。
// 复位对应i 节点位图比特位。
void free_inode(struct m_inode * inode)
{
struct super_block * sb;
struct buffer_head * bh;
// 如果i 节点指针=NULL,则退出。
if (!inode)
return;
// 如果i 节点上的设备号字段为0,说明该节点无用,则用0 清空对应i 节点所占内存区,并返回。
if (!inode->i_dev) {
memset(inode,0,sizeof(*inode));
return;
}
// 如果此i 节点还有其它程序引用,则不能释放,说明内核有问题,死机。
if (inode->i_count>1) {
printk("trying to free inode with count=%d\n",inode->i_count);
panic("free_inode");
}
// 如果文件目录项连接数不为0,则表示还有其它文件目录项在使用该节点,不应释放,而应该放回等。
if (inode->i_nlinks)
panic("trying to free inode with links");
// 取i 节点所在设备的超级块,测试设备是否存在。
if (!(sb = get_super(inode->i_dev)))
panic("trying to free inode on nonexistent device");
// 如果i 节点号=0 或大于该设备上i 节点总数,则出错(0 号i 节点保留没有使用)。
if (inode->i_num < 1 || inode->i_num > sb->s_ninodes)
panic("trying to free inode 0 or nonexistant inode");
// 如果该i 节点对应的节点位图不存在,则出错。
if (!(bh=sb->s_imap[inode->i_num>>13]))
panic("nonexistent imap in superblock");
// 复位i 节点对应的节点位图中的比特位,如果该比特位已经等于0,则出错。
if (clear_bit(inode->i_num&8191,bh->b_data))
printk("free_inode: bit already cleared.\n\r");
// 置i 节点位图所在缓冲区已修改标志,并清空该i 节点结构所占内存区。
bh->b_dirt = 1;
memset(inode,0,sizeof(*inode));
}
//// 为设备dev 建立一个新i 节点。返回该新i 节点的指针。
// 在内存i 节点表中获取一个空闲i 节点表项,并从i 节点位图中找一个空闲i 节点。
struct m_inode * new_inode(int dev)
{
struct m_inode * inode;
struct super_block * sb;
struct buffer_head * bh;
int i,j;
// 从内存i 节点表(inode_table)中获取一个空闲i 节点项(inode)。
if (!(inode=get_empty_inode()))
return NULL;
// 读取指定设备的超级块结构。
if (!(sb = get_super(dev)))
panic("new_inode with unknown device");
// 扫描i 节点位图,寻找首个0 比特位,寻找空闲节点,获取放置该i 节点的节点号。
j = 8192;
for (i=0 ; i<8 ; i++)
if ((bh=sb->s_imap[i]))
if ((j=find_first_zero(bh->b_data))<8192)
break;
// 如果全部扫描完还没找到,或者位图所在的缓冲块无效(bh=NULL)则 返回0,退出(没有空闲i 节点)。
if (!bh || j >= 8192 || j+i*8192 > sb->s_ninodes) {
iput(inode);
return NULL;
}
// 置位对应新i 节点的i 节点位图相应比特位,如果已经置位,则出错。
if (set_bit(j,bh->b_data))
panic("new_inode: bit already set");
// 置i 节点位图所在缓冲区已修改标志。
bh->b_dirt = 1;
// 初始化该i 节点结构。
inode->i_count = 1; // 引用计数。
inode->i_nlinks = 1; // 文件目录项链接数。
inode->i_dev = dev; // i 节点所在的设备号。
inode->i_uid = current->euid; // i 节点所属用户id。
inode->i_gid = current->egid; // 组id。
inode->i_dirt = 1; // 已修改标志置位。
inode->i_num = j + i * 8192; // 对应设备中的i 节点号。
inode->i_mtime = inode->i_atime = inode->i_ctime = CURRENT_TIME; // 设置时间。
return inode; // 返回该i 节点指针。
}
/*
* linux/fs/block_dev.c
*
* (C) 1991 Linus Torvalds
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。(Linus 从minix 中引进的)。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
//// 数据块写函数 - 向指定设备从给定偏移处写入指定长度字节数据。
// 参数:dev - 设备号;pos - 设备文件中偏移量指针;buf - 用户地址空间中缓冲区地址;
// count - 要传送的字节数。
// 对于内核来说,写操作是向高速缓冲区中写入数据,什么时候数据最终写入设备是由高速缓冲管理
// 程序决定并处理的。另外,因为设备是以块为单位进行读写的,因此对于写开始位置不处于块起始
// 处时,需要先将开始字节所在的整个块读出,然后将需要写的数据从写开始处填写满该块,再将完
// 整的一块数据写盘(即交由高速缓冲程序去处理)。
int block_write(int dev, long * pos, char * buf, int count)
{
// 由pos 地址换算成开始读写块的块序号block。并求出需读第1 字节在该块中的偏移位置offset。
int block = *pos >> BLOCK_SIZE_BITS; // pos所在文件数据块号
int offset = *pos & (BLOCK_SIZE-1); // pos在数据块中的偏移值
int chars;
int written = 0;
struct buffer_head * bh;
register char * p;
// 针对要写入的字节数count,循环执行以下操作,直到全部写入。
while (count > 0)
{
// 计算在该块中可写入的字节数。如果需要写入的字节数填不满一块,则只需写count 字节。
chars = BLOCK_SIZE - offset;
if (chars > count)
chars = count;
// 如果正好要写1 块数据,则直接申请1 块高速缓冲块,否则需要读入将被修改的数据块,并预读
// 下两块数据,然后将块号递增1。
if (chars == BLOCK_SIZE)
bh = getblk (dev, block); // buffer.c中实现
else
bh = breada (dev, block, block + 1, block + 2, -1);
block++;
// 如果缓冲块操作失败,则返回已写字节数,如果没有写入任何字节,则返回出错号(负数)。
if (!bh)
return written ? written : -EIO;
// p 指向读出数据块中开始写的位置。若最后写入的数据不足一块,则需从块开始填写(修改)所需
// 的字节,因此这里需置offset 为零。
p = offset + bh->b_data;
offset = 0;
// 将文件中偏移指针前移已写字节数。累加已写字节数chars。传送计数值减去此次已传送字节数。
*pos += chars;
written += chars; // 累计写入的字节数
count -= chars;
// 从用户缓冲区复制chars 字节到p 指向的高速缓冲区中开始写入的位置。
while (chars-- > 0)
*(p++) = get_fs_byte (buf++);
// 置该缓冲区块已修改标志,并释放该缓冲区(也即该缓冲区引用计数递减1)。
bh->b_dirt = 1;
brelse (bh);
}
return written;
}
//// 数据块读函数 - 从指定设备和位置读入指定字节数的数据到高速缓冲中。
int block_read(int dev, unsigned long * pos, char * buf, int count)
{
// 由pos 地址换算成开始读写块的块序号block。并求出需读第1 字节在该块中的偏移位置offset。
int block = *pos >> BLOCK_SIZE_BITS;
int offset = *pos & (BLOCK_SIZE-1);
int chars;
int read = 0;
struct buffer_head * bh;
register char * p;
// 针对要读入的字节数count,循环执行以下操作,直到全部读入。
while (count>0) {
// 计算在该块中需读入的字节数。如果需要读入的字节数不满一块,则只需读count 字节。
chars = BLOCK_SIZE-offset;
if (chars > count)
chars = count;
// 读入需要的数据块,并预读下两块数据,如果读操作出错,则返回已读字节数,如果没有读入任何
// 字节,则返回出错号。然后将块号递增1。
if (!(bh = breada(dev,block,block+1,block+2,-1)))
return read?read:-EIO;
block++;
// p 指向从设备读出数据块中需要读取的开始位置。若最后需要读取的数据不足一块,则需从块开始
// 读取所需的字节,因此这里需将offset 置零。
p = offset + bh->b_data;
offset = 0;
// 将文件中偏移指针前移已读出字节数chars。累加已读字节数。传送计数值减去此次已传送字节数。
*pos += chars;
read += chars;
count -= chars;
// 从高速缓冲区中p 指向的开始位置复制chars 字节数据到用户缓冲区,并释放该高速缓冲区。
while (chars-->0)
put_fs_byte(*(p++),buf++);
brelse(bh);
}
return read; // 返回已读取的字节数,正常退出。
}
/*
* linux/fs/buffer.c
*
* (C) 1991 Linus Torvalds
*/
/*
* 'buffer.c' implements the buffer-cache functions. Race-conditions have
* been avoided by NEVER letting a interrupt change a buffer (except for the
* data, of course), but instead letting the caller do it. NOTE! As interrupts
* can wake up a caller, some cli-sti sequences are needed to check for
* sleep-on-calls. These should be extremely quick, though (I hope).
*/
/*
* 'buffer.c'用于实现缓冲区高速缓存功能。通过不让中断过程改变缓冲区,而是让调用者
* 来执行,避免了竞争条件(当然除改变数据以外)。注意!由于中断可以唤醒一个调用者,
* 因此就需要开关中断指令(cli-sti)序列来检测等待调用返回。但需要非常地快(希望是这样)。
*/
/*
* NOTE! There is one discordant note here: checking floppies for
* disk change. This is where it fits best, I think, as it should
* invalidate changed floppy-disk-caches.
*/
/*
* 注意!这里有一个程序应不属于这里:检测软盘是否更换。但我想这里是
* 放置该程序最好的地方了,因为它需要使已更换软盘缓冲失效。
*/
#include <stdarg.h> // 标准参数头文件。以宏的形式定义变量参数列表。主要说明了-个
// 类型(va_list)和三个宏(va_start, va_arg 和va_end),用于
// vsprintf、vprintf、vfprintf 函数。
#include <linux/config.h> // 内核配置头文件。定义键盘语言和硬盘类型(HD_TYPE)可选项。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#include <asm/io.h> // io 头文件。定义硬件端口输入/输出宏汇编语句。
extern int end; // 由连接程序ld 生成,用于表明内核代码末端。
extern void put_super(int);
extern void invalidate_inodes(int);
struct buffer_head * start_buffer = (struct buffer_head *) &end;
struct buffer_head * hash_table[NR_HASH]; // NR_HASH = 307 项。
static struct buffer_head * free_list; // 空闲缓冲块链表头指针
static struct task_struct * buffer_wait = NULL; // 等待空闲缓冲块而睡眠的任务队列
int NR_BUFFERS = 0;
//// 等待指定缓冲区解锁。
static inline void wait_on_buffer(struct buffer_head * bh)
{
cli();
while (bh->b_lock)
sleep_on(&bh->b_wait); // 如果已被上锁,则进程进入睡眠,等待其解锁。
sti();
}
//// 系统调用。同步设备和内存高速缓冲中数据。
int sys_sync(void)
{
int i;
struct buffer_head * bh;
sync_inodes(); /* write out inodes into buffers *//*将i 节点写入高速缓冲 */
bh = start_buffer;
// 扫描所有高速缓冲区,对于已被修改的缓冲块产生写盘请求,将缓冲中数据与设备中同步。
for (i=0 ; i<NR_BUFFERS ; i++,bh++) {
wait_on_buffer(bh); // 等待缓冲区解锁(如果已上锁的话)。
if (bh->b_dirt)
ll_rw_block(WRITE,bh); // 产生写设备块请求。
}
return 0;
}
//// 对指定设备进行高速缓冲数据与设备上数据的同步操作。
int sync_dev(int dev)
{
int i;
struct buffer_head * bh;
bh = start_buffer;
for (i=0 ; i<NR_BUFFERS ; i++,bh++) {
if (bh->b_dev != dev) // 不是设备 dev 的缓冲块则继续
continue;
wait_on_buffer(bh);
if (bh->b_dev == dev && bh->b_dirt)
ll_rw_block(WRITE,bh);
}
sync_inodes(); // 将i 节点数据写入高速缓冲。
bh = start_buffer;
for (i=0 ; i<NR_BUFFERS ; i++,bh++) {
if (bh->b_dev != dev)
continue;
wait_on_buffer(bh);
if (bh->b_dev == dev && bh->b_dirt)
ll_rw_block(WRITE,bh);
}
return 0;
}
//// 使指定设备在高速缓冲区中的数据无效。
// 扫描高速缓冲中的所有缓冲块,对于指定设备的缓冲区,复位其有效(更新)标志和已修改标志。
void inline invalidate_buffers(int dev)
{
int i;
struct buffer_head * bh;
bh = start_buffer;
for (i=0 ; i<NR_BUFFERS ; i++,bh++) {
if (bh->b_dev != dev) // 如果不是指定设备的缓冲块,则
continue; // 继续扫描下一块。
wait_on_buffer(bh); // 等待该缓冲区解锁(如果已被上锁)
// 由于进程执行过睡眠等待,所以需要再判断一下缓冲区是否是指定设备的。
if (bh->b_dev == dev)
bh->b_uptodate = bh->b_dirt = 0;
}
}
/*
* This routine checks whether a floppy has been changed, and
* invalidates all buffer-cache-entries in that case. This
* is a relatively slow routine, so we have to try to minimize using
* it. Thus it is called only upon a 'mount' or 'open'. This
* is the best way of combining speed and utility, I think.
* People changing diskettes in the middle of an operation deserve
* to loose :-)
*
* NOTE! Although currently this is only for floppies, the idea is
* that any additional removable block-device will use this routine,
* and that mount/open needn't know that floppies/whatever are
* special.
*/
/*
* 该子程序检查一个软盘是否已经被更换,如果已经更换就使高速缓冲中与该软驱
* 对应的所有缓冲区无效。该子程序相对来说较慢,所以我们要尽量少使用它。
* 所以仅在执行'mount'或'open'时才调用它。我想这是将速度和实用性相结合的
* 最好方法。若在操作过程当中更换软盘,会导致数据的丢失,这是咎由自取。
*
* 注意!尽管目前该子程序仅用于软盘,以后任何可移动介质的块设备都将使用该
* 程序,mount/open 操作是不需要知道是否是软盘或其它什么特殊介质的。
*/
//// 检查磁盘是否更换,如果已更换就使对应高速缓冲区无效。
void check_disk_change(int dev)
{
int i;
// 是软盘设备吗?如果不是则退出。
if (MAJOR(dev) != 2)
return;
// 测试对应软盘是否已更换,如果没有则退出。
if (!floppy_change(dev & 0x03))
return;
// 软盘已经更换,所以释放对应设备的i 节点位图和逻辑块位图所占的高速缓冲区;并使该设备的
// i 节点和数据块信息所占的高速缓冲区无效。
for (i=0 ; i<NR_SUPER ; i++)
if (super_block[i].s_dev == dev)
put_super(super_block[i].s_dev);
invalidate_inodes(dev);
invalidate_buffers(dev);
}
// hash 函数和hash 表项的计算宏定义。
#define _hashfn(dev,block) (((unsigned)(dev^block))%NR_HASH)
#define hash(dev,block) hash_table[_hashfn(dev,block)]
//// 从hash 队列和空闲缓冲队列中移走指定的缓冲块。
static inline void remove_from_queues(struct buffer_head * bh)
{
/* remove from hash-queue */
/* 从hash 队列中移除缓冲块 */
if (bh->b_next)
bh->b_next->b_prev = bh->b_prev;
if (bh->b_prev)
bh->b_prev->b_next = bh->b_next;
// 如果该缓冲区是该队列的头一个块,则让hash 表的对应项指向本队列中的下一个缓冲区。
if (hash(bh->b_dev,bh->b_blocknr) == bh)
hash(bh->b_dev,bh->b_blocknr) = bh->b_next;
/* remove from free list */
/* 从空闲缓冲区表中移除缓冲块 */
if (!(bh->b_prev_free) || !(bh->b_next_free))
panic("Free block list corrupted");
bh->b_prev_free->b_next_free = bh->b_next_free;
bh->b_next_free->b_prev_free = bh->b_prev_free;
// 如果空闲链表头指向本缓冲区,则让其指向下一缓冲区。
if (free_list == bh)
free_list = bh->b_next_free;
}
//// 将指定缓冲区插入空闲链表尾并放入hash 队列中。
static inline void insert_into_queues(struct buffer_head * bh)
{
/* put at end of free list */
/* 放在空闲链表末尾处 */
bh->b_next_free = free_list;
bh->b_prev_free = free_list->b_prev_free;
free_list->b_prev_free->b_next_free = bh;
free_list->b_prev_free = bh;
/* put the buffer in new hash-queue if it has a device */
/* 如果该缓冲块对应一个设备,则将其插入新hash 队列中 */
bh->b_prev = NULL;
bh->b_next = NULL;
if (!bh->b_dev)
return;
bh->b_next = hash(bh->b_dev,bh->b_blocknr);
hash(bh->b_dev,bh->b_blocknr) = bh;
bh->b_next->b_prev = bh;
}
//// 在高速缓冲中寻找给定设备和指定块的缓冲区块。
// 如果找到则返回缓冲区块的指针,否则返回NULL。
static struct buffer_head * find_buffer(int dev, int block)
{
struct buffer_head * tmp;
// 搜索 hash 表,寻找指定设备号和块号的缓冲块
for (tmp = hash(dev,block) ; tmp != NULL ; tmp = tmp->b_next)
if (tmp->b_dev==dev && tmp->b_blocknr==block)
return tmp;
return NULL;
}
/*
* Why like this, I hear you say... The reason is race-conditions.
* As we don't lock buffers (unless we are readint them, that is),
* something might happen to it while we sleep (ie a read-error
* will force it bad). This shouldn't really happen currently, but
* the code is ready.
*/
/*
* 代码为什么会是这样子的?我听见你问... 原因是竞争条件。由于我们没有对
* 缓冲区上锁(除非我们正在读取它们中的数据),那么当我们(进程)睡眠时
* 缓冲区可能会发生一些问题(例如一个读错误将导致该缓冲区出错)。目前
* 这种情况实际上是不会发生的,但处理的代码已经准备好了。
*/
//// 利用 hash 表在高速缓冲区中寻找指定的缓冲块。若找到则对该缓冲块上锁并返回块头指针
struct buffer_head * get_hash_table(int dev, int block)
{
struct buffer_head * bh;
for (;;) {
// 在高速缓冲中寻找给定设备和指定块的缓冲区,如果没有找到则返回NULL,退出。
if (!(bh=find_buffer(dev,block)))
return NULL;
// 对该缓冲区增加引用计数,并等待该缓冲区解锁(如果已被上锁)。
bh->b_count++;
wait_on_buffer(bh);
// 由于经过了睡眠状态,因此有必要再验证该缓冲区块的正确性,并返回缓冲区头指针。
if (bh->b_dev == dev && bh->b_blocknr == block)
return bh;
// 如果该缓冲区所属的设备号或块号在睡眠时发生了改变,则撤消对它的引用计数,重新寻找。
bh->b_count--;
}
}
/*
* Ok, this is getblk, and it isn't very clear, again to hinder
* race-conditions. Most of the code is seldom used, (ie repeating),
* so it should be much more efficient than it looks.
*
* The algoritm is changed: hopefully better, and an elusive bug removed.
*/
/*
* OK,下面是getblk 函数,该函数的逻辑并不是很清晰,同样也是因为要考虑
* 竞争条件问题。其中大部分代码很少用到,(例如重复操作语句),因此它应该
* 比看上去的样子有效得多。
*
* 算法已经作了改变:希望能更好,而且一个难以琢磨的错误已经去除。
*/
// 下面宏定义用于同时判断缓冲区的修改标志和锁定标志,并且定义修改标志的权重要比锁定标志大。
#define BADNESS(bh) (((bh)->b_dirt<<1)+(bh)->b_lock)
//// 取高速缓冲中指定的缓冲区。
// 检查所指定的缓冲区是否已经在高速缓冲中,如果不在,就需要在高速缓冲中建立一个对应的新项。
// 返回相应缓冲区头指针。
struct buffer_head * getblk(int dev,int block)
{
struct buffer_head * tmp, * bh;
repeat:
// 搜索hash 表,如果指定块已经在高速缓冲中,则返回对应缓冲区头指针,退出。
if ((bh = get_hash_table(dev,block)))
return bh;
// 扫描空闲数据块链表,寻找空闲缓冲区。
// 首先让tmp 指向空闲链表的第一个空闲缓冲区头。
tmp = free_list;
do {
// 如果该缓冲区正被使用(引用计数不等于0),则继续扫描下一项。
if (tmp->b_count)
continue;
// 如果缓冲头指针bh 为空,或者tmp 所指缓冲头的标志(修改、锁定)权重小于bh 头标志的权重,
// 则让bh 指向该tmp 缓冲区头。如果该tmp 缓冲区头表明缓冲区既没有修改也没有锁定标志置位,
// 则说明已为指定设备上的块取得对应的高速缓冲区,则退出循环。
if (!bh || BADNESS(tmp)<BADNESS(bh)) {
bh = tmp;
if (!BADNESS(tmp))
break;
}
/* and repeat until we find something good *//* 重复操作直到找到适合的缓冲区 */
} while ((tmp = tmp->b_next_free) != free_list);
// 如果所有缓冲区都正被使用(所有缓冲区的头部引用计数都>0),则睡眠,等待有空闲的缓冲区可用。
if (!bh) {
sleep_on(&buffer_wait);
goto repeat;
}
// 等待该缓冲区解锁(如果已被上锁的话)。
wait_on_buffer(bh);
// 如果该缓冲区又被其它任务使用的话,只好重复上述过程。
if (bh->b_count)
goto repeat;
// 如果该缓冲区已被修改,则将数据写盘,并再次等待缓冲区解锁。如果该缓冲区又被其它任务使用
// 的话,只好再重复上述过程。
while (bh->b_dirt) {
sync_dev(bh->b_dev);
wait_on_buffer(bh);
if (bh->b_count)
goto repeat;
}
/* NOTE!! While we slept waiting for this block, somebody else might */
/* already have added "this" block to the cache. check it */
/* 注意!!当进程为了等待该缓冲块而睡眠时,其它进程可能已经将该缓冲块 */
/* 加入进高速缓冲中,所以要对此进行检查。*/
// 在高速缓冲hash 表中检查指定设备和块的缓冲区是否已经被加入进去。如果是的话,就再次重复
// 上述过程。
if (find_buffer(dev,block))
goto repeat;
/* OK, FINALLY we know that this buffer is the only one of it's kind, */
/* and that it's unused (b_count=0), unlocked (b_lock=0), and clean */
/* OK,最终我们知道该缓冲区是指定参数的唯一一块,*/
/* 而且还没有被使用(b_count=0),未被上锁(b_lock=0),并且是干净的(未被修改的)*/
// 于是让我们占用此缓冲区。置引用计数为1,复位修改标志和有效(更新)标志。
bh->b_count=1;
bh->b_dirt=0;
bh->b_uptodate=0;
// 从hash 队列和空闲块链表中移出该缓冲区头,让该缓冲区用于指定设备和其上的指定块。
remove_from_queues(bh);
bh->b_dev=dev;
bh->b_blocknr=block;
// 然后根据此新的设备号和块号重新插入空闲链表和hash 队列新位置处。并最终返回缓冲头指针。
insert_into_queues(bh);
return bh;
}
//// 释放指定的缓冲区。
// 等待该缓冲区解锁。引用计数递减1。唤醒等待空闲缓冲区的进程。
void brelse(struct buffer_head * buf)
{
if (!buf) // 如果缓冲头指针无效则返回。
return;
wait_on_buffer(buf);
if (!(buf->b_count--))
panic("Trying to free free buffer");
wake_up(&buffer_wait);
}
/*
* bread() reads a specified block and returns the buffer that contains
* it. It returns NULL if the block was unreadable.
*/
/*
* 从设备上读取指定的数据块并返回含有数据的缓冲区。如果指定的块不存在
* 则返回NULL。
*/
//// 从指定设备上读取指定的数据块。
struct buffer_head * bread(int dev,int block)
{
struct buffer_head * bh;
// 在高速缓冲中申请一块缓冲区。如果返回值是NULL 指针,表示内核出错,死机。
if (!(bh=getblk(dev,block)))
panic("bread: getblk returned NULL\n");
// 如果该缓冲区中的数据是有效的(已更新的)可以直接使用,则返回。
if (bh->b_uptodate)
return bh;
// 否则调用ll_rw_block()函数,产生读设备块请求。并等待缓冲区解锁。
ll_rw_block(READ,bh);
wait_on_buffer(bh);
// 如果该缓冲区已更新,则返回缓冲区头指针,退出。
if (bh->b_uptodate)
return bh;
// 否则表明读设备操作失败,释放该缓冲区,返回NULL 指针,退出。
brelse(bh);
return NULL;
}
//// 复制内存块。
// 从from 地址复制一块数据到to 位置。
#define COPYBLK(from,to) \
__asm__("cld\n\t" \
"rep\n\t" \
"movsl\n\t" \
::"c" (BLOCK_SIZE/4),"S" (from),"D" (to) \
)
/*
* bread_page reads four buffers into memory at the desired address. It's
* a function of its own, as there is some speed to be got by reading them
* all at the same time, not waiting for one to be read, and then another
* etc.
*/
/*
* bread_page 一次读四个缓冲块内容读到内存指定的地址。它是一个完整的函数,
* 因为同时读取四块可以获得速度上的好处,不用等着读一块,再读一块了。
*/
//// 读设备上一个页面(4 个缓冲块)的内容到内存指定的地址。
void bread_page(unsigned long address,int dev,int b[4])
{
struct buffer_head * bh[4];
int i;
// 循环执行4 次,读一页内容。
for (i=0 ; i<4 ; i++)
if (b[i]) {
// 取高速缓冲中指定设备和块号的缓冲区,如果该缓冲区数据无效则产生读设备请求。
if ((bh[i] = getblk(dev,b[i])))
if (!bh[i]->b_uptodate)
ll_rw_block(READ,bh[i]);
} else
bh[i] = NULL;
// 将4 块缓冲区上的内容顺序复制到指定地址处。
for (i=0 ; i<4 ; i++,address += BLOCK_SIZE)
if (bh[i]) {
wait_on_buffer(bh[i]); // 等待缓冲区解锁(如果已被上锁的话)。
if (bh[i]->b_uptodate) // 如果该缓冲区中数据有效的话,则复制。
COPYBLK((unsigned long) bh[i]->b_data,address);
brelse(bh[i]); // 释放该缓冲区。
}
}
/*
* Ok, breada can be used as bread, but additionally to mark other
* blocks for reading as well. End the argument list with a negative
* number.
*/
/*
* OK,breada 可以象bread 一样使用,但会另外预读一些块。该函数参数列表
* 需要使用一个负数来表明参数列表的结束。
*/
//// 从指定设备读取指定的一些块。
// 成功时返回第1 块的缓冲区头指针,否则返回NULL。
struct buffer_head * breada(int dev,int first, ...)
{
va_list args;
struct buffer_head * bh, *tmp;
// 取可变参数表中第1 个参数(块号)。
va_start(args,first);
// 取高速缓冲中指定设备和块号的缓冲区。如果该缓冲区数据无效,则发出读设备数据块请求。
if (!(bh=getblk(dev,first)))
panic("bread: getblk returned NULL\n");
if (!bh->b_uptodate)
ll_rw_block(READ,bh);
// 然后顺序取可变参数表中其它预读块号,并作与上面同样处理,但不引用。
while ((first=va_arg(args,int))>=0) {
tmp=getblk(dev,first);
if (tmp) {
if (!tmp->b_uptodate)
ll_rw_block(READA,bh);
tmp->b_count--;
}
}
// 可变参数表中所有参数处理完毕。等待第1 个缓冲区解锁(如果已被上锁)。
va_end(args);
wait_on_buffer(bh);
// 如果缓冲区中数据有效,则返回缓冲区头指针,退出。否则释放该缓冲区,返回NULL,退出。
if (bh->b_uptodate)
return bh;
brelse(bh);
return (NULL);
}
//// 缓冲区初始化函数。
// 参数buffer_end 是指定的缓冲区内存的末端。对于系统有16MB 内存,则缓冲区末端设置为4MB。
// 对于系统有8MB 内存,缓冲区末端设置为2MB。
void buffer_init(long buffer_end)
{
struct buffer_head * h = start_buffer;
void * b;
int i;
// 如果缓冲区高端等于1Mb,则由于从640KB-1MB 被显示内存和BIOS 占用,因此实际可用缓冲区内存
// 高端应该是640KB。否则内存高端一定大于1MB。
if (buffer_end == 1<<20)
b = (void *) (640*1024);
else
b = (void *) buffer_end;
// 这段代码用于初始化缓冲区,建立空闲缓冲区环链表,并获取系统中缓冲块的数目。
// 操作的过程是从缓冲区高端开始划分1K 大小的缓冲块,与此同时在缓冲区低端建立描述该缓冲块
// 的结构buffer_head,并将这些buffer_head 组成双向链表。
// h 是指向缓冲头结构的指针,而h+1 是指向内存地址连续的下一个缓冲头地址,也可以说是指向h
// 缓冲头的末端外。为了保证有足够长度的内存来存储一个缓冲头结构,需要b 所指向的内存块
// 地址 >= h 缓冲头的末端,也即要>=h+1。
while ( (b -= BLOCK_SIZE) >= ((void *) (h+1)) ) {
h->b_dev = 0; // 使用该缓冲区的设备号。
h->b_dirt = 0; // 脏标志,也即缓冲区修改标志。
h->b_count = 0; // 该缓冲区引用计数。
h->b_lock = 0; // 缓冲区锁定标志。
h->b_uptodate = 0; // 缓冲区更新标志(或称数据有效标志)。
h->b_wait = NULL; // 指向等待该缓冲区解锁的进程。
h->b_next = NULL; // 指向具有相同hash 值的下一个缓冲头。
h->b_prev = NULL; // 指向具有相同hash 值的前一个缓冲头。
h->b_data = (char *) b; // 指向对应缓冲区数据块(1024 字节)。
h->b_prev_free = h - 1; // 指向链表中前一项。
h->b_next_free = h + 1; // 指向链表中下一项。
h++; // h 指向下一新缓冲头位置。
NR_BUFFERS++; // 缓冲区块数累加。
if (b == (void *) 0x100000) // 如果地址b 递减到等于1MB,则跳过384KB,
b = (void *) 0xA0000; // 让b 指向地址0xA0000(640KB)处。
}
h--; // 让h 指向最后一个有效缓冲头。
free_list = start_buffer; // 让空闲链表头指向头一个缓冲区头。
free_list->b_prev_free = h; // 链表头的b_prev_free 指向前一项(即最后一项)。
h->b_next_free = free_list; // h 的下一项指针指向第一项,形成一个环链。
// 初始化hash 表(哈希表、散列表),置表中所有的指针为NULL。
for (i = 0; i < NR_HASH; i++)
hash_table[i] = NULL;
}
/*
* linux/fs/char_dev.c
*
* (C) 1991 Linus Torvalds
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <asm/io.h> // io 头文件。定义硬件端口输入/输出宏汇编语句。
extern int tty_read(unsigned minor,char * buf,int count); // 终端读。
extern int tty_write(unsigned minor,char * buf,int count); // 终端写。
// 定义字符设备读写函数指针类型。
typedef int (*crw_ptr)(int rw,unsigned minor,char * buf,int count,off_t * pos);
//// 串口终端读写操作函数。
// 参数:rw - 读写命令;minor - 终端子设备号;buf - 缓冲区;cout - 读写字节数;
// pos - 读写操作当前指针,对于终端操作,该指针无用。
// 返回:实际读写的字节数。
static int rw_ttyx(int rw,unsigned minor,char * buf,int count,off_t * pos)
{
return ((rw==READ)?tty_read(minor,buf,count):
tty_write(minor,buf,count));
}
//// 终端读写操作函数。
// 同上rw_ttyx(),只是增加了对进程是否有控制终端的检测。
static int rw_tty(int rw,unsigned minor,char * buf,int count, off_t * pos)
{
// 若进程没有对应的控制终端,则返回出错号。
if (current->tty<0)
return -EPERM;
// 否则调用终端读写函数rw_ttyx(),并返回实际读写字节数。
return rw_ttyx(rw,current->tty,buf,count,pos);
}
//// 内存数据读写。未实现。
static int rw_ram(int rw,char * buf, int count, off_t *pos)
{
return -EIO;
}
//// 内存数据读写操作函数。未实现。
static int rw_mem(int rw,char * buf, int count, off_t * pos)
{
return -EIO;
}
//// 内核数据区读写函数。未实现。
static int rw_kmem(int rw,char * buf, int count, off_t * pos)
{
return -EIO;
}
// 端口读写操作函数。
// 参数:rw - 读写命令;buf - 缓冲区;cout - 读写字节数;pos - 端口地址。
// 返回:实际读写的字节数。
static int rw_port(int rw,char * buf, int count, off_t * pos)
{
int i=*pos;
// 对于所要求读写的字节数,并且端口地址小于64k 时,循环执行单个字节的读写操作。
while (count-->0 && i<65536) {
// 若是读命令,则从端口i 中读取一字节内容并放到用户缓冲区中。
if (rw==READ)
put_fs_byte(inb(i),buf++);
// 若是写命令,则从用户数据缓冲区中取一字节输出到端口i。
else
outb(get_fs_byte(buf++),i);
// 前移一个端口。
i++;
}
// 计算读/写的字节数,并相应调整读写指针。
i -= *pos;
*pos += i;
// 返回读/写的字节数。
return i;
}
//// 内存读写操作函数。
static int rw_memory(int rw, unsigned minor, char * buf, int count, off_t * pos)
{
// 根据内存设备子设备号,分别调用不同的内存读写函数。
switch(minor) {
case 0:
return rw_ram(rw,buf,count,pos);
case 1:
return rw_mem(rw,buf,count,pos);
case 2:
return rw_kmem(rw,buf,count,pos);
case 3:
return (rw==READ)?0:count; /* rw_null */
case 4:
return rw_port(rw,buf,count,pos);
default:
return -EIO;
}
}
// 定义系统中设备种数。
#define NRDEVS ((sizeof (crw_table))/(sizeof (crw_ptr)))
// 字符设备读写函数指针表。
static crw_ptr crw_table[]={
NULL, /* nodev */ /* 无设备(空设备) */
rw_memory, /* /dev/mem etc */ /* /dev/mem 等 */
NULL, /* /dev/fd */ /* /dev/fd 软驱 */
NULL, /* /dev/hd */ /* /dev/hd 硬盘 */
rw_ttyx, /* /dev/ttyx */ /* /dev/ttyx 串口终端 */
rw_tty, /* /dev/tty */ /* /dev/tty 终端 */
NULL, /* /dev/lp */ /* /dev/lp 打印机 */
NULL}; /* unnamed pipes */ /* 未命名管道 */
//// 字符设备读写操作函数。
// 参数:rw - 读写命令;dev - 设备号;buf - 缓冲区;count - 读写字节数;pos -读写指针。
// 返回:实际读/写字节数。
int rw_char(int rw,int dev, char * buf, int count, off_t * pos)
{
crw_ptr call_addr;
// 如果设备号超出系统设备数,则返回出错码。
if (MAJOR(dev)>=NRDEVS)
return -ENODEV;
// 若该设备没有对应的读/写函数,则返回出错码。
if (!(call_addr=crw_table[MAJOR(dev)]))
return -ENODEV;
// 调用对应设备的读写操作函数,并返回实际读/写的字节数。
return call_addr(rw,MINOR(dev),buf,count,pos);
}
/*
* linux/fs/exec.c
*
* (C) 1991 Linus Torvalds
*/
/*
* #!-checking implemented by tytso.
*/
/*
* #!开始的程序检测部分是由tytso 实现的。
*/
/*
* Demand-loading implemented 01.12.91 - no need to read anything but
* the header into memory. The inode of the executable is put into
* "current->executable", and page faults do the actual loading. Clean.
*
* Once more I can proudly say that linux stood up to being changed: it
* was less than 2 hours work to get demand-loading completely implemented.
*/
/*
* 需求时加载是于1991.12.1 实现的 - 只需将执行文件头部分读进内存而无须
* 将整个执行文件都加载进内存。执行文件的i 节点被放在当前进程的可执行字段中
* ("current->executable"),而页异常会进行执行文件的实际加载操作以及清理工作。
*
* 我可以再一次自豪地说,linux 经得起修改:只用了不到2 小时的工作时间就完全
* 实现了需求加载处理。
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <string.h> // 字符串头文件。主要定义了一些有关字符串操作的嵌入函数。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
#include <a.out.h> // a.out 头文件。定义了a.out 执行文件格式和一些宏。
#include <linux/fs.h> // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/mm.h> // 内存管理头文件。含有页面大小定义和一些页面释放函数原型。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
extern int sys_exit(int exit_code); // 程序退出系统调用
extern int sys_close(int fd); // 文件关闭系统调用
/*
* MAX_ARG_PAGES defines the number of pages allocated for arguments
* and envelope for the new program. 32 should suffice, this gives
* a maximum env+arg of 128kB !
*/
/*
* MAX_ARG_PAGES 定义了新程序分配给参数和环境变量使用的内存最大页数。
* 32 页内存应该足够了,这使得环境和参数(env+arg)空间的总合达到128kB!
*/
#define MAX_ARG_PAGES 32
int sys_uselib()
{
return -ENOSYS;
}
/*
* create_tables() parses the env- and arg-strings in new user
* memory and creates the pointer tables from them, and puts their
* addresses on the "stack", returning the new stack pointer value.
*/
/*
* create_tables()函数在新用户内存中解析环境变量和参数字符串,由此
* 创建指针表,并将它们的地址放到"堆栈"上,然后返回新栈的指针值。
*/
//// 在新用户堆栈中创建环境和参数变量指针表。
// 参数:p - 以数据段为起点的参数和环境信息偏移指针;argc - 参数个数;envc -环境变量数。
// 返回:堆栈指针。
static unsigned long * create_tables(char * p,int argc,int envc)
{
unsigned long *argv,*envp;
unsigned long * sp;
// 堆栈指针是以4 字节(1 节)为边界寻址的,因此这里让sp 为4 的整数倍。
sp = (unsigned long *) (0xfffffffc & (unsigned long) p);
// sp 向下移动,空出环境参数占用的空间个数,并让环境参数指针envp 指向该处。
sp -= envc+1;
envp = sp;
// sp 向下移动,空出命令行参数指针占用的空间个数,并让argv 指针指向该处。
// 下面指针加1,sp 将递增指针宽度字节值。
sp -= argc+1;
argv = sp;
// 将环境参数指针envp 和命令行参数指针以及命令行参数个数压入堆栈。
put_fs_long((unsigned long)envp,--sp);
put_fs_long((unsigned long)argv,--sp);
put_fs_long((unsigned long)argc,--sp);
// 将命令行各参数指针放入前面空出来的相应地方,最后放置一个NULL 指针。
while (argc-->0) {
put_fs_long((unsigned long) p,argv++);
while (get_fs_byte(p++)) /* nothing */ ;// p 指针前移4字节。即指向下一个参数串
}
put_fs_long(0,argv);
// 将环境变量各指针放入前面空出来的相应地方,最后放置一个NULL 指针。
while (envc-->0) {
put_fs_long((unsigned long) p,envp++);
while (get_fs_byte(p++)) /* nothing */ ;// 指向下一个环境串
}
put_fs_long(0,envp);
return sp; // 返回构造的当前新堆栈指针。
}
/*
* count() counts the number of arguments/envelopes
*/
/*
* count()函数计算命令行参数/环境变量的个数。
*/
//// 计算参数个数。
// 参数:argv - 参数指针数组,最后一个指针项是NULL。
// 返回:参数个数。
// 统计参数指针数组中指针的个数。关于函数参数传递指针的指针的作用,请参见程序
// kernel/sched.c中。
static int count(char ** argv)
{
int i=0;
char ** tmp;
if ((tmp = argv))
while (get_fs_long((unsigned long *) (tmp++)))
i++;
return i;
}
/*
* 'copy_string()' copies argument/envelope strings from user
* memory to free pages in kernel mem. These are in a format ready
* to be put directly into the top of new user memory.
*
* Modified by TYT, 11/24/91 to add the from_kmem argument, which specifies
* whether the string and the string array are from user or kernel segments:
*
* from_kmem argv * argv **
* 0 user space user space
* 1 kernel space user space
* 2 kernel space kernel space
*
* We do this by playing games with the fs segment register. Since it
* it is expensive to load a segment register, we try to avoid calling
* set_fs() unless we absolutely have to.
*/
/*
* 'copy_string()'函数从用户内存空间拷贝参数和环境字符串到内核空闲页面内存中。
* 这些已具有直接放到新用户内存中的格式。
*
* 由TYT(Tytso)于1991.12.24 日修改,增加了from_kmem 参数,该参数指明了字符串或
* 字符串数组是来自用户段还是内核段。
*
* from_kmem argv * argv **
* 0 用户空间 用户空间
* 1 内核空间 用户空间
* 2 内核空间 内核空间
*
* 我们是通过巧妙处理fs 段寄存器来操作的。由于加载一个段寄存器代价太大,所以
* 我们尽量避免调用set_fs(),除非实在必要。
*/
//// 复制指定个数的参数字符串到参数和环境空间。
// 参数:argc - 欲添加的参数个数;argv - 参数指针数组;page - 参数和环境空间页面指针数组。
// p -在参数表空间中的偏移指针,始终指向已复制串的头部;from_kmem - 字符串来源标志。
// 在do_execve()函数中,p 初始化为指向参数表(128kB)空间的最后一个长字处,参数字符串
// 是以堆栈操作方式逆向往其中复制存放的,因此p 指针会始终指向参数字符串的头部。
// 返回:参数和环境空间当前头部指针。
static unsigned long copy_strings(int argc,char ** argv,unsigned long *page,
unsigned long p, int from_kmem)
{
char *tmp, *pag=NULL;
int len, offset = 0;
unsigned long old_fs, new_fs;
if (!p)
return 0; /* bullet-proofing *//* 偏移指针验证 */
// 取ds 寄存器值到new_fs,并保存原fs 寄存器值到old_fs。
new_fs = get_ds();
old_fs = get_fs();
// 如果字符串和字符串数组来自内核空间,则设置fs 段寄存器指向内核数据段(ds)。
if (from_kmem==2)
set_fs(new_fs);
// 循环处理各个参数,从最后一个参数逆向开始复制,复制到指定偏移地址处。
while (argc-- > 0) {
// 如果字符串在用户空间而字符串数组在内核空间,则设置fs 段寄存器指向内核数据段(ds)。
if (from_kmem == 1)
set_fs(new_fs);
// 从最后一个参数开始逆向操作,取fs 段中最后一参数指针到tmp,如果为空,则出错死机。
if (!(tmp = (char *)get_fs_long(((unsigned long *)argv)+argc)))
panic("argc is wrong");
// 如果字符串在用户空间而字符串数组在内核空间,则恢复fs 段寄存器原值。
if (from_kmem == 1)
set_fs(old_fs);
// 计算该参数字符串长度len,并使tmp 指向该参数字符串末端。
len=0; /* remember zero-padding */
do { /* 我们知道串是以NULL 字节结尾的 */
len++;
} while (get_fs_byte(tmp++));
// 如果该字符串长度超过此时参数和环境空间中还剩余的空闲长度,则恢复fs 段寄存器并返回0。
if (p-len < 0) { /* this shouldn't happen - 128kB */
set_fs(old_fs); /* 不会发生-因为有128kB 的空间 */
return 0;
}
// 复制fs 段中当前指定的参数字符串,是从该字符串尾逆向开始复制。
while (len) {
--p; --tmp; --len;
// 函数刚开始执行时,偏移变量offset 被初始化为0,因此若offset-1<0,说明是首次复制字符串,
// 则令其等于p 指针在页面内的偏移值,并申请空闲页面。
if (--offset < 0) {
offset = p % PAGE_SIZE;
// 如果字符串和字符串数组在内核空间,则恢复fs 段寄存器原值。
if (from_kmem==2)
set_fs(old_fs);
// 如果当前偏移值p 所在的串空间页面指针数组项page[p/PAGE_SIZE]==0,表示相应页面还不存在,
// 则需申请新的内存空闲页面,将该页面指针填入指针数组,并且也使pag 指向该新页面,若申请不
// 到空闲页面则返回0。
if (!(pag = (char *) page[p/PAGE_SIZE]) &&
!(pag = (char *) (page[p/PAGE_SIZE] = get_free_page())))
return 0;
// 如果字符串和字符串数组来自内核空间,则设置fs 段寄存器指向内核数据段(ds)。
if (from_kmem==2)
set_fs(new_fs);
}
// 从fs 段中复制参数字符串中一字节到pag+offset 处。
*(pag + offset) = get_fs_byte(tmp);
}
}
// 如果字符串和字符串数组在内核空间,则恢复fs 段寄存器原值。
if (from_kmem==2)
set_fs(old_fs);
// 最后,返回参数和环境空间中已复制参数信息的头部偏移值。
return p;
}
//// 修改局部描述符表中的描述符基址和段限长,并将参数和环境空间页面放置在数据段末端。
// 参数:text_size - 执行文件头部中a_text 字段给出的代码段长度值;
// page - 参数和环境空间页面指针数组。
// 返回:数据段限长值(64MB)。
static unsigned long change_ldt(unsigned long text_size,unsigned long * page)
{
unsigned long code_limit,data_limit,code_base,data_base;
int i;
// 根据执行文件头部a_text 值,计算以页面长度为边界的代码段限长。并设置数据段长度为64MB。
code_limit = text_size+PAGE_SIZE -1;
code_limit &= 0xFFFFF000;
data_limit = 0x4000000;
// 取当前进程中局部描述符表代码段描述符中代码段基址,代码段基址与数据段基址相同。
code_base = get_base(current->ldt[1]);
data_base = code_base;
// 重新设置局部表中代码段和数据段描述符的基址和段限长。
set_base(current->ldt[1],code_base);
set_limit(current->ldt[1],code_limit);
set_base(current->ldt[2],data_base);
set_limit(current->ldt[2],data_limit);
/* make sure fs points to the NEW data segment */
/* 要确信fs 段寄存器已指向新的数据段 */
// fs 段寄存器中放入局部表数据段描述符的选择符(0x17)。
__asm__("pushl $0x17\n\tpop %%fs"::);
// 将参数和环境空间已存放数据的页面(共可有MAX_ARG_PAGES 页,128kB)放到数据段线性地址的
// 末端。是调用函数put_page()进行操作的(mm/memory.c)。
data_base += data_limit;
for (i=MAX_ARG_PAGES-1 ; i>=0 ; i--) {
data_base -= PAGE_SIZE;
if (page[i]) // 如果该页面存在,就放置该页面。
put_page(page[i],data_base);
}
return data_limit; // 最后返回数据段限长(64MB)。
}
/*
* 'do_execve()' executes a new program.
*/
/*
* 'do_execve()'函数执行一个新程序。
*/
//// execve()系统中断调用函数。加载并执行子进程(其它程序)。
// 该函数系统中断调用(int 0x80)功能号__NR_execve 调用的函数。
// 参数:eip - 指向堆栈中调用系统中断的程序代码指针eip 处,参见kernel/system_call.s 程序
// 开始部分的说明;tmp - 系统中断调用本函数时的返回地址,无用;
// filename - 被执行程序文件名;argv - 命令行参数指针数组;envp - 环境变量指针数组。
// 返回:如果调用成功,则不返回;否则设置出错号,并返回-1。
int do_execve(unsigned long * eip,long tmp,char * filename,
char ** argv, char ** envp)
{
struct m_inode * inode; // 内存中I 节点指针结构变量。
struct buffer_head * bh; // 高速缓存块头指针。
struct exec ex; // 执行文件头部数据结构变量。
unsigned long page[MAX_ARG_PAGES]; // 参数和环境字符串空间的页面指针数组。
int i,argc,envc;
int e_uid, e_gid; // 有效用户id 和有效组id。
int retval; // 返回值。
int sh_bang = 0; // 控制是否需要执行脚本处理代码。
// 参数和环境字符串空间中的偏移指针,初始化为指向该空间的最后一个长字处。
unsigned long p=PAGE_SIZE*MAX_ARG_PAGES-4;
// eip[1]中是原代码段寄存器cs,其中的选择符不可以是内核段选择符,也即内核不能调用本函数。
if ((0xffff & eip[1]) != 0x000f)
panic("execve called from supervisor mode");
// 初始化参数和环境串空间的页面指针数组(表)。
for (i=0 ; i<MAX_ARG_PAGES ; i++) /* clear page-table */
page[i]=0;
// 取可执行文件的对应i 节点号。
if (!(inode=namei(filename))) /* get executables inode */
return -ENOENT;
// 计算参数个数和环境变量个数。
argc = count(argv);
envc = count(envp);
// 执行文件必须是常规文件。若不是常规文件则置出错返回码,跳转到exec_error2。
restart_interp:
if (!S_ISREG(inode->i_mode)) { /* must be regular file */
retval = -EACCES;
goto exec_error2;
}
// 检查被执行文件的执行权限。根据其属性(对应i 节点的uid 和gid),看本进程是否有权执行它。
i = inode->i_mode;
e_uid = (i & S_ISUID) ? inode->i_uid : current->euid;
e_gid = (i & S_ISGID) ? inode->i_gid : current->egid;
if (current->euid == inode->i_uid)
i >>= 6;
else if (current->egid == inode->i_gid)
i >>= 3;
if (!(i & 1) &&
!((inode->i_mode & 0111) && suser())) {
retval = -ENOEXEC;
goto exec_error2;
}
// 读取执行文件的第一块数据到高速缓冲区,若出错则置出错码,跳转到exec_error2 处去处理。
if (!(bh = bread(inode->i_dev,inode->i_zone[0]))) {
retval = -EACCES;
goto exec_error2;
}
// 下面对执行文件的头结构数据进行处理,首先让ex 指向执行头部分的数据结构。
ex = *((struct exec *) bh->b_data); /* read exec-header *//* 读取执行头部分 */
// 如果执行文件开始的两个字节为'#!',并且sh_bang 标志没有置位,则处理脚本文件的执行。
if ((bh->b_data[0] == '#') && (bh->b_data[1] == '!') && (!sh_bang)) {
/*
* This section does the #! interpretation.
* Sorta complicated, but hopefully it will work. -TYT
*/
/*
* 这部分处理对'#!'的解释,有些复杂,但希望能工作。-TYT
*/
char buf[1023], *cp, *interp, *i_name, *i_arg;
unsigned long old_fs;
// 复制执行程序头一行字符'#!'后面的字符串到buf 中,其中含有脚本处理程序名。
strncpy(buf, bh->b_data+2, 1022);
// 释放高速缓冲块和该执行文件i 节点。
brelse(bh);
iput(inode);
// 取第一行内容,并删除开始的空格、制表符。
buf[1022] = '\0';
if ((cp = strchr(buf, '\n'))) {
*cp = '\0';
for (cp = buf; (*cp == ' ') || (*cp == '\t'); cp++);
}
// 若该行没有其它内容,则出错。置出错码,跳转到exec_error1 处。
if (!cp || *cp == '\0') {
retval = -ENOEXEC; /* No interpreter name found */
goto exec_error1;
}
// 否则就得到了开头是脚本解释执行程序名称的一行内容。
interp = i_name = cp;
// 下面分析该行。首先取第一个字符串,其应该是脚本解释程序名,iname 指向该名称。
i_arg = 0;
for ( ; *cp && (*cp != ' ') && (*cp != '\t'); cp++) {
if (*cp == '/')
i_name = cp+1;
}
// 若文件名后还有字符,则应该是参数串,令i_arg 指向该串。
if (*cp) {
*cp++ = '\0';
i_arg = cp;
}
/*
* OK, we've parsed out the interpreter name and
* (optional) argument.
*/
/*
* OK,我们已经解析出解释程序的文件名以及(可选的)参数。
*/
// 若sh_bang 标志没有设置,则设置它,并复制指定个数的环境变量串和参数串到参数和环境空间中。
if (sh_bang++ == 0) {
p = copy_strings(envc, envp, page, p, 0);
p = copy_strings(--argc, argv+1, page, p, 0);
}
/*
* Splice in (1) the interpreter's name for argv[0]
* (2) (optional) argument to interpreter
* (3) filename of shell script
*
* This is done in reverse order, because of how the
* user environment and arguments are stored.
*/
/*
* 拼接 (1) argv[0]中放解释程序的名称
* (2) (可选的)解释程序的参数
* (3) 脚本程序的名称
*
* 这是以逆序进行处理的,是由于用户环境和参数的存放方式造成的。
*/
// 复制脚本程序文件名到参数和环境空间中。
p = copy_strings(1, &filename, page, p, 1);
// 复制解释程序的参数到参数和环境空间中。
argc++;
if (i_arg) {
p = copy_strings(1, &i_arg, page, p, 2);
argc++;
}
// 复制解释程序文件名到参数和环境空间中。若出错,则置出错码,跳转到exec_error1。
p = copy_strings(1, &i_name, page, p, 2);
argc++;
if (!p) {
retval = -ENOMEM;
goto exec_error1;
}
/*
* OK, now restart the process with the interpreter's inode.
*/
/*
* OK,现在使用解释程序的i 节点重启进程。
*/
// 保留原fs 段寄存器(原指向用户数据段),现置其指向内核数据段。
old_fs = get_fs();
set_fs(get_ds());
// 取解释程序的i 节点,并跳转到restart_interp 处重新处理。
if (!(inode=namei(interp))) { /* get executables inode */
set_fs(old_fs);
retval = -ENOENT;
goto exec_error1;
}
set_fs(old_fs);
goto restart_interp;
}
// 释放该缓冲区。
brelse(bh);
// 下面对执行头信息进行处理。
// 对于下列情况,将不执行程序:如果执行文件不是需求页可执行文件(ZMAGIC)、或者代码重定位部分
// 长度a_trsize 不等于0、或者数据重定位信息长度不等于0、或者代码段+数据段+堆段长度超过50MB、
// 或者i 节点表明的该执行文件长度小于代码段+数据段+符号表长度+执行头部分长度的总和。
if (N_MAGIC(ex) != ZMAGIC || ex.a_trsize || ex.a_drsize ||
ex.a_text+ex.a_data+ex.a_bss>0x3000000 ||
inode->i_size < ex.a_text+ex.a_data+ex.a_syms+N_TXTOFF(ex)) {
retval = -ENOEXEC;
goto exec_error2;
}
// 如果执行文件执行头部分长度不等于一个内存块大小(1024 字节),也不能执行。转exec_error2。
if (N_TXTOFF(ex) != BLOCK_SIZE) {
printk("%s: N_TXTOFF != BLOCK_SIZE. See a.out.h.", filename);
retval = -ENOEXEC;
goto exec_error2;
}
// 如果sh_bang 标志没有设置,则复制指定个数的环境变量字符串和参数到参数和环境空间中。
// 若sh_bang 标志已经设置,则表明是将运行脚本程序,此时环境变量页面已经复制,无须再复制。
if (!sh_bang) {
p = copy_strings(envc,envp,page,p,0);
p = copy_strings(argc,argv,page,p,0);
// 如果p=0,则表示环境变量与参数空间页面已经被占满,容纳不下了。转至出错处理处。
if (!p) {
retval = -ENOMEM;
goto exec_error2;
}
}
/* OK, This is the point of no return */
/* OK,下面开始就没有返回的地方了 */
// 如果原程序也是一个执行程序,则释放其i 节点,并让进程executable 字段指向新程序i 节点。
if (current->executable)
iput(current->executable);
current->executable = inode;
// 清复位所有信号处理句柄。但对于SIG_IGN 句柄不能复位,因此在标号“【添加处】”之间需添加一条
// if 语句:if (current->sa[I].sa_handler != SIG_IGN)。这是源代码中的一个bug。
for (i=0 ; i<32 ; i++) ////////////////////【添加处】////////////////////////
current->sigaction[i].sa_handler = NULL;
// 根据执行时关闭(close_on_exec)文件句柄位图标志,关闭指定的打开文件,并复位该标志。
for (i=0 ; i<NR_OPEN ; i++)
if ((current->close_on_exec>>i)&1)
sys_close(i);
current->close_on_exec = 0;
// 根据指定的基地址和限长,释放原来程序代码段和数据段所对应的内存页表指定的内存块及页表本身。
free_page_tables(get_base(current->ldt[1]),get_limit(0x0f));
free_page_tables(get_base(current->ldt[2]),get_limit(0x17));
// 如果“上次任务使用了协处理器”指向的是当前进程,则将其置空,并复位使用了协处理器的标志。
if (last_task_used_math == current)
last_task_used_math = NULL;
current->used_math = 0;
// 根据a_text 修改局部表中描述符基址和段限长,并将参数和环境空间页面放置在数据段末端。
// 执行下面语句之后,p 此时是以数据段起始处为原点的偏移值,仍指向参数和环境空间数据开始处,
// 也即转换成为堆栈的指针。
p += change_ldt(ex.a_text,page)-MAX_ARG_PAGES*PAGE_SIZE;
// create_tables()在新用户堆栈中创建环境和参数变量指针表,并返回该堆栈指针。
p = (unsigned long) create_tables((char *)p,argc,envc);
// 修改当前进程各字段为新执行程序的信息。令进程代码段尾值字段end_code = a_text;令进程数据
// 段尾字段end_data = a_data + a_text;令进程堆结尾字段brk = a_text + a_data + a_bss。
current->brk = ex.a_bss +
(current->end_data = ex.a_data +
(current->end_code = ex.a_text));
// 设置进程堆栈开始字段为堆栈指针所在的页面,并重新设置进程的用户id 和组id。
current->start_stack = p & 0xfffff000;
current->euid = e_uid;
current->egid = e_gid;
// 初始化一页bss 段数据,全为零。
i = ex.a_text+ex.a_data;
while (i&0xfff)
put_fs_byte(0,(char *) (i++));
// 将原调用系统中断的程序在堆栈上的代码指针替换为指向新执行程序的入口点,并将堆栈指针替换
// 为新执行程序的堆栈指针。返回指令将弹出这些堆栈数据并使得CPU 去执行新的执行程序,因此不会
// 返回到原调用系统中断的程序中去了。
eip[0] = ex.a_entry; /* eip, magic happens :-) */ /* eip,魔法起作用了 */
eip[3] = p; /* stack pointer */ /* esp,堆栈指针 */
return 0;
exec_error2:
iput(inode); // 放回 i 节点
exec_error1:
for (i=0 ; i<MAX_ARG_PAGES ; i++)
free_page(page[i]); // 释放存放参数和环境串的内存页面
return(retval); // 返回出错码
}
/*
* linux/fs/fcntl.c
*
* (C) 1991 Linus Torvalds
*/
/* #include <string.h> */
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <fcntl.h> // 文件控制头文件。用于文件及其描述符的操作控制常数符号的定义。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
extern int sys_close(int fd); // 关闭文件系统调用。(fs/open.c)
//// 复制文件句柄(描述符)。
// 参数fd 是欲复制的文件句柄,arg 指定新文件句柄的最小数值。
// 返回新文件句柄或出错码
static int dupfd(unsigned int fd, unsigned int arg)
{
// 如果文件句柄值大于一个程序最多打开文件数NR_OPEN,或者该句柄的文件结构不存在,则出错,
// 返回出错码并退出。
if (fd >= NR_OPEN || !current->filp[fd])
return -EBADF;
// 如果指定的新句柄值arg 大于最多打开文件数,则出错,返回出错码并退出。
if (arg >= NR_OPEN)
return -EINVAL;
// 在当前进程的文件结构指针数组中寻找索引号大于等于arg 但还没有使用的项。
while (arg < NR_OPEN)
if (current->filp[arg])
arg++;
else
break;
// 如果找到的新句柄值arg 大于最多打开文件数,则出错,返回出错码并退出。
if (arg >= NR_OPEN)
return -EMFILE;
// 在执行时关闭标志位图中复位该句柄位。也即在运行exec()类函数时不关闭该句柄。
current->close_on_exec &= ~(1<<arg);
// 令该文件结构指针等于原句柄fd 的指针,并将文件引用计数增1。
(current->filp[arg] = current->filp[fd])->f_count++;
return arg; // 返回新的文件句柄
}
//// 复制文件句柄系统调用函数。
// 复制指定文件句柄oldfd,新句柄值等于newfd。如果newfd 已经打开,则首先关闭之。
int sys_dup2(unsigned int oldfd, unsigned int newfd)
{
sys_close(newfd); // 若句柄newfd 已经打开,则首先关闭之。
return dupfd(oldfd,newfd); // 复制并返回新句柄。
}
//// 复制文件句柄系统调用函数。
// 复制指定文件句柄oldfd,新句柄的值是当前最小的未用句柄。
int sys_dup(unsigned int fildes)
{
return dupfd(fildes,0);
}
//// 文件控制系统调用函数。
// 参数fd 是文件句柄,cmd 是操作命令(参见include/fcntl.h)。
int sys_fcntl(unsigned int fd, unsigned int cmd, unsigned long arg)
{
struct file * filp;
// 如果文件句柄值大于一个进程最多打开文件数NR_OPEN,或者该句柄的文件结构指针为空,则出错,
// 返回出错码并退出。
if (fd >= NR_OPEN || !(filp = current->filp[fd]))
return -EBADF;
// 根据不同命令cmd 进行分别处理。
switch (cmd) {
case F_DUPFD: // 复制文件句柄。
return dupfd(fd,arg);
case F_GETFD: // 取文件句柄的执行时关闭标志。
return (current->close_on_exec>>fd)&1;
case F_SETFD: // 设置句柄执行时关闭标志。arg 位0 置位是设置,否则关闭。
if (arg&1)
current->close_on_exec |= (1<<fd);
else
current->close_on_exec &= ~(1<<fd);
return 0;
case F_GETFL: // 取文件状态标志和访问模式。
return filp->f_flags;
case F_SETFL: // 设置文件状态和访问模式(根据arg 设置添加、非阻塞标志)。
filp->f_flags &= ~(O_APPEND | O_NONBLOCK);
filp->f_flags |= arg & (O_APPEND | O_NONBLOCK);
return 0;
case F_GETLK: case F_SETLK: case F_SETLKW: // 为实现
return -1;
default:
return -1;
}
}
/*
* linux/fs/file_dev.c
*
* (C) 1991 Linus Torvalds
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。(Linus 从minix 中引进的)
#include <fcntl.h> // 文件控制头文件。用于文件及其描述符的操作控制常数符号的定义。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#define MIN(a,b) (((a)<(b))?(a):(b)) // 取a,b 中的最小值。
#define MAX(a,b) (((a)>(b))?(a):(b)) // 取a,b 中的最大值。
//// 文件读函数 - 根据i 节点和文件结构,读设备数据。
// 由i 节点可以知道设备号,由filp 结构可以知道文件中当前读写指针位置。buf 指定用户态中
// 缓冲区的位置,count 为需要读取的字节数。返回值是实际读取的字节数,或出错号(小于0)。
int file_read(struct m_inode * inode, struct file * filp, char * buf, int count)
{
int left,chars,nr;
struct buffer_head * bh;
// 若需要读取的字节计数值小于等于零,则返回。
if ((left = count) <= 0)
return 0;
// 若还需要读取的字节数不等于0,就循环执行以下操作,直到全部读出。
while (left)
{
// 根据i 节点和文件表结构信息,取数据块文件当前读写位置在设备上对应的逻辑块号nr。若nr 不
// 为0,则从i 节点指定的设备上读取该逻辑块,如果读操作失败则退出循环。若nr 为0,表示指定
// 的数据块不存在,置缓冲块指针为NULL。
if ((nr = bmap(inode,(filp->f_pos)/BLOCK_SIZE)))
{
if (!(bh = bread (inode->i_dev, nr)))
break;
}
else
bh = NULL;
// 计算文件读写指针在数据块中的偏移值nr,则该块中可读字节数为(BLOCK_SIZE-nr),然后与还需
// 读取的字节数left 作比较,其中小值即为本次需读的字节数chars。若(BLOCK_SIZE-nr)大则说明
// 该块是需要读取的最后一块数据,反之则还需要读取一块数据。
nr = filp->f_pos % BLOCK_SIZE;
chars = MIN (BLOCK_SIZE - nr, left);
// 调整读写文件指针。指针前移此次将读取的字节数chars。剩余字节计数相应减去chars。
filp->f_pos += chars;
left -= chars;
// 若从设备上读到了数据,则将p 指向读出数据块缓冲区中开始读取的位置,并且复制chars 字节
// 到用户缓冲区buf 中。否则往用户缓冲区中填入chars 个0 值字节。
if (bh)
{
char *p = nr + bh->b_data;
while (chars-- > 0)
put_fs_byte (*(p++), buf++);
brelse (bh);
}
else
{
while (chars-- > 0)
put_fs_byte (0, buf++);
}
}
// 修改该i 节点的访问时间为当前时间。返回读取的字节数,若读取字节数为0,则返回出错号。
inode->i_atime = CURRENT_TIME;
return (count-left)?(count-left):-ERROR;
}
//// 文件写函数 - 根据i 节点和文件结构信息,将用户数据写入指定设备。
// 由i 节点可以知道设备号,由filp 结构可以知道文件中当前读写指针位置。buf 指定用户态中
// 缓冲区的位置,count 为需要写入的字节数。返回值是实际写入的字节数,或出错号(小于0)。
int file_write(struct m_inode * inode, struct file * filp, char * buf, int count)
{
off_t pos;
int block,c;
struct buffer_head * bh;
char * p;
int i=0;
/*
* ok, append may not work when many processes are writing at the same time
* but so what. That way leads to madness anyway.
*/
/*
* ok,当许多进程同时写时,append 操作可能不行,但那又怎样。不管怎样那样做会
* 导致混乱一团。
*/
// 如果是要向文件后添加数据,则将文件读写指针移到文件尾部。否则就将在文件读写指针处写入。
if (filp->f_flags & O_APPEND)
pos = inode->i_size;
else
pos = filp->f_pos;
// 若已写入字节数i 小于需要写入的字节数count,则循环执行以下操作。
while (i<count) {
// 创建数据块号(pos/BLOCK_SIZE)在设备上对应的逻辑块,并返回在设备上的逻辑块号。如果逻辑
// 块号=0,则表示创建失败,退出循环。
if (!(block = create_block(inode,pos/BLOCK_SIZE)))
break;
// 根据该逻辑块号读取设备上的相应数据块,若出错则退出循环。
if (!(bh=bread(inode->i_dev,block)))
break;
// 求出文件读写指针在数据块中的偏移值c,将p 指向读出数据块缓冲区中开始读取的位置。置该
// 缓冲区已修改标志。
c = pos % BLOCK_SIZE;
p = c + bh->b_data;
bh->b_dirt = 1;
// 从开始读写位置到块末共可写入c=(BLOCK_SIZE-c)个字节。若c 大于剩余还需写入的字节数
// (count-i),则此次只需再写入c=(count-i)即可。
c = BLOCK_SIZE-c;
if (c > count-i) c = count-i;
// 文件读写指针前移此次需写入的字节数。如果当前文件读写指针位置值超过了文件的大小,则
// 修改i 节点中文件大小字段,并置i 节点已修改标志。
pos += c;
if (pos > inode->i_size) {
inode->i_size = pos;
inode->i_dirt = 1;
}
// 已写入字节计数累加此次写入的字节数c。从用户缓冲区buf 中复制c 个字节到高速缓冲区中p
// 指向开始的位置处。然后释放该缓冲区。
i += c;
while (c-->0)
*(p++) = get_fs_byte(buf++);
brelse(bh);
}
// 更改文件修改时间为当前时间。
inode->i_mtime = CURRENT_TIME;
// 如果此次操作不是在文件尾添加数据,则把文件读写指针调整到当前读写位置,并更改i 节点修改
// 时间为当前时间。
if (!(filp->f_flags & O_APPEND)) {
filp->f_pos = pos;
inode->i_ctime = CURRENT_TIME;
}
// 返回写入的字节数,若写入字节数为0,则返回出错号-1。
return (i?i:-1);
}
/*
* linux/fs/file_table.c
*
* (C) 1991 Linus Torvalds
*/
#include <linux/fs.h> // 文件系统头文件。定义文件表结构(file,buffer_head, m_inode等).
struct file file_table[NR_FILE]; // 文件表数组 (64项)
/*
* linux/fs/inode.c
*
* (C) 1991 Linus Torvalds
*/
#include <string.h> // 字符串头文件。主要定义了一些有关字符串操作的嵌入函数。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/mm.h> // 内存管理头文件。含有页面大小定义和一些页面释放函数原型。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
struct m_inode inode_table[NR_INODE]={{0,},}; // 内存中i 节点表(NR_INODE=32 项)。
static void read_inode(struct m_inode * inode);
static void write_inode(struct m_inode * inode);
//// 等待指定的i 节点可用。
// 如果i 节点已被锁定,则将当前任务置为不可中断的等待状态。直到该i 节点解锁。
static inline void wait_on_inode(struct m_inode * inode)
{
cli();
while (inode->i_lock)
sleep_on(&inode->i_wait);
sti();
}
//// 对指定的i 节点上锁(锁定指定的i 节点)。
// 如果i 节点已被锁定,则将当前任务置为不可中断的等待状态。直到该i 节点解锁,然后对其上锁。
static inline void lock_inode(struct m_inode * inode)
{
cli();
while (inode->i_lock)
sleep_on(&inode->i_wait);
inode->i_lock=1; // 置锁定标志。
sti();
}
//// 对指定的i 节点解锁。
// 复位i 节点的锁定标志,并明确地唤醒等待此i 节点的进程。
static inline void unlock_inode(struct m_inode * inode)
{
inode->i_lock=0;
wake_up(&inode->i_wait);
}
//// 释放内存中设备dev 的所有i 节点。
// 扫描内存中的i 节点表数组,如果是指定设备使用的i 节点就释放之。
void invalidate_inodes(int dev)
{
int i;
struct m_inode * inode;
inode = 0+inode_table; // 让指针首先指向i 节点表指针数组首项。
for(i=0 ; i<NR_INODE ; i++,inode++) {
// 扫描i 节点表指针数组中的所有i 节点。
wait_on_inode(inode); // 等待该i 节点可用(解锁)。
if (inode->i_dev == dev) {
if (inode->i_count) // 如果其引用数不为0,则显示出错警告;
printk("inode in use on removed disk\n\r");
inode->i_dev = inode->i_dirt = 0; // 释放该i 节点(置设备号为0 等)。
}
}
}
//// 同步所有i 节点。
// 同步内存与设备上的所有i 节点信息。
void sync_inodes(void)
{
int i;
struct m_inode * inode;
inode = 0+inode_table; // 让指针首先指向i 节点表指针数组首项。
for(i=0 ; i<NR_INODE ; i++,inode++) { // 扫描i 节点表指针数组。
wait_on_inode(inode); // 等待该i 节点可用(解锁)。
if (inode->i_dirt && !inode->i_pipe)// 如果该i 节点已修改且不是管道节点
write_inode(inode); // 则写盘。
}
}
//// 文件数据块映射到盘块的处理操作。(block 位图处理函数,bmap - block map)
// 参数:inode – 文件的i 节点;block – 文件中的数据块号;create - 创建标志。
// 如果创建标志置位,则在对应逻辑块不存在时就申请新磁盘块。
// 返回block 数据块对应在设备上的逻辑块号(盘块号)。
static int _bmap(struct m_inode * inode,int block,int create)
{
struct buffer_head * bh;
int i;
// 如果块号小于0,则死机。
if (block<0)
panic("_bmap: block<0");
// 如果块号大于直接块数 + 间接块数 + 二次间接块数,超出文件系统表示范围,则死机。
if (block >= 7+512+512*512)
panic("_bmap: block>big");
// 如果该块号小于7,则使用直接块表示。
if (block<7) {
// 如果创建标志置位,并且i 节点中对应该块的逻辑块(区段)字段为0,则向相应设备申请一磁盘
// 块(逻辑块,区块),并将盘上逻辑块号(盘块号)填入逻辑块字段中。然后设置i 节点修改时间,
// 置i 节点已修改标志。最后返回逻辑块号。
if (create && !inode->i_zone[block])
if ((inode->i_zone[block]=new_block(inode->i_dev))) {
inode->i_ctime=CURRENT_TIME;
inode->i_dirt=1;
}
return inode->i_zone[block];
}
// 如果该块号>=7,并且小于7+512,则说明是一次间接块。下面对一次间接块进行处理。
block -= 7;
if (block<512) {
// 如果是创建,并且该i 节点中对应间接块字段为0,表明文件是首次使用间接块,则需申请
// 一磁盘块用于存放间接块信息,并将此实际磁盘块号填入间接块字段中。然后设置i 节点
// 已修改标志和修改时间。
if (create && !inode->i_zone[7])
if ((inode->i_zone[7]=new_block(inode->i_dev))) {
inode->i_dirt=1;
inode->i_ctime=CURRENT_TIME;
}
// 若此时i 节点间接块字段中为0,表明申请磁盘块失败,返回0 退出。
if (!inode->i_zone[7])
return 0;
// 读取设备上的一次间接块。
if (!(bh = bread(inode->i_dev,inode->i_zone[7])))
return 0;
// 取该间接块上第block 项中的逻辑块号(盘块号)。
i = ((unsigned short *) (bh->b_data))[block];
// 如果是创建并且间接块的第block 项中的逻辑块号为0 的话,则申请一磁盘块(逻辑块),并让
// 间接块中的第block 项等于该新逻辑块块号。然后置位间接块的已修改标志。
if (create && !i)
if ((i=new_block(inode->i_dev))) {
((unsigned short *) (bh->b_data))[block]=i;
bh->b_dirt=1;
}
// 最后释放该间接块,返回磁盘上新申请的对应block 的逻辑块的块号。
brelse(bh);
return i;
}
// 程序运行到此,表明数据块是二次间接块,处理过程与一次间接块类似。下面是对二次间接块的处理。
// 将block 再减去间接块所容纳的块数(512)。
block -= 512;
// 如果是新创建并且i 节点的二次间接块字段为0,则需申请一磁盘块用于存放二次间接块的一级块
// 信息,并将此实际磁盘块号填入二次间接块字段中。之后,置i 节点已修改编制和修改时间。
if (create && !inode->i_zone[8])
if ((inode->i_zone[8]=new_block(inode->i_dev))) {
inode->i_dirt=1;
inode->i_ctime=CURRENT_TIME;
}
// 若此时i 节点二次间接块字段为0,表明申请磁盘块失败,返回0 退出。
if (!inode->i_zone[8])
return 0;
// 读取该二次间接块的一级块。
if (!(bh=bread(inode->i_dev,inode->i_zone[8])))
return 0;
// 取该二次间接块的一级块上第(block/512)项中的逻辑块号。
i = ((unsigned short *)bh->b_data)[block>>9];
// 如果是创建并且二次间接块的一级块上第(block/512)项中的逻辑块号为0 的话,则需申请一磁盘
// 块(逻辑块)作为二次间接块的二级块,并让二次间接块的一级块中第(block/512)项等于该二级
// 块的块号。然后置位二次间接块的一级块已修改标志。并释放二次间接块的一级块。
if (create && !i)
if ((i=new_block(inode->i_dev))) {
((unsigned short *) (bh->b_data))[block>>9]=i;
bh->b_dirt=1;
}
brelse(bh);
// 如果二次间接块的二级块块号为0,表示申请磁盘块失败,返回0 退出。
if (!i)
return 0;
// 读取二次间接块的二级块。
if (!(bh=bread(inode->i_dev,i)))
return 0;
// 取该二级块上第block 项中的逻辑块号。(与上511 是为了限定block 值不超过511)
i = ((unsigned short *)bh->b_data)[block&511];
// 如果是创建并且二级块的第block 项中的逻辑块号为0 的话,则申请一磁盘块(逻辑块),作为
// 最终存放数据信息的块。并让二级块中的第block 项等于该新逻辑块块号(i)。然后置位二级块的
// 已修改标志。
if (create && !i)
if ((i=new_block(inode->i_dev))) {
((unsigned short *) (bh->b_data))[block&511]=i;
bh->b_dirt=1;
}
// 最后释放该二次间接块的二级块,返回磁盘上新申请的对应block 的逻辑块的块号。
brelse(bh);
return i;
}
//// 根据i 节点信息取文件数据块block 在设备上对应的逻辑块号。
int bmap(struct m_inode * inode,int block)
{
return _bmap(inode,block,0);
}
//// 创建文件数据块block 在设备上对应的逻辑块,并返回设备上对应的逻辑块号。
int create_block(struct m_inode * inode, int block)
{
return _bmap(inode,block,1);
}
//// 释放一个i 节点(回写入设备)。
void iput(struct m_inode * inode)
{
if (!inode)
return;
wait_on_inode(inode); // 等待inode 节点解锁(如果已上锁的话)。
if (!inode->i_count)
panic("iput: trying to free free inode");
// 如果是管道i 节点,则唤醒等待该管道的进程,引用次数减1,如果还有引用则返回。否则释放
// 管道占用的内存页面,并复位该节点的引用计数值、已修改标志和管道标志,并返回。
// 对于pipe 节点,inode->i_size 存放着物理内存页地址。参见get_pipe_inode()
if (inode->i_pipe) {
wake_up(&inode->i_wait);
if (--inode->i_count)
return;
free_page(inode->i_size);
inode->i_count=0;
inode->i_dirt=0;
inode->i_pipe=0;
return;
}
// 如果i 节点对应的设备号=0,则将此节点的引用计数递减1,返回。
if (!inode->i_dev) {
inode->i_count--;
return;
}
// 如果是块设备文件的i 节点,此时逻辑块字段0 中是设备号,则刷新该设备。并等待i 节点解锁。
if (S_ISBLK(inode->i_mode)) {
sync_dev(inode->i_zone[0]);
wait_on_inode(inode);
}
repeat:
// 如果i 节点的引用计数大于1,则递减1。
if (inode->i_count>1) {
inode->i_count--;
return;
}
// 如果i 节点的链接数为0,则释放该i 节点的所有逻辑块,并释放该i 节点。
if (!inode->i_nlinks) {
truncate(inode);
free_inode(inode);
return;
}
// 如果该i 节点已作过修改,则更新该i 节点,并等待该i 节点解锁。
if (inode->i_dirt) {
write_inode(inode); /* we can sleep - so do again */
wait_on_inode(inode);
goto repeat;
}
// i 节点引用计数递减1。
inode->i_count--;
return;
}
//// 从i 节点表(inode_table)中获取一个空闲i 节点项。
// 寻找引用计数count 为0 的i 节点,并将其写盘后清零,返回其指针。
struct m_inode * get_empty_inode(void)
{
struct m_inode * inode;
static struct m_inode * last_inode = inode_table; // last_inode 指向i 节点表第一项。
int i;
do {
// 扫描i 节点表。
inode = NULL;
for (i = NR_INODE; i ; i--) {
// 如果last_inode 已经指向i 节点表的最后1 项之后,则让其重新指向i 节点表开始处。
if (++last_inode >= inode_table + NR_INODE)
last_inode = inode_table;
// 如果last_inode 所指向的i 节点的计数值为0,则说明可能找到空闲i 节点项。让inode 指向
// 该i 节点。如果该i 节点的已修改标志和锁定标志均为0,则我们可以使用该i 节点,于是退出循环。
if (!last_inode->i_count) {
inode = last_inode;
if (!inode->i_dirt && !inode->i_lock)
break;
}
}
// 如果没有找到空闲i 节点(inode=NULL),则将整个i 节点表打印出来供调试使用,并死机。
if (!inode) {
for (i=0 ; i<NR_INODE ; i++)
printk("%04x: %6d\t",inode_table[i].i_dev,
inode_table[i].i_num);
panic("No free inodes in mem");
}
// 等待该i 节点解锁(如果又被上锁的话)。
wait_on_inode(inode);
// 如果该i 节点已修改标志被置位的话,则将该i 节点刷新,并等待该i 节点解锁。
while (inode->i_dirt) {
write_inode(inode);
wait_on_inode(inode);
}
} while (inode->i_count); // 如果i 节点又被其它占用的话,则重新寻找空闲i 节点。
// 已找到空闲i 节点项。则将该i 节点项内容清零,并置引用标志为1,返回该i 节点指针。
memset(inode,0,sizeof(*inode));
inode->i_count = 1;
return inode;
}
//// 获取管道节点。返回为i 节点指针(如果是NULL 则失败)。
// 首先扫描i 节点表,寻找一个空闲i 节点项,然后取得一页空闲内存供管道使用。
// 然后将得到的i 节点的引用计数置为2(读者和写者),初始化管道头和尾,置i 节点的管道类型表示。
struct m_inode * get_pipe_inode(void)
{
struct m_inode * inode;
if (!(inode = get_empty_inode())) // 如果找不到空闲i 节点则返回NULL。
return NULL;
if (!(inode->i_size=get_free_page())) { // 节点的i_size 字段指向缓冲区。
inode->i_count = 0; // 如果已没有空闲内存,则
return NULL; // 释放该i 节点,并返回NULL。
}
inode->i_count = 2; /* sum of readers/writers *//* 读/写两者总计 */
PIPE_HEAD(*inode) = PIPE_TAIL(*inode) = 0; // 复位管道头尾指针。
inode->i_pipe = 1; // 置节点为管道使用的标志。
return inode; // 返回i 节点指针。
}
//// 从设备上读取指定节点号的i 节点。
// nr - i 节点号。
struct m_inode * iget(int dev,int nr)
{
struct m_inode * inode, * empty;
if (!dev)
panic("iget with dev==0");
// 从i 节点表中取一个空闲i 节点。
empty = get_empty_inode();
// 扫描i 节点表。寻找指定节点号的i 节点。并递增该节点的引用次数。
inode = inode_table;
while (inode < NR_INODE+inode_table) {
// 如果当前扫描的i 节点的设备号不等于指定的设备号或者节点号不等于指定的节点号,则继续扫描。
if (inode->i_dev != dev || inode->i_num != nr) {
inode++;
continue;
}
// 找到指定设备号和节点号的i 节点,等待该节点解锁(如果已上锁的话)。
wait_on_inode(inode);
// 在等待该节点解锁的阶段,节点表可能会发生变化,所以再次判断,如果发生了变化,则再次重新
// 扫描整个i 节点表。
if (inode->i_dev != dev || inode->i_num != nr) {
inode = inode_table;
continue;
}
// 将该i 节点引用计数增1。
inode->i_count++;
if (inode->i_mount) {
int i;
// 如果该i 节点是其它文件系统的安装点,则在超级块表中搜寻安装在此i 节点的超级块。如果没有
// 找到,则显示出错信息,并释放函数开始获取的空闲节点,返回该i 节点指针。
for (i = 0 ; i<NR_SUPER ; i++)
if (super_block[i].s_imount==inode)
break;
if (i >= NR_SUPER) {
printk("Mounted inode hasn't got sb\n");
if (empty)
iput(empty);
return inode;
}
// 将该i 节点写盘。从安装在此i 节点文件系统的超级块上取设备号,并令i 节点号为1。然后重新
// 扫描整个i 节点表,取该被安装文件系统的根节点。
iput(inode);
dev = super_block[i].s_dev;
nr = ROOT_INO;
inode = inode_table;
continue;
}
// 已经找到相应的i 节点,因此放弃临时申请的空闲节点,返回该找到的i 节点。
if (empty)
iput(empty);
return inode;
}
// 如果在i 节点表中没有找到指定的i 节点,则利用前面申请的空闲i 节点在i 节点表中建立该节点。
// 并从相应设备上读取该i 节点信息。返回该i 节点。
if (!empty)
return (NULL);
inode=empty;
inode->i_dev = dev;
inode->i_num = nr;
read_inode(inode);
return inode;
}
//// 从设备上读取指定i 节点的信息到内存中(缓冲区中)。
static void read_inode(struct m_inode * inode)
{
struct super_block * sb;
struct buffer_head * bh;
int block;
// 首先锁定该i 节点,取该节点所在设备的超级块。
lock_inode(inode);
if (!(sb=get_super(inode->i_dev)))
panic("trying to read inode without dev");
// 该i 节点所在的逻辑块号 = (启动块+超级块) + i 节点位图占用的块数 + 逻辑块位图占用的块数 +
// (i 节点号-1)/每块含有的i 节点数。
block = 2 + sb->s_imap_blocks + sb->s_zmap_blocks +
(inode->i_num-1)/INODES_PER_BLOCK;
// 从设备上读取该i 节点所在的逻辑块,并将该inode 指针指向对应i 节点信息。
if (!(bh=bread(inode->i_dev,block)))
panic("unable to read i-node block");
*(struct d_inode *)inode =
((struct d_inode *)bh->b_data)
[(inode->i_num-1)%INODES_PER_BLOCK];
// 最后释放读入的缓冲区,并解锁该i 节点。
brelse(bh);
unlock_inode(inode);
}
//// 将指定i 节点信息写入设备(写入缓冲区相应的缓冲块中,待缓冲区刷新时会写入盘中)。
static void write_inode(struct m_inode * inode)
{
struct super_block * sb;
struct buffer_head * bh;
int block;
// 首先锁定该i 节点,如果该i 节点没有被修改过或者该i 节点的设备号等于零,则解锁该i 节点,
// 并退出。
lock_inode(inode);
if (!inode->i_dirt || !inode->i_dev) {
unlock_inode(inode);
return;
}
// 获取该i 节点的超级块。
if (!(sb=get_super(inode->i_dev)))
panic("trying to write inode without device");
// 该i 节点所在的逻辑块号 = (启动块+超级块) + i 节点位图占用的块数 + 逻辑块位图占用的块数 +
// (i 节点号-1)/每块含有的i 节点数。
block = 2 + sb->s_imap_blocks + sb->s_zmap_blocks +
(inode->i_num-1)/INODES_PER_BLOCK;
// 从设备上读取该i 节点所在的逻辑块。
if (!(bh=bread(inode->i_dev,block)))
panic("unable to read i-node block");
// 将该i 节点信息复制到逻辑块对应该i 节点的项中。
((struct d_inode *)bh->b_data)
[(inode->i_num-1)%INODES_PER_BLOCK] =
*(struct d_inode *)inode;
// 置缓冲区已修改标志,而i 节点修改标志置零。然后释放该含有i 节点的缓冲区,并解锁该i 节点。
bh->b_dirt=1;
inode->i_dirt=0;
brelse(bh);
unlock_inode(inode);
}
/*
* linux/fs/ioctl.c
*
* (C) 1991 Linus Torvalds
*/
/* #include <string.h>*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
extern int tty_ioctl(int dev, int cmd, int arg); // 终端ioctl(chr_drv/tty_ioctl.c)。
// 定义输入输出控制(ioctl)函数指针。
typedef int (*ioctl_ptr)(int dev,int cmd,int arg);
// 定义系统中设备种数。
#define NRDEVS ((sizeof (ioctl_table))/(sizeof (ioctl_ptr)))
// ioctl 操作函数指针表。
static ioctl_ptr ioctl_table[]={
NULL, /* nodev */
NULL, /* /dev/mem */
NULL, /* /dev/fd */
NULL, /* /dev/hd */
tty_ioctl, /* /dev/ttyx */
tty_ioctl, /* /dev/tty */
NULL, /* /dev/lp */
NULL}; /* named pipes */
//// 系统调用函数 - 输入输出控制函数。
// 参数:fd - 文件描述符;cmd - 命令码;arg - 参数。
// 返回:成功则返回0,否则返回出错码。
int sys_ioctl(unsigned int fd, unsigned int cmd, unsigned long arg)
{
struct file * filp;
int dev,mode;
// 如果文件描述符超出可打开的文件数,或者对应描述符的文件结构指针为空,则返回出错码,退出。
if (fd >= NR_OPEN || !(filp = current->filp[fd]))
return -EBADF;
// 取对应文件的属性。如果该文件不是字符文件,也不是块设备文件,则返回出错码,退出。
mode=filp->f_inode->i_mode;
if (!S_ISCHR(mode) && !S_ISBLK(mode))
return -EINVAL;
// 从字符或块设备文件的i 节点中取设备号。如果设备号大于系统现有的设备数,则返回出错号。
dev = filp->f_inode->i_zone[0];
if (MAJOR(dev) >= NRDEVS)
return -ENODEV;
// 如果该设备在ioctl 函数指针表中没有对应函数,则返回出错码。
if (!ioctl_table[MAJOR(dev)])
return -ENOTTY;
// 否则返回实际ioctl 函数返回码,成功则返回0,否则返回出错码。
return ioctl_table[MAJOR(dev)](dev,cmd,arg);
}
/*
* linux/fs/namei.c
*
* (C) 1991 Linus Torvalds
*/
/*
* Some corrections by tytso.
*/
/*
* tytso 作了一些纠正。
*/
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <string.h> // 字符串头文件。主要定义了一些有关字符串操作的嵌入函数。
#include <fcntl.h> // 文件控制头文件。用于文件及其描述符的操作控制常数符号的定义。
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <const.h> // 常数符号头文件。目前仅定义了i 节点中i_mode 字段的各标志位。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
// 访问模式宏。x 是include/fcntl.h 定义的文件访问标志。
// 根据x 值索引对应数值(数值表示rwx 权限: r, w, rw, wxrwxrwx)(数值是8 进制)。
#define ACC_MODE(x) ("\004\002\006\377"[(x)&O_ACCMODE])
/*
* comment out this line if you want names > NAME_LEN chars to be
* truncated. Else they will be disallowed.
*/
/*
* 如果想让文件名长度>NAME_LEN 的字符被截掉,就将下面定义注释掉。
*/
/* #define NO_TRUNCATE */
#define MAY_EXEC 1 // 可执行(可进入)。
#define MAY_WRITE 2 // 可写。
#define MAY_READ 4 // 可读。
/*
* permission()
*
* is used to check for read/write/execute permissions on a file.
* I don't know if we should look at just the euid or both euid and
* uid, but that should be easily changed.
*/
/*
* permission()
* 该函数用于检测一个文件的读/写/执行权限。我不知道是否只需检查euid,还是
* 需要检查euid 和uid 两者,不过这很容易修改。
*/
//// 检测文件访问许可权限。
// 参数:inode - 文件对应的i 节点;mask - 访问属性屏蔽码。
// 返回:访问许可返回1,否则返回0。
static int permission(struct m_inode * inode,int mask)
{
int mode = inode->i_mode; // 文件访问属性
/* special case: not even root can read/write a deleted file */
/* 特殊情况:即使是超级用户(root)也不能读/写一个已被删除的文件 */
// 如果i 节点有对应的设备,但该i 节点的连接数等于0,则返回。
if (inode->i_dev && !inode->i_nlinks)
return 0;
// 否则,如果进程的有效用户id(euid)与i 节点的用户id 相同,则取文件宿主的用户访问权限。
else if (current->euid==inode->i_uid)
mode >>= 6;
// 否则,如果进程的有效组id(egid)与i 节点的组id 相同,则取组用户的访问权限。
else if (current->egid==inode->i_gid)
mode >>= 3;
// 如果上面所取的的访问权限与屏蔽码相同,或者是超级用户,则返回1,否则返回0。
if (((mode & mask & 0007) == mask) || suser())
return 1;
return 0;
}
/*
* ok, we cannot use strncmp, as the name is not in our data space.
* Thus we'll have to use match. No big problem. Match also makes
* some sanity tests.
*
* NOTE! unlike strncmp, match returns 1 for success, 0 for failure.
*/
/*
* ok,我们不能使用strncmp 字符串比较函数,因为名称不在我们的数据空间(不在内核空间)。
* 因而我们只能使用match()。问题不大。match()同样也处理一些完整的测试。
*
* 注意!与strncmp 不同的是match()成功时返回1,失败时返回0。
*/
//// 指定长度字符串比较函数。
// 参数:len - 比较的字符串长度;name - 文件名指针;de - 目录项结构。
// 返回:相同返回1,不同返回0。
static int match(int len,const char * name,struct dir_entry * de)
{
register int same ;
// 如果目录项指针空,或者目录项i 节点等于0,或者要比较的字符串长度超过文件名长度,则返回0。
if (!de || !de->inode || len > NAME_LEN)
return 0;
// 如果要比较的长度len 小于NAME_LEN,但是目录项中文件名长度超过len,则返回0。
if (len < NAME_LEN && de->name[len])
return 0;
// 下面嵌入汇编语句,在用户数据空间(fs)执行字符串的比较操作。
// %0 - eax(比较结果same);%1 - eax(eax 初值0);%2 - esi(名字指针);%3 - edi(目录项名指针);
// %4 - ecx(比较的字节长度值len)。
__asm__("cld\n\t"
"fs ; repe ; cmpsb\n\t" // 用户空间执行循环比较[esi++]和[edi++]操作,
"setz %%al" // 若比较结果一样(z=0)则设置al=1(same=eax)。
:"=a" (same)
:"0" (0),"S" ((long) name),"D" ((long) de->name),"c" (len)
);
return same;
}
/*
* find_entry()
*
* finds an entry in the specified directory with the wanted name. It
* returns the cache buffer in which the entry was found, and the entry
* itself (as a parameter - res_dir). It does NOT read the inode of the
* entry - you'll have to do that yourself if you want to.
*
* This also takes care of the few special cases due to '..'-traversal
* over a pseudo-root and a mount point.
*/
/*
* find_entry()
* 在指定的目录中寻找一个与名字匹配的目录项。返回一个含有找到目录项的高速
* 缓冲区以及目录项本身(作为一个参数 - res_dir)。并不读目录项的i 节点 - 如
* 果需要的话需自己操作。
*
* '..'目录项,操作期间也会对几种特殊情况分别处理 - 比如横越一个伪根目录以
* 及安装点。
*/
//// 查找指定目录和文件名的目录项。
// 参数:dir - 指定目录i 节点的指针;name - 文件名;namelen - 文件名长度;
// 返回:高速缓冲区指针;res_dir - 返回的目录项结构指针;
static struct buffer_head * find_entry(struct m_inode ** dir,
const char * name, int namelen, struct dir_entry ** res_dir)
{
int entries;
int block,i;
struct buffer_head * bh;
struct dir_entry * de;
struct super_block * sb;
// 如果定义了NO_TRUNCATE,则若文件名长度超过最大长度NAME_LEN,则返回。
#ifdef NO_TRUNCATE
if (namelen > NAME_LEN)
return NULL;
//如果没有定义NO_TRUNCATE,则若文件名长度超过最大长度NAME_LEN,则截短之。
#else
if (namelen > NAME_LEN)
namelen = NAME_LEN;
#endif
// 计算本目录中目录项项数entries。置空返回目录项结构指针。
entries = (*dir)->i_size / (sizeof (struct dir_entry));
*res_dir = NULL;
// 如果文件名长度等于0,则返回NULL,退出。
if (!namelen)
return NULL;
/* check for '..', as we might have to do some "magic" for it */
/* 检查目录项'..',因为可能需要对其特别处理 */
if (namelen==2 && get_fs_byte(name)=='.' && get_fs_byte(name+1)=='.') {
/* '..' in a pseudo-root results in a faked '.' (just change namelen) */
/* 伪根中的'..'如同一个假'.'(只需改变名字长度) */
// 如果当前进程的根节点指针即是指定的目录,则将文件名修改为'.',
if ((*dir) == current->root)
namelen=1;
// 否则如果该目录的i 节点号等于ROOT_INO(1)的话,说明是文件系统根节点。则取文件系统的超级块。
else if ((*dir)->i_num == ROOT_INO) {
/* '..' over a mount-point results in 'dir' being exchanged for the mounted
directory-inode. NOTE! We set mounted, so that we can iput the new dir */
/* 在一个安装点上的'..'将导致目录交换到安装到文件系统的目录i 节点。
注意!由于设置了mounted 标志,因而我们能够取出该新目录 */
sb=get_super((*dir)->i_dev);
// 如果被安装到的i 节点存在,则先释放原i 节点,然后对被安装到的i 节点进行处理。
// 让*dir 指向该被安装到的i 节点;该i 节点的引用数加1。
if (sb->s_imount) {
iput(*dir);
(*dir)=sb->s_imount;
(*dir)->i_count++;
}
}
}
// 如果该i 节点所指向的第一个直接磁盘块号为0,则返回NULL,退出。
if (!(block = (*dir)->i_zone[0]))
return NULL;
// 从节点所在设备读取指定的目录项数据块,如果不成功,则返回NULL,退出。
if (!(bh = bread((*dir)->i_dev,block)))
return NULL;
// 在目录项数据块中搜索匹配指定文件名的目录项,首先让de 指向数据块,并在不超过目录中目录项数
// 的条件下,循环执行搜索。
i = 0;
de = (struct dir_entry *) bh->b_data;
while (i < entries) {
// 如果当前目录项数据块已经搜索完,还没有找到匹配的目录项,则释放当前目录项数据块。
if ((char *)de >= BLOCK_SIZE+bh->b_data) {
brelse(bh);
bh = NULL;
// 在读入下一目录项数据块。若这块为空,则只要还没有搜索完目录中的所有目录项,就跳过该块,
// 继续读下一目录项数据块。若该块不空,就让de 指向该目录项数据块,继续搜索。
if (!(block = bmap(*dir,i/DIR_ENTRIES_PER_BLOCK)) ||
!(bh = bread((*dir)->i_dev,block))) {
i += DIR_ENTRIES_PER_BLOCK;
continue;
}
de = (struct dir_entry *) bh->b_data;
}
// 如果找到匹配的目录项的话,则返回该目录项结构指针和该目录项数据块指针,退出。
if (match(namelen,name,de)) {
*res_dir = de;
return bh;
}
// 否则继续在目录项数据块中比较下一个目录项。
de++;
i++;
}
// 若指定目录中的所有目录项都搜索完还没有找到相应的目录项,则释放目录项数据块,返回NULL。
brelse(bh);
return NULL;
}
/*
* add_entry()
*
* adds a file entry to the specified directory, using the same
* semantics as find_entry(). It returns NULL if it failed.
*
* NOTE!! The inode part of 'de' is left at 0 - which means you
* may not sleep between calling this and putting something into
* the entry, as someone else might have used it while you slept.
*/
/*
* add_entry()
* 使用与find_entry()同样的方法,往指定目录中添加一文件目录项。
* 如果失败则返回NULL。
*
* 注意!!'de'(指定目录项结构指针)的i 节点部分被设置为0 - 这表示
* 在调用该函数和往目录项中添加信息之间不能睡眠,因为若睡眠那么其它
* 人(进程)可能会已经使用了该目录项。
*/
//// 根据指定的目录和文件名添加目录项。
// 参数:dir - 指定目录的i 节点;name - 文件名;namelen - 文件名长度;
// 返回:高速缓冲区指针;res_dir - 返回的目录项结构指针;
static struct buffer_head * add_entry(struct m_inode * dir,
const char * name, int namelen, struct dir_entry ** res_dir)
{
int block,i;
struct buffer_head * bh;
struct dir_entry * de;
*res_dir = NULL;
// 如果定义了NO_TRUNCATE,则若文件名长度超过最大长度NAME_LEN,则返回。
#ifdef NO_TRUNCATE
if (namelen > NAME_LEN)
return NULL;
//如果没有定义NO_TRUNCATE,则若文件名长度超过最大长度NAME_LEN,则截短之。
#else
if (namelen > NAME_LEN)
namelen = NAME_LEN;
#endif
// 如果文件名长度等于0,则返回NULL,退出。
if (!namelen)
return NULL;
// 如果该目录i 节点所指向的第一个直接磁盘块号为0,则返回NULL 退出。
if (!(block = dir->i_zone[0]))
return NULL;
// 如果读取该磁盘块失败,则返回NULL 并退出。
if (!(bh = bread(dir->i_dev,block)))
return NULL;
// 在目录项数据块中循环查找最后未使用的目录项。首先让目录项结构指针de 指向高速缓冲的数据块
// 开始处,也即第一个目录项。
i = 0;
de = (struct dir_entry *) bh->b_data;
while (1) {
// 如果当前判别的目录项已经超出当前数据块,则释放该数据块,重新申请一块磁盘块block。如果
// 申请失败,则返回NULL,退出。
if ((char *)de >= BLOCK_SIZE+bh->b_data) {
brelse(bh);
bh = NULL;
block = create_block(dir,i/DIR_ENTRIES_PER_BLOCK);
if (!block)
return NULL;
// 如果读取磁盘块返回的指针为空,则跳过该块继续。
if (!(bh = bread(dir->i_dev,block))) {
i += DIR_ENTRIES_PER_BLOCK;
continue;
}
// 否则,让目录项结构指针de 志向该块的高速缓冲数据块开始处。
de = (struct dir_entry *) bh->b_data;
}
// 如果当前所操作的目录项序号i*目录结构大小已经超过了该目录所指出的大小i_size,则说明该第i
// 个目录项还未使用,我们可以使用它。于是对该目录项进行设置(置该目录项的i 节点指针为空)。并
// 更新该目录的长度值(加上一个目录项的长度,设置目录的i 节点已修改标志,再更新该目录的改变时
// 间为当前时间。
if (i*sizeof(struct dir_entry) >= dir->i_size) {
de->inode=0;
dir->i_size = (i+1)*sizeof(struct dir_entry);
dir->i_dirt = 1;
dir->i_ctime = CURRENT_TIME;
}
// 若该目录项的i 节点为空,则表示找到一个还未使用的目录项。于是更新目录的修改时间为当前时间。
// 并从用户数据区复制文件名到该目录项的文件名字段,置相应的高速缓冲块已修改标志。返回该目录
// 项的指针以及该高速缓冲区的指针,退出。
if (!de->inode) {
dir->i_mtime = CURRENT_TIME;
for (i=0; i < NAME_LEN ; i++)
de->name[i]=(i<namelen)?get_fs_byte(name+i):0;
bh->b_dirt = 1;
*res_dir = de;
return bh;
}
// 如果该目录项已经被使用,则继续检测下一个目录项。
de++;
i++;
}
// 执行不到这里。也许Linus 在写这段代码时是先复制了上面find_entry()的代码,而后修改成本函数的。
brelse(bh);
return NULL;
}
/*
* get_dir()
*
* Getdir traverses the pathname until it hits the topmost directory.
* It returns NULL on failure.
*/
/*
* get_dir()
* 该函数根据给出的路径名进行搜索,直到达到最顶端的目录。
* 如果失败则返回NULL。
*/
//// 搜寻指定路径名的目录。
// 参数:pathname - 路径名。
// 返回:目录的i 节点指针。失败时返回NULL。
static struct m_inode * get_dir(const char * pathname)
{
char c;
const char * thisname;
struct m_inode * inode;
struct buffer_head * bh;
int namelen,inr,idev;
struct dir_entry * de;
// 如果进程没有设定根i 节点,或者该进程根i 节点的引用为0,则系统出错,死机。
if (!current->root || !current->root->i_count)
panic("No root inode");
// 如果进程的当前工作目录指针为空,或者该当前目录i 节点的引用计数为0,也是系统有问题,死机。
if (!current->pwd || !current->pwd->i_count)
panic("No cwd inode");
// 如果用户指定的路径名的第1 个字符是'/',则说明路径名是绝对路径名。则从根i 节点开始操作。
if ((c=get_fs_byte(pathname))=='/') {
inode = current->root;
pathname++;
// 否则若第一个字符是其它字符,则表示给定的是相对路径名。应从进程的当前工作目录开始操作。
// 则取进程当前工作目录的i 节点。
} else if (c)
inode = current->pwd;
// 否则表示路径名为空,出错。返回NULL,退出。
else
return NULL; /* empty name is bad *//* 空的路径名是错误的 */
// 将取得的i 节点引用计数增1。
inode->i_count++;
while (1) {
// 若该i 节点不是目录节点,或者没有可进入的访问许可,则释放该i 节点,返回NULL,退出。
thisname = pathname;
if (!S_ISDIR(inode->i_mode) || !permission(inode,MAY_EXEC)) {
iput(inode);
return NULL;
}
// 从路径名开始起搜索检测字符,直到字符已是结尾符(NULL)或者是'/',此时namelen 正好是当前处理
// 目录名的长度。如果最后也是一个目录名,但其后没有加'/',则不会返回该最后目录的i 节点!
// 比如:/var/log/httpd,将只返回log/目录的i 节点。
for(namelen=0;(c=get_fs_byte(pathname++))&&(c!='/');namelen++)
/* nothing */ ;
if (!c)
return inode;
// 调用查找指定目录和文件名的目录项函数,在当前处理目录中寻找子目录项。如果没有找到,则释放
// 该i 节点,并返回NULL,退出。
if (!(bh = find_entry(&inode,thisname,namelen,&de))) {
iput(inode);
return NULL;
}
// 取该子目录项的i 节点号inr 和设备号idev,释放包含该目录项的高速缓冲块和该i 节点。
inr = de->inode;
idev = inode->i_dev;
brelse(bh);
iput(inode);
// 取节点号inr 的i 节点信息,若失败,则返回NULL,退出。否则继续以该子目录的i 节点进行操作。
if (!(inode = iget(idev,inr)))
return NULL;
}
}
/*
* dir_namei()
*
* dir_namei() returns the inode of the directory of the
* specified name, and the name within that directory.
*/
/*
* dir_namei()
* dir_namei()函数返回指定目录名的i 节点指针,以及在最顶层目录的名称。
*/
// 参数:pathname - 目录路径名;namelen - 路径名长度。
// 返回:指定目录名最顶层目录的i 节点指针和最顶层目录名及其长度。
static struct m_inode * dir_namei(const char * pathname,
int * namelen, const char ** name)
{
char c;
const char * basename;
struct m_inode * dir;
// 取指定路径名最顶层目录的i 节点,若出错则返回NULL,退出。
if (!(dir = get_dir(pathname)))
return NULL;
// 对路径名pathname 进行搜索检测,查处最后一个'/'后面的名字字符串,计算其长度,并返回最顶
// 层目录的i 节点指针。
basename = pathname;
while ((c=get_fs_byte(pathname++)))
if (c=='/')
basename=pathname;
*namelen = pathname-basename-1;
*name = basename;
return dir;
}
/*
* namei()
*
* is used by most simple commands to get the inode of a specified name.
* Open, link etc use their own routines, but this is enough for things
* like 'chmod' etc.
*/
/*
* namei()
* 该函数被许多简单的命令用于取得指定路径名称的i 节点。open、link 等则使用它们
* 自己的相应函数,但对于象修改模式'chmod'等这样的命令,该函数已足够用了。
*/
//// 取指定路径名的i 节点。
// 参数:pathname - 路径名。
// 返回:对应的i 节点。
struct m_inode * namei(const char * pathname)
{
const char * basename;
int inr,dev,namelen;
struct m_inode * dir;
struct buffer_head * bh;
struct dir_entry * de;
// 首先查找指定路径的最顶层目录的目录名及其i 节点,若不存在,则返回NULL,退出。
if (!(dir = dir_namei(pathname,&namelen,&basename)))
return NULL;
// 如果返回的最顶层名字的长度是0,则表示该路径名以一个目录名为最后一项。
if (!namelen) /* special case: '/usr/' etc */
return dir; /* 对应于'/usr/'等情况 */
// 在返回的顶层目录中寻找指定文件名的目录项的i 节点。因为如果最后也是一个目录名,但其后没
// 有加'/',则不会返回该最后目录的i 节点!比如:/var/log/httpd,将只返回log/目录的i 节点。
// 因此dir_namei()将不以'/'结束的最后一个名字当作一个文件名来看待。因此这里需要单独对这种
// 情况使用寻找目录项i 节点函数find_entry()进行处理。
bh = find_entry(&dir,basename,namelen,&de);
if (!bh) {
iput(dir);
return NULL;
}
// 取该目录项的i 节点号和目录的设备号,并释放包含该目录项的高速缓冲区以及目录i 节点。
inr = de->inode;
dev = dir->i_dev;
brelse(bh);
iput(dir);
// 取对应节号的i 节点,修改其被访问时间为当前时间,并置已修改标志。最后返回该i 节点指针。
dir=iget(dev,inr);
if (dir) {
dir->i_atime=CURRENT_TIME;
dir->i_dirt=1;
}
return dir;
}
/*
* open_namei()
*
* namei for open - this is in fact almost the whole open-routine.
*/
/*
* open_namei()
* open()所使用的namei 函数 - 这其实几乎是完整的打开文件程序。
*/
//// 文件打开namei 函数。
// 参数:pathname - 文件路径名;flag - 文件打开标志;mode - 文件访问许可属性;
// 返回:成功返回0,否则返回出错码;res_inode - 返回的对应文件路径名的的i 节点指针。
int open_namei(const char * pathname, int flag, int mode,
struct m_inode ** res_inode)
{
const char * basename;
int inr,dev,namelen;
struct m_inode * dir, *inode;
struct buffer_head * bh;
struct dir_entry * de;
// 如果文件访问许可模式标志是只读(0),但文件截0 标志O_TRUNC 却置位了,则改为只写标志。
if ((flag & O_TRUNC) && !(flag & O_ACCMODE))
flag |= O_WRONLY;
// 使用进程的文件访问许可屏蔽码,屏蔽掉给定模式中的相应位,并添上普通文件标志。
mode &= 0777 & ~current->umask;
mode |= I_REGULAR;
// 根据路径名寻找到对应的i 节点,以及最顶端文件名及其长度。
if (!(dir = dir_namei(pathname,&namelen,&basename)))
return -ENOENT;
// 如果最顶端文件名长度为0(例如'/usr/'这种路径名的情况),那么若打开操作不是创建、截0,
// 则表示打开一个目录名,直接返回该目录的i 节点,并退出。
if (!namelen) { /* special case: '/usr/' etc */
if (!(flag & (O_ACCMODE|O_CREAT|O_TRUNC))) {
*res_inode=dir;
return 0;
}
// 否则释放该i 节点,返回出错码。
iput(dir);
return -EISDIR;
}
// 在dir 节点对应的目录中取文件名对应的目录项结构de 和该目录项所在的高速缓冲区。
bh = find_entry(&dir,basename,namelen,&de);
// 如果该高速缓冲指针为NULL,则表示没有找到对应文件名的目录项,因此只可能是创建文件操作。
if (!bh) {
// 如果不是创建文件,则释放该目录的i 节点,返回出错号退出。
if (!(flag & O_CREAT)) {
iput(dir);
return -ENOENT;
}
// 如果用户在该目录没有写的权力,则释放该目录的i 节点,返回出错号退出。
if (!permission(dir,MAY_WRITE)) {
iput(dir);
return -EACCES;
}
// 在目录节点对应的设备上申请一个新i 节点,若失败,则释放目录的i 节点,并返回没有空间出错码。
inode = new_inode(dir->i_dev);
if (!inode) {
iput(dir);
return -ENOSPC;
}
// 否则使用该新i 节点,对其进行初始设置:置节点的用户id;对应节点访问模式;置已修改标志。
inode->i_uid = current->euid;
inode->i_mode = mode;
inode->i_dirt = 1;
// 然后在指定目录dir 中添加一新目录项。
bh = add_entry(dir,basename,namelen,&de);
// 如果返回的应该含有新目录项的高速缓冲区指针为NULL,则表示添加目录项操作失败。于是将该
// 新i 节点的引用连接计数减1;并释放该i 节点与目录的i 节点,返回出错码,退出。
if (!bh) {
inode->i_nlinks--;
iput(inode);
iput(dir);
return -ENOSPC;
}
// 初始设置该新目录项:置i 节点号为新申请到的i 节点的号码;并置高速缓冲区已修改标志。然后
// 释放该高速缓冲区,释放目录的i 节点。返回新目录项的i 节点指针,退出。
de->inode = inode->i_num;
bh->b_dirt = 1;
brelse(bh);
iput(dir);
*res_inode = inode;
return 0;
}
// 若上面在目录中取文件名对应的目录项结构操作成功(也即bh 不为NULL),取出该目录项的i 节点号
// 和其所在的设备号,并释放该高速缓冲区以及目录的i 节点。
inr = de->inode;
dev = dir->i_dev;
brelse(bh);
iput(dir);
// 如果独占使用标志O_EXCL 置位,则返回文件已存在出错码,退出。
if (flag & O_EXCL)
return -EEXIST;
// 如果取该目录项对应i 节点的操作失败,则返回访问出错码,退出。
if (!(inode=iget(dev,inr)))
return -EACCES;
// 若该i 节点是一个目录的节点并且访问模式是只读或只写,或者没有访问的许可权限,则释放该i
// 节点,返回访问权限出错码,退出。
if ((S_ISDIR(inode->i_mode) && (flag & O_ACCMODE)) ||
!permission(inode,ACC_MODE(flag))) {
iput(inode);
return -EPERM;
}
// 更新该i 节点的访问时间字段为当前时间。
inode->i_atime = CURRENT_TIME;
// 如果设立了截0 标志,则将该i 节点的文件长度截为0。
if (flag & O_TRUNC)
truncate(inode);
// 最后返回该目录项i 节点的指针,并返回0(成功)。
*res_inode = inode;
return 0;
}
int sys_symlink()
{
return -ENOSYS;
}
//// 系统调用函数 - 创建一个特殊文件或普通文件节点(node)。
// 创建名称为filename,由mode 和dev 指定的文件系统节点(普通文件、设备特殊文件或命名管道)。
// 参数:filename - 路径名;mode - 指定使用许可以及所创建节点的类型;dev - 设备号。
// 返回:成功则返回0,否则返回出错码。
int sys_mknod(const char * filename, int mode, int dev)
{
const char * basename;
int namelen;
struct m_inode * dir, * inode;
struct buffer_head * bh;
struct dir_entry * de;
// 如果不是超级用户,则返回访问许可出错码。
if (!suser())
return -EPERM;
// 如果找不到对应路径名目录的i 节点,则返回出错码。
if (!(dir = dir_namei(filename,&namelen,&basename)))
return -ENOENT;
// 如果最顶端的文件名长度为0,则说明给出的路径名最后没有指定文件名,释放该目录i 节点,返回
// 出错码,退出。
if (!namelen) {
iput(dir);
return -ENOENT;
}
// 如果在该目录中没有写的权限,则释放该目录的i 节点,返回访问许可出错码,退出。
if (!permission(dir,MAY_WRITE)) {
iput(dir);
return -EPERM;
}
// 如果对应路径名上最后的文件名的目录项已经存在,则释放包含该目录项的高速缓冲区,释放目录
// 的i 节点,返回文件已经存在出错码,退出。
bh = find_entry(&dir,basename,namelen,&de);
if (bh) {
brelse(bh);
iput(dir);
return -EEXIST;
}
// 申请一个新的i 节点,如果不成功,则释放目录的i 节点,返回无空间出错码,退出。
inode = new_inode(dir->i_dev);
if (!inode) {
iput(dir);
return -ENOSPC;
}
// 设置该i 节点的属性模式。如果要创建的是块设备文件或者是字符设备文件,则令i 节点的直接块
// 指针0 等于设备号。
inode->i_mode = mode;
if (S_ISBLK(mode) || S_ISCHR(mode))
inode->i_zone[0] = dev;
// 设置该i 节点的修改时间、访问时间为当前时间。
inode->i_mtime = inode->i_atime = CURRENT_TIME;
inode->i_dirt = 1;
// 在目录中新添加一个目录项,如果失败(包含该目录项的高速缓冲区指针为NULL),则释放目录的
// i 节点;所申请的i 节点引用连接计数复位,并释放该i 节点。返回出错码,退出。
bh = add_entry(dir,basename,namelen,&de);
if (!bh) {
iput(dir);
inode->i_nlinks=0;
iput(inode);
return -ENOSPC;
}
// 令该目录项的i 节点字段等于新i 节点号,置高速缓冲区已修改标志,释放目录和新的i 节点,释放
// 高速缓冲区,最后返回0(成功)。
de->inode = inode->i_num;
bh->b_dirt = 1;
iput(dir);
iput(inode);
brelse(bh);
return 0;
}
//// 系统调用函数 - 创建目录。
// 参数:pathname - 路径名;mode - 目录使用的权限属性。
// 返回:成功则返回0,否则返回出错码。
int sys_mkdir(const char * pathname, int mode)
{
const char * basename;
int namelen;
struct m_inode * dir, * inode;
struct buffer_head * bh, *dir_block;
struct dir_entry * de;
// 如果不是超级用户,则返回访问许可出错码。
if (!suser ())
return -EPERM;
// 如果找不到对应路径名目录的i 节点,则返回出错码。
if (!(dir = dir_namei (pathname, &namelen, &basename)))
return -ENOENT;
// 如果最顶端的文件名长度为0,则说明给出的路径名最后没有指定文件名,释放该目录i 节点,返回
// 出错码,退出。
if (!namelen)
{
iput (dir);
return -ENOENT;
}
// 如果在该目录中没有写的权限,则释放该目录的i 节点,返回访问许可出错码,退出。
if (!permission (dir, MAY_WRITE))
{
iput (dir);
return -EPERM;
}
// 如果对应路径名上最后的文件名的目录项已经存在,则释放包含该目录项的高速缓冲区,释放目录
// 的i 节点,返回文件已经存在出错码,退出。
bh = find_entry (&dir, basename, namelen, &de);
if (bh)
{
brelse (bh);
iput (dir);
return -EEXIST;
}
// 申请一个新的i 节点,如果不成功,则释放目录的i 节点,返回无空间出错码,退出。
inode = new_inode (dir->i_dev);
if (!inode)
{
iput (dir);
return -ENOSPC;
}
// 置该新i 节点对应的文件长度为32(一个目录项的大小),置节点已修改标志,以及节点的修改时间
// 和访问时间。
inode->i_size = 32;
inode->i_dirt = 1;
inode->i_mtime = inode->i_atime = CURRENT_TIME;
// 为该i 节点申请一磁盘块,并令节点第一个直接块指针等于该块号。如果申请失败,则释放对应目录
// 的i 节点;复位新申请的i 节点连接计数;释放该新的i 节点,返回没有空间出错码,退出。
if (!(inode->i_zone[0] = new_block (inode->i_dev)))
{
iput (dir);
inode->i_nlinks--;
iput (inode);
return -ENOSPC;
}
// 置该新的i 节点已修改标志。
inode->i_dirt = 1;
// 读新申请的磁盘块。若出错,则释放对应目录的i 节点;释放申请的磁盘块;复位新申请的i 节点
// 连接计数;释放该新的i 节点,返回没有空间出错码,退出。
if (!(dir_block = bread (inode->i_dev, inode->i_zone[0])))
{
iput (dir);
free_block (inode->i_dev, inode->i_zone[0]);
inode->i_nlinks--;
iput (inode);
return -ERROR;
}
// 令de 指向目录项数据块,置该目录项的i 节点号字段等于新申请的i 节点号,名字字段等于"."。
de = (struct dir_entry *) dir_block->b_data;
de->inode = inode->i_num;
strcpy (de->name, ".");
// 然后de 指向下一个目录项结构,该结构用于存放上级目录的节点号和名字".."。
de++;
de->inode = dir->i_num;
strcpy (de->name, "..");
inode->i_nlinks = 2;
// 然后设置该高速缓冲区已修改标志,并释放该缓冲区。
dir_block->b_dirt = 1;
brelse (dir_block);
// 初始化设置新i 节点的模式字段,并置该i 节点已修改标志。
inode->i_mode = I_DIRECTORY | (mode & 0777 & ~current->umask);
inode->i_dirt = 1;
// 在目录中新添加一个目录项,如果失败(包含该目录项的高速缓冲区指针为NULL),则释放目录的
// i 节点;所申请的i 节点引用连接计数复位,并释放该i 节点。返回出错码,退出。
bh = add_entry (dir, basename, namelen, &de);
if (!bh)
{
iput (dir);
free_block (inode->i_dev, inode->i_zone[0]);
inode->i_nlinks = 0;
iput (inode);
return -ENOSPC;
}
// 令该目录项的i 节点字段等于新i 节点号,置高速缓冲区已修改标志,释放目录和新的i 节点,释放
// 高速缓冲区,最后返回0(成功)。
de->inode = inode->i_num;
bh->b_dirt = 1;
dir->i_nlinks++;
dir->i_dirt = 1;
iput (dir);
iput (inode);
brelse (bh);
return 0;
}
/*
* routine to check that the specified directory is empty (for rmdir)
*/
/*
* 用于检查指定的目录是否为空的子程序(用于rmdir 系统调用函数)。
*/
//// 检查指定目录是否是空的。
// 参数:inode - 指定目录的i 节点指针。
// 返回:0 - 是空的;1 - 不空。
static int empty_dir(struct m_inode * inode)
{
int nr,block;
int len;
struct buffer_head * bh;
struct dir_entry * de;
// 计算指定目录中现有目录项的个数(应该起码有2 个,即"."和".."两个文件目录项)。
len = inode->i_size / sizeof (struct dir_entry);
// 如果目录项个数少于2 个或者该目录i 节点的第1 个直接块没有指向任何磁盘块号,或者相应磁盘
// 块读不出,则显示警告信息“设备dev 上目录错”,返回0(失败)。
if (len < 2 || !inode->i_zone[0] ||
!(bh = bread (inode->i_dev, inode->i_zone[0])))
{
printk ("warning - bad directory on dev %04x\n", inode->i_dev);
return 0;
}
// 让de 指向含有读出磁盘块数据的高速缓冲区中第1 项目录项。
de = (struct dir_entry *) bh->b_data;
// 如果第1 个目录项的i 节点号字段值不等于该目录的i 节点号,或者第2 个目录项的i 节点号字段
// 为零,或者两个目录项的名字字段不分别等于"."和"..",则显示出错警告信息“设备dev 上目录错”
// 并返回0。
if (de[0].inode != inode->i_num || !de[1].inode ||
strcmp (".", de[0].name) || strcmp ("..", de[1].name))
{
printk ("warning - bad directory on dev %04x\n", inode->i_dev);
return 0;
}
// 令nr 等于目录项序号;de 指向第三个目录项。
nr = 2;
de += 2;
// 循环检测该目录中所有的目录项(len-2 个),看有没有目录项的i 节点号字段不为0(被使用)。
while (nr < len)
{
// 如果该块磁盘块中的目录项已经检测完,则释放该磁盘块的高速缓冲区,读取下一块含有目录项的
// 磁盘块。若相应块没有使用(或已经不用,如文件已经删除等),则继续读下一块,若读不出,则出
// 错,返回0。否则让de 指向读出块的首个目录项。
if ((void *) de >= (void *) (bh->b_data + BLOCK_SIZE))
{
brelse (bh);
block = bmap (inode, nr / DIR_ENTRIES_PER_BLOCK);
if (!block)
{
nr += DIR_ENTRIES_PER_BLOCK;
continue;
}
if (!(bh = bread (inode->i_dev, block)))
return 0;
de = (struct dir_entry *) bh->b_data;
}
// 如果该目录项的i 节点号字段不等于0,则表示该目录项目前正被使用,则释放该高速缓冲区,
// 返回0,退出。
if (de->inode)
{
brelse (bh);
return 0;
}
// 否则,若还没有查询完该目录中的所有目录项,则继续检测。
de++;
nr++;
}
// 到这里说明该目录中没有找到已用的目录项(当然除了头两个以外),则返回缓冲区,返回1。
brelse (bh);
return 1;
}
//// 系统调用函数 - 删除指定名称的目录。
// 参数: name - 目录名(路径名)。
// 返回:返回0 表示成功,否则返回出错号。
int sys_rmdir(const char * name)
{
const char * basename;
int namelen;
struct m_inode * dir, * inode;
struct buffer_head * bh;
struct dir_entry * de;
// 如果不是超级用户,则返回访问许可出错码。
if (!suser ())
return -EPERM;
// 如果找不到对应路径名目录的i 节点,则返回出错码。
if (!(dir = dir_namei (name, &namelen, &basename)))
return -ENOENT;
// 如果最顶端的文件名长度为0,则说明给出的路径名最后没有指定文件名,释放该目录i 节点,返回
// 出错码,退出。
if (!namelen)
{
iput (dir);
return -ENOENT;
}
// 如果在该目录中没有写的权限,则释放该目录的i 节点,返回访问许可出错码,退出。
if (!permission (dir, MAY_WRITE))
{
iput (dir);
return -EPERM;
}
// 如果对应路径名上最后的文件名的目录项不存在,则释放包含该目录项的高速缓冲区,释放目录
// 的i 节点,返回文件已经存在出错码,退出。否则dir 是包含要被删除目录名的目录i 节点,de
// 是要被删除目录的目录项结构。
bh = find_entry (&dir, basename, namelen, &de);
if (!bh)
{
iput (dir);
return -ENOENT;
}
// 取该目录项指明的i 节点。若出错则释放目录的i 节点,并释放含有目录项的高速缓冲区,返回
// 出错号。
if (!(inode = iget (dir->i_dev, de->inode)))
{
iput (dir);
brelse (bh);
return -EPERM;
}
// 若该目录设置了受限删除标志并且进程的有效用户id 不等于该i 节点的用户id,则表示没有权限删
// 除该目录,于是释放包含要删除目录名的目录i 节点和该要删除目录的i 节点,释放高速缓冲区,返
// 回出错码。
if ((dir->i_mode & S_ISVTX) && current->euid &&
inode->i_uid != current->euid)
{
iput (dir);
iput (inode);
brelse (bh);
return -EPERM;
}
// 如果要被删除的目录项的i 节点的设备号不等于包含该目录项的目录的设备号,或者该被删除目录的
// 引用连接计数大于1(表示有符号连接等),则不能删除该目录,于是释放包含要删除目录名的目录
// i 节点和该要删除目录的i 节点,释放高速缓冲区,返回出错码。
if (inode->i_dev != dir->i_dev || inode->i_count > 1)
{
iput (dir);
iput (inode);
brelse (bh);
return -EPERM;
}
// 如果要被删除目录的目录项i 节点的节点号等于包含该需删除目录的i 节点号,则表示试图删除"."
// 目录。于是释放包含要删除目录名的目录i 节点和该要删除目录的i 节点,释放高速缓冲区,返回
// 出错码。
if (inode == dir)
{ /* we may not delete ".", but "../dir" is ok */
iput (inode); /* 我们不可以删除".",但可以删除"../dir" */
iput (dir);
brelse (bh);
return -EPERM;
}
// 若要被删除的目录的i 节点的属性表明这不是一个目录,则释放包含要删除目录名的目录i 节点和
// 该要删除目录的i 节点,释放高速缓冲区,返回出错码。
if (!S_ISDIR (inode->i_mode))
{
iput (inode);
iput (dir);
brelse (bh);
return -ENOTDIR;
}
// 若该需被删除的目录不空,则释放包含要删除目录名的目录i 节点和该要删除目录的i 节点,释放
// 高速缓冲区,返回出错码。
if (!empty_dir (inode))
{
iput (inode);
iput (dir);
brelse (bh);
return -ENOTEMPTY;
}
// 若该需被删除目录的i 节点的连接数不等于2,则显示警告信息。
if (inode->i_nlinks != 2)
printk ("empty directory has nlink!=2 (%d)", inode->i_nlinks);
// 置该需被删除目录的目录项的i 节点号字段为0,表示该目录项不再使用,并置含有该目录项的高速
// 缓冲区已修改标志,并释放该缓冲区。
de->inode = 0;
bh->b_dirt = 1;
brelse (bh);
// 置被删除目录的i 节点的连接数为0,并置i 节点已修改标志。
inode->i_nlinks = 0;
inode->i_dirt = 1;
// 将包含被删除目录名的目录的i 节点引用计数减1,修改其改变时间和修改时间为当前时间,并置
// 该节点已修改标志。
dir->i_nlinks--;
dir->i_ctime = dir->i_mtime = CURRENT_TIME;
dir->i_dirt = 1;
// 最后释放包含要删除目录名的目录i 节点和该要删除目录的i 节点,返回0(成功)。
iput (dir);
iput(inode);
return 0;
}
//// 系统调用函数 - 删除文件名以及可能也删除其相关的文件。
// 从文件系统删除一个名字。如果是一个文件的最后一个连接,并且没有进程正打开该文件,则该文件
// 也将被删除,并释放所占用的设备空间。
// 参数:name - 文件名。
// 返回:成功则返回0,否则返回出错号。
int sys_unlink(const char * name)
{
const char * basename;
int namelen;
struct m_inode * dir, * inode;
struct buffer_head * bh;
struct dir_entry * de;
// 如果找不到对应路径名目录的i 节点,则返回出错码。
if (!(dir = dir_namei (name, &namelen, &basename)))
return -ENOENT;
// 如果最顶端的文件名长度为0,则说明给出的路径名最后没有指定文件名,释放该目录i 节点,返回
// 出错码,退出。
if (!namelen)
{
iput (dir);
return -ENOENT;
}
// 如果在该目录中没有写的权限,则释放该目录的i 节点,返回访问许可出错码,退出。
if (!permission (dir, MAY_WRITE))
{
iput (dir);
return -EPERM;
}
// 如果对应路径名上最后的文件名的目录项不存在,则释放包含该目录项的高速缓冲区,释放目录
// 的i 节点,返回文件已经存在出错码,退出。否则dir 是包含要被删除目录名的目录i 节点,de
// 是要被删除目录的目录项结构。
bh = find_entry (&dir, basename, namelen, &de);
if (!bh)
{
iput (dir);
return -ENOENT;
}
// 取该目录项指明的i 节点。若出错则释放目录的i 节点,并释放含有目录项的高速缓冲区,返回
// 出错号。
if (!(inode = iget (dir->i_dev, de->inode)))
{
iput (dir);
brelse (bh);
return -ENOENT;
}
// 如果该目录设置了受限删除标志并且用户不是超级用户,并且进程的有效用户id 不等于被删除文件
// 名i 节点的用户id,并且进程的有效用户id 也不等于目录i 节点的用户id,则没有权限删除该文件
// 名。则释放该目录i 节点和该文件名目录项的i 节点,释放包含该目录项的缓冲区,返回出错号。
if ((dir->i_mode & S_ISVTX) && !suser () &&
current->euid != inode->i_uid && current->euid != dir->i_uid)
{
iput (dir);
iput (inode);
brelse (bh);
return -EPERM;
}
// 如果该指定文件名是一个目录,则也不能删除,释放该目录i 节点和该文件名目录项的i 节点,释放
// 包含该目录项的缓冲区,返回出错号。
if (S_ISDIR (inode->i_mode))
{
iput (inode);
iput (dir);
brelse (bh);
return -EPERM;
}
// 如果该i 节点的连接数已经为0,则显示警告信息,修正其为1。
if (!inode->i_nlinks)
{
printk ("Deleting nonexistent file (%04x:%d), %d\n",
inode->i_dev, inode->i_num, inode->i_nlinks);
inode->i_nlinks = 1;
}
// 将该文件名的目录项中的i 节点号字段置为0,表示释放该目录项,并设置包含该目录项的缓冲区
// 已修改标志,释放该高速缓冲区。
de->inode = 0;
bh->b_dirt = 1;
brelse (bh);
// 该i 节点的连接数减1,置已修改标志,更新改变时间为当前时间。最后释放该i 节点和目录的i 节
// 点,返回0(成功)。
inode->i_nlinks--;
inode->i_dirt = 1;
inode->i_ctime = CURRENT_TIME;
iput (inode);
iput (dir);
return 0;
}
//// 系统调用函数 - 为文件建立一个文件名。
// 为一个已经存在的文件创建一个新连接(也称为硬连接 - hard link)。
// 参数:oldname - 原路径名;newname - 新的路径名。
// 返回:若成功则返回0,否则返回出错号。
int sys_link(const char * oldname, const char * newname)
{
struct dir_entry * de;
struct m_inode * oldinode, * dir;
struct buffer_head * bh;
const char * basename;
int namelen;
// 取原文件路径名对应的i 节点oldinode。如果为0,则表示出错,返回出错号。
oldinode = namei (oldname);
if (!oldinode)
return -ENOENT;
// 如果原路径名对应的是一个目录名,则释放该i 节点,返回出错号。
if (S_ISDIR (oldinode->i_mode))
{
iput (oldinode);
return -EPERM;
}
// 查找新路径名的最顶层目录的i 节点,并返回最后的文件名及其长度。如果目录的i 节点没有找到,
// 则释放原路径名的i 节点,返回出错号。
dir = dir_namei (newname, &namelen, &basename);
if (!dir)
{
iput (oldinode);
return -EACCES;
}
// 如果新路径名中不包括文件名,则释放原路径名i 节点和新路径名目录的i 节点,返回出错号。
if (!namelen)
{
iput (oldinode);
iput (dir);
return -EPERM;
}
// 如果新路径名目录的设备号与原路径名的设备号不一样,则也不能建立连接,于是释放新路径名
// 目录的i 节点和原路径名的i 节点,返回出错号。
if (dir->i_dev != oldinode->i_dev)
{
iput (dir);
iput (oldinode);
return -EXDEV;
}
// 如果用户没有在新目录中写的权限,则也不能建立连接,于是释放新路径名目录的i 节点和原路径名
// 的i 节点,返回出错号。
if (!permission (dir, MAY_WRITE))
{
iput (dir);
iput (oldinode);
return -EACCES;
}
// 查询该新路径名是否已经存在,如果存在,则也不能建立连接,于是释放包含该已存在目录项的高速
// 缓冲区,释放新路径名目录的i 节点和原路径名的i 节点,返回出错号。
bh = find_entry (&dir, basename, namelen, &de);
if (bh)
{
brelse (bh);
iput (dir);
iput (oldinode);
return -EEXIST;
}
// 在新目录中添加一个目录项。若失败则释放该目录的i 节点和原路径名的i 节点,返回出错号。
bh = add_entry (dir, basename, namelen, &de);
if (!bh)
{
iput (dir);
iput (oldinode);
return -ENOSPC;
}
// 否则初始设置该目录项的i 节点号等于原路径名的i 节点号,并置包含该新添目录项的高速缓冲区
// 已修改标志,释放该缓冲区,释放目录的i 节点。
de->inode = oldinode->i_num;
bh->b_dirt = 1;
brelse (bh);
iput (dir);
// 将原节点的应用计数加1,修改其改变时间为当前时间,并设置i 节点已修改标志,最后释放原
// 路径名的i 节点,并返回0(成功)。
oldinode->i_nlinks++;
oldinode->i_ctime = CURRENT_TIME;
oldinode->i_dirt = 1;
iput (oldinode);
return 0;
}
/*
* linux/fs/open.c
*
* (C) 1991 Linus Torvalds
*/
/* #include <string.h> */
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <fcntl.h> // 文件控制头文件。用于文件及其描述符的操作控制常数符号的定义。
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
#include <utime.h> // 用户时间头文件。定义了访问和修改时间结构以及utime()原型。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/tty.h> // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
// 取文件系统信息系统调用函数。
int sys_ustat(int dev, struct ustat * ubuf)
{
return -ENOSYS; // 出错码:功能还没有实现
}
// 设置文件访问和修改时间。
// 参数 filename 是文件名,times是访问和修改时间结构指针。
// 如果 times 指针不为NULL,则取utimbuf 结构中的时间信息来设置文件的访问和修改时间
// 如果 times 指针式NULL,则取系统当前时间来设置指定文件的访问和修改时间域
int sys_utime(char * filename, struct utimbuf * times)
{
struct m_inode * inode;
long actime,modtime;
// 文件的时间信息保存在其 i 节点中。因此我们首先根据文件名取得对应 i节点。如果没有
// 找到,则返回出错码
if (!(inode=namei(filename)))
return -ENOENT;
// 如果提供的访问和修改时间结构指针times不为NULL,则从结构中读取用户设置的时间值
// 否则就用系统当前时间来设置文件的访问和修改时间
if (times) {
actime = get_fs_long((unsigned long *) &times->actime);
modtime = get_fs_long((unsigned long *) &times->modtime);
} else
actime = modtime = CURRENT_TIME;
// 然后修改 i 节点中的访问时间字段和修改时间字段。再设置 i 节点已修改标志,放回该i
// 节点,并返回0.
inode->i_atime = actime;
inode->i_mtime = modtime;
inode->i_dirt = 1;
iput(inode);
return 0;
}
/*
* XXX should we use the real or effective uid? BSD uses the real uid,
* so as to make this call useful to setuid programs.
*/
/*
* XXX 我们该用真实用户id(ruid)还是有效用户id(euid)?BSD系统使用了真实用户id
* 以使该调用可以供setuid程序使用。
*(注:POSIX标准建议使用真实用户ID)。
*(英文注释开始的‘XXX’表示重要提示。)
*/
//// 检查对文件的访问权限
// 参数 filename 是文件名,mode是检查的访问属性,它有3个有效比特位组成:R_OK(值4)、
// W_OK(2)、X_OK(1)和F_OK(0)组成。分别表示检测文件是否可读,可写、可执行和文件
// 是否存在。如果访问允许的话,则返回0,否则返回出错码。
int sys_access(const char * filename,int mode)
{
struct m_inode * inode;
int res, i_mode;
// 屏蔽码由低3 位组成,因此清除所有高比特位。
mode &= 0007;
// 如果文件名对应的i 节点不存在,则返回出错码。
if (!(inode=namei(filename)))
return -EACCES;
// 取文件的属性码,并释放该i 节点。
i_mode = res = inode->i_mode & 0777;
iput(inode);
// 如果当前进程是该文件的宿主,则取文件宿主属性。
if (current->uid == inode->i_uid)
res >>= 6;
// 否则如果当前进程是与该文件同属一组,则取文件组属性。
else if (current->gid == inode->i_gid)
res >>= 6;
// 如果文件属性具有查询的属性位,则访问许可,返回0。
if ((res & 0007 & mode) == mode)
return 0;
/*
* XXX we are doing this test last because we really should be
* swapping the effective with the real user id (temporarily),
* and then calling suser() routine. If we do call the
* suser() routine, it needs to be called last.
*/
/*
* XXX 我们最后才做下面的测试,因为我们实际上需要交换有效用户id 和
* 真实用户id(临时地),然后才调用suser()函数。如果我们确实要调用
* suser()函数,则需要最后才被调用。
*/
// 如果当前用户id 为0(超级用户)并且屏蔽码执行位是0 或文件可以被任何人访问,则返回0。
if ((!current->uid) &&
(!(mode & 1) || (i_mode & 0111)))
return 0;
// 否则返回出错码。
return -EACCES;
}
//// 改变当前工作目录系统调用函数。
// 参数filename 是目录名。
// 操作成功则返回0,否则返回出错码。
int sys_chdir(const char * filename)
{
struct m_inode * inode;
// 如果文件名对应的i 节点不存在,则返回出错码。
if (!(inode = namei(filename)))
return -ENOENT;
// 如果该i 节点不是目录的i 节点,则释放该节点,返回出错码。
if (!S_ISDIR(inode->i_mode)) {
iput(inode);
return -ENOTDIR;
}
// 释放当前进程原工作目录i 节点,并指向该新置的工作目录i 节点。返回0。
iput(current->pwd);
current->pwd = inode;
return (0);
}
//// 改变根目录系统调用函数。
// 将指定的路径名改为根目录'/'。
// 如果操作成功则返回0,否则返回出错码。
int sys_chroot(const char * filename)
{
struct m_inode * inode;
// 如果文件名对应的 i 节点不存在,则返回出错码
if (!(inode=namei(filename)))
return -ENOENT;
// 如果该i 节点不是目录的i 节点,则释放该节点,返回出错码。
if (!S_ISDIR(inode->i_mode)) {
iput(inode);
return -ENOTDIR;
}
// 释放当前进程的根目录i 节点,并重置为这里指定目录名的i 节点,返回0。
iput(current->root);
current->root = inode;
return (0);
}
//// 修改文件属性系统调用函数。
// 参数filename 是文件名,mode 是新的文件属性。
// 若操作成功则返回0,否则返回出错码。
int sys_chmod(const char * filename,int mode)
{
struct m_inode * inode;
// 如果文件名对应的i 节点不存在,则返回出错码。
if (!(inode=namei(filename)))
return -ENOENT;
// 如果当前进程的有效用户id 不等于文件i 节点的用户id,并且当前进程不是超级用户,则释放该
// 文件i 节点,返回出错码。
if ((current->euid != inode->i_uid) && !suser()) {
iput(inode);
return -EACCES;
}
// 重新设置i 节点的文件属性,并置该i 节点已修改标志。释放该i 节点,返回0。
inode->i_mode = (mode & 07777) | (inode->i_mode & ~07777);
inode->i_dirt = 1;
iput(inode);
return 0;
}
//// 修改文件宿主系统调用函数。
// 参数filename 是文件名,uid 是用户标识符(用户id),gid 是组id。
// 若操作成功则返回0,否则返回出错码。
int sys_chown(const char * filename,int uid,int gid)
{
struct m_inode * inode;
// 如果文件名对应的i 节点不存在,则返回出错码。
if (!(inode=namei(filename)))
return -ENOENT;
// 若当前进程不是超级用户,则释放该i 节点,返回出错码。
if (!suser()) {
iput(inode);
return -EACCES;
}
// 设置文件对应i 节点的用户id 和组id,并置i 节点已经修改标志,释放该i 节点,返回0。
inode->i_uid=uid;
inode->i_gid=gid;
inode->i_dirt=1;
iput(inode);
return 0;
}
//// 打开(或创建)文件系统调用函数。
// 参数filename 是文件名,flag 是打开文件标志:只读O_RDONLY、只写O_WRONLY 或读写O_RDWR,
// 以及O_CREAT、O_EXCL、O_APPEND 等其它一些标志的组合,若本函数创建了一个新文件,则mode
// 用于指定使用文件的许可属性,这些属性有S_IRWXU(文件宿主具有读、写和执行权限)、S_IRUSR
// (用户具有读文件权限)、S_IRWXG(组成员具有读、写和执行权限)等等。对于新创建的文件,这些
// 属性只应用于将来对文件的访问,创建了只读文件的打开调用也将返回一个可读写的文件句柄。
// 若操作成功则返回文件句柄(文件描述符),否则返回出错码。(参见sys/stat.h, fcntl.h)
int sys_open(const char * filename,int flag,int mode)
{
struct m_inode * inode;
struct file * f;
int i,fd;
// 将用户设置的模式与进程的模式屏蔽码相与,产生许可的文件模式。
mode &= 0777 & ~current->umask;
// 搜索进程结构中文件结构指针数组,查找一个空闲项,若已经没有空闲项,则返回出错码。
for(fd=0 ; fd<NR_OPEN ; fd++)
if (!current->filp[fd])
break;
if (fd>=NR_OPEN)
return -EINVAL;
// 设置执行时关闭文件句柄位图,复位对应比特位。
current->close_on_exec &= ~(1<<fd);
// 令f 指向文件表数组开始处。搜索空闲文件结构项(句柄引用计数为0 的项),若已经没有空闲
// 文件表结构项,则返回出错码。
f=0+file_table;
for (i=0 ; i<NR_FILE ; i++,f++)
if (!f->f_count) break;
if (i>=NR_FILE)
return -EINVAL;
// 让进程的对应文件句柄的文件结构指针指向搜索到的文件结构,并令句柄引用计数递增1。
(current->filp[fd]=f)->f_count++;
// 调用函数执行打开操作,若返回值小于0,则说明出错,释放刚申请到的文件结构,返回出错码。
if ((i=open_namei(filename,flag,mode,&inode))<0) {
current->filp[fd]=NULL;
f->f_count=0;
return i;
}
/* ttys are somewhat special (ttyxx major==4, tty major==5) */
/* ttys 有些特殊(ttyxx 主号==4,tty 主号==5)*/
// 如果是字符设备文件,那么如果设备号是4 的话,则设置当前进程的tty 号为该i 节点的子设备号。
// 并设置当前进程tty 对应的tty 表项的父进程组号等于进程的父进程组号。
if (S_ISCHR(inode->i_mode)) {
if (MAJOR(inode->i_zone[0])==4) {
if (current->leader && current->tty<0) {
current->tty = MINOR(inode->i_zone[0]);
tty_table[current->tty].pgrp = current->pgrp;
}
// 否则如果该字符文件设备号是5 的话,若当前进程没有tty,则说明出错,释放i 节点和申请到的
// 文件结构,返回出错码。
} else if (MAJOR(inode->i_zone[0])==5)
if (current->tty<0) {
iput(inode);
current->filp[fd]=NULL;
f->f_count=0;
return -EPERM;
}
}
/* Likewise with block-devices: check for floppy_change */
/* 同样对于块设备文件:需要检查盘片是否被更换 */
// 如果打开的是块设备文件,则检查盘片是否更换,若更换则需要是高速缓冲中对应该设备的所有
// 缓冲块失效。
if (S_ISBLK(inode->i_mode))
check_disk_change(inode->i_zone[0]);
// 初始化文件结构。置文件结构属性和标志,置句柄引用计数为1,设置i 节点字段,文件读写指针
// 初始化为0。返回文件句柄。
f->f_mode = inode->i_mode;
f->f_flags = flag;
f->f_count = 1;
f->f_inode = inode;
f->f_pos = 0;
return (fd);
}
//// 创建文件系统调用函数。
// 参数pathname 是路径名,mode 与上面的sys_open()函数相同。
// 成功则返回文件句柄,否则返回出错码。
int sys_creat(const char * pathname, int mode)
{
return sys_open(pathname, O_CREAT | O_TRUNC, mode);
}
// 关闭文件系统调用函数。
// 参数fd 是文件句柄。
// 成功则返回0,否则返回出错码。
int sys_close(unsigned int fd)
{
struct file * filp;
// 若文件句柄值大于程序同时能打开的文件数,则返回出错码。
if (fd >= NR_OPEN)
return -EINVAL;
// 复位进程的执行时关闭文件句柄位图对应位。
current->close_on_exec &= ~(1<<fd);
// 若该文件句柄对应的文件结构指针是NULL,则返回出错码。
if (!(filp = current->filp[fd]))
return -EINVAL;
// 置该文件句柄的文件结构指针为NULL。
current->filp[fd] = NULL;
// 若在关闭文件之前,对应文件结构中的句柄引用计数已经为0,则说明内核出错,死机。
if (filp->f_count == 0)
panic("Close: file count is 0");
// 否则将对应文件结构的句柄引用计数减1,如果还不为0,则返回0(成功)。若已等于0,说明该
// 文件已经没有句柄引用,则释放该文件i 节点,返回0。
if (--filp->f_count)
return (0);
iput(filp->f_inode);
return (0);
}
/*
* linux/fs/pipe.c
*
* (C) 1991 Linus Torvalds
*/
#include <signal.h> // 信号头文件。定义信号符号常量,信号结构以及信号操作函数原型。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/mm.h> /* for get_free_page */ /* 使用其中的get_free_page */
// 内存管理头文件。含有页面大小定义和一些页面释放函数原型。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
//// 管道读操作函数。
// 参数inode 是管道对应的i 节点,buf 是数据缓冲区指针,count 是读取的字节数。
int read_pipe(struct m_inode * inode, char * buf, int count)
{
int chars, size, read = 0;
// 若欲读取的字节计数值count 大于0,则循环执行以下操作。
while (count>0) {
// 若当前管道中没有数据(size=0),则唤醒等待该节点的进程,如果已没有写管道者,则返回已读
// 字节数,退出。否则在该i 节点上睡眠,等待信息。
while (!(size=PIPE_SIZE(*inode))) {
wake_up(&inode->i_wait);
if (inode->i_count != 2) /* are there any writers? */
return read;
sleep_on(&inode->i_wait);
}
// 取管道尾到缓冲区末端的字节数chars。如果其大于还需要读取的字节数count,则令其等于count。
// 如果chars 大于当前管道中含有数据的长度size,则令其等于size。
chars = PAGE_SIZE-PIPE_TAIL(*inode);
if (chars > count)
chars = count;
if (chars > size)
chars = size;
// 读字节计数减去此次可读的字节数chars,并累加已读字节数。
count -= chars;
read += chars;
// 令size 指向管道尾部,调整当前管道尾指针(前移chars 字节)。
size = PIPE_TAIL(*inode);
PIPE_TAIL(*inode) += chars;
PIPE_TAIL(*inode) &= (PAGE_SIZE-1);
// 将管道中的数据复制到用户缓冲区中。对于管道i 节点,其i_size 字段中是管道缓冲块指针。
while (chars-->0)
put_fs_byte(((char *)inode->i_size)[size++],buf++);
}
// 唤醒等待该管道i 节点的进程,并返回读取的字节数。
wake_up(&inode->i_wait);
return read;
}
//// 管道写操作函数。
// 参数inode 是管道对应的i 节点,buf 是数据缓冲区指针,count 是将写入管道的字节数。
int write_pipe(struct m_inode * inode, char * buf, int count)
{
int chars, size, written = 0;
// 若将写入的字节计数值count 还大于0,则循环执行以下操作。
while (count>0) {
// 若当前管道中没有已经满了(size=0),则唤醒等待该节点的进程,如果已没有读管道者,则向进程
// 发送SIGPIPE 信号,并返回已写入的字节数并退出。若写入0 字节,则返回-1。否则在该i 节点上
// 睡眠,等待管道腾出空间。
while (!(size=(PAGE_SIZE-1)-PIPE_SIZE(*inode))) {
wake_up(&inode->i_wait);
if (inode->i_count != 2) { /* no readers */
current->signal |= (1<<(SIGPIPE-1));
return written?written:-1;
}
sleep_on(&inode->i_wait);
}
// 取管道头部到缓冲区末端空间字节数chars。如果其大于还需要写入的字节数count,则令其等于
// count。如果chars 大于当前管道中空闲空间长度size,则令其等于size。
chars = PAGE_SIZE-PIPE_HEAD(*inode);
if (chars > count)
chars = count;
if (chars > size)
chars = size;
// 写入字节计数减去此次可写入的字节数chars,并累加已写字节数到written。
count -= chars;
written += chars;
// 令size 指向管道数据头部,调整当前管道数据头部指针(前移chars 字节)。
size = PIPE_HEAD(*inode);
PIPE_HEAD(*inode) += chars;
PIPE_HEAD(*inode) &= (PAGE_SIZE-1);
// 从用户缓冲区复制chars 个字节到管道中。对于管道i 节点,其i_size 字段中是管道缓冲块指针。
while (chars-->0)
((char *)inode->i_size)[size++]=get_fs_byte(buf++);
}
// 唤醒等待该i 节点的进程,返回已写入的字节数,退出。
wake_up(&inode->i_wait);
return written;
}
//// 创建管道系统调用函数。
// 在fildes 所指的数组中创建一对文件句柄(描述符)。这对文件句柄指向一管道i 节点。fildes[0]
// 用于读管道中数据,fildes[1]用于向管道中写入数据。
// 成功时返回0,出错时返回-1。
int sys_pipe(unsigned long * fildes)
{
struct m_inode * inode;
struct file * f[2];
int fd[2];
int i,j;
// 从系统文件表中取两个空闲项(引用计数字段为0 的项),并分别设置引用计数为1。
j=0;
for(i=0;j<2 && i<NR_FILE;i++)
if (!file_table[i].f_count)
(f[j++]=i+file_table)->f_count++;
// 如果只有一个空闲项,则释放该项(引用计数复位)。
if (j==1)
f[0]->f_count=0;
// 如果没有找到两个空闲项,则返回-1。
if (j<2)
return -1;
// 针对上面取得的两个文件结构项,分别分配一文件句柄,并使进程的文件结构指针分别指向这两个
// 文件结构。
j=0;
for(i=0;j<2 && i<NR_OPEN;i++)
if (!current->filp[i]) {
current->filp[ fd[j]=i ] = f[j];
j++;
}
// 如果只有一个空闲文件句柄,则释放该句柄。
if (j==1)
current->filp[fd[0]]=NULL;
// 如果没有找到两个空闲句柄,则释放上面获取的两个文件结构项(复位引用计数值),并返回-1。
if (j<2) {
f[0]->f_count=f[1]->f_count=0;
return -1;
}
// 申请管道i 节点,并为管道分配缓冲区(1 页内存)。如果不成功,则相应释放两个文件句柄和文
// 件结构项,并返回-1。
if (!(inode=get_pipe_inode())) {
current->filp[fd[0]] =
current->filp[fd[1]] = NULL;
f[0]->f_count = f[1]->f_count = 0;
return -1;
}
// 初始化两个文件结构,都指向同一个i 节点,读写指针都置零。第1 个文件结构的文件模式置为读,
// 第2 个文件结构的文件模式置为写。
f[0]->f_inode = f[1]->f_inode = inode;
f[0]->f_pos = f[1]->f_pos = 0;
f[0]->f_mode = 1; /* read */
f[1]->f_mode = 2; /* write */
// 将文件句柄数组复制到对应的用户数组中,并返回0,退出。
put_fs_long(fd[0],0+fildes);
put_fs_long(fd[1],1+fildes);
return 0;
}
/*
* linux/fs/read_write.c
*
* (C) 1991 Linus Torvalds
*/
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
// 字符设备读写函数。 fs/char_dev.c
extern int rw_char (int rw, int dev, char *buf, int count, off_t * pos);
// 读管道操作函数。 fs/pipe.c
extern int read_pipe (struct m_inode *inode, char *buf, int count);
// 写管道操作函数。fs/pipe.c
extern int write_pipe (struct m_inode *inode, char *buf, int count);
// 块设备读操作函数。fs/block_dev.c
extern int block_read (int dev, off_t * pos, char *buf, int count);
// 块设备写操作函数。fs/block_dev.c
extern int block_write (int dev, off_t * pos, char *buf, int count);
// 读文件操作函数。fs/file_dev.c
extern int file_read (struct m_inode *inode, struct file *filp,
char *buf, int count);
// 写文件操作函数。fs/file_dev.c
extern int file_write (struct m_inode *inode, struct file *filp,
char *buf, int count);
//// 重定位文件读写指针系统调用函数。
// 参数fd 是文件句柄,offset 是新的文件读写指针偏移值,origin 是偏移的起始位置,是SEEK_SET
// (0,从文件开始处)、SEEK_CUR(1,从当前读写位置)、SEEK_END(2,从文件尾处)三者之一。
int sys_lseek(unsigned int fd,off_t offset, int origin)
{
struct file * file;
int tmp;
if (fd >= NR_OPEN || !(file=current->filp[fd]) || !(file->f_inode)
|| !IS_SEEKABLE(MAJOR(file->f_inode->i_dev)))
return -EBADF;
// 如果文件对应的i 节点是管道节点,则返回出错码,退出。管道头尾指针不可随意移动!
if (file->f_inode->i_pipe)
return -ESPIPE;
// 根据设置的定位标志,分别重新定位文件读写指针。
switch (origin) {
// origin = SEEK_SET,要求以文件起始处作为原点设置文件读写指针。若偏移值小于零,则出错返
// 回错误码。否则设置文件读写指针等于offset。
case 0:
if (offset<0) return -EINVAL;
file->f_pos=offset;
break;
// origin = SEEK_CUR,要求以文件当前读写指针处作为原点重定位读写指针。如果文件当前指针加
// 上偏移值小于0,则返回出错码退出。否则在当前读写指针上加上偏移值。
case 1:
if (file->f_pos+offset<0) return -EINVAL;
file->f_pos += offset;
break;
// origin = SEEK_END,要求以文件末尾作为原点重定位读写指针。此时若文件大小加上偏移值小于零
// 则返回出错码退出。否则重定位读写指针为文件长度加上偏移值。
case 2:
if ((tmp=file->f_inode->i_size+offset) < 0)
return -EINVAL;
file->f_pos = tmp;
break;
// origin 设置出错,返回出错码退出。
default:
return -EINVAL;
}
return file->f_pos; // 返回重定位后的文件读写指针值。
}
//// 读文件系统调用函数。
// 参数fd 是文件句柄,buf 是缓冲区,count 是欲读字节数。
int sys_read(unsigned int fd,char * buf,int count)
{
struct file * file;
struct m_inode * inode;
// 如果文件句柄值大于程序最多打开文件数NR_OPEN,或者需要读取的字节计数值小于0,或者该句柄
// 的文件结构指针为空,则返回出错码并退出。
if (fd>=NR_OPEN || count<0 || !(file=current->filp[fd]))
return -EINVAL;
// 若需读取的字节数count 等于0,则返回0,退出
if (!count)
return 0;
// 验证存放数据的缓冲区内存限制。
verify_area(buf,count);
// 取文件对应的i 节点。若是管道文件,并且是读管道文件模式,则进行读管道操作,若成功则返回
// 读取的字节数,否则返回出错码,退出。
inode = file->f_inode;
if (inode->i_pipe)
return (file->f_mode&1)?read_pipe(inode,buf,count):-EIO;
// 如果是字符型文件,则进行读字符设备操作,返回读取的字符数。
if (S_ISCHR(inode->i_mode))
return rw_char(READ,inode->i_zone[0],buf,count,&file->f_pos);
// 如果是块设备文件,则执行块设备读操作,并返回读取的字节数。
if (S_ISBLK(inode->i_mode))
return block_read(inode->i_zone[0],&file->f_pos,buf,count);
// 如果是目录文件或者是常规文件,则首先验证读取数count 的有效性并进行调整(若读取字节数加上
// 文件当前读写指针值大于文件大小,则重新设置读取字节数为文件长度-当前读写指针值,若读取数
// 等于0,则返回0 退出),然后执行文件读操作,返回读取的字节数并退出。
if (S_ISDIR(inode->i_mode) || S_ISREG(inode->i_mode)) {
if (count+file->f_pos > inode->i_size)
count = inode->i_size - file->f_pos;
if (count<=0)
return 0;
return file_read(inode,file,buf,count);
}
// 否则打印节点文件属性,并返回出错码退出。
printk("(Read)inode->i_mode=%06o\n\r",inode->i_mode);
return -EINVAL;
}
//// 写文件系统调用
// 参数fd是文件句柄,buf 是用户缓冲区,count是欲写的字节数。
int sys_write(unsigned int fd,char * buf,int count)
{
struct file * file;
struct m_inode * inode;
// 如果文件句柄值大于程序最多打开文件数NR_OPEN,或者需要写入的字节计数小于0,或者该句柄
// 的文件结构指针为空,则返回出错码并退出。
if (fd>=NR_OPEN || count <0 || !(file=current->filp[fd]))
return -EINVAL;
// 若需读取的字节数count 等于0,则返回0,退出
if (!count)
return 0;
// 取文件对应的i 节点。若是管道文件,并且是写管道文件模式,则进行写管道操作,若成功则返回
// 写入的字节数,否则返回出错码,退出。
inode=file->f_inode;
if (inode->i_pipe)
return (file->f_mode&2)?write_pipe(inode,buf,count):-EIO;
// 如果是字符型文件,则进行写字符设备操作,返回写入的字符数,退出。
if (S_ISCHR(inode->i_mode))
return rw_char(WRITE,inode->i_zone[0],buf,count,&file->f_pos);
// 如果是块设备文件,则进行块设备写操作,并返回写入的字节数,退出。
if (S_ISBLK(inode->i_mode))
return block_write(inode->i_zone[0],&file->f_pos,buf,count);
// 若是常规文件,则执行文件写操作,并返回写入的字节数,退出。
if (S_ISREG(inode->i_mode))
return file_write(inode,file,buf,count);
// 否则,显示对应节点的文件模式,返回出错码,退出。
printk("(Write)inode->i_mode=%06o\n\r",inode->i_mode);
return -EINVAL;
}
/* nothing , only the stub */
/* gohigh */
#include <errno.h>
int sys_select()
{
return -ENOSYS;
}
/*
* linux/fs/stat.c
*
* (C) 1991 Linus Torvalds
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
#include <linux/fs.h> // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
//// 复制文件状态信息。
// 参数inode 是文件对应的i 节点,statbuf 是stat 文件状态结构指针,用于存放取得的状态信息。
static void cp_stat(struct m_inode * inode, struct stat * statbuf)
{
struct stat tmp;
int i;
// 首先验证(或分配)存放数据的内存空间。
verify_area(statbuf,sizeof (* statbuf));
// 然后临时复制相应节点上的信息。
tmp.st_dev = inode->i_dev; // 文件所在的设备号。
tmp.st_ino = inode->i_num; // 文件i 节点号。
tmp.st_mode = inode->i_mode; // 文件属性。
tmp.st_nlink = inode->i_nlinks; // 文件的连接数。
tmp.st_uid = inode->i_uid; // 文件的用户id。
tmp.st_gid = inode->i_gid; // 文件的组id。
tmp.st_rdev = inode->i_zone[0]; // 设备号(如果文件是特殊的字符文件或块文件)。
tmp.st_size = inode->i_size; // 文件大小(字节数)(如果文件是常规文件)。
tmp.st_atime = inode->i_atime; // 最后访问时间。
tmp.st_mtime = inode->i_mtime; // 最后修改时间。
tmp.st_ctime = inode->i_ctime; // 最后节点修改时间。
// 最后将这些状态信息复制到用户缓冲区中。
for (i=0 ; i<sizeof (tmp) ; i++)
put_fs_byte(((char *) &tmp)[i],&((char *) statbuf)[i]);
}
//// 文件状态系统调用函数 - 根据文件名获取文件状态信息。
// 参数filename 是指定的文件名,statbuf 是存放状态信息的缓冲区指针。
// 返回0,若出错则返回出错码。
int sys_stat(char * filename, struct stat * statbuf)
{
struct m_inode * inode;
// 首先根据文件名找出对应的 i节点。若出错,则返回出错码.
if (!(inode=namei(filename)))
return -ENOENT;
// 然后将i节点上的文件状态信息复制到用户缓冲区中,并放回该i节点.
cp_stat(inode,statbuf);
iput(inode);
return 0;
}
//// 文件状态系统调用 - 根据文件句柄获取文件状态信息。
// 参数fd 是指定文件的句柄(描述符),statbuf 是存放状态信息的缓冲区指针。
// 返回0,若出错则返回出错码。
int sys_fstat(unsigned int fd, struct stat * statbuf)
{
struct file * f;
struct m_inode * inode;
// 如果文件句柄值大于一个程序最多打开文件数NR_OPEN,或者该句柄的文件结构指针为空,或者
// 对应文件结构的i 节点字段为空,则出错,返回出错码并退出。
if (fd >= NR_OPEN || !(f=current->filp[fd]) || !(inode=f->f_inode))
return -EBADF;
// 将i 节点上的文件状态信息复制到用户缓冲区中。
cp_stat(inode,statbuf);
return 0;
}
int sys_lstat(char * filename, struct stat * statbuf)
{
return sys_stat(filename, statbuf);
}
int sys_readlink()
{
return -ENOSYS;
}
/*
* linux/fs/super.c
*
* (C) 1991 Linus Torvalds
*/
/*
* super.c contains code to handle the super-block tables.
*/
/*
* super.c 程序中包含有处理超级块表的代码.
*/
#include <linux/config.h> // 内核配置头文件。定义键盘语言和硬盘类型(HD_TYPE)可选项。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#include <errno.h> // 错误号头文件。包含系统中各种出错号。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
int sync_dev (int dev); // 对指定设备执行高速缓冲与设备上数据的同步操作。(fs/buffer.c)
void wait_for_keypress (void); // 等待击键。(kernel/chr_drv/tty_io.c)
/* set_bit uses setb, as gas doesn't recognize setc */
/* set_bit()使用了setb 指令,因为汇编编译器gas 不能识别指令setc */
//// 测试指定位偏移处比特位的值(0 或1),并返回该比特位值。(应该取名为test_bit()更妥帖)
// 嵌入式汇编宏。参数 bitnr 是比特位偏移值,addr 是测试比特位操作的起始地址。
#define set_bit(bitnr,addr) ({ \
register int __res ; \
__asm__("bt %2,%3;setb %%al":"=a" (__res):"a" (0),"r" (bitnr),"m" (*(addr))); \
__res; })
struct super_block super_block[NR_SUPER]; // 超级块结构数组(共8 项)。
/* this is initialized in init/main.c */
/* ROOT_DEV 已在init/main.c 中被初始化 */
int ROOT_DEV = 0;
//// 锁定指定的超级块。
static void lock_super(struct super_block * sb)
{
cli();
while (sb->s_lock) // 如果该超级块已经上锁,则睡眠等待。
sleep_on(&(sb->s_wait));
sb->s_lock = 1; // 给该超级块加锁(置锁定标志)。
sti();
}
//// 对指定超级块解锁。(如果使用ulock_super 这个名称则更妥帖)。
static void free_super(struct super_block * sb)
{
cli();
sb->s_lock = 0; // 复位锁定标志。
wake_up(&(sb->s_wait)); // 唤醒等待该超级块的进程。
sti();
}
//// 睡眠等待超级块解锁。
static void wait_on_super(struct super_block * sb)
{
cli();
while (sb->s_lock) // 如果超级块已经上锁,则睡眠等待。
sleep_on(&(sb->s_wait));
sti();
}
//// 取指定设备的超级块。返回该超级块结构指针。
struct super_block * get_super(int dev)
{
struct super_block * s;
// 如果没有指定设备,则返回空指针。
if (!dev)
return NULL;
// s 指向超级块数组开始处。搜索整个超级块数组,寻找指定设备的超级块。
s = 0+super_block;
while (s < NR_SUPER+super_block)
// 如果当前搜索项是指定设备的超级块,则首先等待该超级块解锁(若已经被其它进程上锁的话)。
// 在等待期间,该超级块有可能被其它设备使用,因此此时需再判断一次是否是指定设备的超级块,
// 如果是则返回该超级块的指针。否则就重新对超级块数组再搜索一遍,因此s 重又指向超级块数组
// 开始处。
if (s->s_dev == dev) {
wait_on_super(s);
if (s->s_dev == dev)
return s;
s = 0+super_block;
// 如果当前搜索项不是,则检查下一项。如果没有找到指定的超级块,则返回空指针。
} else
s++;
return NULL;
}
//// 释放指定设备的超级块。
// 释放设备所使用的超级块数组项(置s_dev=0),并释放该设备i 节点位图和逻辑块位图所占用
// 的高速缓冲块。如果超级块对应的文件系统是根文件系统,或者其i 节点上已经安装有其它的文件
// 系统,则不能释放该超级块。
void put_super(int dev)
{
struct super_block * sb;
/* struct m_inode * inode;*/
int i;
// 如果指定设备是根文件系统设备,则显示警告信息“根系统盘改变了,准备生死决战吧”,并返回。
if (dev == ROOT_DEV) {
printk("root diskette changed: prepare for armageddon\n\r");
return;
}
// 如果找不到指定设备的超级块,则返回。
if (!(sb = get_super(dev)))
return;
// 如果该超级块指明本文件系统i 节点上安装有其它的文件系统,则显示警告信息,返回。
if (sb->s_imount) {
printk("Mounted disk changed - tssk, tssk\n\r");
return;
}
// 找到指定设备的超级块后,首先锁定该超级块,然后置该超级块对应的设备号字段为0,也即即将
// 放弃该超级块。
lock_super(sb);
sb->s_dev = 0;
// 然后释放该设备i 节点位图和逻辑块位图在缓冲区中所占用的缓冲块。
for(i=0;i<I_MAP_SLOTS;i++)
brelse(sb->s_imap[i]);
for(i=0;i<Z_MAP_SLOTS;i++)
brelse(sb->s_zmap[i]);
// 最后对该超级块解锁,并返回。
free_super(sb);
return;
}
//// 从设备上读取超级块到缓冲区中。
// 如果该设备的超级块已经在高速缓冲中并且有效,则直接返回该超级块的指针。
static struct super_block * read_super(int dev)
{
struct super_block * s;
struct buffer_head * bh;
int i,block;
// 如果没有指明设备,则返回空指针。
if (!dev)
return NULL;
// 首先检查该设备是否可更换过盘片(也即是否是软盘设备),如果更换过盘,则高速缓冲区有关该
// 设备的所有缓冲块均失效,需要进行失效处理(释放原来加载的文件系统)。
check_disk_change(dev);
// 如果该设备的超级块已经在高速缓冲中,则直接返回该超级块的指针。
if ((s = get_super(dev)))
return s;
// 否则,首先在超级块数组中找出一个空项(也即其s_dev=0 的项)。如果数组已经占满则返回空指针。
for (s = 0+super_block ;; s++) {
if (s >= NR_SUPER+super_block)
return NULL;
if (!s->s_dev)
break;
}
// 找到超级块空项后,就将该超级块用于指定设备,对该超级块的内存项进行部分初始化。
s->s_dev = dev;
s->s_isup = NULL;
s->s_imount = NULL;
s->s_time = 0;
s->s_rd_only = 0;
s->s_dirt = 0;
// 然后锁定该超级块,并从设备上读取超级块信息到bh 指向的缓冲区中。如果读超级块操作失败,
// 则释放上面选定的超级块数组中的项,并解锁该项,返回空指针退出。
lock_super(s);
if (!(bh = bread(dev,1))) {
s->s_dev=0;
free_super(s);
return NULL;
}
// 将设备上读取的超级块信息复制到超级块数组相应项结构中。并释放存放读取信息的高速缓冲块。
*((struct d_super_block *) s) =
*((struct d_super_block *) bh->b_data);
brelse(bh);
// 如果读取的超级块的文件系统魔数字段内容不对,说明设备上不是正确的文件系统,因此同上面
// 一样,释放上面选定的超级块数组中的项,并解锁该项,返回空指针退出。
// 对于该版linux 内核,只支持minix 文件系统版本1.0,其魔数是0x137f。
if (s->s_magic != SUPER_MAGIC) {
s->s_dev = 0;
free_super(s);
return NULL;
}
// 下面开始读取设备上i 节点位图和逻辑块位图数据。首先初始化内存超级块结构中位图空间。
for (i=0;i<I_MAP_SLOTS;i++)
s->s_imap[i] = NULL;
for (i=0;i<Z_MAP_SLOTS;i++)
s->s_zmap[i] = NULL;
// 然后从设备上读取i 节点位图和逻辑块位图信息,并存放在超级块对应字段中。
block=2;
for (i=0 ; i < s->s_imap_blocks ; i++)
if ((s->s_imap[i]=bread(dev,block)))
block++;
else
break;
for (i=0 ; i < s->s_zmap_blocks ; i++)
if ((s->s_zmap[i]=bread(dev,block)))
block++;
else
break;
// 如果读出的位图逻辑块数不等于位图应该占有的逻辑块数,说明文件系统位图信息有问题,超级块
// 初始化失败。因此只能释放前面申请的所有资源,返回空指针并退出。
if (block != 2+s->s_imap_blocks+s->s_zmap_blocks) {
// 释放i 节点位图和逻辑块位图占用的高速缓冲区。
for(i=0;i<I_MAP_SLOTS;i++)
brelse(s->s_imap[i]);
for(i=0;i<Z_MAP_SLOTS;i++)
brelse(s->s_zmap[i]);
//释放上面选定的超级块数组中的项,并解锁该超级块项,返回空指针退出。
s->s_dev=0;
free_super(s);
return NULL;
}
// 否则一切成功。对于申请空闲i 节点的函数来讲,如果设备上所有的i 节点已经全被使用,则查找
// 函数会返回0 值。因此0 号i 节点是不能用的,所以这里将位图中的最低位设置为1,以防止文件
// 系统分配0 号i 节点。同样的道理,也将逻辑块位图的最低位设置为1。
s->s_imap[0]->b_data[0] |= 1;
s->s_zmap[0]->b_data[0] |= 1;
// 解锁该超级块,并返回超级块指针。
free_super(s);
return s;
}
//// 卸载文件系统的系统调用函数。
// 参数dev_name 是设备文件名。
int sys_umount(char * dev_name)
{
struct m_inode * inode;
struct super_block * sb;
int dev;
// 首先根据设备文件名找到对应的i 节点,并取其中的设备号。
if (!(inode=namei(dev_name)))
return -ENOENT;
dev = inode->i_zone[0];
// 如果不是块设备文件,则释放刚申请的i 节点dev_i,返回出错码。
if (!S_ISBLK(inode->i_mode)) {
iput(inode);
return -ENOTBLK;
}
// 释放设备文件名的i 节点。
iput(inode);
// 如果设备是根文件系统,则不能被卸载,返回出错号。
if (dev==ROOT_DEV)
return -EBUSY;
// 如果取设备的超级块失败,或者该设备文件系统没有安装过,则返回出错码。
if (!(sb=get_super(dev)) || !(sb->s_imount))
return -ENOENT;
// 如果超级块所指明的被安装到的i 节点没有置位其安装标志,则显示警告信息。
if (!sb->s_imount->i_mount)
printk("Mounted inode has i_mount=0\n");
// 查找i 节点表,看是否有进程在使用该设备上的文件,如果有则返回忙出错码。
for (inode=inode_table+0 ; inode<inode_table+NR_INODE ; inode++)
if (inode->i_dev==dev && inode->i_count)
return -EBUSY;
// 复位被安装到的i 节点的安装标志,释放该i 节点。
sb->s_imount->i_mount=0;
iput(sb->s_imount);
// 置超级块中被安装i 节点字段为空,并释放设备文件系统的根i 节点,置超级块中被安装系统
// 根i 节点指针为空。
sb->s_imount = NULL;
iput(sb->s_isup);
sb->s_isup = NULL;
// 释放该设备的超级块以及位图占用的缓冲块,并对该设备执行高速缓冲与设备上数据的同步操作。
put_super(dev);
sync_dev(dev);
return 0;
}
//// 安装文件系统调用函数。
// 参数dev_name 是设备文件名,dir_name 是安装到的目录名,rw_flag 被安装文件的读写标志。
// 将被加载的地方必须是一个目录名,并且对应的i 节点没有被其它程序占用。
int sys_mount(char * dev_name, char * dir_name, int rw_flag)
{
struct m_inode * dev_i, * dir_i;
struct super_block * sb;
int dev;
// 首先根据设备文件名找到对应的i 节点,并取其中的设备号。
// 对于块特殊设备文件,设备号在i 节点的i_zone[0]中。
if (!(dev_i=namei(dev_name)))
return -ENOENT;
dev = dev_i->i_zone[0];
// 如果不是块设备文件,则释放刚取得的i 节点dev_i,返回出错码。
if (!S_ISBLK(dev_i->i_mode)) {
iput(dev_i);
return -EPERM;
}
// 释放该设备文件的i 节点dev_i。
iput(dev_i);
// 根据给定的目录文件名找到对应的i 节点dir_i。
if (!(dir_i=namei(dir_name)))
return -ENOENT;
// 如果该i 节点的引用计数不为1(仅在这里引用),或者该i 节点的节点号是根文件系统的节点
// 号1,则释放该i 节点,返回出错码。
if (dir_i->i_count != 1 || dir_i->i_num == ROOT_INO) {
iput(dir_i);
return -EBUSY;
}
// 如果该节点不是一个目录文件节点,则也释放该i 节点,返回出错码。
if (!S_ISDIR(dir_i->i_mode)) {
iput(dir_i);
return -EPERM;
}
// 读取将安装文件系统的超级块,如果失败则也释放该i 节点,返回出错码。
if (!(sb=read_super(dev))) {
iput(dir_i);
return -EBUSY;
}
// 如果将要被安装的文件系统已经安装在其它地方,则释放该i 节点,返回出错码。
if (sb->s_imount) {
iput(dir_i);
return -EBUSY;
}
// 如果将要安装到的i 节点已经安装了文件系统(安装标志已经置位),则释放该i 节点,返回出错码。
if (dir_i->i_mount) {
iput(dir_i);
return -EPERM;
}
// 被安装文件系统超级块的“被安装到i 节点”字段指向安装到的目录名的i 节点。
sb->s_imount = dir_i;
// 设置安装位置i 节点的安装标志和节点已修改标志。/* 注意!这里没有iput(dir_i) */
dir_i->i_mount=1; /* 这将在umount 内操作 */
dir_i->i_dirt=1; /* NOTE! we don't iput(dir_i) */
return 0; /* we do that in umount */
}
//// 安装根文件系统。
// 该函数是在系统开机初始化设置时(sys_setup())调用的。(kernel/blk_drv/hd.c)
void mount_root(void)
{
int i,free;
struct super_block * p;
struct m_inode * mi;
// 如果磁盘i 节点结构不是32 个字节,则出错,死机。该判断是用于防止修改源代码时的不一致性。
if (32 != sizeof (struct d_inode))
panic("bad i-node size");
// 初始化文件表数组(共64 项,也即系统同时只能打开64 个文件),将所有文件结构中的引用计数
// 设置为0。
for(i=0;i<NR_FILE;i++)
file_table[i].f_count=0;
// 如果根文件系统所在设备是软盘的话,就提示“插入根文件系统盘,并按回车键”,并等待按键。
if (MAJOR(ROOT_DEV) == 2) {
printk("Insert root floppy and press ENTER");
wait_for_keypress();
}
// 初始化超级块数组(共8 项)。
for(p = &super_block[0] ; p < &super_block[NR_SUPER] ; p++) {
p->s_dev = 0;
p->s_lock = 0;
p->s_wait = NULL;
}
// 如果读根设备上超级块失败,则显示信息,并死机。
if (!(p=read_super(ROOT_DEV)))
panic("Unable to mount root");
//从设备上读取文件系统的根i 节点(1),如果失败则显示出错信息,死机。
if (!(mi=iget(ROOT_DEV,ROOT_INO)))
panic("Unable to read root i-node");
// 该i 节点引用次数递增3 次。因为下面也引用了该i 节点。
mi->i_count += 3 ; /* NOTE! it is logically used 4 times, not 1 */
/* 注意!从逻辑上讲,它已被引用了4 次,而不是1 次 */
// 置该超级块的被安装文件系统i 节点和被安装到的i 节点为该i 节点。
p->s_isup = p->s_imount = mi;
// 设置当前进程的当前工作目录和根目录i 节点。此时当前进程是1 号进程。
current->pwd = mi;
current->root = mi;
// 统计该设备上空闲块数。首先令i 等于超级块中表明的设备逻辑块总数。
free=0;
i=p->s_nzones;
// 然后根据逻辑块位图中相应比特位的占用情况统计出空闲块数。这里宏函数set_bit()只是在测试
// 比特位,而非设置比特位。"i&8191"用于取得i 节点号在当前块中的偏移值。"i>>13"是将i 除以
// 8192,也即除一个磁盘块包含的比特位数。
while (-- i >= 0)
if (!set_bit(i&8191,p->s_zmap[i>>13]->b_data))
free++;
// 显示设备上空闲逻辑块数/逻辑块总数。
printk("%d/%d free blocks\n\r",free,p->s_nzones);
// 统计设备上空闲i 节点数。首先令i 等于超级块中表明的设备上i 节点总数+1。加1 是将0 节点
// 也统计进去。
free=0;
i=p->s_ninodes+1;
// 然后根据i 节点位图中相应比特位的占用情况计算出空闲i 节点数。
while (-- i >= 0)
if (!set_bit(i&8191,p->s_imap[i>>13]->b_data))
free++;
// 显示设备上可用的空闲i 节点数/i 节点总数。
printk("%d/%d free inodes\n\r",free,p->s_ninodes);
}
/*
* linux/fs/truncate.c
*
* (C) 1991 Linus Torvalds
*/
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
//// 释放一次间接块。
static void free_ind(int dev,int block)
{
struct buffer_head * bh;
unsigned short * p;
int i;
// 如果逻辑块号为0,则返回。
if (!block)
return;
// 读取一次间接块,并释放其上表明使用的所有逻辑块,然后释放该一次间接块的缓冲区。
if ((bh=bread(dev,block))) {
p = (unsigned short *) bh->b_data; // 指向数据缓冲区。
for (i=0;i<512;i++,p++) // 每个逻辑块上可有512 个块号。
if (*p)
free_block(dev,*p); // 释放指定的逻辑块。
brelse(bh); // 释放缓冲区。
}
// 最后释放设备上的一次间接块
free_block(dev,block);
}
//// 释放二次间接块。
static void free_dind(int dev,int block)
{
struct buffer_head * bh;
unsigned short * p;
int i;
// 如果逻辑块号为0,则返回。
if (!block)
return;
// 读取二次间接块的一级块,并释放其上表明使用的所有逻辑块,然后释放该一级块的缓冲区。
if ((bh=bread(dev,block))) {
p = (unsigned short *) bh->b_data; // 指向数据缓冲区。
for (i=0;i<512;i++,p++) // 每个逻辑块上可连接512 个二级块。
if (*p)
free_ind(dev,*p); // 释放所有一次间接块。
brelse(bh); // 释放缓冲区。
}
// 最后释放设备上的二次间接块。
free_block(dev,block);
}
//// 将节点对应的文件长度截为0,并释放占用的设备空间。
void truncate(struct m_inode * inode)
{
int i;
// 如果不是常规文件或者是目录文件,则返回。
if (!(S_ISREG(inode->i_mode) || S_ISDIR(inode->i_mode)))
return;
// 释放i 节点的7 个直接逻辑块,并将这7 个逻辑块项全置零。
for (i=0;i<7;i++)
if (inode->i_zone[i]) {
// 如果块号不为0,则释放之。
free_block(inode->i_dev,inode->i_zone[i]);
inode->i_zone[i]=0;
}
free_ind(inode->i_dev,inode->i_zone[7]); // 释放一次间接块。
free_dind(inode->i_dev,inode->i_zone[8]); // 释放二次间接块。
inode->i_zone[7] = inode->i_zone[8] = 0; // 逻辑块项7、8 置零。
inode->i_size = 0; // 文件大小置零。
inode->i_dirt = 1; // 置节点已修改标志。
inode->i_mtime = inode->i_ctime = CURRENT_TIME; // 重置文件和节点修改时间为当前时间。
}
#ifndef _A_OUT_H
#define _A_OUT_H
#define __GNU_EXEC_MACROS__
// 执行文件结构。
// ===============================================================
// unsigned long a_magic // 执行文件魔数。使用N_MAGIC 等宏访问。
// unsigned a_text // 代码长度,字节数。
// unsigned a_data // 数据长度,字节数。
// unsigned a_bss // 文件中的未初始化数据区长度,字节数。
// unsigned a_syms // 文件中的符号表长度,字节数。
// unsigned a_entry // 执行开始地址。
// unsigned a_trsize // 代码重定位信息长度,字节数。
// unsigned a_drsize // 数据重定位信息长度,字节数。
// ----------------------------------------------------------------
struct exec {
unsigned long a_magic; /* Use macros N_MAGIC, etc for access */
unsigned a_text; /* length of text, in bytes */
unsigned a_data; /* length of data, in bytes */
unsigned a_bss; /* length of uninitialized data area for file, in bytes */
unsigned a_syms; /* length of symbol table data in file, in bytes */
unsigned a_entry; /* start address */
unsigned a_trsize; /* length of relocation info for text, in bytes */
unsigned a_drsize; /* length of relocation info for data, in bytes */
};
// 用于取执行结构中的魔数。
#ifndef N_MAGIC
#define N_MAGIC(exec) ((exec).a_magic)
#endif
#ifndef OMAGIC
/* Code indicating object file or impure executable. */
/* 指明为目标文件或者不纯的可执行文件的代号 */
#define OMAGIC 0407
/* Code indicating pure executable. */
/* 指明为纯可执行文件的代号 */
#define NMAGIC 0410
/* Code indicating demand-paged executable. */
/* 指明为需求分页处理的可执行文件 */
#define ZMAGIC 0413
#endif /* not OMAGIC */
// 如果魔数不能被识别,则返回真。
#ifndef N_BADMAG
#define N_BADMAG(x) \
(N_MAGIC(x) != OMAGIC && N_MAGIC(x) != NMAGIC \
&& N_MAGIC(x) != ZMAGIC)
#endif
#define _N_BADMAG(x) \
(N_MAGIC(x) != OMAGIC && N_MAGIC(x) != NMAGIC \
&& N_MAGIC(x) != ZMAGIC)
// 程序头在内存中的偏移位置。
#define _N_HDROFF(x) (SEGMENT_SIZE - sizeof (struct exec))
// 代码起始偏移值。
#ifndef N_TXTOFF
#define N_TXTOFF(x) \
(N_MAGIC(x) == ZMAGIC ? _N_HDROFF((x)) + sizeof (struct exec) : sizeof (struct exec))
#endif
// 数据起始偏移值。从代码部分末端开始.
#ifndef N_DATOFF
#define N_DATOFF(x) (N_TXTOFF(x) + (x).a_text)
#endif
// 代码重定位信息偏移值。从数据部分末端开始.
#ifndef N_TRELOFF
#define N_TRELOFF(x) (N_DATOFF(x) + (x).a_data)
#endif
// 数据重定位信息偏移值。从代码重定位信息末端开始
#ifndef N_DRELOFF
#define N_DRELOFF(x) (N_TRELOFF(x) + (x).a_trsize)
#endif
// 符号表偏移值。从上面数据段重定位表末端开始
#ifndef N_SYMOFF
#define N_SYMOFF(x) (N_DRELOFF(x) + (x).a_drsize)
#endif
// 字符串信息偏移值。在符号表之后.
#ifndef N_STROFF
#define N_STROFF(x) (N_SYMOFF(x) + (x).a_syms)
#endif
/* Address of text segment in memory after it is loaded. */
/* 代码段加载到内存中后的地址 */
#ifndef N_TXTADDR
#define N_TXTADDR(x) 0
#endif
/* Address of data segment in memory after it is loaded.
Note that it is up to you to define SEGMENT_SIZE
on machines not listed here. */
/* 数据段加载到内存中后的地址。
注意,对于下面没有列出名称的机器,需要你自己来定义
对应的SEGMENT_SIZE */
#if defined(vax) || defined(hp300) || defined(pyr)
#define SEGMENT_SIZE PAGE_SIZE
#endif
#ifdef hp300
#define PAGE_SIZE 4096
#endif
#ifdef sony
#define SEGMENT_SIZE 0x2000
#endif /* Sony. */
#ifdef is68k
#define SEGMENT_SIZE 0x20000
#endif
#if defined(m68k) && defined(PORTAR)
#define PAGE_SIZE 0x400
#define SEGMENT_SIZE PAGE_SIZE
#endif
// 这里,Linux0.11 内核把内存页定义为4KB,段大小定义为1KB。因此没有使用上面的定义
#define PAGE_SIZE 4096
#define SEGMENT_SIZE 1024
// 以段为界的大小(进位方式)
#define _N_SEGMENT_ROUND(x) (((x) + SEGMENT_SIZE - 1) & ~(SEGMENT_SIZE - 1))
// 代码段尾地址
#define _N_TXTENDADDR(x) (N_TXTADDR(x)+(x).a_text)
// 数据段开始地址
#ifndef N_DATADDR
#define N_DATADDR(x) \
(N_MAGIC(x)==OMAGIC? (_N_TXTENDADDR(x)) \
: (_N_SEGMENT_ROUND (_N_TXTENDADDR(x))))
#endif
/* Address of bss segment in memory after it is loaded. */
/* bss 段加载到内存以后的地址 */
#ifndef N_BSSADDR
#define N_BSSADDR(x) (N_DATADDR(x) + (x).a_data)
#endif
#ifndef N_NLIST_DECLARED
struct nlist {
union {
char *n_name;
struct nlist *n_next;
long n_strx;
} n_un;
unsigned char n_type;
char n_other;
short n_desc;
unsigned long n_value;
};
#endif
// 下面定义 nList 结构中 n_type字段值得常量符号。
#ifndef N_UNDF
#define N_UNDF 0
#endif
#ifndef N_ABS
#define N_ABS 2
#endif
#ifndef N_TEXT
#define N_TEXT 4
#endif
#ifndef N_DATA
#define N_DATA 6
#endif
#ifndef N_BSS
#define N_BSS 8
#endif
#ifndef N_COMM
#define N_COMM 18
#endif
#ifndef N_FN
#define N_FN 15
#endif
// 以下3个常量定义是nlist结构中 n_type字段的屏蔽码(八进制表示)
#ifndef N_EXT
#define N_EXT 1 // 0x01(0b0000,0001)符号是否是外部的(全局的)。
#endif
#ifndef N_TYPE
#define N_TYPE 036 // 0x1e (0b0001,1110) 符号的类型位
#endif
#ifndef N_STAB // STAB -- 符号表类型(Symbol table tepes)。
#define N_STAB 0340 // 0xe0(0b1110,0000)这几个比特用于符号调试器。
#endif
/* The following type indicates the definition of a symbol as being
an indirect reference to another symbol. The other symbol
appears as an undefined reference, immediately following this symbol.
Indirection is asymmetrical. The other symbol's value will be used
to satisfy requests for the indirect symbol, but not vice versa.
If the other symbol does not have a definition, libraries will
be searched to find a definition. */
/* 下面的类型指明了符号的定义作为对另一个符号的间接引用。紧接该符号的其它
* 的符号呈现为未定义的引用。
*
* 间接性是不对称的。其它符号的值将被用于满足间接符号的请求,但反之不然。
* 如果其它符号并没有定义,则将搜索库来寻找一个定义
*/
#define N_INDR 0xa
/* The following symbols refer to set elements.
All the N_SET[ATDB] symbols with the same name form one set.
Space is allocated for the set in the text section, and each set
element's value is stored into one word of the space.
The first word of the space is the length of the set (number of elements).
The address of the set is made into an N_SETV symbol
whose name is the same as the name of the set.
This symbol acts like a N_DATA global symbol
in that it can satisfy undefined external references.
*/
/*
下面的符号与集合元素有关。所有具有相同名称N_SET[ATDB]的符号
形成一个集合。在代码部分中已为集合分配了空间,并且每个集合元素
的值存放在一个字(word)的空间。空间的第一个字存有集合的长度(集合元素数目)。
集合的地址被放入一个N_SETV 符号,它的名称与集合同名。
在满足未定义的外部引用方面,该符号的行为象一个N_DATA 全局符号。
*/
/* These appear as input to LD, in a .o file. */
/* 以下这些符号在目标文件中是作为链接程序LD 的输入。*/
#define N_SETA 0x14 /* Absolute set element symbol */
/* 绝对集合元素符号 */
#define N_SETT 0x16 /* Text set element symbol */
/* 代码集合元素符号 */
#define N_SETD 0x18 /* Data set element symbol */
/* 数据集合元素符号 */
#define N_SETB 0x1A /* Bss set element symbol */
/* Bss 集合元素符号 */
/* This is output from LD. */
/* 下面是LD 的输出。*/
#define N_SETV 0x1C /* Pointer to set vector in data area. */
/* 指向数据区中集合向量。*/
#ifndef N_RELOCATION_INFO_DECLARED
/*
This structure describes a single relocation to be performed.
The text-relocation section of the file is a vector of these structures,
all of which apply to the text section.
Likewise, the data-relocation section applies to the data section.
*/
/*
下面的结构描述执行一个重定位的操作。
文件的代码重定位部分是这些结构的一个向量,所有这些适用于代码部分。
类似地,数据重定位部分适用于数据部分。
*/
// 重定位信息结构。
struct relocation_info
{
/* Address (within segment) to be relocated. */
/* 需要重定位的地址(在段内)。*/
int r_address;
/* The meaning of r_symbolnum depends on r_extern. */
/* r_symbolnum 的含义与r_extern 有关。*/
unsigned int r_symbolnum:24;
/* Nonzero means value is a pc-relative offset
and it should be relocated for changes in its own address
as well as for changes in the symbol or section specified. */
/* 非零意味着值是一个pc 相关的偏移值,因而需要被重定位到自己
的地址处以及符号或节指定的改变。 */
unsigned int r_pcrel:1;
/* Length (as exponent of 2) of the field to be relocated.
Thus, a value of 2 indicates 1<<2 bytes. */
/* 需要被重定位的字段长度(是2 的次方)。
因此,若值是2 则表示1<<2 字节数。*/
unsigned int r_length:2;
/* 1 => relocate with value of symbol.
r_symbolnum is the index of the symbol
in file's the symbol table.
0 => relocate with the address of a segment.
r_symbolnum is N_TEXT, N_DATA, N_BSS or N_ABS
(the N_EXT bit may be set also, but signifies nothing). */
/* 1 => 以符号的值重定位。
r_symbolnum 是文件符号表中符号的索引。
0 => 以段的地址进行重定位。
r_symbolnum 是N_TEXT、N_DATA、N_BSS 或N_ABS
(N_EXT 比特位也可以被设置,但是毫无意义)。*/
unsigned int r_extern:1;
/* Four bits that aren't used, but when writing an object file
it is desirable to clear them. */
/* 没有使用的4 个比特位,但是当进行写一个目标文件时
最好将它们复位掉。*/
unsigned int r_pad:4;
};
#endif /* no N_RELOCATION_INFO_DECLARED. */
#endif /* __A_OUT_GNU_H__ */
//// 硬件端口字节输出函数。
// 参数:value - 欲输出字节;port - 端口。
#define outb(value,port) \
__asm__ ("outb %%al,%%dx"::"a" (value),"d" (port))
//// 硬件端口字节输入函数。
// 参数:port - 端口。返回读取的字节。
#define inb(port) ({ \
unsigned char _v; \
__asm__ volatile ("inb %%dx,%%al":"=a" (_v):"d" (port)); \
_v; \
})
//// 带延迟的硬件端口字节输出函数。
// 参数:value - 欲输出字节;port - 端口。
#define outb_p(value,port) \
__asm__ ("outb %%al,%%dx\n" \
"\tjmp 1f\n" \
"1:\tjmp 1f\n" \
"1:"::"a" (value),"d" (port))
//// 带延迟的硬件端口字节输入函数。
// 参数:port - 端口。返回读取的字节。
#define inb_p(port) ({ \
unsigned char _v; \
__asm__ volatile ("inb %%dx,%%al\n" \
"\tjmp 1f\n" \
"1:\tjmp 1f\n" \
"1:":"=a" (_v):"d" (port)); \
_v; \
})
/*
* NOTE!!! memcpy(dest,src,n) assumes ds=es=normal data segment. This
* goes for all kernel functions (ds=es=kernel space, fs=local data,
* gs=null), as well as for all well-behaving user programs (ds=es=
* user data space). This is NOT a bug, as any user program that changes
* es deserves to die if it isn't careful.
*/
/*
* 注意!!!memcpy(dest,src,n)假设段寄存器ds=es=通常数据段。在内核中使用的
* 所有函数都基于该假设(ds=es=内核空间,fs=局部数据空间,gs=null),具有良好
* 行为的应用程序也是这样(ds=es=用户数据空间)。如果任何用户程序随意改动了
* es 寄存器而出错,则并不是由于系统程序错误造成的。
*/
//// 内存块复制。从源地址src 处开始复制n 个字节到目的地址dest 处。
// 参数:dest - 复制的目的地址,src - 复制的源地址,n - 复制字节数。
// %0 - edi(目的地址dest),%1 - esi(源地址src),%2 - ecx(字节数n),
#define memcpy(dest,src,n) ({ \
void * _res = dest; \
__asm__ ("cld;rep;movsb" \
::"D" ((long)(_res)),"S" ((long)(src)),"c" ((long) (n)) \
); \
_res; \
})
//// 读取fs 段中指定地址处的字节。
// 参数:addr - 指定的内存地址。
// %0 - (返回的字节_v);%1 - (内存地址addr)。
// 返回:返回内存fs:[addr]处的字节。
static inline unsigned char get_fs_byte(const char * addr)
{
unsigned register char _v;
__asm__ ("movb %%fs:%1,%0":"=r" (_v):"m" (*addr));
return _v;
}
//// 读取fs 段中指定地址处的字。
// 参数:addr - 指定的内存地址。
// %0 - (返回的字_v);%1 - (内存地址addr)。
// 返回:返回内存fs:[addr]处的字。
static inline unsigned short get_fs_word(const unsigned short *addr)
{
unsigned short _v;
__asm__ ("movw %%fs:%1,%0":"=r" (_v):"m" (*addr));
return _v;
}
//// 读取fs 段中指定地址处的长字(4 字节)。
// 参数:addr - 指定的内存地址。
// %0 - (返回的长字_v);%1 - (内存地址addr)。
// 返回:返回内存fs:[addr]处的长字。
static inline unsigned long get_fs_long(const unsigned long *addr)
{
unsigned long _v;
__asm__ ("movl %%fs:%1,%0":"=r" (_v):"m" (*addr)); \
return _v;
}
//// 将一字节存放在fs 段中指定内存地址处。
// 参数:val - 字节值;addr - 内存地址。
// %0 - 寄存器(字节值val);%1 - (内存地址addr)。
static inline void put_fs_byte(char val,char *addr)
{
__asm__ ("movb %0,%%fs:%1"::"r" (val),"m" (*addr));
}
//// 将一字存放在fs 段中指定内存地址处。
// 参数:val - 字值;addr - 内存地址。
// %0 - 寄存器(字值val);%1 - (内存地址addr)。
static inline void put_fs_word(short val,short * addr)
{
__asm__ ("movw %0,%%fs:%1"::"r" (val),"m" (*addr));
}
//// 将一长字存放在fs 段中指定内存地址处。
// 参数:val - 长字值;addr - 内存地址。
// %0 - 寄存器(长字值val);%1 - (内存地址addr)。
static inline void put_fs_long(unsigned long val,unsigned long * addr)
{
__asm__ ("movl %0,%%fs:%1"::"r" (val),"m" (*addr));
}
/*
* Someone who knows GNU asm better than I should double check the followig.
* It seems to work, but I don't know if I'm doing something subtly wrong.
* --- TYT, 11/24/91
* [ nothing wrong here, Linus ]
*/
/*
* 比我更懂GNU 汇编的人应该仔细检查下面的代码。这些代码能使用,但我不知道是否
* 含有一些小错误。
* --- TYT,1991 年11 月24 日
* [ 这些代码没有错误,Linus ]
*/
//// 取fs 段寄存器值(选择符)。
// 返回:fs 段寄存器值。
static inline unsigned long get_fs()
{
unsigned short _v;
__asm__("mov %%fs,%%ax":"=a" (_v):);
return _v;
}
//// 取ds 段寄存器值。
// 返回:ds 段寄存器值。
static inline unsigned long get_ds()
{
unsigned short _v;
__asm__("mov %%ds,%%ax":"=a" (_v):);
return _v;
}
//// 设置fs 段寄存器。
// 参数:val - 段值(选择符)。
static inline void set_fs(unsigned long val)
{
__asm__("mov %0,%%fs"::"a" ((unsigned short) val));
}
//// 切换到用户模式运行。
// 该函数利用iret 指令实现从内核模式切换到用户模式(初始任务0)。
#define move_to_user_mode() \
__asm__ ("movl %%esp,%%eax\n\t" \
"pushl $0x17\n\t" \
"pushl %%eax\n\t" \
"pushfl\n\t" \
"pushl $0x0f\n\t" \
"pushl $1f\n\t" \
"iret\n" \
"1:\tmovl $0x17,%%eax\n\t" \
"movw %%ax,%%ds\n\t" \
"movw %%ax,%%es\n\t" \
"movw %%ax,%%fs\n\t" \
"movw %%ax,%%gs" \
:::"ax")
#define sti() __asm__ ("sti"::) // 开中断嵌入汇编宏函数。
#define cli() __asm__ ("cli"::) // 关中断。
#define nop() __asm__ ("nop"::) // 空操作。
#define iret() __asm__ ("iret"::) // 中断返回。
//// 设置门描述符宏函数。
// 参数:gate_addr -描述符地址;type -描述符中类型域值;dpl -描述符特权层值;addr -偏移地址。
// %0 - (由dpl,type 组合成的类型标志字);%1 - (描述符低4 字节地址);
// %2 - (描述符高4 字节地址);%3 - edx(程序偏移地址addr);%4 - eax(高字中含有段选择符)。
#define _set_gate(gate_addr,type,dpl,addr) \
__asm__ ("movw %%dx,%%ax\n\t" \
"movw %0,%%dx\n\t" \
"movl %%eax,%1\n\t" \
"movl %%edx,%2" \
: \
: "i" ((short) (0x8000+(dpl<<13)+(type<<8))), \
"o" (*((char *) (gate_addr))), \
"o" (*(4+(char *) (gate_addr))), \
"d" ((char *) (addr)),"a" (0x00080000))
//// 设置中断门函数。
// 参数:n - 中断号;addr - 中断程序偏移地址。
// &idt[n]对应中断号在中断描述符表中的偏移值;中断描述符的类型是14,特权级是0。
#define set_intr_gate(n,addr) \
_set_gate(&idt[n],14,0,addr)
//// 设置陷阱门函数。
// 参数:n - 中断号;addr - 中断程序偏移地址。
// &idt[n]对应中断号在中断描述符表中的偏移值;中断描述符的类型是15,特权级是0。
#define set_trap_gate(n,addr) \
_set_gate(&idt[n],15,0,addr)
//// 设置系统调用门函数。
// 参数:n - 中断号;addr - 中断程序偏移地址。
// &idt[n]对应中断号在中断描述符表中的偏移值;中断描述符的类型是15,特权级是3。
#define set_system_gate(n,addr) \
_set_gate(&idt[n],15,3,addr)
//// 设置段描述符函数。
// 参数:gate_addr -描述符地址;type -描述符中类型域值;dpl -描述符特权层值;
// base - 段的基地址;limit - 段限长。(参见段描述符的格式)
#define _set_seg_desc(gate_addr,type,dpl,base,limit) {\
*(gate_addr) = ((base) & 0xff000000) | \
(((base) & 0x00ff0000)>>16) | \
((limit) & 0xf0000) | \
((dpl)<<13) | \
(0x00408000) | \
((type)<<8); \
*((gate_addr)+1) = (((base) & 0x0000ffff)<<16) | \
((limit) & 0x0ffff); }
//// 在全局表中设置任务状态段/局部表描述符。
// 参数:n - 在全局表中描述符项n 所对应的地址;addr - 状态段/局部表所在内存的基地址。
// type - 描述符中的标志类型字节。
// %0 - eax(地址addr);%1 - (描述符项n 的地址);%2 - (描述符项n 的地址偏移2 处);
// %3 - (描述符项n 的地址偏移4 处);%4 - (描述符项n 的地址偏移5 处);
// %5 - (描述符项n 的地址偏移6 处);%6 - (描述符项n 的地址偏移7 处);
#define _set_tssldt_desc(n,addr,type) \
__asm__ ("movw $104,%1\n\t" \
"movw %%ax,%2\n\t" \
"rorl $16,%%eax\n\t" \
"movb %%al,%3\n\t" \
"movb $" type ",%4\n\t" \
"movb $0x00,%5\n\t" \
"movb %%ah,%6\n\t" \
"rorl $16,%%eax" \
::"a" (addr), "m" (*(n)), "m" (*(n+2)), "m" (*(n+4)), \
"m" (*(n+5)), "m" (*(n+6)), "m" (*(n+7)) \
)
//// 在全局表中设置任务状态段描述符。
// n - 是该描述符的指针;addr - 是描述符中的基地址值。任务状态段描述符的类型是0x89。
#define set_tss_desc(n,addr) _set_tssldt_desc(((char *) (n)),((int)(addr)),"0x89")
//// 在全局表中设置局部表描述符。
// n - 是该描述符的指针;addr - 是描述符中的基地址值。局部表描述符的类型是0x82。
#define set_ldt_desc(n,addr) _set_tssldt_desc(((char *) (n)),((int)(addr)),"0x82")
#ifndef _CONST_H
#define _CONST_H
#define BUFFER_END 0x200000 // 定义缓冲使用内存的末端(代码中没有使用该常量)
// i节点数据结构中 i_mode 字段的个标志位
#define I_TYPE 0170000 // 指明i节点类型(类型屏蔽码)
#define I_DIRECTORY 0040000 // 是目录文件。
#define I_REGULAR 0100000 // 是常规文件,不是目录文件或特殊文件
#define I_BLOCK_SPECIAL 0060000 // 是块设备特殊文件
#define I_CHAR_SPECIAL 0020000 // 是字符设备特殊文件
#define I_NAMED_PIPE 0010000 // 是命名管道节点
#define I_SET_UID_BIT 0004000 // 在执行时设置有效用户ID类型
#define I_SET_GID_BIT 0002000 // 在执行时设置有效组 ID类型
#endif
#ifndef _CTYPE_H
#define _CTYPE_H
#define _U 0x01 /* upper */ // 该比特位用于大写字符[A-Z]。
#define _L 0x02 /* lower */ // 该比特位用于小写字符[a-z]。
#define _D 0x04 /* digit */ // 该比特位用于数值[0-9]。
#define _C 0x08 /* cntrl */ // 该比特位用于控制字符。
#define _P 0x10 /* punct */ // 该比特位用于标点字符
#define _S 0x20 /* white space (space/lf/tab) */ // 空白字符,如空格、\t、\n等。
#define _X 0x40 /* hex digit */ // 该比特位用于十六进制数字
#define _SP 0x80 /* hard space (0x20) */ // 该比特位用于空格字符(0x20)
extern unsigned char _ctype[]; // 字符特征数组(表),定义各个字符对应上面的属性。
extern char _ctmp; // 一个临时字符变量(在定义lib/cype.c中)
// 下面是一些确定字符类型的宏
#define isalnum(c) ((_ctype+1)[(int)c]&(_U|_L|_D)) // 是字符或数字 [A-Z]、 [a-z]、[0-9]。
#define isalpha(c) ((_ctype+1)[(int)c]&(_U|_L)) // 是字符。
#define iscntrl(c) ((_ctype+1)[(int)c]&(_C)) // 是控制字符。
#define isdigit(c) ((_ctype+1)[(int)c]&(_D)) // 是数字。
#define isgraph(c) ((_ctype+1)[(int)c]&(_P|_U|_L|_D)) // 是图形字符。
#define islower(c) ((_ctype+1)[(int)c]&(_L)) // 是小写字符。
#define isprint(c) ((_ctype+1)[(int)c]&(_P|_U|_L|_D|_SP)) // 是可打印字符。
#define ispunct(c) ((_ctype+1)[(int)c]&(_P)) // 是标点符号。
#define isspace(c) ((_ctype+1)[(int)c]&(_S)) // 是空白字符如空格,\f,\n,\r,\t,\v。
#define isupper(c) ((_ctype+1)[(int)c]&(_U)) // 是大写字符。
#define isxdigit(c) ((_ctype+1)[(int)c]&(_D|_X)) // 是十六进制数字。
// 在下面两个定义中,宏参数前使用了前缀(unsigned),因此c应该加括号,即表示成(c)。
// 因为在程序中C可能是一个复杂的表达式。
#define isascii(c) (((unsigned) c)<=0x7f) // 是ASCII字符。
#define toascii(c) (((unsigned) c)&0x7f) // 转换成 ASCII字符。
// 以下两个红定义中使用一个临时变量_ctmp的原因是:在宏定义中,宏的参数只能被使用一次。
// 但对于多线程来说这是不安全的,因为两个或多个线程可能在同一时刻使用这个公共临时变量。
// 因此从Linux2.2.x版本开始更改为使用两个函数来取代这两个宏定义.
#define tolower(c) (_ctmp=c,isupper(_ctmp)?_ctmp-('A'-'a'):_ctmp) // 转换成小写字符
#define toupper(c) (_ctmp=c,islower(_ctmp)?_ctmp-('a'-'A'):_ctmp) // 转换成大写字符
#endif
#ifndef _ERRNO_H
#define _ERRNO_H
/*
* ok, as I hadn't got any other source of information about
* possible error numbers, I was forced to use the same numbers
* as minix.
* Hopefully these are posix or something. I wouldn't know (and posix
* isn't telling me - they want $$$ for their f***ing standard).
*
* We don't use the _SIGN cludge of minix, so kernel returns must
* see to the sign by themselves.
*
* NOTE! Remember to change strerror() if you change this file!
*/
/*
* ok,由于我没有得到任何其它有关出错号的资料,我只能使用与minix 系统
* 相同的出错号了。
* 希望这些是POSIX 兼容的或者在一定程度上是这样的,我不知道(而且POSIX
* 没有告诉我 - 要获得他们的混蛋标准需要出钱)。
*
* 我们没有使用minix 那样的_SIGN 簇,所以内核的返回值必须自己辨别正负号。
*
* 注意!如果你改变该文件的话,记着也要修改strerror()函数。
*/
// 系统调用以及很多库函数返回一个特殊的值以表示操作失败。这个值通常选择-1
// 或者其他一些特定的值来表示。但是这个返回值仅说明错误发生了。如果需要知道
// 出错类型,就需要查看表示系统出错号的变量errno。该变量即在errno.h文件中
// 声明。在程序开始执行时该变量值就被初始化为0.
extern int errno;
// 在出错时,系统调用会把出错号放在变量errno中(负值),然后返回-1.因此程序
// 若需要知道具体的出错号,就需要查看errno的值。
#define ERROR 99 // 一般错误。
#define EPERM 1 // 操作没有许可。
#define ENOENT 2 // 文件或目录不存在。
#define ESRCH 3 // 指定的进程不存在。
#define EINTR 4 // 中断的函数调用。
#define EIO 5 // 输入/输出错。
#define ENXIO 6 // 指定设备或地址不存在。
#define E2BIG 7 // 参数列表太长。
#define ENOEXEC 8 // 执行程序格式错误。
#define EBADF 9 // 文件句柄(描述符)错误。
#define ECHILD 10 // 子进程不存在。
#define EAGAIN 11 // 资源暂时不可用。
#define ENOMEM 12 // 内存不足。
#define EACCES 13 // 没有许可权限。
#define EFAULT 14 // 地址错。
#define ENOTBLK 15 // 不是块设备文件。
#define EBUSY 16 // 资源正忙。
#define EEXIST 17 // 文件已存在。
#define EXDEV 18 // 非法连接。
#define ENODEV 19 // 设备不存在。
#define ENOTDIR 20 // 不是目录文件。
#define EISDIR 21 // 是目录文件。
#define EINVAL 22 // 参数无效。
#define ENFILE 23 // 系统打开文件数太多。
#define EMFILE 24 // 打开文件数太多。
#define ENOTTY 25 // 不恰当的IO 控制操作(没有tty 终端)。
#define ETXTBSY 26 // 不再使用。
#define EFBIG 27 // 文件太大。
#define ENOSPC 28 // 设备已满(设备已经没有空间)。
#define ESPIPE 29 // 无效的文件指针重定位。
#define EROFS 30 // 文件系统只读。
#define EMLINK 31 // 连接太多。
#define EPIPE 32 // 管道错。
#define EDOM 33 // 域(domain)出错。
#define ERANGE 34 // 结果太大。
#define EDEADLK 35 // 避免资源死锁。
#define ENAMETOOLONG 36 // 文件名太长。
#define ENOLCK 37 // 没有锁定可用。
#define ENOSYS 38 // 功能还没有实现。
#define ENOTEMPTY 39 // 目录不空。
#endif
#ifndef _FCNTL_H
#define _FCNTL_H
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
/* open/fcntl - NOCTTY, NDELAY isn't implemented yet */
/* open/fcntl - NOCTTY 和NDELAY 现在还没有实现 */
#define O_ACCMODE 00003 // 文件访问模式屏蔽码。
// 打开文件open()和文件控制fcntl()函数使用的文件访问模式。同时只能使用三者之一。
#define O_RDONLY 00 // 以只读方式打开文件。
#define O_WRONLY 01 // 以只写方式打开文件。
#define O_RDWR 02 // 以读写方式打开文件。
// 下面是文件创建标志,用于open()。可与上面访问模式用'位或'的方式一起使用。
#define O_CREAT 00100 /* not fcntl */ // 如果文件不存在就创建。
#define O_EXCL 00200 /* not fcntl */ // 独占使用文件标志。
#define O_NOCTTY 00400 /* not fcntl */ // 不分配控制终端。
#define O_TRUNC 01000 /* not fcntl */ // 若文件已存在且是写操作,则长度截为0。
#define O_APPEND 02000 // 以添加方式打开,文件指针置为文件尾。
#define O_NONBLOCK 04000 /* not fcntl */ // 非阻塞方式打开和操作文件。
#define O_NDELAY O_NONBLOCK // 非阻塞方式打开和操作文件。
/*
* Defines for fcntl-commands. Note that currently
* locking isn't supported, and other things aren't really
* tested.
*/
/*
* 下面定义了fcntl 的命令。注意目前锁定命令还没有支持,而其它
* 命令实际上还没有测试过。
*/
// 文件句柄(描述符)操作函数fcntl()的命令。
#define F_DUPFD 0 /* dup */ // 拷贝文件句柄为最小数值的句柄。
#define F_GETFD 1 /* get f_flags */ // 取文件句柄标志。
#define F_SETFD 2 /* set f_flags */ // 设置文件句柄标志。
#define F_GETFL 3 /* more flags (cloexec) */ // 取文件状态标志和访问模式。
#define F_SETFL 4 // 设置文件状态标志和访问模式。
// 下面是文件锁定命令。fcntl()的第三个参数lock 是指向flock 结构的指针。
#define F_GETLK 5 /* not implemented */ // 返回阻止锁定的flock 结构。
#define F_SETLK 6 // 设置(F_RDLCK 或F_WRLCK)或清除(F_UNLCK)锁定。
#define F_SETLKW 7 // 等待设置或清除锁定。
/* for F_[GET|SET]FL */
/* 用于 F_GETFL 或F_SETFL */
// 在执行exec()簇函数时关闭文件句柄。(执行时关闭 - Close On EXECution)
#define FD_CLOEXEC 1 /* actually anything with low bit set goes */
/* 实际上只要低位为1 即可 */
/* Ok, these are locking features, and aren't implemented at any
* level. POSIX wants them.
*/
/* OK,以下是锁定类型,任何函数中都还没有实现。POSIX 标准要求这些类型。
*/
#define F_RDLCK 0 // 共享或读文件锁定。
#define F_WRLCK 1 // 独占或写文件锁定。
#define F_UNLCK 2 // 文件解锁。
/* Once again - not implemented, but ... */
/* 同样 - 也还没有实现,但是... */
// 文件锁定操作数据结构。描述了受影响文件段的类型(l_type)、开始偏移(l_whence)、
// 相对偏移(l_start)、锁定长度(l_len)和实施锁定的进程id。
struct flock
{
short l_type; // 锁定类型(F_RDLCK,F_WRLCK,F_UNLCK)。
short l_whence; // 开始偏移(SEEK_SET,SEEK_CUR 或SEEK_END)。
off_t l_start; // 阻塞锁定的开始处。相对偏移(字节数)。
off_t l_len; // 阻塞锁定的大小;如果是0 则为到文件末尾。
pid_t l_pid; // 加锁的进程id。
};
// 以下是使用上述标志或命令的函数原型。
// 创建新文件或重写一个已存在文件。
// 参数filename 是欲创建文件的文件名,mode 是创建文件的属性(参见include/sys/stat.h)。
extern int creat (const char *filename, mode_t mode);
// 文件句柄操作,会影响文件的打开。
// 参数fildes 是文件句柄,cmd 是操作命令,见上面。
extern int fcntl (int fildes, int cmd, ...);
// 打开文件。在文件与文件句柄之间建立联系。
// 参数filename 是欲打开文件的文件名,flags 是上面的标志的组合。
extern int open (const char *filename, int flags, ...);
#endif
#ifndef _CONFIG_H
#define _CONFIG_H
/*
* The root-device is no longer hard-coded. You can change the default
* root-device by changing the line ROOT_DEV = XXX in boot/bootsect.s
*/
/*
* 根文件系统设备已不再是硬编码的了。通过修改boot/bootsect.s 文件中行
* ROOT_DEV = XXX,你可以改变根设备的默认设置值。
*/
/*
* define your keyboard here -
* KBD_FINNISH for Finnish keyboards
* KBD_US for US-type
* KBD_GR for German keyboards
* KBD_FR for Frech keyboard
*/
/*
* 在这里定义你的键盘类型 -
* KBD_FINNISH 是芬兰键盘。
* KBD_US 是美式键盘。
* KBD_GR 是德式键盘。
* KBD_FR 是法式键盘。
*/
#define KBD_US
/*#define KBD_GR */
/*#define KBD_FR */
/*#define KBD_FINNISH */
/*
* Normally, Linux can get the drive parameters from the BIOS at
* startup, but if this for some unfathomable reason fails, you'd
* be left stranded. For this case, you can define HD_TYPE, which
* contains all necessary info on your harddisk.
*
* The HD_TYPE macro should look like this:
*
* #define HD_TYPE { head, sect, cyl, wpcom, lzone, ctl}
*
* In case of two harddisks, the info should be sepatated by
* commas:
*
* #define HD_TYPE { h,s,c,wpcom,lz,ctl },{ h,s,c,wpcom,lz,ctl }
*/
/*
* 通常,Linux 能够在启动时从BIOS 中获取驱动器德参数,但是若由于未知原因
* 而没有得到这些参数时,会使程序束手无策。对于这种情况,你可以定义HD_TYPE,
* 其中包括硬盘的所有信息。
*
* HD_TYPE 宏应该象下面这样的形式:
*
* #define HD_TYPE { head, sect, cyl, wpcom, lzone, ctl}
*
* 对于有两个硬盘的情况,参数信息需用逗号分开:
*
* #define HD_TYPE { h,s,c,wpcom,lz,ctl }, {h,s,c,wpcom,lz,ctl }
*/
/*
This is an example, two drives, first is type 2, second is type 3:
#define HD_TYPE { 4,17,615,300,615,8 }, { 6,17,615,300,615,0 }
NOTE: ctl is 0 for all drives with heads<=8, and ctl=8 for drives
with more than 8 heads.
If you want the BIOS to tell what kind of drive you have, just
leave HD_TYPE undefined. This is the normal thing to do.
*/
/*
* 下面是一个例子,两个硬盘,第1 个是类型2,第2 个是类型3:
*
11.23 fdreg.h 头文件
* #define HD_TYPE { 4,17,615,300,615,8 }, {6,17,615,300,615,0 }
*
* 注意:对应所有硬盘,若其磁头数<=8,则ctl 等于0,若磁头数多于8 个,
* 则ctl=8。
*
* 如果你想让BIOS 给出硬盘的类型,那么只需不定义HD_TYPE。这是默认操作。
*/
#endif
/*
* This file contains some defines for the floppy disk controller.
* Various sources. Mostly "IBM Microcomputers: A Programmers
* Handbook", Sanches and Canton.
*/
/*
* 该文件中含有一些软盘控制器的一些定义。这些信息有多处来源,大多数取自
* Sanches 和 Canton编著的“IBM微型计算机:程序员手册”一书。
*/
#ifndef _FDREG_H
#define _FDREG_H
// 一些软盘类型函数的原型说明
extern int ticks_to_floppy_on(unsigned int nr);
extern void floppy_on(unsigned int nr);
extern void floppy_off(unsigned int nr);
extern void floppy_select(unsigned int nr);
extern void floppy_deselect(unsigned int nr);
// 下面是有关软盘控制器一些端口和符号的定义。
/* Fd controller regs. S&C, about page 340 */
/* 软盘控制器(FDC)寄存器端口。摘自S&C书中约340页*/
#define FD_STATUS 0x3f4 // 主状态寄存器端口。
#define FD_DATA 0x3f5 // 数据端口
#define FD_DOR 0x3f2 /* Digital Output Register */
// 数字输出寄存器(也称为数字控制寄存器)。
#define FD_DIR 0x3f7 /* Digital Input Register (read) */
// 数字输入寄存器。
#define FD_DCR 0x3f7 /* Diskette Control Register (write)*/
// 数字传输率控制寄存器。
/* Bits of main status register */
/* 主状态寄存器各位的含义*/
#define STATUS_BUSYMASK 0x0F /* drive busy mask */
// 驱动器忙位(每位对应一个驱动器)
#define STATUS_BUSY 0x10 /* FDC busy */
// 软盘控制器忙。
#define STATUS_DMA 0x20 /* 0- DMA mode */
// 0 - 为DMA数据传输模式, 1- 为非DMA模式
#define STATUS_DIR 0x40 /* 0- cpu->fdc */
// 传输方向:0-CPU-> fdc, 1 - 相反.
#define STATUS_READY 0x80 /* Data reg ready */
// 数据寄存器就绪位
/* Bits of FD_ST0 */ // 状态字节0 (ST0)各比特位的含义。
#define ST0_DS 0x03 /* drive select mask */
// 驱动器选择号(发生中断时驱动器号)。
#define ST0_HA 0x04 /* Head (Address) */
// 磁头号
#define ST0_NR 0x08 /* Not Ready */
// 磁盘驱动器为准备好。
#define ST0_ECE 0x10 /* Equipment chech error */
// 设备检测出错(零磁道校准出错)
#define ST0_SE 0x20 /* Seek end */
// 寻道或重新校正操作执行结束
#define ST0_INTR 0xC0 /* Interrupt code mask */
// 中断代码位(中断原因),00 - 命令正常结束;
// 01 - 命令异常结束; 10 - 命令无效; 11 - fdd就绪状态改变
/* Bits of FD_ST1 */ // 状态字节1(ST1)各比特位的含义
#define ST1_MAM 0x01 /* Missing Address Mark */
// 未找到地址标志(ID AM).
#define ST1_WP 0x02 /* Write Protect */
// 写保护
#define ST1_ND 0x04 /* No Data - unreadable */
// 未找到指定的扇区.
#define ST1_OR 0x10 /* OverRun */
// 数据传输超时(DMA控制器故障)
#define ST1_CRC 0x20 /* CRC error in data or addr */
// CRC 检验出错
#define ST1_EOC 0x80 /* End Of Cylinder */
// 访问超过一个磁道上的最大扇区号。
/* Bits of FD_ST2 */ // 状态字节2(ST2)各比特位的含义
#define ST2_MAM 0x01 /* Missing Addess Mark (again) */
// 未找到数据地址标志
#define ST2_BC 0x02 /* Bad Cylinder */
// 磁道坏。
#define ST2_SNS 0x04 /* Scan Not Satisfied */
// 检索(扫描)条件不满足
#define ST2_SEH 0x08 /* Scan Equal Hit */
// 检索条件满足
#define ST2_WC 0x10 /* Wrong Cylinder */
// 磁道(柱面号)号不符
#define ST2_CRC 0x20 /* CRC error in data field */
// CRC 检验出错
#define ST2_CM 0x40 /* Control Mark = deleted */
// 访问超过一个磁道上的最大扇区号。
/* Bits of FD_ST3 */ // 状态字节3(ST3)各比特位的含义。
#define ST3_HA 0x04 /* Head (Address) */
// 磁头号。
#define ST3_TZ 0x10 /* Track Zero signal (1=track 0) */
// 零磁道信号。
#define ST3_WP 0x40 /* Write Protect */
// 写保护。
/* Values for FD_COMMAND */ // 软盘命令码
#define FD_RECALIBRATE 0x07 /* move to track 0 */
// 重新校正(磁头退到零磁道)。
#define FD_SEEK 0x0F /* seek track */
// 磁头寻道
#define FD_READ 0xE6 /* read with MT, MFM, SKip deleted */
// 读数据(MT多磁道操作,MFM格式,跳过删除数据)。
#define FD_WRITE 0xC5 /* write with MT, MFM */
// 写数据(MT,MFM)。
#define FD_SENSEI 0x08 /* Sense Interrupt Status */
// 检测中断状态。
#define FD_SPECIFY 0x03 /* specify HUT etc */
// 设定驱动器参数(步进速率、磁头卸载时间等)。
/* DMA commands */ //DMA 命令
#define DMA_READ 0x46 // DMA 读盘,DMA方式字(送DMA端口 12,11)。
#define DMA_WRITE 0x4A // DMA 写盘,DMA方式字。
#endif
/*
* This file has definitions for some important file table
* structures etc.
*/
/*
* 本文件含有某些重要文件表结构的定义等。
*/
#ifndef _FS_H
#define _FS_H
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
/* devices are as follows: (same as minix, so we can use the minix
* file system. These are major numbers.)
*
* 0 - unused (nodev)
* 1 - /dev/mem
* 2 - /dev/fd
* 3 - /dev/hd
* 4 - /dev/ttyx
* 5 - /dev/tty
* 6 - /dev/lp
* 7 - unnamed pipes
*/
/*
* 系统所含的设备如下:(与minix 系统的一样,所以我们可以使用minix 的
* 文件系统。以下这些是主设备号。)
*
* 0 - 没有用到(nodev)
* 1 - /dev/mem 内存设备。
* 2 - /dev/fd 软盘设备。
* 3 - /dev/hd 硬盘设备。
* 4 - /dev/ttyx tty 串行终端设备。
* 5 - /dev/tty tty 终端设备。
* 6 - /dev/lp 打印设备。
* 7 - unnamed pipes 没有命名的管道。
*/
#define IS_SEEKABLE(x) ((x)>=1 && (x)<=3) // 是否是可以寻找定位的设备。
#define READ 0
#define WRITE 1
#define READA 2 /* read-ahead - don't pause */
#define WRITEA 3 /* "write-ahead" - silly, but somewhat useful */
void buffer_init (long buffer_end);
#define MAJOR(a) (((unsigned)(a))>>8) // 取高字节(主设备号)。
#define MINOR(a) ((a)&0xff) // 取低字节(次设备号)。
#define NAME_LEN 14 // 名字长度值。
#define ROOT_INO 1 // 根i 节点。
#define I_MAP_SLOTS 8 // i 节点位图槽数。
#define Z_MAP_SLOTS 8 // 逻辑块(区段块)位图槽数。
#define SUPER_MAGIC 0x137F // 文件系统魔数。
#define NR_OPEN 20 // 打开文件数。
#define NR_INODE 32
#define NR_FILE 64
#define NR_SUPER 8
#define NR_HASH 307
#define NR_BUFFERS nr_buffers
#define BLOCK_SIZE 1024 // 数据块长度。
#define BLOCK_SIZE_BITS 10 // 数据块长度所占比特位数。
#ifndef NULL
#define NULL ((void *) 0)
#endif
// 每个逻辑块可存放的i 节点数。
#define INODES_PER_BLOCK ((BLOCK_SIZE)/(sizeof (struct d_inode)))
// 每个逻辑块可存放的目录项数。
#define DIR_ENTRIES_PER_BLOCK ((BLOCK_SIZE)/(sizeof (struct dir_entry)))
// 管道头、管道尾、管道大小、管道空?、管道满?、管道头指针递增。
#define PIPE_HEAD(inode) ((inode).i_zone[0])
#define PIPE_TAIL(inode) ((inode).i_zone[1])
#define PIPE_SIZE(inode) ((PIPE_HEAD(inode)-PIPE_TAIL(inode))&(PAGE_SIZE-1))
#define PIPE_EMPTY(inode) (PIPE_HEAD(inode)==PIPE_TAIL(inode))
#define PIPE_FULL(inode) (PIPE_SIZE(inode)==(PAGE_SIZE-1))
#define INC_PIPE(head) \
__asm__( "incl %0\n\tandl $4095,%0":: "m" (head))
typedef char buffer_block[BLOCK_SIZE]; // 块缓冲区。
// 缓冲区头数据结构。(极为重要!!!)
// 在程序中常用bh 来表示buffer_head 类型的缩写。
struct buffer_head
{
char *b_data; /* pointer to data block (1024 bytes) *///指针。
unsigned long b_blocknr; /* block number */ // 块号。
unsigned short b_dev; /* device (0 = free) */ // 数据源的设备号。
unsigned char b_uptodate; // 更新标志:表示数据是否已更新。
unsigned char b_dirt; /* 0-clean,1-dirty */ //修改标志:0 未修改,1 已修改.
unsigned char b_count; /* users using this block */ // 使用的用户数。
unsigned char b_lock; /* 0 - ok, 1 -locked */ // 缓冲区是否被锁定。
struct task_struct *b_wait; // 指向等待该缓冲区解锁的任务。
struct buffer_head *b_prev; // hash 队列上前一块(这四个指针用于缓冲区的管理)。
struct buffer_head *b_next; // hash 队列上下一块。
struct buffer_head *b_prev_free; // 空闲表上前一块。
struct buffer_head *b_next_free; // 空闲表上下一块。
};
// 磁盘上的索引节点(i 节点)数据结构。
struct d_inode
{
unsigned short i_mode; // 文件类型和属性(rwx 位)。
unsigned short i_uid; // 用户id(文件拥有者标识符)。
unsigned long i_size; // 文件大小(字节数)。
unsigned long i_time; // 修改时间(自1970.1.1:0 算起,秒)。
unsigned char i_gid; // 组id(文件拥有者所在的组)。
unsigned char i_nlinks; // 链接数(多少个文件目录项指向该i 节点)。
unsigned short i_zone[9]; // 直接(0-6)、间接(7)或双重间接(8)逻辑块号。
// zone 是区的意思,可译成区段,或逻辑块。
};
// 这是在内存中的i 节点结构。前7 项与d_inode 完全一样。
struct m_inode
{
unsigned short i_mode; // 文件类型和属性(rwx 位)。
unsigned short i_uid; // 用户id(文件拥有者标识符)。
unsigned long i_size; // 文件大小(字节数)。
unsigned long i_mtime; // 修改时间(自1970.1.1:0 算起,秒)。
unsigned char i_gid; // 组id(文件拥有者所在的组)。
unsigned char i_nlinks; // 文件目录项链接数。
unsigned short i_zone[9]; // 直接(0-6)、间接(7)或双重间接(8)逻辑块号。
/* these are in memory also */
struct task_struct *i_wait; // 等待该i 节点的进程。
unsigned long i_atime; // 最后访问时间。
unsigned long i_ctime; // i 节点自身修改时间。
unsigned short i_dev; // i 节点所在的设备号。
unsigned short i_num; // i 节点号。
unsigned short i_count; // i 节点被使用的次数,0 表示该i 节点空闲。
unsigned char i_lock; // 锁定标志。
unsigned char i_dirt; // 已修改(脏)标志。
unsigned char i_pipe; // 管道标志。
unsigned char i_mount; // 安装标志。
unsigned char i_seek; // 搜寻标志(lseek 时)。
unsigned char i_update; // 更新标志。
};
// 文件结构(用于在文件句柄与i 节点之间建立关系)
struct file
{
unsigned short f_mode; // 文件操作模式(RW 位)
unsigned short f_flags; // 文件打开和控制的标志。
unsigned short f_count; // 对应文件句柄(文件描述符)数。
struct m_inode *f_inode; // 指向对应i 节点。
off_t f_pos; // 文件位置(读写偏移值)。
};
// 内存中磁盘超级块结构。
struct super_block
{
unsigned short s_ninodes; // 节点数。
unsigned short s_nzones; // 逻辑块数。
unsigned short s_imap_blocks; // i 节点位图所占用的数据块数。
unsigned short s_zmap_blocks; // 逻辑块位图所占用的数据块数。
unsigned short s_firstdatazone; // 第一个数据逻辑块号。
unsigned short s_log_zone_size; // log(数据块数/逻辑块)。(以2 为底)。
unsigned long s_max_size; // 文件最大长度。
unsigned short s_magic; // 文件系统魔数。
/* These are only in memory */
struct buffer_head *s_imap[8]; // i 节点位图缓冲块指针数组(占用8 块,可表示64M)。
struct buffer_head *s_zmap[8]; // 逻辑块位图缓冲块指针数组(占用8 块)。
unsigned short s_dev; // 超级块所在的设备号。
struct m_inode *s_isup; // 被安装的文件系统根目录的i 节点。(isup-super i)
struct m_inode *s_imount; // 被安装到的i 节点。
unsigned long s_time; // 修改时间。
struct task_struct *s_wait; // 等待该超级块的进程。
unsigned char s_lock; // 被锁定标志。
unsigned char s_rd_only; // 只读标志。
unsigned char s_dirt; // 已修改(脏)标志。
};
// 磁盘上超级块结构。
struct d_super_block
{
unsigned short s_ninodes; // 节点数。
unsigned short s_nzones; // 逻辑块数。
unsigned short s_imap_blocks; // i 节点位图所占用的数据块数。
unsigned short s_zmap_blocks; // 逻辑块位图所占用的数据块数。
unsigned short s_firstdatazone; // 第一个数据逻辑块。
unsigned short s_log_zone_size; // log(数据块数/逻辑块)。(以2 为底)。
unsigned long s_max_size; // 文件最大长度。
unsigned short s_magic; // 文件系统魔数。
};
// 文件目录项结构。
struct dir_entry
{
unsigned short inode; // i 节点。
char name[NAME_LEN]; // 文件名。
};
extern struct m_inode inode_table[NR_INODE]; // 定义i 节点表数组(32 项)。
extern struct file file_table[NR_FILE]; // 文件表数组(64 项)。
extern struct super_block super_block[NR_SUPER]; // 超级块数组(8 项)。
extern struct buffer_head *start_buffer; // 缓冲区起始内存位置。
extern int nr_buffers; // 缓冲块数。
//// 磁盘操作函数原型。
// 检测驱动器中软盘是否改变。
extern void check_disk_change (int dev);
// 检测指定软驱中软盘更换情况。如果软盘更换了则返回1,否则返回0。
extern int floppy_change (unsigned int nr);
// 设置启动指定驱动器所需等待的时间(设置等待定时器)。
extern int ticks_to_floppy_on (unsigned int dev);
// 启动指定驱动器。
extern void floppy_on (unsigned int dev);
// 关闭指定的软盘驱动器。
extern void floppy_off (unsigned int dev);
//// 以下是文件系统操作管理用的函数原型。
// 将i 节点指定的文件截为0。
extern void truncate (struct m_inode *inode);
// 刷新i 节点信息。
extern void sync_inodes (void);
// 等待指定的i 节点。
extern void wait_on (struct m_inode *inode);
// 逻辑块(区段,磁盘块)位图操作。取数据块block 在设备上对应的逻辑块号。
extern int bmap (struct m_inode *inode, int block);
// 创建数据块block 在设备上对应的逻辑块,并返回在设备上的逻辑块号。
extern int create_block (struct m_inode *inode, int block);
// 获取指定路径名的i 节点号。
extern struct m_inode *namei (const char *pathname);
// 根据路径名为打开文件操作作准备。
extern int open_namei (const char *pathname, int flag, int mode,
struct m_inode **res_inode);
// 释放一个i 节点(回写入设备)。
extern void iput (struct m_inode *inode);
// 从设备读取指定节点号的一个i 节点。
extern struct m_inode *iget (int dev, int nr);
// 从i 节点表(inode_table)中获取一个空闲i 节点项。
extern struct m_inode *get_empty_inode (void);
// 获取(申请一)管道节点。返回为i 节点指针(如果是NULL 则失败)。
extern struct m_inode *get_pipe_inode (void);
// 在哈希表中查找指定的数据块。返回找到块的缓冲头指针。
extern struct buffer_head *get_hash_table (int dev, int block);
// 从设备读取指定块(首先会在hash 表中查找)。
extern struct buffer_head *getblk (int dev, int block);
// 读/写数据块。
extern void ll_rw_block (int rw, struct buffer_head *bh);
// 释放指定缓冲块。
extern void brelse (struct buffer_head *buf);
// 读取指定的数据块。
extern struct buffer_head *bread (int dev, int block);
// 读4 块缓冲区到指定地址的内存中。
extern void bread_page (unsigned long addr, int dev, int b[4]);
// 读取头一个指定的数据块,并标记后续将要读的块。
extern struct buffer_head *breada (int dev, int block, ...);
// 向设备dev 申请一个磁盘块(区段,逻辑块)。返回逻辑块号
extern int new_block (int dev);
// 释放设备数据区中的逻辑块(区段,磁盘块)block。复位指定逻辑块block 的逻辑块位图比特位。
extern void free_block (int dev, int block);
// 为设备dev 建立一个新i 节点,返回i 节点号。
extern struct m_inode *new_inode (int dev);
// 释放一个i 节点(删除文件时)。
extern void free_inode (struct m_inode *inode);
// 刷新指定设备缓冲区。
extern int sync_dev (int dev);
// 读取指定设备的超级块。
extern struct super_block *get_super (int dev);
extern int ROOT_DEV;
// 安装根文件系统。
extern void mount_root (void);
#endif
/*
* This file contains some defines for the AT-hd-controller.
* Various sources. Check out some definitions (see comments with
* a ques).
*/
/*
* 本文件含有一些AT 硬盘控制器的定义。来自各种资料。请查证某些
* 定义(带有问号的注释)。
*/
#ifndef _HDREG_H
#define _HDREG_H
/* Hd controller regs. Ref: IBM AT Bios-listing */
/* 硬盘控制器寄存器端口。参见:IBM AT Bios 程序 */
#define HD_DATA 0x1f0 /* _CTL when writing */
#define HD_ERROR 0x1f1 /* see err-bits */
#define HD_NSECTOR 0x1f2 /* nr of sectors to read/write */
#define HD_SECTOR 0x1f3 /* starting sector */
#define HD_LCYL 0x1f4 /* starting cylinder */
#define HD_HCYL 0x1f5 /* high byte of starting cyl */
#define HD_CURRENT 0x1f6 /* 101dhhhh , d=drive, hhhh=head */
#define HD_STATUS 0x1f7 /* see status-bits */
#define HD_PRECOMP HD_ERROR /* same io address, read=error, write=precomp */
#define HD_COMMAND HD_STATUS /* same io address, read=status, write=cmd */
#define HD_CMD 0x3f6 // 控制寄存器端口。
/* Bits of HD_STATUS */
/* 硬盘状态寄存器各位的定义(HD_STATUS) */
#define ERR_STAT 0x01 // 命令执行错误。
#define INDEX_STAT 0x02 // 收到索引。
#define ECC_STAT 0x04 /* Corrected error */ // ECC 校验错。
#define DRQ_STAT 0x08 // 请求服务。
#define SEEK_STAT 0x10 // 寻道结束。
#define WRERR_STAT 0x20 // 驱动器故障。
#define READY_STAT 0x40 // 驱动器准备好(就绪)。
#define BUSY_STAT 0x80 // 控制器忙碌。
/* Values for HD_COMMAND */
/* 硬盘命令值(HD_CMD) */
#define WIN_RESTORE 0x10 // 驱动器重新校正(驱动器复位)。
#define WIN_READ 0x20 // 读扇区。
#define WIN_WRITE 0x30 // 写扇区。
#define WIN_VERIFY 0x40 // 扇区检验。
#define WIN_FORMAT 0x50 // 格式化磁道。
#define WIN_INIT 0x60 // 控制器初始化。
#define WIN_SEEK 0x70 // 寻道。
#define WIN_DIAGNOSE 0x90 // 控制器诊断。
#define WIN_SPECIFY 0x91 // 建立驱动器参数。
/* Bits for HD_ERROR */
/* 错误寄存器各比特位的含义(HD_ERROR) */
// 执行控制器诊断命令时含义与其它命令时的不同。下面分别列出:
// ==================================================
// 诊断命令时 其它命令时
// --------------------------------------------------
// 0x01 无错误 数据标志丢失
// 0x02 控制器出错 磁道0 错
// 0x03 扇区缓冲区错
// 0x04 ECC 部件错 命令放弃
// 0x05 控制处理器错
// 0x10 ID 未找到
// 0x40 ECC 错误
// 0x80 坏扇区
//---------------------------------------------------
#define MARK_ERR 0x01 /* Bad address mark ? */
#define TRK0_ERR 0x02 /* couldn't find track 0 */
#define ABRT_ERR 0x04 /* ? */
#define ID_ERR 0x10 /* ? */
#define ECC_ERR 0x40 /* ? */
#define BBD_ERR 0x80 /* ? */
// 硬盘分区表结构。参见下面列表后信息。
struct partition
{
unsigned char boot_ind; /* 0x80 - active (unused) */
unsigned char head; /* ? */
unsigned char sector; /* ? */
unsigned char cyl; /* ? */
unsigned char sys_ind; /* ? */
unsigned char end_head; /* ? */
unsigned char end_sector; /* ? */
unsigned char end_cyl; /* ? */
unsigned int start_sect; /* starting sector counting from 0 */
unsigned int nr_sects; /* nr of sectors in partition */
};
#endif
#ifndef _HEAD_H
#define _HEAD_H
typedef struct desc_struct
{ // 定义了段描述符的数据结构。该结构仅说明每个描述
unsigned long a, b; // 符是由8 个字节构成,每个描述符表共有256 项。
}
desc_table[256];
extern unsigned long pg_dir[1024]; // 内存页目录数组。每个目录项为4 字节。从物理地址0 开始。
extern desc_table idt, gdt; // 中断描述符表,全局描述符表。
#define GDT_NUL 0 // 全局描述符表的第0 项,不用。
#define GDT_CODE 1 // 第1 项,是内核代码段描述符项。
#define GDT_DATA 2 // 第2 项,是内核数据段描述符项。
#define GDT_TMP 3 // 第3 项,系统段描述符,Linux 没有使用。
#define LDT_NUL 0 // 每个局部描述符表的第0 项,不用。
#define LDT_CODE 1 // 第1 项,是用户程序代码段描述符项。
#define LDT_DATA 2 // 第2 项,是用户程序数据段描述符项。
#endif
/*
* 'kernel.h' contains some often-used function prototypes etc
*/
/*
* 'kernel.h'定义了一些常用函数的原型等。
*/
// 验证给定地址开始的内存块是否超限。若超限则追加内存。( kernel/fork.c)。
void verify_area (void *addr, int count);
// 显示内核出错信息,然后进入死循环。( kernel/panic.c)。
volatile void panic (const char *str);
// 标准打印(显示)函数。( init/main.c)。
int printf (const char *fmt, ...);
// 内核专用的打印信息函数,功能与printf()相同。( kernel/printk.c)。
int printk (const char *fmt, ...);
// 往tty 上写指定长度的字符串。( kernel/chr_drv/tty_io.c)。
int tty_write (unsigned ch, char *buf, int count);
// 通用内核内存分配函数。( lib/malloc.c)。
void *malloc (unsigned int size);
// 释放指定对象占用的内存。( lib/malloc.c)。
void free_s (void *obj, int size);
#define free(x) free_s((x), 0)
/*
* This is defined as a macro, but at some point this might become a
* real subroutine that sets a flag if it returns true (to do
* BSD-style accounting where the process is flagged if it uses root
* privs). The implication of this is that you should do normal
* permissions checks first, and check suser() last.
*/
/*
* 下面函数是以宏的形式定义的,但是在某方面来看它可以成为一个真正的子程序,
* 如果返回是true 时它将设置标志(如果使用root 用户权限的进程设置了标志,则用
* 于执行BSD 方式的计帐处理)。这意味着你应该首先执行常规权限检查,最后再
* 检测suser()。
*/
#define suser() (current->euid == 0) // 检测是否是超级用户。
#ifndef _MM_H
#define _MM_H
#define PAGE_SIZE 4096 // 定义内存页面的大小(字节数)。
// 取空闲页面函数。返回页面地址。扫描页面映射数组mem_map[]取空闲页面。
extern unsigned long get_free_page (void);
// 在指定物理地址处放置一页面。在页目录和页表中放置指定页面信息。
extern unsigned long put_page (unsigned long page, unsigned long address);
// 释放物理地址addr 开始的一页面内存。修改页面映射数组mem_map[]中引用次数信息。
extern void free_page (unsigned long addr);
#endif
#ifndef _SCHED_H
#define _SCHED_H
#define NR_TASKS 64 // 系统中同时最多任务(进程)数。
#define HZ 100 // 定义系统时钟滴答频率(1 百赫兹,每个滴答10ms)
#define FIRST_TASK task[0] // 任务0 比较特殊,所以特意给它单独定义一个符号。
#define LAST_TASK task[NR_TASKS-1] // 任务数组中的最后一项任务。
#include <linux/head.h> // head 头文件,定义了段描述符的简单结构,和几个选择符常量。
#include <linux/fs.h> // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。
#include <linux/mm.h> // 内存管理头文件。含有页面大小定义和一些页面释放函数原型。
#include <signal.h> // 信号头文件。定义信号符号常量,信号结构以及信号操作函数原型。
#if (NR_OPEN > 32)
#error "Currently the close-on-exec-flags are in one word, max 32 files/proc"
#endif
// 这里定义了进程运行可能处的状态。
#define TASK_RUNNING 0 // 进程正在运行或已准备就绪。
#define TASK_INTERRUPTIBLE 1 // 进程处于可中断等待状态。
#define TASK_UNINTERRUPTIBLE 2 // 进程处于不可中断等待状态,主要用于I/O 操作等待。
#define TASK_ZOMBIE 3 // 进程处于僵死状态,已经停止运行,但父进程还没发信号。
#define TASK_STOPPED 4 // 进程已停止。
#ifndef NULL
#define NULL ((void *) 0) // 定义NULL 为空指针。
#endif
// 复制进程的页目录页表。Linus 认为这是内核中最复杂的函数之一。( mm/memory.c)
extern int copy_page_tables (unsigned long from, unsigned long to, long size);
// 释放页表所指定的内存块及页表本身。( mm/memory.c)
extern int free_page_tables (unsigned long from, unsigned long size);
// 调度程序的初始化函数。( kernel/sched.c)
extern void sched_init(void);
// 进程调度函数。( kernel/sched.c)
extern void schedule(void);
// 异常(陷阱)中断处理初始化函数,设置中断调用门并允许中断请求信号。( kernel/traps.c)
extern void trap_init(void);
#ifndef PANIC
// 显示内核出错信息,然后进入死循环。( kernel/panic.c)。
volatile void panic(const char * str);
#endif
// 往tty 上写指定长度的字符串。( kernel/chr_drv/tty_io.c)。
extern int tty_write(unsigned minor,char * buf,int count);
extern void record_task_state(long pid, long new_state, long jiffies, const char* fun_name, int line_num);
#define RECORD_TASK_STATE(pid, state, jiffies) record_task_state(pid, state, jiffies, __FUNCTION__, __LINE__);
// 为了与经典的进程状态相匹配,方便理解,这里定义了一组新的进程状态。
#define TS_CREATE 0 // 创建
#define TS_READY 1 // 就绪态
#define TS_RUNNING 2 // 运行态
#define TS_WAIT 3 // 阻塞态
#define TS_STOPPED 4 // 结束
typedef int (*fn_ptr)(); // 定义函数指针类型。
// 下面是数学协处理器使用的结构,主要用于保存进程切换时 i387 的执行状态信息。
struct i387_struct {
long cwd; // 控制字(Control word)。
long swd; // 状态字(Status word)。
long twd; // 标记字(Tag word)。
long fip; // 协处理器代码指针。
long fcs; // 协处理器代码段寄存器。
long foo;
long fos;
long st_space[20]; /* 8*10 bytes for each FP-reg = 80 bytes */
};
// 任务状态段数据结构。
struct tss_struct {
long back_link; /* 16 high bits zero */
long esp0;
long ss0; /* 16 high bits zero */
long esp1;
long ss1; /* 16 high bits zero */
long esp2;
long ss2; /* 16 high bits zero */
long cr3;
long eip;
long eflags;
long eax,ecx,edx,ebx;
long esp;
long ebp;
long esi;
long edi;
long es; /* 16 high bits zero */
long cs; /* 16 high bits zero */
long ss; /* 16 high bits zero */
long ds; /* 16 high bits zero */
long fs; /* 16 high bits zero */
long gs; /* 16 high bits zero */
long ldt; /* 16 high bits zero */
long trace_bitmap; /* bits: trace 0, bitmap 16-31 */
struct i387_struct i387;
};
// 这里是任务(进程)数据结构,或称为进程描述符。
// ==========================
// long state 任务的运行状态(-1 不可运行,0 可运行(就绪),>0 已停止)。
// long counter 任务运行时间计数(递减)(滴答数),运行时间片。
// long priority 运行优先数。任务开始运行时counter = priority,越大运行越长。
// long signal 信号。是位图,每个比特位代表一种信号,信号值=位偏移值+1。
// struct sigaction sigaction[32] 信号执行属性结构,对应信号将要执行的操作和标志信息。
// long blocked 进程信号屏蔽码(对应信号位图)。
// --------------------------
// int exit_code 任务执行停止的退出码,其父进程会取。
// unsigned long start_code 代码段地址。
// unsigned long end_code 代码长度(字节数)。
// unsigned long end_data 代码长度 + 数据长度(字节数)。
// unsigned long brk 总长度(字节数)。
// unsigned long start_stack 堆栈段地址。
// long pid 进程标识号(进程号)。
// long father 父进程号。
// long pgrp 父进程组号。
// long session 会话号。
// long leader 会话首领。
// unsigned short uid 用户标识号(用户id)。
// unsigned short euid 有效用户id。
// unsigned short suid 保存的用户id。
// unsigned short gid 组标识号(组id)。
// unsigned short egid 有效组id。
// unsigned short sgid 保存的组id。
// long alarm 报警定时值(滴答数)。
// long utime 用户态运行时间(滴答数)。
// long stime 系统态运行时间(滴答数)。
// long cutime 子进程用户态运行时间。
// long cstime 子进程系统态运行时间。
// long start_time 进程开始运行时刻。
// unsigned short used_math 标志:是否使用了协处理器。
// --------------------------
// int tty 进程使用tty 的子设备号。-1 表示没有使用。
// unsigned short umask 文件创建属性屏蔽位。
// struct m_inode * pwd 当前工作目录i 节点结构。
// struct m_inode * root 根目录i 节点结构。
// struct m_inode * executable 执行文件i 节点结构。
// unsigned long close_on_exec 执行时关闭文件句柄位图标志。(参见include/fcntl.h)
// struct file * filp[NR_OPEN] 进程使用的文件表结构。
// --------------------------
// struct desc_struct ldt[3] 本任务的局部表描述符。0-空,1-代码段cs,2-数据和堆栈段ds&ss。
// --------------------------
// struct tss_struct tss 本进程的任务状态段信息结构。
// ==========================
struct task_struct {
/* these are hardcoded - don't touch */
long state; /* -1 unrunnable, 0 runnable, >0 stopped */
long counter;
long priority;
long signal;
struct sigaction sigaction[32];
long blocked; /* bitmap of masked signals */
/* various fields */
int exit_code;
unsigned long start_code,end_code,end_data,brk,start_stack;
long pid,father,pgrp,session,leader;
unsigned short uid,euid,suid;
unsigned short gid,egid,sgid;
long alarm;
long utime,stime,cutime,cstime,start_time;
unsigned short used_math;
/* file system info */
int tty; /* -1 if no tty, so it must be signed */
unsigned short umask;
struct m_inode * pwd;
struct m_inode * root;
struct m_inode * executable;
unsigned long close_on_exec;
struct file * filp[NR_OPEN];
/* ldt for this task 0 - zero 1 - cs 2 - ds&ss */
struct desc_struct ldt[3];
/* tss for this task */
struct tss_struct tss;
};
/*
* INIT_TASK is used to set up the first task table, touch at
* your own risk!. Base=0, limit=0x9ffff (=640kB)
*/
/*
* INIT_TASK 用于设置第1 个任务表,若想修改,责任自负?!
* 基址Base = 0,段长limit = 0x9ffff(=640kB)。
*/
// 对应上面任务结构的第1 个任务的信息。
#define INIT_TASK \
/* state etc */ { 0,15,15, \
/* signals */ 0,{{},},0, \
/* ec,brk... */ 0,0,0,0,0,0, \
/* pid etc.. */ 0,-1,0,0,0, \
/* uid etc */ 0,0,0,0,0,0, \
/* alarm */ 0,0,0,0,0,0, \
/* math */ 0, \
/* fs info */ -1,0022,NULL,NULL,NULL,0, \
/* filp */ {NULL,}, \
{ \
{0,0}, \
/* ldt */ {0x9f,0xc0fa00}, \
{0x9f,0xc0f200}, \
}, \
/*tss*/ {0,PAGE_SIZE+(long)&init_task,0x10,0,0,0,0,(long)&pg_dir,\
0,0,0,0,0,0,0,0, \
0,0,0x17,0x17,0x17,0x17,0x17,0x17, \
_LDT(0),0x80000000, \
{} \
}, \
}
extern struct task_struct *task[NR_TASKS]; // 任务数组。
extern struct task_struct *last_task_used_math; // 上一个使用过协处理器的进程。
extern struct task_struct *current; // 当前进程结构指针变量。
extern long volatile jiffies; // 从开机开始算起的滴答数(10ms/滴答)。
extern long startup_time; // 开机时间。从1970:0:0:0 开始计时的秒数。
#define CURRENT_TIME (startup_time+jiffies/HZ) // 当前时间(秒数)。
// 添加定时器函数(定时时间jiffies 滴答数,定时到时调用函数*fn())。( kernel/sched.c)
extern void add_timer(long jiffies, void (*fn)(void));
// 不可中断的等待睡眠。( kernel/sched.c)
extern void sleep_on(struct task_struct ** p);
// 可中断的等待睡眠。( kernel/sched.c)
extern void interruptible_sleep_on(struct task_struct ** p);
// 明确唤醒睡眠的进程。( kernel/sched.c)
extern void wake_up(struct task_struct ** p);
/*
* Entry into gdt where to find first TSS. 0-nul, 1-cs, 2-ds, 3-syscall
* 4-TSS0, 5-LDT0, 6-TSS1 etc ...
*/
/*
* 寻找第1 个TSS 在全局表中的入口。0-没有用nul,1-代码段cs,2-数据段ds,3-系统段syscall
* 4-任务状态段TSS0,5-局部表LTD0,6-任务状态段TSS1,等。
*/
// 全局表中第1 个任务状态段(TSS)描述符的选择符索引号。
#define FIRST_TSS_ENTRY 4
// 全局表中第1 个局部描述符表(LDT)描述符的选择符索引号。
#define FIRST_LDT_ENTRY (FIRST_TSS_ENTRY+1)
// 宏定义,计算在全局表中第n 个任务的TSS 描述符的索引号(选择符)。
#define _TSS(n) ((((unsigned long) n)<<4)+(FIRST_TSS_ENTRY<<3))
// 宏定义,计算在全局表中第n 个任务的LDT 描述符的索引号。
#define _LDT(n) ((((unsigned long) n)<<4)+(FIRST_LDT_ENTRY<<3))
// 宏定义,加载第n 个任务的任务寄存器tr。
#define ltr(n) __asm__("ltr %%ax"::"a" (_TSS(n)))
// 宏定义,加载第n 个任务的局部描述符表寄存器ldtr。
#define lldt(n) __asm__("lldt %%ax"::"a" (_LDT(n)))
// 取当前运行任务的任务号(是任务数组中的索引值,与进程号pid 不同)。
// 返回:n - 当前任务号。用于( kernel/traps.c)。
#define str(n) \
__asm__("str %%ax\n\t" \
"subl %2,%%eax\n\t" \
"shrl $4,%%eax" \
:"=a" (n) \
:"a" (0),"i" (FIRST_TSS_ENTRY<<3))
/*
* switch_to(n) should switch tasks to task nr n, first
* checking that n isn't the current task, in which case it does nothing.
* This also clears the TS-flag if the task we switched to has used
* tha math co-processor latest.
*/
/*
* switch_to(n)将切换当前任务到任务nr,即n。首先检测任务n 不是当前任务,
* 如果是则什么也不做退出。如果我们切换到的任务最近(上次运行)使用过数学
* 协处理器的话,则还需复位控制寄存器cr0 中的TS 标志。
*/
// 输入:%0 - 新TSS 的偏移地址(*&__tmp.a); %1 - 存放新TSS 的选择符值(*&__tmp.b);
// dx - 新任务n 的选择符;ecx - 新任务指针task[n]。
// 其中临时数据结构__tmp 中,a 的值是32 位偏移值,b 为新TSS 的选择符。在任务切换时,a 值
// 没有用(忽略)。在判断新任务上次执行是否使用过协处理器时,是通过将新任务状态段的地址与
// 保存在last_task_used_math 变量中的使用过协处理器的任务状态段的地址进行比较而作出的。
#define switch_to(n) {\
struct {long a,b;} __tmp; \
__asm__("cmpl %%ecx,_current\n\t" \
"je 1f\n\t" \
"movw %%dx,%1\n\t" \
"xchgl %%ecx,_current\n\t" \
"ljmp *%0\n\t" \
"cmpl %%ecx,_last_task_used_math\n\t" \
"jne 1f\n\t" \
"clts\n" \
"1:" \
::"m" (*&__tmp.a),"m" (*&__tmp.b), \
"d" (_TSS(n)),"c" ((long) task[n])); \
}
// 页面地址对准。(在内核代码中没有任何地方引用!!)
#define PAGE_ALIGN(n) (((n)+0xfff)&0xfffff000)
// 设置位于地址addr 处描述符中的各基地址字段(基地址是base),参见列表后说明。
// %0 - 地址addr 偏移2;%1 - 地址addr 偏移4;%2 - 地址addr 偏移7;edx - 基地址base。
#define _set_base(addr,base) \
__asm__ ("push %%edx\n\t" \
"movw %%dx,%0\n\t" \
"rorl $16,%%edx\n\t" \
"movb %%dl,%1\n\t" \
"movb %%dh,%2\n\t" \
"pop %%edx" \
::"m" (*((addr)+2)), \
"m" (*((addr)+4)), \
"m" (*((addr)+7)), \
"d" (base) \
)
#define _set_limit(addr,limit) \
__asm__ ("push %%edx\n\t" \
"movw %%dx,%0\n\t" \
"rorl $16,%%edx\n\t" \
"movb %1,%%dh\n\t" \
"andb $0xf0,%%dh\n\t" \
"orb %%dh,%%dl\n\t" \
"movb %%dl,%1\n\t" \
"pop %%edx" \
::"m" (*(addr)), \
"m" (*((addr)+6)), \
"d" (limit) \
)
// 设置局部描述符表中ldt 描述符的基地址字段。
#define set_base(ldt,base) _set_base( ((char *)&(ldt)) , (base) )
// 设置局部描述符表中ldt 描述符的段长字段。
#define set_limit(ldt,limit) _set_limit( ((char *)&(ldt)) , (limit-1)>>12 )
/**
#define _get_base(addr) ({\
unsigned long __base; \
__asm__("movb %3,%%dh\n\t" \
"movb %2,%%dl\n\t" \
"shll $16,%%edx\n\t" \
"movw %1,%%dx" \
:"=d" (__base) \
:"m" (*((addr)+2)), \
"m" (*((addr)+4)), \
"m" (*((addr)+7)) \
:"memory"); \
__base;})
**/
// 从地址addr 处描述符中取段基地址。功能与_set_base()正好相反。
// edx - 存放基地址(__base);%1 - 地址addr 偏移2;%2 - 地址addr 偏移4;%3 - addr 偏移7。
static inline unsigned long _get_base(char * addr)
{
unsigned long __base;
__asm__("movb %3,%%dh\n\t"
"movb %2,%%dl\n\t"
"shll $16,%%edx\n\t"
"movw %1,%%dx"
:"=&d" (__base)
:"m" (*((addr)+2)),
"m" (*((addr)+4)),
"m" (*((addr)+7)));
return __base;
}
// 取局部描述符表中ldt 所指段描述符中的基地址。
#define get_base(ldt) _get_base( ((char *)&(ldt)) )
// 取段选择符segment 的段长值。
// %0 - 存放段长值(字节数);%1 - 段选择符segment。
#define get_limit(segment) ({ \
unsigned long __limit; \
__asm__("lsll %1,%0\n\tincl %0":"=r" (__limit):"r" (segment)); \
__limit;})
#endif
extern int sys_setup (); // 系统启动初始化设置函数。 (kernel/blk_drv/hd.c)
extern int sys_exit (); // 程序退出。 (kernel/exit.c)
extern int sys_fork (); // 创建进程。 (kernel/system_call.s)
extern int sys_read (); // 读文件。 (fs/read_write.c)
extern int sys_write (); // 写文件。 (fs/read_write.c)
extern int sys_open (); // 打开文件。 (fs/open.c)
extern int sys_close (); // 关闭文件。 (fs/open.c)
extern int sys_waitpid (); // 等待进程终止。 (kernel/exit.c)
extern int sys_creat (); // 创建文件。 (fs/open.c)
extern int sys_link (); // 创建一个文件的硬连接。 (fs/namei.c)
extern int sys_unlink (); // 删除一个文件名(或删除文件)。 (fs/namei.c)
extern int sys_execve (); // 执行程序。 (kernel/system_call.s)
extern int sys_chdir (); // 更改当前目录。 (fs/open.c)
extern int sys_time (); // 取当前时间。 (kernel/sys.c)
extern int sys_mknod (); // 建立块/字符特殊文件。 (fs/namei.c)
extern int sys_chmod (); // 修改文件属性。 (fs/open.c)
extern int sys_chown (); // 修改文件宿主和所属组。 (fs/open.c)
extern int sys_break (); // (-kernel/sys.c)
extern int sys_stat (); // 使用路径名取文件的状态信息。 (fs/stat.c)
extern int sys_lseek (); // 重新定位读/写文件偏移。 (fs/read_write.c)
extern int sys_getpid (); // 取进程id。 (kernel/sched.c)
extern int sys_mount (); // 安装文件系统。 (fs/super.c)
extern int sys_umount (); // 卸载文件系统。 (fs/super.c)
extern int sys_setuid (); // 设置进程用户id。 (kernel/sys.c)
extern int sys_getuid (); // 取进程用户id。 (kernel/sched.c)
extern int sys_stime (); // 设置系统时间日期。 (-kernel/sys.c)
extern int sys_ptrace (); // 程序调试。 (-kernel/sys.c)
extern int sys_alarm (); // 设置报警。 (kernel/sched.c)
extern int sys_fstat (); // 使用文件句柄取文件的状态信息。(fs/stat.c)
extern int sys_pause (); // 暂停进程运行。 (kernel/sched.c)
extern int sys_utime (); // 改变文件的访问和修改时间。 (fs/open.c)
extern int sys_stty (); // 修改终端行设置。 (-kernel/sys.c)
extern int sys_gtty (); // 取终端行设置信息。 (-kernel/sys.c)
extern int sys_access (); // 检查用户对一个文件的访问权限。(fs/open.c)
extern int sys_nice (); // 设置进程执行优先权。 (kernel/sched.c)
extern int sys_ftime (); // 取日期和时间。 (-kernel/sys.c)
extern int sys_sync (); // 同步高速缓冲与设备中数据。 (fs/buffer.c)
extern int sys_kill (); // 终止一个进程。 (kernel/exit.c)
extern int sys_rename (); // 更改文件名。 (-kernel/sys.c)
extern int sys_mkdir (); // 创建目录。 (fs/namei.c)
extern int sys_rmdir (); // 删除目录。 (fs/namei.c)
extern int sys_dup (); // 复制文件句柄。 (fs/fcntl.c)
extern int sys_pipe (); // 创建管道。 (fs/pipe.c)
extern int sys_times (); // 取运行时间。 (kernel/sys.c)
extern int sys_prof (); // 程序执行时间区域。 (-kernel/sys.c)
extern int sys_brk (); // 修改数据段长度。 (kernel/sys.c)
extern int sys_setgid (); // 设置进程组id。 (kernel/sys.c)
extern int sys_getgid (); // 取进程组id。 (kernel/sched.c)
extern int sys_signal (); // 信号处理。 (kernel/signal.c)
extern int sys_geteuid (); // 取进程有效用户id。 (kenrl/sched.c)
extern int sys_getegid (); // 取进程有效组id。 (kenrl/sched.c)
extern int sys_acct (); // 进程记帐。 (-kernel/sys.c)
extern int sys_phys (); // (-kernel/sys.c)
extern int sys_lock (); // (-kernel/sys.c)
extern int sys_ioctl (); // 设备控制。 (fs/ioctl.c)
extern int sys_fcntl (); // 文件句柄操作。 (fs/fcntl.c)
extern int sys_mpx (); // (-kernel/sys.c)
extern int sys_setpgid (); // 设置进程组id。 (kernel/sys.c)
extern int sys_ulimit (); // (-kernel/sys.c)
extern int sys_uname (); // 显示系统信息。 (kernel/sys.c)
extern int sys_umask (); // 取默认文件创建属性码。 (kernel/sys.c)
extern int sys_chroot (); // 改变根系统。 (fs/open.c)
extern int sys_ustat (); // 取文件系统信息。 (fs/open.c)
extern int sys_dup2 (); // 复制文件句柄。 (fs/fcntl.c)
extern int sys_getppid (); // 取父进程id。 (kernel/sched.c)
extern int sys_getpgrp (); // 取进程组id,等于getpgid(0)。(kernel/sys.c)
extern int sys_setsid (); // 在新会话中运行程序。 (kernel/sys.c)
extern int sys_sigaction (); // 改变信号处理过程。 (kernel/signal.c)
extern int sys_sgetmask (); // 取信号屏蔽码。 (kernel/signal.c)
extern int sys_ssetmask (); // 设置信号屏蔽码。 (kernel/signal.c)
extern int sys_setreuid (); // 设置真实与/或有效用户id。 (kernel/sys.c)
extern int sys_setregid (); // 设置真实与/或有效组id。 (kernel/sys.c)
extern int sys_sigpending();
extern int sys_sigsuspend();
extern int sys_sethostname();
extern int sys_setrlimit();
extern int sys_getrlimit();
extern int sys_getrusage();
extern int sys_gettimeofday();
extern int sys_settimeofday();
extern int sys_getgroups();
extern int sys_setgroups();
extern int sys_select();
extern int sys_symlink();
extern int sys_lstat();
extern int sys_readlink();
extern int sys_uselib();
// 系统调用函数指针表。用于系统调用中断处理程序(int 0x80),作为跳转表。
// 数组元素为系统调用内核函数的函数指针,索引即系统调用号
fn_ptr sys_call_table[] = {
sys_setup, //0
sys_exit, //1
sys_fork, //2
sys_read, //3
sys_write, //4
sys_open, //5
sys_close, //6
sys_waitpid, //7
sys_creat, //8
sys_link, //9
sys_unlink, //10
sys_execve, //11
sys_chdir, //12
sys_time, //13
sys_mknod, //14
sys_chmod, //15
sys_chown, //16
sys_break, //17
sys_stat, //18
sys_lseek, //19
sys_getpid, //20
sys_mount, //21
sys_umount, //22
sys_setuid, //23
sys_getuid, //24
sys_stime, //25
sys_ptrace, //26
sys_alarm, //27
sys_fstat, //28
sys_pause, //29
sys_utime, //30
sys_stty, //31
sys_gtty, //32
sys_access, //33
sys_nice, //34
sys_ftime, //35
sys_sync, //36
sys_kill, //37
sys_rename, //38
sys_mkdir, //39
sys_rmdir, //40
sys_dup, //41
sys_pipe, //42
sys_times, //43
sys_prof, //44
sys_brk, //45
sys_setgid, //46
sys_getgid, //47
sys_signal, //48
sys_geteuid, //49
sys_getegid, //50
sys_acct, //51
sys_phys, //52
sys_lock, //53
sys_ioctl, //54
sys_fcntl, //55
sys_mpx, //56
sys_setpgid, //57
sys_ulimit, //58
sys_uname, //59
sys_umask, //60
sys_chroot, //61
sys_ustat, //62
sys_dup2, //63
sys_getppid, //64
sys_getpgrp, //65
sys_setsid, //66
sys_sigaction, //67
sys_sgetmask, //68
sys_ssetmask, //69
sys_setreuid, //70
sys_setregid, //71
sys_sigsuspend, //72
sys_sigpending, //73
sys_sethostname, //74
sys_setrlimit, //75
sys_getrlimit, //76
sys_getrusage, //77
sys_gettimeofday, //78
sys_settimeofday, //79
sys_getgroups, //80
sys_setgroups, //81
sys_select, //82
sys_symlink, //83
sys_lstat, //84
sys_readlink, //85
sys_uselib //86
};
/*
* 'tty.h' defines some structures used by tty_io.c and some defines.
*
* NOTE! Don't touch this without checking that nothing in rs_io.s or
* con_io.s breaks. Some constants are hardwired into the system (mainly
* offsets into 'tty_queue'
*/
/*
* 'tty.h'中定义了tty_io.c 程序使用的某些结构和其它一些定义。
*
* 注意!在修改这里的定义时,一定要检查rs_io.s 或con_io.s 程序中不会出现问题。
* 在系统中有些常量是直接写在程序中的(主要是一些tty_queue 中的偏移值)。
*/
#ifndef _TTY_H
#define _TTY_H
#include <termios.h> // 终端输入输出函数头文件。主要定义控制异步通信口的终端接口。
#define TTY_BUF_SIZE 1024 // tty 缓冲区大小。
// tty 等待队列数据结构。
struct tty_queue {
unsigned long data; // 等待队列缓冲区中当前数据指针字符数)。
// 对于串口终端,则存放串行端口地址。
unsigned long head; // 缓冲区中数据头指针。
unsigned long tail; // 缓冲区中数据尾指针。
struct task_struct *proc_list; // 等待进程列表。
char buf[TTY_BUF_SIZE]; // 队列的缓冲区。
};
// 以下定义了tty 等待队列中缓冲区操作宏函数。(tail 在前,head 在后)。
// a 缓冲区指针前移1 字节,并循环。
#define INC(a) ((a) = ((a)+1) & (TTY_BUF_SIZE-1))
// a 缓冲区指针后退1 字节,并循环。
#define DEC(a) ((a) = ((a)-1) & (TTY_BUF_SIZE-1))
// 清空指定队列的缓冲区。
#define EMPTY(a) ((a).head == (a).tail)
// 缓冲区还可存放字符的长度(空闲区长度)。
#define LEFT(a) (((a).tail-(a).head-1)&(TTY_BUF_SIZE-1))
// 缓冲区中最后一个位置。
#define LAST(a) ((a).buf[(TTY_BUF_SIZE-1)&((a).head-1)])
// 缓冲区满(如果为1 的话)。
#define FULL(a) (!LEFT(a))
// 缓冲区中已存放字符的长度。
#define CHARS(a) (((a).head-(a).tail)&(TTY_BUF_SIZE-1))
// 从queue 队列项缓冲区中取一字符(从tail 处,并且tail+=1)。
#define GETCH(queue,c) \
(void)({c=(queue).buf[(queue).tail];INC((queue).tail);})
// 往queue 队列项缓冲区中放置一字符(在head 处,并且head+=1)。
#define PUTCH(c,queue) \
(void)({(queue).buf[(queue).head]=(c);INC((queue).head);})
// 判断终端键盘字符类型。
#define INTR_CHAR(tty) ((tty)->termios.c_cc[VINTR]) // 中断符。
#define QUIT_CHAR(tty) ((tty)->termios.c_cc[VQUIT]) // 退出符。
#define ERASE_CHAR(tty) ((tty)->termios.c_cc[VERASE]) // 削除符。
#define KILL_CHAR(tty) ((tty)->termios.c_cc[VKILL]) // 终止符。
#define EOF_CHAR(tty) ((tty)->termios.c_cc[VEOF]) // 文件结束符。
#define START_CHAR(tty) ((tty)->termios.c_cc[VSTART]) // 开始符。
#define STOP_CHAR(tty) ((tty)->termios.c_cc[VSTOP]) // 结束符。
#define SUSPEND_CHAR(tty) ((tty)->termios.c_cc[VSUSP]) // 挂起符。
// tty 数据结构。
struct tty_struct
{
struct termios termios; // 终端io 属性和控制字符数据结构。
int pgrp; // 所属进程组。
int stopped; // 停止标志。
void (*write) (struct tty_struct * tty); // tty 写函数指针。
struct tty_queue read_q; // tty 读队列。
struct tty_queue write_q; // tty 写队列。
struct tty_queue secondary; // tty 辅助队列(存放规范模式字符序列),
}; // 可称为规范(熟)模式队列。
extern struct tty_struct tty_table[];
/* intr=^C quit=^| erase=del kill=^U
eof=^D vtime=\0 vmin=\1 sxtc=\0
start=^Q stop=^S susp=^Z eol=\0
reprint=^R discard=^U werase=^W lnext=^V
eol2=\0
*/
/*
中断intr=^C 退出quit=^| 删除erase=del 终止kill=^U
文件结束eof=^D vtime=\0 vmin=\1 sxtc=\0
开始start=^Q 停止stop=^S 挂起susp=^Z 行结束eol=\0
重显reprint=^R 丢弃discard=^U werase=^W lnext=^V
行结束eol2=\0
*/
// 控制字符对应的ASCII 码值。[8 进制]
#define INIT_C_CC "\003\034\177\025\004\0\1\0\021\023\032\0\022\017\027\026\0"
void rs_init (void); // 异步串行通信初始化。 (kernel/chr_drv/serial.c)
void con_init (void); // 控制终端初始化。 (kernel/chr_drv/console.c)
void tty_init (void); // tty 初始化。 (kernel/chr_drv/tty_io.c)
int tty_read (unsigned c, char *buf, int n); // (kernel/chr_drv/tty_io.c)
int tty_write (unsigned c, char *buf, int n); // (kernel/chr_drv/tty_io.c)
void rs_write (struct tty_struct *tty); // (kernel/chr_drv/serial.c)
void con_write (struct tty_struct *tty); // (kernel/chr_drv/console.c)
void copy_to_cooked (struct tty_struct *tty); // (kernel/chr_drv/tty_io.c)
#endif
#ifndef _SIGNAL_H
#define _SIGNAL_H
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
typedef int sig_atomic_t; // 定义信号原子操作类型。
typedef unsigned int sigset_t; /* 32 bits */// 定义信号集类型。
#define _NSIG 32 // 定义信号种类 -- 32 种。
#define NSIG _NSIG // NSIG = _NSIG
// 以下这些是Linux 0.11 内核中定义的信号。
#define SIGHUP 1 // Hang Up -- 挂断控制终端或进程。
#define SIGINT 2 // Interrupt -- 来自键盘的中断。
#define SIGQUIT 3 // Quit -- 来自键盘的退出。
#define SIGILL 4 // Illeagle -- 非法指令。
#define SIGTRAP 5 // Trap -- 跟踪断点。
#define SIGABRT 6 // Abort -- 异常结束。
#define SIGIOT 6 // IO Trap -- 同上。
#define SIGUNUSED 7 // Unused -- 没有使用。
#define SIGFPE 8 // FPE -- 协处理器出错。
#define SIGKILL 9 // Kill -- 强迫进程终止。
#define SIGUSR1 10 // User1 -- 用户信号1,进程可使用。
#define SIGSEGV 11 // Segment Violation -- 无效内存引用。
#define SIGUSR2 12 // User2 -- 用户信号2,进程可使用。
#define SIGPIPE 13 // Pipe -- 管道写出错,无读者。
#define SIGALRM 14 // Alarm -- 实时定时器报警。
#define SIGTERM 15 // Terminate -- 进程终止。
#define SIGSTKFLT 16 // Stack Fault -- 栈出错(协处理器)。
#define SIGCHLD 17 // Child -- 子进程停止或被终止。
#define SIGCONT 18 // Continue -- 恢复进程继续执行。
#define SIGSTOP 19 // Stop -- 停止进程的执行。
#define SIGTSTP 20 // TTY Stop -- tty 发出停止进程,可忽略。
#define SIGTTIN 21 // TTY In -- 后台进程请求输入。
#define SIGTTOU 22 // TTY Out -- 后台进程请求输出。
/* Ok, I haven't implemented sigactions, but trying to keep headers POSIX */
/* OK,我还没有实现sigactions 的编制,但在头文件中仍希望遵守POSIX 标准 */
//////////////////////// 【标号一】 //////////////////////////
#define SA_NOCLDSTOP 1 // 当子进程处于停止状态,就不对SIGCHLD 处理。
#define SA_NOMASK 0x40000000 // 不阻止在指定的信号处理程序(信号句柄)中再收到该信号。
#define SA_ONESHOT 0x80000000 // 信号句柄一旦被调用过就恢复到默认处理句柄。
// 以下参数用于sigprocmask()-- 改变阻塞信号集(屏蔽码)。这些参数可以改变该函数的行为。
#define SIG_BLOCK 0 /* for blocking signals */
// 在阻塞信号集中加上给定的信号集。
#define SIG_UNBLOCK 1 /* for unblocking signals */
// 从阻塞信号集中删除指定的信号集。
#define SIG_SETMASK 2 /* for setting the signal mask */
// 设置阻塞信号集(信号屏蔽码)。
#define SIG_DFL ((void (*)(int))0) /* default signal handling */
// 默认的信号处理程序(信号句柄)。
#define SIG_IGN ((void (*)(int))1) /* ignore signal */
// 忽略信号的处理程序。
// 下面是sigaction 的数据结构。
// sa_handler 是对应某信号指定要采取的行动。可以是上面的SIG_DFL,或者是SIG_IGN 来忽略
// 该信号,也可以是指向处理该信号函数的一个指针。
// sa_mask 给出了对信号的屏蔽码,在信号程序执行时将阻塞对这些信号的处理。
// sa_flags 指定改变信号处理过程的信号集。它是由【标号一】的位标志定义的。
// sa_restorer 恢复过程指针,是用于保存原返回的过程指针。
// 另外,引起触发信号处理的信号也将被阻塞,除非使用了SA_NOMASK 标志。
struct sigaction
{
void (*sa_handler) (int);
sigset_t sa_mask;
int sa_flags;
void (*sa_restorer) (void);
};
// 为信号_sig 安装一个新的信号处理程序(信号句柄),与sigaction()类似。
void (*signal (int _sig, void (*_func) (int))) (int);
// 向当前进程发送一个信号。其作用等价于kill(getpid(),sig)。
int raise (int sig);
// 可用于向任何进程组或进程发送任何信号。
int kill (pid_t pid, int sig);
// 向信号集中添加信号。
int sigaddset (sigset_t * mask, int signo);
// 从信号集中去除指定的信号。
int sigdelset (sigset_t * mask, int signo);
// 从信号集中清除指定信号集。
int sigemptyset (sigset_t * mask);
// 向信号集中置入所有信号。
int sigfillset (sigset_t * mask);
// 判断一个信号是否是信号集中的。1 -- 是, 0 -- 不是, -1 -- 出错。
int sigismember (sigset_t * mask, int signo); /* 1 - is, 0 - not, -1 error */
// 对set 中的信号进行检测,看是否有挂起的信号。
int sigpending (sigset_t * set);
// 改变目前的被阻塞信号集(信号屏蔽码)。
int sigprocmask (int how, sigset_t * set, sigset_t * oldset);
// 用sigmask 临时替换进程的信号屏蔽码,然后暂停该进程直到收到一个信号。
int sigsuspend (sigset_t * sigmask);
// 用于改变进程在收到指定信号时所采取的行动。
int sigaction (int sig, struct sigaction *act, struct sigaction *oldact);
#endif /* _SIGNAL_H */
#ifndef _STDARG_H
#define _STDARG_H
typedef char *va_list; // 定义va_list 是一个字符指针类型。
/* Amount of space required in an argument list for an arg of type TYPE.
TYPE may alternatively be an expression whose type is used. */
/* 下面给出了类型为TYPE 的arg 参数列表所要求的空间容量。
TYPE 也可以是使用该类型的一个表达式 */
// 下面这句定义了取整后的TYPE 类型的字节长度值。是int 长度(4)的倍数。
#define __va_rounded_size(TYPE) \
(((sizeof (TYPE) + sizeof (int) - 1) / sizeof (int)) * sizeof (int))
// 下面这个函数(用宏实现)使AP 指向传给函数的可变参数表的第一个参数。
// 在第一次调用va_arg 或va_end 之前,必须首先调用该函数。
// 下面的__builtin_saveregs()是在gcc 的库程序libgcc2.c 中定义的,用于保存寄存器。
// 它的说明可参见gcc 手册章节“Target Description Macros”中的
// “Implementing the Varargs Macros”小节。
#ifndef __sparc__
#define va_start(AP, LASTARG) \
(AP = ((char *) &(LASTARG) + __va_rounded_size (LASTARG)))
#else
#define va_start(AP, LASTARG) \
(__builtin_saveregs (), \
AP = ((char *) &(LASTARG) + __va_rounded_size (LASTARG)))
#endif
// 下面该宏用于被调用函数完成一次正常返回。va_end 可以修改AP 使其在重新调用
// va_start 之前不能被使用。va_end 必须在va_arg 读完所有的参数后再被调用。
void va_end (va_list); /* Defined in gnulib *//* 在gnulib 中定义 */
#define va_end(AP)
// 下面该宏用于扩展表达式使其与下一个被传递参数具有相同的类型和值。
// 对于缺省值,va_arg 可以用字符、无符号字符和浮点类型。
// 在第一次使用va_arg 时,它返回表中的第一个参数,后续的每次调用都将返回表中的
// 下一个参数。这是通过先访问AP,然后把它增加以指向下一项来实现的。
// va_arg 使用TYPE 来完成访问和定位下一项,每调用一次va_arg,它就修改AP 以指示
// 表中的下一参数。
#define va_arg(AP, TYPE) \
(AP += __va_rounded_size (TYPE), \
*((TYPE *) (AP - __va_rounded_size (TYPE))))
#endif /* _STDARG_H */
#ifndef _STDDEF_H
#define _STDDEF_H
#ifndef _PTRDIFF_T
#define _PTRDIFF_T
typedef long ptrdiff_t; // 两个指针相减结果的类型.
#endif
#ifndef _SIZE_T
#define _SIZE_T
typedef unsigned long size_t; // sizeof返回的类型.
#endif
#undef NULL
#define NULL ((void *)0) // 空指针
// 下面定义了一个计算某成员在类型中偏移位置的宏。使用该宏可以确定一个成员(字段)
// 在包含它的结构类型中从结构开始处算起的字节偏移量。宏的结果时类型位size_t的整数
// 常量表达式。这里是一个技巧手法。((TYPE *)0)是将一个整数0类型投射(typecast)
// 成数据对象指针类型,然后在该结果上进行运算.
#define offsetof(TYPE, MEMBER) ((size_t) &((TYPE *)0)->MEMBER)
#endif
#ifndef _STRING_H_
#define _STRING_H_
#ifndef NULL
#define NULL ((void *) 0)
#endif
#ifndef _SIZE_T
#define _SIZE_T
typedef unsigned int size_t;
#endif
extern char * strerror(int errno);
/*
* This string-include defines all string functions as inline
* functions. Use gcc. It also assumes ds=es=data space, this should be
* normal. Most of the string-functions are rather heavily hand-optimized,
* see especially strtok,strstr,str[c]spn. They should work, but are not
* very easy to understand. Everything is done entirely within the register
* set, making the functions fast and clean. String instructions have been
* used through-out, making for "slightly" unclear code :-)
*
* (C) 1991 Linus Torvalds
*/
/*
* 这个字符串头文件以内嵌函数的形式定义了所有字符串操作函数。使用gcc 时,同时
* 假定了ds=es=数据空间,这应该是常规的。绝大多数字符串函数都是经手工进行大量
* 优化的,尤其是函数strtok、strstr、str[c]spn。它们应该能正常工作,但却不是那
* 么容易理解。所有的操作基本上都是使用寄存器集来完成的,这使得函数即快有整洁。
* 所有地方都使用了字符串指令,这又使得代码“稍微”难以理解.
*
* (C) 1991 Linus Torvalds
*/
//// 将一个字符串(src)拷贝到另一个字符串(dest),直到遇到NULL 字符后停止。
// 参数:dest - 目的字符串指针,src - 源字符串指针。
// %0 - esi(src),%1 - edi(dest)。
extern inline char * strcpy(char * dest,const char *src)
{
register char *p1 = dest;
register const char *p2 = src;
while(0 != *p2) {
*p1++ = *p2++;
}
*p1 = 0;
return dest;
//__asm__("cld\n"
//"1:\tlodsb\n\t" // 加载DS:[esi]处1 字节->al,并更新esi。
//"stosb\n\t" // 存储字节al->ES:[edi],并更新edi.
//"testb %%al,%%al\n\t" // 刚存储的字节是0?
//"jne 1b" // 不是则向后跳转到标号1 处,否则结束。
//::"S" (src),"D" (dest));
//return dest; // 返回目的字符串指针。
}
//// 拷贝源字符串count 个字节到目的字符串。
// 如果源串长度小于count 个字节,就附加空字符(NULL)到目的字符串。
// 参数:dest - 目的字符串指针,src - 源字符串指针,count - 拷贝字节数。
// %0 - esi(src),%1 - edi(dest),%2 - ecx(count)。
extern inline char * strncpy(char * dest,const char *src,int count)
{
__asm__("cld\n"
"1:\tdecl %2\n\t" // 寄存器ecx--(count--)。
"js 2f\n\t" // 如果count<0 则向前跳转到标号2,结束。
"lodsb\n\t" // 取ds:[esi]处1 字节->al,并且esi++。
"stosb\n\t" // 存储该字节->es:[edi],并且edi++。
"testb %%al,%%al\n\t" // 该字节是0?
"jne 1b\n\t" // 不是,则向前跳转到标号1 处继续拷贝。
"rep\n\t" // 否则,在目的串中存放剩余个数的空字符。
"stosb\n"
"2:"
::"S" (src),"D" (dest),"c" (count));
return dest; // 返回目的字符串指针。
}
//// 将源字符串拷贝到目的字符串的末尾处。
// 参数:dest - 目的字符串指针,src - 源字符串指针。
// %0 - esi(src),%1 - edi(dest),%2 - eax(0),%3 - ecx(-1)。
extern inline char * strcat(char * dest,const char * src)
{
__asm__("cld\n\t"
"repne\n\t" // 比较al 与es:[edi]字节,并更新edi++,
"scasb\n\t" // 直到找到目的串中是0 的字节,此时edi 已经指向后1 字节。
"decl %1\n" // 让es:[edi]指向0 值字节。
"1:\tlodsb\n\t" // 取源字符串字节ds:[esi]->al,并esi++。
"stosb\n\t" // 将该字节存到es:[edi],并edi++。
"testb %%al,%%al\n\t" // 该字节是0?
"jne 1b" // 不是,则向后跳转到标号1 处继续拷贝,否则结束。
::"S" (src),"D" (dest),"a" (0),"c" (0xffffffff));
return dest; // 返回目的字符串指针。
}
//// 将源字符串的count 个字节复制到目的字符串的末尾处,最后添一空字符。
// 参数:dest - 目的字符串,src - 源字符串,count - 欲复制的字节数。
// %0 - esi(src),%1 - edi(dest),%2 - eax(0),%3 - ecx(-1),%4 - (count)。
extern inline char * strncat(char * dest,const char * src,int count)
{
__asm__("cld\n\t"
"repne\n\t" // 比较al 与es:[edi]字节,edi++。
"scasb\n\t" // 直到找到目的串的末端0 值字节。
"decl %1\n\t" // edi 指向该0 值字节。
"movl %4,%3\n" // 欲复制字节数->ecx。
"1:\tdecl %3\n\t" // ecx--(从0 开始计数)。
"js 2f\n\t" // ecx <0 ?,是则向前跳转到标号2 处。
"lodsb\n\t" // 否则取ds:[esi]处的字节->al,esi++。
"stosb\n\t" // 存储到es:[edi]处,edi++。
"testb %%al,%%al\n\t" // 该字节值为0?
"jne 1b\n" // 不是则向后跳转到标号1 处,继续复制。
"2:\txorl %2,%2\n\t" // 将al 清零。
"stosb" // 存到es:[edi]处。
::"S" (src),"D" (dest),"a" (0),"c" (0xffffffff),"g" (count)
);
return dest; // 返回目的字符串指针。
}
//// 将一个字符串与另一个字符串进行比较。
// 参数:cs - 字符串1,ct - 字符串2。
// %0 - eax(__res)返回值,%1 - edi(cs)字符串1 指针,%2 - esi(ct)字符串2 指针。
// 返回:如果串1 > 串2,则返回1;串1 = 串2,则返回0;串1 < 串2,则返回-1。
extern inline int strcmp(const char * cs,const char * ct)
{
register const char *p1 = cs;
register const char *p2 = ct;
while(*p1 == *p2 && 0 != *p1) {
p1++;
p2++;
}
return *p1 - *p2;
//register int __res ;
//__asm__("cld\n"
//"1:\tlodsb\n\t" // 取字符串2 的字节ds:[esi]->al,并且esi++。
//"scasb\n\t" // al 与字符串1 的字节es:[edi]作比较,并且edi++。
//"jne 2f\n\t" // 如果不相等,则向前跳转到标号2。
//"testb %%al,%%al\n\t" // 该字节是0 值字节吗(字符串结尾)?
//"jne 1b\n\t" // 不是,则向后跳转到标号1,继续比较。
//"xorl %%eax,%%eax\n\t" // 是,则返回值eax 清零,
//"jmp 3f\n" // 向前跳转到标号3,结束。
//"2:\tmovl $1,%%eax\n\t" // eax 中置1。
//"jl 3f\n\t" // 若前面比较中串2 字符<串1 字符,则返回正值,结束。
//"negl %%eax\n" // 否则eax = -eax,返回负值,结束。
//"3:"
//:"=a" (__res):"D" (cs),"S" (ct));
//return __res; // 返回比较结果。
}
//// 字符串1 与字符串2 的前count 个字符进行比较。
// 参数:cs - 字符串1,ct - 字符串2,count - 比较的字符数。
// %0 - eax(__res)返回值,%1 - edi(cs)串1 指针,%2 - esi(ct)串2 指针,%3 - ecx(count)。
// 返回:如果串1 > 串2,则返回1;串1 = 串2,则返回0;串1 < 串2,则返回-1。
extern inline int strncmp(const char * cs,const char * ct,int count)
{
register int __res ;
__asm__("cld\n"
"1:\tdecl %3\n\t" // count--。
"js 2f\n\t" // 如果count<0,则向前跳转到标号2。
"lodsb\n\t" // 取串2 的字符ds:[esi]->al,并且esi++。
"scasb\n\t" // 比较al 与串1 的字符es:[edi],并且edi++。
"jne 3f\n\t" // 如果不相等,则向前跳转到标号3。
"testb %%al,%%al\n\t" // 该字符是NULL 字符吗?
"jne 1b\n" // 不是,则向后跳转到标号1,继续比较。
"2:\txorl %%eax,%%eax\n\t" // 是NULL 字符,则eax 清零(返回值)。
"jmp 4f\n" // 向前跳转到标号4,结束。
"3:\tmovl $1,%%eax\n\t" // eax 中置1。
"jl 4f\n\t" // 如果前面比较中串2 字符<串2 字符,则返回1,结束。
"negl %%eax\n" // 否则eax = -eax,返回负值,结束。
"4:"
:"=a" (__res):"D" (cs),"S" (ct),"c" (count));
return __res; // 返回比较结果。
}
//// 在字符串中寻找第一个匹配的字符。
// 参数:s - 字符串,c - 欲寻找的字符。
// %0 - eax(__res),%1 - esi(字符串指针s),%2 - eax(字符c)。
// 返回:返回字符串中第一次出现匹配字符的指针。若没有找到匹配的字符,则返回空指针。
extern inline char * strchr(const char * s,char c)
{
register char * __res ;
__asm__("cld\n\t"
"movb %%al,%%ah\n" // 将欲比较字符移到ah。
"1:\tlodsb\n\t" // 取字符串中字符ds:[esi]??al,并且esi++。
"cmpb %%ah,%%al\n\t" // 字符串中字符al 与指定字符ah 相比较。
"je 2f\n\t" // 若相等,则向前跳转到标号2 处。
"testb %%al,%%al\n\t" // al 中字符是NULL 字符吗?(字符串结尾?)
"jne 1b\n\t" // 若不是,则向后跳转到标号1,继续比较。
"movl $1,%1\n" // 是,则说明没有找到匹配字符,esi 置1。
"2:\tmovl %1,%0\n\t" // 将指向匹配字符后一个字节处的指针值放入eax
"decl %0" // 将指针调整为指向匹配的字符。
:"=a" (__res):"S" (s),"0" (c));
return __res; // 返回指针。
}
//// 寻找字符串中指定字符最后一次出现的地方。(反向搜索字符串)
// 参数:s - 字符串,c - 欲寻找的字符。
// %0 - edx(__res),%1 - edx(0),%2 - esi(字符串指针s),%3 - eax(字符c)。
// 返回:返回字符串中最后一次出现匹配字符的指针。若没有找到匹配的字符,则返回空指针。
extern inline char * strrchr(const char * s,char c)
{
register char * __res;
__asm__("cld\n\t"
"movb %%al,%%ah\n" // 将欲寻找的字符移到ah。
"1:\tlodsb\n\t" // 取字符串中字符ds:[esi]->al,并且esi++。
"cmpb %%ah,%%al\n\t" // 字符串中字符al 与指定字符ah 作比较。
"jne 2f\n\t" // 若不相等,则向前跳转到标号2 处。
"movl %%esi,%0\n\t" // 将字符指针保存到edx 中。
"decl %0\n" // 指针后退一位,指向字符串中匹配字符处。
"2:\ttestb %%al,%%al\n\t" // 比较的字符是0 吗(到字符串尾)?
"jne 1b" // 不是则向后跳转到标号1 处,继续比较。
:"=d" (__res):"0" (0),"S" (s),"a" (c));
return __res; // 返回指针。
}
//// 在字符串1 中寻找第1 个字符序列,该字符序列中的任何字符都包含在字符串2 中。
// 参数:cs - 字符串1 指针,ct - 字符串2 指针。
// %0 - esi(__res),%1 - eax(0),%2 - ecx(-1),%3 - esi(串1 指针cs),%4 - (串2 指针ct)。
// 返回字符串1 中包含字符串2 中任何字符的首个字符序列的长度值。
extern inline int strspn(const char * cs, const char * ct)
{
register char * __res;
__asm__("cld\n\t"
"movl %4,%%edi\n\t" // 首先计算串2 的长度。串2 指针放入edi 中。
"repne\n\t" // 比较al(0)与串2 中的字符(es:[edi]),并edi++。
"scasb\n\t" // 如果不相等就继续比较(ecx 逐步递减)。
"notl %%ecx\n\t" // ecx 中每位取反。
"decl %%ecx\n\t" // ecx--,得串2 的长度值。
"movl %%ecx,%%edx\n" // 将串2 的长度值暂放入edx 中。
"1:\tlodsb\n\t" // 取串1 字符ds:[esi]->al,并且esi++。
"testb %%al,%%al\n\t" // 该字符等于0 值吗(串1 结尾)?
"je 2f\n\t" // 如果是,则向前跳转到标号2 处。
"movl %4,%%edi\n\t" // 取串2 头指针放入edi 中。
"movl %%edx,%%ecx\n\t" // 再将串2 的长度值放入ecx 中。
"repne\n\t" // 比较al 与串2 中字符es:[edi],并且edi++。
"scasb\n\t" // 如果不相等就继续比较。
"je 1b\n" // 如果相等,则向后跳转到标号1 处。
"2:\tdecl %0" // esi--,指向最后一个包含在串2 中的字符。
:"=S" (__res):"a" (0),"c" (0xffffffff),"0" (cs),"g" (ct)
);
return __res-cs; // 返回字符序列的长度值。
}
//// 寻找字符串1 中不包含字符串2 中任何字符的首个字符序列。
// 参数:cs - 字符串1 指针,ct - 字符串2 指针。
// %0 - esi(__res),%1 - eax(0),%2 - ecx(-1),%3 - esi(串1 指针cs),%4 - (串2 指针ct)。
// 返回字符串1 中不包含字符串2 中任何字符的首个字符序列的长度值。
extern inline int strcspn(const char * cs, const char * ct)
{
register char * __res;
__asm__("cld\n\t"
"movl %4,%%edi\n\t" // 首先计算串2 的长度。串2 指针放入edi 中。
"repne\n\t" // 比较al(0)与串2 中的字符(es:[edi]),并edi++。
"scasb\n\t" // 如果不相等就继续比较(ecx 逐步递减)。
"notl %%ecx\n\t" // ecx 中每位取反。
"decl %%ecx\n\t" // ecx--,得串2 的长度值。
"movl %%ecx,%%edx\n" // 将串2 的长度值暂放入edx 中。
"1:\tlodsb\n\t" // 取串1 字符ds:[esi]->al,并且esi++。
"testb %%al,%%al\n\t" // 该字符等于0 值吗(串1 结尾)?
"je 2f\n\t" // 如果是,则向前跳转到标号2 处。
"movl %4,%%edi\n\t" // 取串2 头指针放入edi 中。
"movl %%edx,%%ecx\n\t" // 再将串2 的长度值放入ecx 中。
"repne\n\t" // 比较al 与串2 中字符es:[edi],并且edi++。
"scasb\n\t" // 如果不相等就继续比较。
"jne 1b\n" // 如果不相等,则向后跳转到标号1 处。
"2:\tdecl %0" // esi--,指向最后一个包含在串2 中的字符。
:"=S" (__res):"a" (0),"c" (0xffffffff),"0" (cs),"g" (ct)
);
return __res-cs; // 返回字符序列的长度值。
}
//// 在字符串1 中寻找首个包含在字符串2 中的任何字符。
// 参数:cs - 字符串1 的指针,ct - 字符串2 的指针。
// %0 -esi(__res),%1 -eax(0),%2 -ecx(0xffffffff),%3 -esi(串1 指针cs),%4 -(串2 指针ct)。
// 返回字符串1 中首个包含字符串2 中字符的指针。
extern inline char * strpbrk(const char * cs,const char * ct)
{
register char * __res ;
__asm__("cld\n\t"
"movl %4,%%edi\n\t" // 首先计算串2 的长度。串2 指针放入edi 中。
"repne\n\t" // 比较al(0)与串2 中的字符(es:[edi]),并edi++。
"scasb\n\t" // 如果不相等就继续比较(ecx 逐步递减)。
"notl %%ecx\n\t" // ecx 中每位取反。
"decl %%ecx\n\t" // ecx--,得串2 的长度值。
"movl %%ecx,%%edx\n" // 将串2 的长度值暂放入edx 中。
"1:\tlodsb\n\t" // 取串1 字符ds:[esi]->al,并且esi++。
"testb %%al,%%al\n\t" // 该字符等于0 值吗(串1 结尾)?
"je 2f\n\t" // 如果是,则向前跳转到标号2 处。
"movl %4,%%edi\n\t" // 取串2 头指针放入edi 中。
"movl %%edx,%%ecx\n\t" // 再将串2 的长度值放入ecx 中。
"repne\n\t" // 比较al 与串2 中字符es:[edi],并且edi++。
"scasb\n\t" // 如果不相等就继续比较。
"jne 1b\n\t" // 如果不相等,则向后跳转到标号1 处。
"decl %0\n\t" // esi--,指向一个包含在串2 中的字符。
"jmp 3f\n" // 向前跳转到标号3 处。
"2:\txorl %0,%0\n" // 没有找到符合条件的,将返回值为NULL。
"3:"
:"=S" (__res):"a" (0),"c" (0xffffffff),"0" (cs),"g" (ct)
);
return __res; // 返回指针值。
}
//// 在字符串1 中寻找首个匹配整个字符串2 的字符串。
// 参数:cs - 字符串1 的指针,ct - 字符串2 的指针。
// %0 -eax(__res),%1 -eax(0),%2 -ecx(0xffffffff),%3 -esi(串1 指针cs),%4 -(串2 指针ct)。
// 返回:返回字符串1 中首个匹配字符串2 的字符串指针。
extern inline char * strstr(const char * cs,const char * ct)
{
register char * __res ;
__asm__("cld\n\t" \
"movl %4,%%edi\n\t" // 首先计算串2 的长度。串2 指针放入edi 中。
"repne\n\t" // 比较al(0)与串2 中的字符(es:[edi]),并edi++。
"scasb\n\t" // 如果不相等就继续比较(ecx 逐步递减)。
"notl %%ecx\n\t" // ecx 中每位取反。
"decl %%ecx\n\t" /* NOTE! This also sets Z if searchstring='' */
/* 注意!如果搜索串为空,将设置Z 标志 */// 得串2 的长度值。
"movl %%ecx,%%edx\n" // 将串2 的长度值暂放入edx 中。
"1:\tmovl %4,%%edi\n\t" // 取串2 头指针放入edi 中。
"movl %%esi,%%eax\n\t" // 将串1 的指针复制到eax 中。
"movl %%edx,%%ecx\n\t" // 再将串2 的长度值放入ecx 中。
"repe\n\t" // 比较串1 和串2 字符(ds:[esi],es:[edi]),esi++,edi++。
"cmpsb\n\t" // 若对应字符相等就一直比较下去。
"je 2f\n\t" /* also works for empty string, see above */
/* 对空串同样有效,见上面 */// 若全相等,则转到标号2。
"xchgl %%eax,%%esi\n\t" // 串1 头指针??esi,比较结果的串1 指针->eax。
"incl %%esi\n\t" // 串1 头指针指向下一个字符。
"cmpb $0,-1(%%eax)\n\t" // 串1 指针(eax-1)所指字节是0 吗?
"jne 1b\n\t" // 不是则跳转到标号1,继续从串1 的第2 个字符开始比较。
"xorl %%eax,%%eax\n\t" // 清eax,表示没有找到匹配。
"2:"
:"=a" (__res):"0" (0),"c" (0xffffffff),"S" (cs),"g" (ct)
);
return __res; // 返回比较结果。
}
//// 计算字符串长度。
// 参数:s - 字符串。
// %0 - ecx(__res),%1 - edi(字符串指针s),%2 - eax(0),%3 - ecx(0xffffffff)。
// 返回:返回字符串的长度。
extern inline int strlen(const char * s)
{
register int __res ;
__asm__("cld\n\t"
"repne\n\t" // al(0)与字符串中字符es:[edi]比较,
"scasb\n\t" // 若不相等就一直比较。
"notl %0\n\t" // ecx 取反。
"decl %0" // ecx--,得字符串得长度值。
:"=c" (__res):"D" (s),"a" (0),"0" (0xffffffff));
return __res; // 返回字符串长度值。
}
extern char * ___strtok; // 用于临时存放指向下面被分析字符串1(s)的指针。
//// 利用字符串2 中的字符将字符串1 分割成标记(tokern)序列。
// 将串1 看作是包含零个或多个单词(token)的序列,并由分割符字符串2 中的一个或多个字符分开。
// 第一次调用strtok()时,将返回指向字符串1 中第1 个token 首字符的指针,并在返回token 时将
// 一null 字符写到分割符处。后续使用null 作为字符串1 的调用,将用这种方法继续扫描字符串1,
// 直到没有token 为止。在不同的调用过程中,分割符串2 可以不同。
// 参数:s - 待处理的字符串1,ct - 包含各个分割符的字符串2。
// 汇编输出:%0 - ebx(__res),%1 - esi(__strtok);
// 汇编输入:%2 - ebx(__strtok),%3 - esi(字符串1 指针s),%4 - (字符串2 指针ct)。
// 返回:返回字符串s 中第1 个token,如果没有找到token,则返回一个null 指针。
// 后续使用字符串s 指针为null 的调用,将在原字符串s 中搜索下一个token。
extern inline char * strtok(char * s,const char * ct)
{
register char * __res ;
__asm__("testl %1,%1\n\t" // 首先测试esi(字符串1 指针s)是否是NULL。
"jne 1f\n\t" // 如果不是,则表明是首次调用本函数,跳转标号1。
"testl %0,%0\n\t" // 如果是NULL,则表示此次是后续调用,测ebx(__strtok)。
"je 8f\n\t" // 如果ebx 指针是NULL,则不能处理,跳转结束。
"movl %0,%1\n" // 将ebx 指针复制到esi。
"1:\txorl %0,%0\n\t" // 清ebx 指针。
"movl $-1,%%ecx\n\t" // 置ecx = 0xffffffff。
"xorl %%eax,%%eax\n\t" // 清零eax。
"cld\n\t" // 清方向位。
"movl %4,%%edi\n\t" // 下面求字符串2 的长度。edi 指向字符串2。
"repne\n\t" // 将al(0)与es:[edi]比较,并且edi++。
"scasb\n\t" // 直到找到字符串2 的结束null 字符,或计数ecx==0。
"notl %%ecx\n\t" // 将ecx 取反,
"decl %%ecx\n\t" // ecx--,得到字符串2 的长度值。
"je 7f\n\t" /* empty delimeter-string */
/* 分割符字符串空 */// 若串2 长度为0,则转标号7。
"movl %%ecx,%%edx\n" // 将串2 长度暂存入edx。
"2:\tlodsb\n\t" // 取串1 的字符ds:[esi]->al,并且esi++。
"testb %%al,%%al\n\t" // 该字符为0 值吗(串1 结束)?
"je 7f\n\t" // 如果是,则跳转标号7。
"movl %4,%%edi\n\t" // edi 再次指向串2 首。
"movl %%edx,%%ecx\n\t" // 取串2 的长度值置入计数器ecx。
"repne\n\t" // 将al 中串1 的字符与串2 中所有字符比较.
"scasb\n\t" // 判断该字符是否为分割符。
"je 2b\n\t" // 若能在串2 中找到相同字符(分割符),则跳转标号2。
"decl %1\n\t" // 若不是分割符,则串1 指针esi 指向此时的该字符。
"cmpb $0,(%1)\n\t" // 该字符是NULL 字符吗?
"je 7f\n\t" // 若是,则跳转标号7 处。
"movl %1,%0\n" // 将该字符的指针esi 存放在ebx。
"3:\tlodsb\n\t" // 取串1 下一个字符ds:[esi]->al,并且esi++。
"testb %%al,%%al\n\t" // 该字符是NULL 字符吗?
"je 5f\n\t" // 若是,表示串1 结束,跳转到标号5。
"movl %4,%%edi\n\t" // edi 再次指向串2 首。
"movl %%edx,%%ecx\n\t" // 串2 长度值置入计数器ecx。
"repne\n\t" // 将al 中串1 的字符与串2 中每个字符比较,
"scasb\n\t" // 测试al 字符是否是分割符。
"jne 3b\n\t" // 若不是分割符则跳转标号3,检测串1 中下一个字符。
"decl %1\n\t" // 若是分割符,则esi--,指向该分割符字符。
"cmpb $0,(%1)\n\t" // 该分割符是NULL 字符吗?
"je 5f\n\t" // 若是,则跳转到标号5。
"movb $0,(%1)\n\t" // 若不是,则将该分割符用NULL 字符替换掉。
"incl %1\n\t" // esi 指向串1 中下一个字符,也即剩余串首。
"jmp 6f\n" // 跳转标号6 处。
"5:\txorl %1,%1\n" // esi 清零。
"6:\tcmpb $0,(%0)\n\t" // ebx 指针指向NULL 字符吗?
"jne 7f\n\t" // 若不是,则跳转标号7。
"xorl %0,%0\n" // 若是,则让ebx=NULL。
"7:\ttestl %0,%0\n\t" // ebx 指针为NULL 吗?
"jne 8f\n\t" // 若不是则跳转8,结束汇编代码。
"movl %0,%1\n" // 将esi 置为NULL。
"8:"
:"=b" (__res),"=S" (___strtok)
:"0" (___strtok),"1" (s),"g" (ct)
);
return __res; // 返回指向新token 的指针。
}
//// 内存块复制。从源地址src 处开始复制n 个字节到目的地址dest 处。
// 参数:dest - 复制的目的地址,src - 复制的源地址,n - 复制字节数。
// %0 - ecx(n),%1 - esi(src),%2 - edi(dest)。
extern inline void * memcpy(void * dest,const void * src, int n)
{
__asm__("cld\n\t"
"rep\n\t" // 重复执行复制ecx 个字节,
"movsb" // 从ds:[esi]到es:[edi],esi++,edi++。
::"c" (n),"S" (src),"D" (dest)
);
return dest; // 返回目的地址。
}
//// 内存块移动。同内存块复制,但考虑移动的方向。
// 参数:dest - 复制的目的地址,src - 复制的源地址,n - 复制字节数。
// 若dest<src 则:%0 - ecx(n),%1 - esi(src),%2 - edi(dest)。
// 否则:%0 - ecx(n),%1 - esi(src+n-1),%2 - edi(dest+n-1)。
// 这样操作是为了防止在复制时错误地重叠覆盖。
extern inline void * memmove(void * dest,const void * src, int n)
{
if (dest<src)
__asm__("cld\n\t" // 清方向位。
"rep\n\t" // 从ds:[esi]到es:[edi],并且esi++,edi++,
"movsb" // 重复执行复制ecx 字节。
::"c" (n),"S" (src),"D" (dest)
);
else
__asm__("std\n\t" // 置方向位,从末端开始复制。
"rep\n\t" // 从ds:[esi]到es:[edi],并且esi--,edi--,
"movsb" // 复制ecx 个字节。
::"c" (n),"S" (src+n-1),"D" (dest+n-1)
);
return dest;
}
//// 比较n 个字节的两块内存(两个字符串),即使遇上NULL 字节也不停止比较。
// 参数:cs - 内存块1 地址,ct - 内存块2 地址,count - 比较的字节数。
// %0 - eax(__res),%1 - eax(0),%2 - edi(内存块1),%3 - esi(内存块2),%4 - ecx(count)。
// 返回:若块1>块2 返回1;块1<块2,返回-1;块1==块2,则返回0。
extern inline int memcmp(const void * cs,const void * ct,int count)
{
register int __res ;
__asm__("cld\n\t"
"repe\n\t" // 如果相等则重复,
"cmpsb\n\t" // 比较ds:[esi]与es:[edi]的内容,并且esi++,edi++。
"je 1f\n\t" // 如果都相同,则跳转到标号1,返回0(eax)值
"movl $1,%%eax\n\t" // 否则eax 置1,
"jl 1f\n\t" // 若内存块2 内容的值<内存块1,则跳转标号1。
"negl %%eax\n" // 否则eax = -eax。
"1:"
:"=a" (__res):"0" (0),"D" (cs),"S" (ct),"c" (count)
);
return __res; // 返回比较结果。
}
//// 在n 字节大小的内存块(字符串)中寻找指定字符。
// 参数:cs - 指定内存块地址,c - 指定的字符,count - 内存块长度。
// %0 - edi(__res),%1 - eax(字符c),%2 - edi(内存块地址cs),%3 - ecx(字节数count)。
// 返回第一个匹配字符的指针,如果没有找到,则返回NULL 字符。
extern inline void * memchr(const void * cs,char c,int count)
{
register void * __res ;
if (!count) // 如果内存块长度==0,则返回NULL,没有找到。
return NULL;
__asm__("cld\n\t"
"repne\n\t" // 如果不相等则重复执行下面语句,
"scasb\n\t" // al 中字符与es:[edi]字符作比较,并且edi++,
"je 1f\n\t" // 如果相等则向前跳转到标号1 处。
"movl $1,%0\n" // 否则edi 中置1。
"1:\tdecl %0" // 让edi 指向找到的字符(或是NULL)。
:"=D" (__res):"a" (c),"D" (cs),"c" (count)
);
return __res; // 返回字符指针。
}
//// 用字符填写指定长度内存块。
// 用字符c 填写s 指向的内存区域,共填count 字节。
// %0 - eax(字符c),%1 - edi(内存地址),%2 - ecx(字节数count)。
extern inline void * memset(void * s,char c,int count)
{
__asm__("cld\n\t"
"rep\n\t" // 重复ecx 指定的次数,执行
"stosb" // 将al 中字符存入es:[edi]中,并且edi++。
::"a" (c),"D" (s),"c" (count)
);
return s;
}
#endif
#ifndef _SYS_STAT_H
#define _SYS_STAT_H
#include <sys/types.h>
struct stat {
dev_t st_dev; // 含有文件的设备号。
ino_t st_ino; // 文件i 节点号。
umode_t st_mode; // 文件属性(见下面)。
nlink_t st_nlink; // 指定文件的连接数。
uid_t st_uid; // 文件的用户(标识)号。
gid_t st_gid; // 文件的组号。
dev_t st_rdev; // 设备号(如果文件是特殊的字符文件或块文件)。
off_t st_size; // 文件大小(字节数)(如果文件是常规文件)。
time_t st_atime; // 上次(最后)访问时间。
time_t st_mtime; // 最后修改时间。
time_t st_ctime; // 最后节点修改时间。
};
// 以下这些是st_mode 值的符号名称。
// 文件类型:
#define S_IFMT 00170000 // 文件类型(8 进制表示)。
#define S_IFREG 0100000 // 常规文件。
#define S_IFBLK 0060000 // 块特殊(设备)文件,如磁盘dev/fd0。
#define S_IFDIR 0040000 // 目录文件。
#define S_IFCHR 0020000 // 字符设备文件。
#define S_IFIFO 0010000 // FIFO 特殊文件。
// 文件属性位:
#define S_ISUID 0004000 // 执行时设置用户ID(set-user-ID)。
#define S_ISGID 0002000 // 执行时设置组ID。
#define S_ISVTX 0001000 // 对于目录,受限删除标志。
#define S_ISREG(m) (((m) & S_IFMT) == S_IFREG) // 测试是否常规文件。
#define S_ISDIR(m) (((m) & S_IFMT) == S_IFDIR) // 是否目录文件。
#define S_ISCHR(m) (((m) & S_IFMT) == S_IFCHR) // 是否字符设备文件。
#define S_ISBLK(m) (((m) & S_IFMT) == S_IFBLK) // 是否块设备文件。
#define S_ISFIFO(m) (((m) & S_IFMT) == S_IFIFO) // 是否FIFO 特殊文件。
#define S_IRWXU 00700 // 宿主可以读、写、执行/搜索。
#define S_IRUSR 00400 // 宿主读许可。
#define S_IWUSR 00200 // 宿主写许可。
#define S_IXUSR 00100 // 宿主执行/搜索许可。
#define S_IRWXG 00070 // 组成员可以读、写、执行/搜索。
#define S_IRGRP 00040 // 组成员读许可。
#define S_IWGRP 00020 // 组成员写许可。
#define S_IXGRP 00010 // 组成员执行/搜索许可。
#define S_IRWXO 00007 // 其他人读、写、执行/搜索许可。
#define S_IROTH 00004 // 其他人读许可。
#define S_IWOTH 00002 // 其他人写许可。
#define S_IXOTH 00001 // 其他人执行/搜索许可。
extern int chmod (const char *_path, mode_t mode); // 修改文件属性。
extern int fstat (int fildes, struct stat *stat_buf); // 取指定文件句柄的文件状态信息。
extern int mkdir (const char *_path, mode_t mode); // 创建目录。
extern int mkfifo (const char *_path, mode_t mode); // 创建管道文件。
extern int stat (const char *filename, struct stat *stat_buf); // 取指定文件名的文件状态信息。
extern mode_t umask (mode_t mask); // 设置属性屏蔽码。
extern int lstat(const char *, struct stat *);
#endif
#ifndef _TIMES_H
#define _TIMES_H
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
struct tms
{
time_t tms_utime; // 用户使用的CPU 时间。
time_t tms_stime; // 系统(内核)CPU 时间。
time_t tms_cutime; // 已终止的子进程使用的用户CPU 时间。
time_t tms_cstime; // 已终止的子进程使用的系统CPU 时间。
};
extern time_t times(struct tms * tp);
#endif
#ifndef _SYS_TYPES_H
#define _SYS_TYPES_H
#ifndef _SIZE_T
#define _SIZE_T
typedef unsigned int size_t; // 用于对象的大小(长度)。
#endif
#ifndef _TIME_T
#define _TIME_T
typedef long time_t; // 用于时间(以秒计)。
#endif
#ifndef _PTRDIFF_T
#define _PTRDIFF_T
typedef long ptrdiff_t;
#endif
#ifndef NULL
#define NULL ((void *) 0)
#endif
typedef int pid_t; // 用于进程号和进程组号。
typedef unsigned short uid_t; // 用于用户号(用户标识号)。
typedef unsigned char gid_t; // 用于组号。
typedef unsigned short dev_t; // 用于设备号。
typedef unsigned short ino_t; // 用于文件序列号。
typedef unsigned short mode_t; // 用于某些文件属性。
typedef unsigned short umode_t; //
typedef unsigned char nlink_t; // 用于连接计数。
typedef int daddr_t;
typedef long off_t; // 用于文件长度(大小)。
typedef unsigned char u_char; // 无符号字符类型。
typedef unsigned short ushort; // 无符号短整数类型。
typedef struct
{
int quot, rem;
}
div_t; // 用于DIV 操作。
typedef struct
{
long quot, rem;
}
ldiv_t; // 用于长DIV 操作。
struct ustat
{
daddr_t f_tfree;
ino_t f_tinode;
char f_fname[6];
char f_fpack[6];
};
#endif
#ifndef _SYS_UTSNAME_H
#define _SYS_UTSNAME_H
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
struct utsname
{
char sysname[9]; // 本版本操作系统的名称。
char nodename[9]; // 与实现相关的网络中节点名称。
char release[9]; // 本实现的当前发行级别。
char version[9]; // 本次发行的版本级别。
char machine[9]; // 系统运行的硬件类型名称。
};
extern int uname (struct utsname *utsbuf);
#endif
#ifndef _SYS_WAIT_H
#define _SYS_WAIT_H
#include <sys/types.h>
#define _LOW(v) ( (v) & 0377) // 取低字节(8 进制表示)。
#define _HIGH(v) ( ((v) >> 8) & 0377) // 取高字节。
/* options for waitpid, WUNTRACED not supported */
/* waitpid 的选项,其中WUNTRACED 未被支持 */
#define WNOHANG 1 // 如果没有状态也不要挂起,并立刻返回。
#define WUNTRACED 2 // 报告停止执行的子进程状态。
#define WIFEXITED(s) (!((s)&0xFF) // 如果子进程正常退出,则为真。
#define WIFSTOPPED(s) (((s)&0xFF)==0x7F) // 如果子进程正停止着,则为true。
#define WEXITSTATUS(s) (((s)>>8)&0xFF) // 返回退出状态。
#define WTERMSIG(s) ((s)&0x7F) // 返回导致进程终止的信号值(信号量)。
#define WSTOPSIG(s) (((s)>>8)&0xFF) // 返回导致进程停止的信号值。
#define WIFSIGNALED(s) (((unsigned int)(s)-1 & 0xFFFF) < 0xFF) // 如果由于未捕捉到信号
// 而导致子进程退出则为真。
// wait()和waitpit()函数允许进程获取与其子进程之一的状态信息。各种选项允许获取已经终止或
// 停止的子进程状态信息。如果存在两个或两个以上子进程的状态信息,则报告的顺序是不指定的。
// wait()将挂起当前进程,直到其子进程之一退出(终止),或者收到要求终止该进程的信号,
// 或者是需要调用一个信号句柄(信号处理程序)。
// waitpid()挂起当前进程,直到pid 指定的子进程退出(终止)或者收到要求终止该进程的信号,
// 或者是需要调用一个信号句柄(信号处理程序)。
// 如果pid= -1,options=0,则waitpid()的作用与wait()函数一样。否则其行为将随pid 和options
// 参数的不同而不同。(参见kernel/exit.c)
pid_t wait (int *stat_loc);
pid_t waitpid (pid_t pid, int *stat_loc, int options);
#endif
#ifndef _TERMIOS_H
#define _TERMIOS_H
#define TTY_BUF_SIZE 1024 // tty 中的缓冲区长度。
/* 0x54 is just a magic number to make these relatively uniqe ('T') */
/* 0x54 只是一个魔数,目的是为了使这些常数唯一('T') */
// tty 设备的ioctl 调用命令集。ioctl 将命令编码在低位字中。
// 下面名称TC[*]的含义是tty 控制命令。
// 取相应终端termios 结构中的信息(参见tcgetattr())。
#define TCGETS 0x5401
// 设置相应终端termios 结构中的信息(参见tcsetattr(),TCSANOW)。
#define TCSETS 0x5402
// 在设置终端termios 的信息之前,需要先等待输出队列中所有数据处理完(耗尽)。对于修改参数
// 会影响输出的情况,就需要使用这种形式(参见tcsetattr(),TCSADRAIN 选项)。
#define TCSETSW 0x5403
// 在设置termios 的信息之前,需要先等待输出队列中所有数据处理完,并且刷新(清空)输入队列。
// 再设置(参见tcsetattr(),TCSAFLUSH 选项)。
#define TCSETSF 0x5404
// 取相应终端termio 结构中的信息(参见tcgetattr())。
#define TCGETA 0x5405
// 设置相应终端termio 结构中的信息(参见tcsetattr(),TCSANOW 选项)。
#define TCSETA 0x5406
// 在设置终端termio 的信息之前,需要先等待输出队列中所有数据处理完(耗尽)。对于修改参数
// 会影响输出的情况,就需要使用这种形式(参见tcsetattr(),TCSADRAIN 选项)。
#define TCSETAW 0x5407
// 在设置termio 的信息之前,需要先等待输出队列中所有数据处理完,并且刷新(清空)输入队列。
// 再设置(参见tcsetattr(),TCSAFLUSH 选项)。
#define TCSETAF 0x5408
// 等待输出队列处理完毕(空),如果参数值是0,则发送一个break(参见tcsendbreak(),tcdrain())。
#define TCSBRK 0x5409
// 开始/停止控制。如果参数值是0,则挂起输出;如果是1,则重新开启挂起的输出;如果是2,则挂起
// 输入;如果是3,则重新开启挂起的输入(参见tcflow())。
#define TCXONC 0x540A
//刷新已写输出但还没发送或已收但还没有读数据。如果参数是0,则刷新(清空)输入队列;如果是1,
// 则刷新输出队列;如果是2,则刷新输入和输出队列(参见tcflush())。
#define TCFLSH 0x540B
// 下面名称TIOC[*]的含义是tty 输入输出控制命令。
// 设置终端串行线路专用模式。
#define TIOCEXCL 0x540C
// 复位终端串行线路专用模式。
#define TIOCNXCL 0x540D
// 设置tty 为控制终端。(TIOCNOTTY - 禁止tty 为控制终端)。
#define TIOCSCTTY 0x540E
// 读取指定终端设备进程的组id(参见tcgetpgrp())。
#define TIOCGPGRP 0x540F
// 设置指定终端设备进程的组id(参见tcsetpgrp())。
#define TIOCSPGRP 0x5410
// 返回输出队列中还未送出的字符数。
#define TIOCOUTQ 0x5411
// 模拟终端输入。该命令以一个指向字符的指针作为参数,并假装该字符是在终端上键入的。用户必须
// 在该控制终端上具有超级用户权限或具有读许可权限。
#define TIOCSTI 0x5412
// 读取终端设备窗口大小信息(参见winsize 结构)。
#define TIOCGWINSZ 0x5413
// 设置终端设备窗口大小信息(参见winsize 结构)。
#define TIOCSWINSZ 0x5414
// 返回modem 状态控制引线的当前状态比特位标志集。
#define TIOCMGET 0x5415
// 设置单个modem 状态控制引线的状态(true 或false)(Individual control line Set)。
#define TIOCMBIS 0x5416
// 复位单个modem 状态控制引线的状态(Individual control line clear)。
#define TIOCMBIC 0x5417
// 设置modem 状态引线的状态。如果某一比特位置位,则modem 对应的状态引线将置为有效。
#define TIOCMSET 0x5418
// 读取软件载波检测标志(1 - 开启;0 - 关闭)。
// 对于本地连接的终端或其它设备,软件载波标志是开启的,对于使用modem 线路的终端或设备则
// 是关闭的。为了能使用这两个ioctl 调用,tty 线路应该是以O_NDELAY 方式打开的,这样open()
// 就不会等待载波。
#define TIOCGSOFTCAR 0x5419
// 设置软件载波检测标志(1 - 开启;0 - 关闭)。
#define TIOCSSOFTCAR 0x541A
// 返回输入队列中还未取走字符的数目。
#define TIOCINQ 0x541B
// 窗口大小(Window size)属性结构。在窗口环境中可用于基于屏幕的应用程序。
// ioctls 中的TIOCGWINSZ 和TIOCSWINSZ 可用来读取或设置这些信息。
struct winsize
{
unsigned short ws_row; // 窗口字符行数。
unsigned short ws_col; // 窗口字符列数。
unsigned short ws_xpixel; // 窗口宽度,象素值。
unsigned short ws_ypixel; // 窗口高度,象素值。
};
// AT&T 系统V 的termio 结构。
#define NCC 8 // termio 结构中控制字符数组的长度。
struct termio
{
unsigned short c_iflag; /* input mode flags */ // 输入模式标志。
unsigned short c_oflag; /* output mode flags */ // 输出模式标志。
unsigned short c_cflag; /* control mode flags */ // 控制模式标志。
unsigned short c_lflag; /* local mode flags */ // 本地模式标志。
unsigned char c_line; /* line discipline */ // 线路规程(速率)。
unsigned char c_cc[NCC]; /* control characters */ // 控制字符数组。
};
// POSIX 的termios 结构。
#define NCCS 17 // termios 结构中控制字符数组的长度。
struct termios
{
unsigned long c_iflag; /* input mode flags */ // 输入模式标志。
unsigned long c_oflag; /* output mode flags */ // 输出模式标志。
unsigned long c_cflag; /* control mode flags */ // 控制模式标志。
unsigned long c_lflag; /* local mode flags */ // 本地模式标志。
unsigned char c_line; /* line discipline */ // 线路规程(速率)。
unsigned char c_cc[NCCS]; /* control characters */ // 控制字符数组。
};
/* c_cc characters *//* c_cc 数组中的字符 */
// 以下是c_cc 数组对应字符的索引值。
#define VINTR 0 // c_cc[VINTR] = INTR (^C),\003,中断字符。
#define VQUIT 1 // c_cc[VQUIT] = QUIT (^\),\034,退出字符。
#define VERASE 2 // c_cc[VERASE] = ERASE (^H),\177,擦出字符。
#define VKILL 3 // c_cc[VKILL] = KILL (^U),\025,终止字符。
#define VEOF 4 // c_cc[VEOF] = EOF (^D),\004,文件结束字符。
#define VTIME 5 // c_cc[VTIME] = TIME (\0),\0, 定时器值(参见后面说明)。
#define VMIN 6 // c_cc[VMIN] = MIN (\1),\1, 定时器值。
#define VSWTC 7 // c_cc[VSWTC] = SWTC (\0),\0, 交换字符。
#define VSTART 8 // c_cc[VSTART] = START (^Q),\021,开始字符。
#define VSTOP 9 // c_cc[VSTOP] = STOP (^S),\023,停止字符。
#define VSUSP 10 // c_cc[VSUSP] = SUSP (^Z),\032,挂起字符。
#define VEOL 11 // c_cc[VEOL] = EOL (\0),\0, 行结束字符。
#define VREPRINT 12 // c_cc[VREPRINT] = REPRINT (^R),\022,重显示字符。
#define VDISCARD 13 // c_cc[VDISCARD] = DISCARD (^O),\017,丢弃字符。
#define VWERASE 14 // c_cc[VWERASE] = WERASE (^W),\027,单词擦除字符。
#define VLNEXT 15 // c_cc[VLNEXT] = LNEXT (^V),\026,下一行字符。
#define VEOL2 16 // c_cc[VEOL2] = EOL2 (\0),\0, 行结束2。
/* c_iflag bits *//* c_iflag 比特位 */
// termios 结构输入模式字段c_iflag 各种标志的符号常数。
#define IGNBRK 0000001 // 输入时忽略BREAK 条件。
#define BRKINT 0000002 // 在BREAK 时产生SIGINT 信号。
#define IGNPAR 0000004 // 忽略奇偶校验出错的字符。
#define PARMRK 0000010 // 标记奇偶校验错。
#define INPCK 0000020 // 允许输入奇偶校验。
#define ISTRIP 0000040 // 屏蔽字符第8 位。
#define INLCR 0000100 // 输入时将换行符NL 映射成回车符CR。
#define IGNCR 0000200 // 忽略回车符CR。
#define ICRNL 0000400 // 在输入时将回车符CR 映射成换行符NL。
#define IUCLC 0001000 // 在输入时将大写字符转换成小写字符。
#define IXON 0002000 // 允许开始/停止(XON/XOFF)输出控制。
#define IXANY 0004000 // 允许任何字符重启输出。
#define IXOFF 0010000 // 允许开始/停止(XON/XOFF)输入控制。
#define IMAXBEL 0020000 // 输入队列满时响铃。
/* c_oflag bits *//* c_oflag 比特位 */
// termios 结构中输出模式字段c_oflag 各种标志的符号常数。
#define OPOST 0000001 // 执行输出处理。
#define OLCUC 0000002 // 在输出时将小写字符转换成大写字符。
#define ONLCR 0000004 // 在输出时将换行符NL 映射成回车-换行符CR-NL。
#define OCRNL 0000010 // 在输出时将回车符CR 映射成换行符NL。
#define ONOCR 0000020 // 在0 列不输出回车符CR。
#define ONLRET 0000040 // 换行符NL 执行回车符的功能。
#define OFILL 0000100 // 延迟时使用填充字符而不使用时间延迟。
#define OFDEL 0000200 // 填充字符是ASCII 码DEL。如果未设置,则使用ASCII NULL。
#define NLDLY 0000400 // 选择换行延迟。
#define NL0 0000000 // 换行延迟类型0。
#define NL1 0000400 // 换行延迟类型1。
#define CRDLY 0003000 // 选择回车延迟。
#define CR0 0000000 // 回车延迟类型0。
#define CR1 0001000 // 回车延迟类型1。
#define CR2 0002000 // 回车延迟类型2。
#define CR3 0003000 // 回车延迟类型3。
#define TABDLY 0014000 // 选择水平制表延迟。
#define TAB0 0000000 // 水平制表延迟类型0。
#define TAB1 0004000 // 水平制表延迟类型1。
#define TAB2 0010000 // 水平制表延迟类型2。
#define TAB3 0014000 // 水平制表延迟类型3。
#define XTABS 0014000 // 将制表符TAB 换成空格,该值表示空格数。
#define BSDLY 0020000 // 选择退格延迟。
#define BS0 0000000 // 退格延迟类型0。
#define BS1 0020000 // 退格延迟类型1。
#define VTDLY 0040000 // 纵向制表延迟。
#define VT0 0000000 // 纵向制表延迟类型0。
#define VT1 0040000 // 纵向制表延迟类型1。
#define FFDLY 0040000 // 选择换页延迟。
#define FF0 0000000 // 换页延迟类型0。
#define FF1 0040000 // 换页延迟类型1。
/* c_cflag bit meaning *//* c_cflag 比特位的含义 */
// termios 结构中控制模式标志字段c_cflag 标志的符号常数(8 进制数)。
#define CBAUD 0000017 // 传输速率位屏蔽码。
#define B0 0000000 /* hang up */ /* 挂断线路 */
#define B50 0000001 // 波特率 50。
#define B75 0000002 // 波特率 75。
#define B110 0000003 // 波特率 110。
#define B134 0000004 // 波特率 134。
#define B150 0000005 // 波特率 150。
#define B200 0000006 // 波特率 200。
#define B300 0000007 // 波特率 300。
#define B600 0000010 // 波特率 600。
#define B1200 0000011 // 波特率 1200。
#define B1800 0000012 // 波特率 1800。
#define B2400 0000013 // 波特率 2400。
#define B4800 0000014 // 波特率 4800。
#define B9600 0000015 // 波特率 9600。
#define B19200 0000016 // 波特率 19200。
#define B38400 0000017 // 波特率 38400。
#define EXTA B19200 // 扩展波特率A。
#define EXTB B38400 // 扩展波特率B。
#define CSIZE 0000060 // 字符位宽度屏蔽码。
#define CS5 0000000 // 每字符5 比特位。
#define CS6 0000020 // 每字符6 比特位。
#define CS7 0000040 // 每字符7 比特位。
#define CS8 0000060 // 每字符8 比特位。
#define CSTOPB 0000100 // 设置两个停止位,而不是1 个。
#define CREAD 0000200 // 允许接收。
#define CPARENB 0000400 // 开启输出时产生奇偶位、输入时进行奇偶校验。
#define CPARODD 0001000 // 输入/输入校验是奇校验。
#define HUPCL 0002000 // 最后进程关闭后挂断。
#define CLOCAL 0004000 // 忽略调制解调器(modem)控制线路。
#define CIBAUD 03600000 /* input baud rate (not used) */ /* 输入波特率(未使用) */
#define CRTSCTS 020000000000 /* flow control */ /* 流控制 */
#define PARENB CPARENB // 开启输出时产生奇偶位、输入时进行奇偶校验。
#define PARODD CPARODD // 输入/输入校验是奇校验。
/* c_lflag bits *//* c_lflag 比特位 */
// termios 结构中本地模式标志字段c_lflag 的符号常数。
#define ISIG 0000001 // 当收到字符INTR、QUIT、SUSP 或DSUSP,产生相应的信号。
#define ICANON 0000002 // 开启规范模式(熟模式)。
#define XCASE 0000004 // 若设置了ICANON,则终端是大写字符的。
#define ECHO 0000010 // 回显输入字符。
#define ECHOE 0000020 // 若设置了ICANON,则ERASE/WERASE 将擦除前一字符/单词。
#define ECHOK 0000040 // 若设置了ICANON,则KILL 字符将擦除当前行。
#define ECHONL 0000100 // 如设置了ICANON,则即使ECHO 没有开启也回显NL 字符。
#define NOFLSH 0000200 // 当生成SIGINT 和SIGQUIT 信号时不刷新输入输出队列,当
// 生成SIGSUSP 信号时,刷新输入队列。
#define TOSTOP 0000400 // 发送SIGTTOU 信号到后台进程的进程组,该后台进程试图写
// 自己的控制终端。
#define ECHOCTL 0001000 // 若设置了ECHO,则除TAB、NL、START 和STOP 以外的ASCII
// 控制信号将被回显成象^X 式样,X 值是控制符+0x40。
#define ECHOPRT 0002000 // 若设置了ICANON 和IECHO,则字符在擦除时将显示。
#define ECHOKE 0004000 // 若设置了ICANON,则KILL 通过擦除行上的所有字符被回显。
#define FLUSHO 0010000 // 输出被刷新。通过键入DISCARD 字符,该标志被翻转。
#define PENDIN 0040000 // 当下一个字符是读时,输入队列中的所有字符将被重显。
#define IEXTEN 0100000 // 开启实现时定义的输入处理。
/* modem lines *//* modem 线路信号符号常数 */
#define TIOCM_LE 0x001 // 线路允许(Line Enable)。
#define TIOCM_DTR 0x002 // 数据终端就绪(Data Terminal Ready)。
#define TIOCM_RTS 0x004 // 请求发送(Request to Send)。
#define TIOCM_ST 0x008 // 串行数据发送(Serial Transfer)。
#define TIOCM_SR 0x010 // 串行数据接收(Serial Receive)。
#define TIOCM_CTS 0x020 // 清除发送(Clear To Send)。
#define TIOCM_CAR 0x040 // 载波监测(Carrier Detect)。
#define TIOCM_RNG 0x080 // 响铃指示(Ring indicate)。
#define TIOCM_DSR 0x100 // 数据设备就绪(Data Set Ready)。
#define TIOCM_CD TIOCM_CAR
#define TIOCM_RI TIOCM_RNG
/* tcflow() and TCXONC use these *//* tcflow()和TCXONC 使用这些符号常数 */
#define TCOOFF 0 // 挂起输出。
#define TCOON 1 // 重启被挂起的输出。
#define TCIOFF 2 // 系统传输一个STOP 字符,使设备停止向系统传输数据。
#define TCION 3 // 系统传输一个START 字符,使设备开始向系统传输数据。
/* tcflush() and TCFLSH use these *//* tcflush()和TCFLSH 使用这些符号常数 */
#define TCIFLUSH 0 // 清接收到的数据但不读。
#define TCOFLUSH 1 // 清已写的数据但不传送。
#define TCIOFLUSH 2 // 清接收到的数据但不读。清已写的数据但不传送。
/* tcsetattr uses these *//* tcsetattr()使用这些符号常数 */
#define TCSANOW 0 // 改变立即发生。
#define TCSADRAIN 1 // 改变在所有已写的输出被传输之后发生。
#define TCSAFLUSH 2 // 改变在所有已写的输出被传输之后并且在所有接收到但
// 还没有读取的数据被丢弃之后发生。
typedef int speed_t; // 波特率数值类型。
// 返回termios_p 所指termios 结构中的接收波特率。
extern speed_t cfgetispeed (struct termios *termios_p);
// 返回termios_p 所指termios 结构中的发送波特率。
extern speed_t cfgetospeed (struct termios *termios_p);
// 将termios_p 所指termios 结构中的接收波特率设置为speed。
extern int cfsetispeed (struct termios *termios_p, speed_t speed);
// 将termios_p 所指termios 结构中的发送波特率设置为speed。
extern int cfsetospeed (struct termios *termios_p, speed_t speed);
// 等待fildes 所指对象已写输出数据被传送出去。
extern int tcdrain (int fildes);
// 挂起/重启fildes 所指对象数据的接收和发送。
extern int tcflow (int fildes, int action);
// 丢弃fildes 指定对象所有已写但还没传送以及所有已收到但还没有读取的数据。
extern int tcflush (int fildes, int queue_selector);
// 获取与句柄fildes 对应对象的参数,并将其保存在termios_p 所指的地方。
extern int tcgetattr (int fildes, struct termios *termios_p);
// 如果终端使用异步串行数据传输,则在一定时间内连续传输一系列0 值比特位。
extern int tcsendbreak (int fildes, int duration);
// 使用termios 结构指针termios_p 所指的数据,设置与终端相关的参数。
extern int tcsetattr (int fildes, int optional_actions,
struct termios *termios_p);
#endif
#ifndef _TIME_H
#define _TIME_H
#ifndef _TIME_T
#define _TIME_T
typedef long time_t; // 从GMT 1970 年1 月1 日开始的以秒计数的时间(日历时间)。
#endif
#ifndef _SIZE_T
#define _SIZE_T
typedef unsigned int size_t;
#endif
#define CLOCKS_PER_SEC 100 // 系统时钟滴答频率,100HZ。
typedef long clock_t; // 从进程开始系统经过的时钟滴答数。
struct tm
{
int tm_sec; // 秒数 [0,59]。
int tm_min; // 分钟数 [ 0,59]。
int tm_hour; // 小时数 [0,59]。
int tm_mday; // 1 个月的天数 [0,31]。
int tm_mon; // 1 年中月份 [0,11]。
int tm_year; // 从1900 年开始的年数。
int tm_wday; // 1 星期中的某天 [0,6](星期天 =0)。
int tm_yday; // 1 年中的某天 [0,365]。
int tm_isdst; // 夏令时标志。
};
// 以下是有关时间操作的函数原型。
// 确定处理器使用时间。返回程序所用处理器时间(滴答数)的近似值。
clock_t clock (void);
// 取时间(秒数)。返回从1970.1.1:0:0:0 开始的秒数(称为日历时间)。
time_t time (time_t * tp);
// 计算时间差。返回时间time2 与time1 之间经过的秒数。
double difftime (time_t time2, time_t time1);
// 将tm 结构表示的时间转换成日历时间。
time_t mktime (struct tm *tp);
// 将tm 结构表示的时间转换成一个字符串。返回指向该串的指针。
char *asctime (const struct tm *tp);
// 将日历时间转换成一个字符串形式,如“Wed Jun 30 21:49:08:1993\n”。
char *ctime (const time_t * tp);
// 将日历时间转换成tm 结构表示的UTC 时间(UTC - 世界时间代码Universal Time Code)。
struct tm *gmtime (const time_t * tp);
// 将日历时间转换成tm 结构表示的指定时间区(timezone)的时间。
struct tm *localtime (const time_t * tp);
// 将tm 结构表示的时间利用格式字符串fmt 转换成最大长度为smax 的字符串并将结果存储在s 中。
size_t strftime (char *s, size_t smax, const char *fmt, const struct tm *tp);
// 初始化时间转换信息,使用环境变量TZ,对zname 变量进行初始化。
// 在与时间区相关的时间转换函数中将自动调用该函数。
void tzset (void);
#endif
#ifndef _UNISTD_H
#define _UNISTD_H
/* ok, this may be a joke, but I'm working on it */
/* ok, 这也许是个玩笑,但我正在着手处理 */
// 下面符号常数指出符合IEEE 标准1003.1 实现的版本号,是一个整数值。
#define _POSIX_VERSION 198808L
// chown()和fchown()的使用受限于进程的权限。/* 只有超级用户可以执行chown(我想..)*/
#define _POSIX_CHOWN_RESTRICTED /* only root can do a chown (I think..) */
// 长于(NAME_MAX)的路径名将产生错误,而不会自动截断。/* 路径名不截断(但是请看内核代码)*/
#define _POSIX_NO_TRUNC /* no pathname truncation (but see in kernel) */
// 下面这个符号将定义成字符值,该值将禁止终端对其的处理。/* 禁止象^C 这样的字符 */
#define _POSIX_VDISABLE '\0' /* character to disable things like ^C */
// 每个进程都有一保存的set-user-ID 和一保存的set-group-ID。 /* 我们将着手对此进行处理 */
/*#define _POSIX_SAVED_IDS *//* we'll get to this yet */
// 系统实现支持作业控制。 /* 我们还没有支持这项标准,希望很快就行 */
/*#define _POSIX_JOB_CONTROL *//* we aren't there quite yet. Soon hopefully */
#define STDIN_FILENO 0 // 标准输入文件句柄(描述符)号。
#define STDOUT_FILENO 1 // 标准输出文件句柄号。
#define STDERR_FILENO 2 // 标准出错文件句柄号。
#ifndef NULL
#define NULL ((void *)0) // 定义空指针。
#endif
/* access *//* 文件访问 */
// 以下定义的符号常数用于access()函数。
#define F_OK 0 // 检测文件是否存在。
#define X_OK 1 // 检测是否可执行(搜索)。
#define W_OK 2 // 检测是否可写。
#define R_OK 4 // 检测是否可读。
/* lseek *//* 文件指针重定位 */
// 以下符号常数用于lseek()和fcntl()函数。
#define SEEK_SET 0 // 将文件读写指针设置为偏移值。
#define SEEK_CUR 1 // 将文件读写指针设置为当前值加上偏移值。
#define SEEK_END 2 // 将文件读写指针设置为文件长度加上偏移值。
/* _SC stands for System Configuration. We don't use them much */
/* _SC 表示系统配置。我们很少使用 */
// 下面的符号常数用于sysconf()函数。
#define _SC_ARG_MAX 1 // 最大变量数。
#define _SC_CHILD_MAX 2 // 子进程最大数。
#define _SC_CLOCKS_PER_SEC 3 // 每秒滴答数。
#define _SC_NGROUPS_MAX 4 // 最大组数。
#define _SC_OPEN_MAX 5 // 最大打开文件数。
#define _SC_JOB_CONTROL 6 // 作业控制。
#define _SC_SAVED_IDS 7 // 保存的标识符。
#define _SC_VERSION 8 // 版本。
/* more (possibly) configurable things - now pathnames */
/* 更多的(可能的)可配置参数 - 现在用于路径名 */
// 下面的符号常数用于pathconf()函数。
#define _PC_LINK_MAX 1 // 连接最大数。
#define _PC_MAX_CANON 2 // 最大常规文件数。
#define _PC_MAX_INPUT 3 // 最大输入长度。
#define _PC_NAME_MAX 4 // 名称最大长度。
#define _PC_PATH_MAX 5 // 路径最大长度。
#define _PC_PIPE_BUF 6 // 管道缓冲大小。
#define _PC_NO_TRUNC 7 // 文件名不截断。
#define _PC_VDISABLE 8 // 禁止系统维护的终端特殊字符
#define _PC_CHOWN_RESTRICTED 9 // 不允许改变宿主受限。
#include <sys/stat.h> // 文件状态头文件。含有文件或文件系统状态结构stat{}和常量。
#include <sys/times.h> // 定义了进程中运行时间结构tms 以及times()函数原型。
#include <sys/utsname.h> // 系统名称结构头文件。
#include <utime.h> // 用户时间头文件。定义了访问和修改时间结构以及utime()原型。
#ifdef __LIBRARY__
// 以下是内核实现的系统调用符号常数,用于作为系统调用函数表中的索引值。( include/linux/sys.h )
#define __NR_setup 0 /* used only by init, to get system going */
/* __NR_setup 仅用于初始化,以启动系统 */
#define __NR_exit 1
#define __NR_fork 2
#define __NR_read 3
#define __NR_write 4
#define __NR_open 5
#define __NR_close 6
#define __NR_waitpid 7
#define __NR_creat 8
#define __NR_link 9
#define __NR_unlink 10
#define __NR_execve 11
#define __NR_chdir 12
#define __NR_time 13
#define __NR_mknod 14
#define __NR_chmod 15
#define __NR_chown 16
#define __NR_break 17
#define __NR_stat 18
#define __NR_lseek 19
#define __NR_getpid 20
#define __NR_mount 21
#define __NR_umount 22
#define __NR_setuid 23
#define __NR_getuid 24
#define __NR_stime 25
#define __NR_ptrace 26
#define __NR_alarm 27
#define __NR_fstat 28
#define __NR_pause 29
#define __NR_utime 30
#define __NR_stty 31
#define __NR_gtty 32
#define __NR_access 33
#define __NR_nice 34
#define __NR_ftime 35
#define __NR_sync 36
#define __NR_kill 37
#define __NR_rename 38
#define __NR_mkdir 39
#define __NR_rmdir 40
#define __NR_dup 41
#define __NR_pipe 42
#define __NR_times 43
#define __NR_prof 44
#define __NR_brk 45
#define __NR_setgid 46
#define __NR_getgid 47
#define __NR_signal 48
#define __NR_geteuid 49
#define __NR_getegid 50
#define __NR_acct 51
#define __NR_phys 52
#define __NR_lock 53
#define __NR_ioctl 54
#define __NR_fcntl 55
#define __NR_mpx 56
#define __NR_setpgid 57
#define __NR_ulimit 58
#define __NR_uname 59
#define __NR_umask 60
#define __NR_chroot 61
#define __NR_ustat 62
#define __NR_dup2 63
#define __NR_getppid 64
#define __NR_getpgrp 65
#define __NR_setsid 66
#define __NR_sigaction 67
#define __NR_sgetmask 68
#define __NR_ssetmask 69
#define __NR_setreuid 70
#define __NR_setregid 71
#define __NR_sigsuspend 72
#define __NR_sigpending 73
#define __NR_sethostname 74
#define __NR_setrlimit 75
#define __NR_getrlimit 76
#define __NR_getrusage 77
#define __NR_gettimeofday 78
#define __NR_settimeofday 79
#define __NR_getgroups 80
#define __NR_setgroups 81
#define __NR_select 82
#define __NR_symlink 83
#define __NR_lstat 84
#define __NR_readlink 85
#define __NR_uselib 86
// 以下定义系统调用嵌入式汇编宏函数。
// 不带参数的系统调用宏函数。type name(void)。
// %0 - eax(__res),%1 - eax(__NR_##name)。其中name 是系统调用的名称,与 __NR_ 组合形成上面
// 的系统调用符号常数,从而用来对系统调用表中函数指针寻址。
// 返回:如果返回值大于等于0,则返回该值,否则置出错号errno,并返回-1。
#define _syscall0(type,name) \
type name(void) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
: "=a" (__res) \
: "0" (__NR_##name)); \
if (__res >= 0) \
return (type) __res; \
errno = -__res; \
return -1; \
}
// 有1 个参数的系统调用宏函数。type name(atype a)
// %0 - eax(__res),%1 - eax(__NR_name),%2 - ebx(a)
#define _syscall1(type,name,atype,a) \
type name(atype a) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
: "=a" (__res) \
: "0" (__NR_##name),"b" ((long)(a))); \
if (__res >= 0) \
return (type) __res; \
errno = -__res; \
return -1; \
}
// 有2 个参数的系统调用宏函数。type name(atype a, btype b)
// %0 - eax(__res),%1 - eax(__NR_name),%2 - ebx(a),%3 - ecx(b)。
#define _syscall2(type,name,atype,a,btype,b) \
type name(atype a,btype b) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
: "=a" (__res) \
: "0" (__NR_##name),"b" ((long)(a)),"c" ((long)(b))); \
if (__res >= 0) \
return (type) __res; \
errno = -__res; \
return -1; \
}
// 有3 个参数的系统调用宏函数。type name(atype a, btype b, ctype c)
// %0 - eax(__res),%1 - eax(__NR_name),%2 - ebx(a),%3 - ecx(b),%4 - edx(c)。
#define _syscall3(type,name,atype,a,btype,b,ctype,c) \
type name(atype a,btype b,ctype c) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
: "=a" (__res) \
: "0" (__NR_##name),"b" ((long)(a)),"c" ((long)(b)),"d" ((long)(c))); \
if (__res>=0) \
return (type) __res; \
errno=-__res; \
return -1; \
}
#endif /* __LIBRARY__ */
extern int errno; // 出错号,全局变量。
// 对应各系统调用的函数原型定义。
int access(const char * filename, mode_t mode);
int acct(const char * filename);
int alarm(int sec);
int brk(void * end_data_segment);
void * sbrk(ptrdiff_t increment);
int chdir(const char * filename);
int chmod(const char * filename, mode_t mode);
int chown(const char * filename, uid_t owner, gid_t group);
int chroot(const char * filename);
int close(int fildes);
int creat(const char * filename, mode_t mode);
int dup(int fildes);
int execve(const char * filename, char ** argv, char ** envp);
int execv(const char * pathname, char ** argv);
int execvp(const char * file, char ** argv);
int execl(const char * pathname, char * arg0, ...);
int execlp(const char * file, char * arg0, ...);
int execle(const char * pathname, char * arg0, ...);
volatile void exit(int status);
volatile void _exit(int status);
int fcntl(int fildes, int cmd, ...);
int fork(void);
int getpid(void);
int getuid(void);
int geteuid(void);
int getgid(void);
int getegid(void);
int ioctl(int fildes, int cmd, ...);
int kill(pid_t pid, int signal);
int link(const char * filename1, const char * filename2);
int lseek(int fildes, off_t offset, int origin);
int mknod(const char * filename, mode_t mode, dev_t dev);
int mount(const char * specialfile, const char * dir, int rwflag);
int nice(int val);
int open(const char * filename, int flag, ...);
int pause(void);
int pipe(int * fildes);
int read(int fildes, char * buf, off_t count);
int setpgrp(void);
int setpgid(pid_t pid,pid_t pgid);
int setuid(uid_t uid);
int setgid(gid_t gid);
void (*signal(int sig, void (*fn)(int)))(int);
int stat(const char * filename, struct stat * stat_buf);
int fstat(int fildes, struct stat * stat_buf);
int stime(time_t * tptr);
int sync(void);
time_t time(time_t * tloc);
time_t times(struct tms * tbuf);
int ulimit(int cmd, long limit);
mode_t umask(mode_t mask);
int umount(const char * specialfile);
int uname(struct utsname * name);
int unlink(const char * filename);
int ustat(dev_t dev, struct ustat * ubuf);
int utime(const char * filename, struct utimbuf * times);
pid_t waitpid(pid_t pid,int * wait_stat,int options);
pid_t wait(int * wait_stat);
int write(int fildes, const char * buf, off_t count);
int dup2(int oldfd, int newfd);
int getppid(void);
pid_t getpgrp(void);
pid_t setsid(void);
#endif
#ifndef _UTIME_H
#define _UTIME_H
#include <sys/types.h> /* I know - shouldn't do this, but .. */
/* 我知道 - 不应该这样做,但是.. */
struct utimbuf {
time_t actime; // 文件访问时间。 从1970.1.1:0:0:0开始的秒数.
time_t modtime; // 文件修改时间。 从1970.1.1:0:0:0开始的秒数.
};
// 设置文件访问和修改时间函数.
extern int utime(const char *filename, struct utimbuf *times);
#endif
/*
* linux/init/main.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__ // 定义该变量是为了包括定义在 unistd.h 中的内嵌汇编代码等信息。
#include <unistd.h> // *.h 头文件所在的默认目录是include/,则在代码中就不用明确指明位置。
// 如果不是UNIX 的标准头文件,则需要指明所在的目录,并用双引号括住。
// 标准符号常数与类型文件。定义了各种符号常数和类型,并申明了各种函数。
// 如果定义了__LIBRARY__,则还包括系统调用号和内嵌汇编代码_syscall0()等。
#include <time.h> // 时间类型头文件。其中最主要定义了tm 结构和一些有关时间的函数原形。
/*
* we need this inline - forking from kernel space will result
* in NO COPY ON WRITE (!!!), until an execve is executed. This
* is no problem, but for the stack. This is handled by not letting
* main() use the stack at all after fork(). Thus, no function
* calls - which means inline code for fork too, as otherwise we
* would use the stack upon exit from 'fork()'.
*
* Actually only pause and fork are needed inline, so that there
* won't be any messing with the stack from main(), but we define
* some others too.
*/
/*
* 我们需要下面这些内嵌语句 - 从内核空间创建进程(forking)将导致没有写时复制(COPY ON WRITE)!!!
* 直到一个执行execve 调用。这对堆栈可能带来问题。处理的方法是在fork()调用之后不让main()使用
* 任何堆栈。因此就不能有函数调用 - 这意味着fork 也要使用内嵌的代码,否则我们在从fork()退出
* 时就要使用堆栈了。
* 实际上只有pause 和fork 需要使用内嵌方式,以保证从main()中不会弄乱堆栈,但是我们同时还
* 定义了其它一些函数。
*/
/*static*/ inline _syscall0(int,fork) // 是unistd.h 中的内嵌宏代码。以嵌入汇编的形式调用
// Linux 的系统调用中断0x80。该中断是所有系统调用的
// 入口。该条语句实际上是int fork()创建进程系统调用。
// syscall0 名称中最后的0 表示无参数,1 表示1 个参数。
/*static*/ inline _syscall0(int,pause) // int pause()系统调用:暂停进程的执行,直到收到一个信号。
/*static*/ inline _syscall1(int,setup,void *,BIOS) // int setup(void * BIOS)系统调用,仅用于
// linux 初始化(仅在这个程序中被调用)。
/*static*/ inline _syscall0(int,sync) // int sync()系统调用:更新文件系统。
#include <linux/tty.h> // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、第1 个初始任务
// 的数据。还有一些以宏的形式定义的有关描述符参数设置和获取的
// 嵌入式汇编函数程序。
#include <linux/head.h> // head 头文件,定义了段描述符的简单结构,和几个选择符常量。
#include <asm/system.h> // 系统头文件。以宏的形式定义了许多有关设置或修改
// 描述符/中断门等的嵌入式汇编子程序。
#include <asm/io.h> // io 头文件。以宏的嵌入汇编程序形式定义对io 端口操作的函数。
#include <stddef.h> // 标准定义头文件。定义了NULL, offsetof(TYPE, MEMBER)。
#include <stdarg.h> // 标准参数头文件。以宏的形式定义变量参数列表。主要说明了-个
// 类型(va_list)和三个宏(va_start, va_arg 和va_end),vsprintf、
// vprintf、vfprintf。
#include <unistd.h>
#include <fcntl.h> // 文件控制头文件。用于文件及其描述符的操作控制常数符号的定义。
#include <sys/types.h> // 类型头文件。定义了基本的系统数据类型。
#include <linux/fs.h> // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。
static char printbuf[1024];
extern int vsprintf(); // 送格式化输出到一字符串中(在kernel/vsprintf.c)
extern void init(void);
extern void blk_dev_init(void); // 块设备初始化子程序(kernel/blk_drv/ll_rw_blk.c)
extern void chr_dev_init(void); // 字符设备初始化(kernel/chr_drv/tty_io.c)
extern void hd_init(void); // 硬盘初始化程序(kernel/blk_drv/hd.c)
extern void floppy_init(void); // 软驱初始化程序(kernel/blk_drv/floppy.c)
extern void mem_init(long start, long end); // 内存管理初始化(mm/memory.c)
extern long rd_init(long mem_start, int length); //虚拟盘初始化(kernel/blk_drv/ramdisk.c)
extern long kernel_mktime(struct tm * tm); // 建立内核时间(秒)。
extern long startup_time; // 内核启动时间(开机时间)(秒)。
/*
* This is set up by the setup-routine at boot-time
*/
/*
* 以下这些数据是由setup.s 程序在引导时间设置的。
*/
#define EXT_MEM_K (*(unsigned short *)0x90002)
#define DRIVE_INFO (*(struct drive_info *)0x90080)
#define ORIG_ROOT_DEV (*(unsigned short *)0x901FC)
/*
* Yeah, yeah, it's ugly, but I cannot find how to do this correctly
* and this seems to work. I anybody has more info on the real-time
* clock I'd be interested. Most of this was trial and error, and some
* bios-listing reading. Urghh.
*/
/*
* 是啊,是啊,下面这段程序很差劲,但我不知道如何正确地实现,而且好象它还能运行。如果有
* 关于实时时钟更多的资料,那我很感兴趣。这些都是试探出来的,以及看了一些bios 程序,呵!
*/
/* 这段宏读取 CMOS 实时时钟信息。*/
#define CMOS_READ(addr) ({ \
outb_p(0x80|addr,0x70); \
inb_p(0x71); \
})
#define BCD_TO_BIN(val) ((val)=((val)&15) + ((val)>>4)*10) // 将BCD 码转换成数字。
// 该子程序取CMOS 时钟,并设置开机时间 startup_time(秒)。
static void time_init(void)
{
struct tm time;
do {
time.tm_sec = CMOS_READ(0);
time.tm_min = CMOS_READ(2);
time.tm_hour = CMOS_READ(4);
time.tm_mday = CMOS_READ(7);
time.tm_mon = CMOS_READ(8);
time.tm_year = CMOS_READ(9);
} while (time.tm_sec != CMOS_READ(0));
BCD_TO_BIN(time.tm_sec);
BCD_TO_BIN(time.tm_min);
BCD_TO_BIN(time.tm_hour);
BCD_TO_BIN(time.tm_mday);
BCD_TO_BIN(time.tm_mon);
BCD_TO_BIN(time.tm_year);
time.tm_mon--;
startup_time = kernel_mktime(&time);
}
static long memory_end = 0; // 机器具有的内存(字节数)。
static long buffer_memory_end = 0; // 高速缓冲区末端地址。
static long main_memory_start = 0; // 主内存(将用于分页)开始的位置。
struct drive_info { char dummy[32]; } drive_info; // 用于存放硬盘参数表信息。
void start(void) /* This really IS void, no error here. */
{ /* The startup routine assumes (well, ...) this */
/* 这里确实是void,并没错。在startup 程序(head.s)中就是这样假设的.
* 参见head.s 程序
*/
/*
* Interrupts are still disabled. Do necessary setups, then
* enable them
*/
/*
* 此时中断仍被禁止着,做完必要的设置后就将其开启。
*/
// 下面这段代码用于保存:
// 根设备号 ROOT_DEV; 高速缓存末端地址 buffer_memory_end;
// 机器内存数 memory_end;主内存开始地址 main_memory_start;
ROOT_DEV = ORIG_ROOT_DEV;
drive_info = DRIVE_INFO;
memory_end = (1<<20) + (EXT_MEM_K<<10); // 内存大小=1Mb 字节+扩展内存(k)*1024 字节。
memory_end &= 0xfffff000; // 忽略不到4Kb(1 页)的内存数。
if (memory_end > 16*1024*1024) // 如果内存超过16Mb,则按16Mb 计。
memory_end = 16*1024*1024;
if (memory_end > 12*1024*1024) // 如果内存>12Mb,则设置缓冲区末端=4Mb
buffer_memory_end = 4*1024*1024;
else if (memory_end > 6*1024*1024) // 否则如果内存>6Mb,则设置缓冲区末端=2Mb
buffer_memory_end = 2*1024*1024;
else
buffer_memory_end = 1*1024*1024; // 否则则设置缓冲区末端=1Mb
main_memory_start = buffer_memory_end; // 主内存起始位置=缓冲区末端;
#ifdef RAMDISK // 如果定义了虚拟盘,则主内存将减少。
main_memory_start += rd_init(main_memory_start, RAMDISK*1024);
#endif
// 以下是内核进行所有方面的初始化工作。阅读时最好跟着调用的程序深入进去看,实在看
// 不下去了,就先放一放,看下一个初始化调用 -- 这是经验之谈。
mem_init(main_memory_start,memory_end);
trap_init(); // 陷阱门(硬件中断向量)初始化。(kernel/traps.c)
blk_dev_init(); // 块设备初始化。 (kernel/blk_dev/ll_rw_blk.c)
chr_dev_init(); // 字符设备初始化。 (kernel/chr_dev/tty_io.c)
tty_init(); // tty 初始化。 (kernel/chr_dev/tty_io.c)
time_init(); // 设置开机启动时间:startup_time。
sched_init(); // 调度程序初始化(加载了任务0 的tr, ldtr) (kernel/sched.c)
buffer_init(buffer_memory_end); // 缓冲管理初始化,建内存链表等。(fs/buffer.c)
hd_init(); // 硬盘初始化。 (kernel/blk_dev/hd.c)
floppy_init(); // 软驱初始化。 (kernel/blk_dev/floppy.c)
sti(); // 所有初始化工作都做完了,开启中断。
// 下面过程通过在堆栈中设置的参数,利用中断返回指令切换到任务0。
move_to_user_mode(); // 移到用户模式。 (include/asm/system.h)
if (!fork()) { /* we count on this going ok */
init();
}
/*
* NOTE!! For any other task 'pause()' would mean we have to get a
* signal to awaken, but task0 is the sole exception (see 'schedule()')
* as task 0 gets activated at every idle moment (when no other tasks
* can run). For task0 'pause()' just means we go check if some other
* task can run, and if not we return here.
*/
/* 注意!! 对于任何其它的任务,'pause()'将意味着我们必须等待收到一个信号才会返回就
* 绪运行态,但任务0(task0)是唯一的意外情况(参见'schedule()'),因为任务0 在任何
* 空闲时间里都会被激活(当没有其它任务在运行时),因此对于任务0'pause()'仅意味着我们
* 返回来查看是否有其它任务可以运行,如果没有的话我们就回到这里,一直循环执行'pause()'。
*/
for(;;) pause();
}
static int printf(const char *fmt, ...)
{
// 产生格式化信息并输出到标准输出设备stdout(1),这里是指屏幕上显示。参数'*fmt'指定输出将
// 采用的格式,参见各种标准C 语言书籍。该子程序正好是vsprintf 如何使用的一个例子。该程
// 序使用vsprintf()将格式化的字符串放入printbuf 缓冲区,然后用write()将缓冲区的内容输出
// 到标准设备(1--stdout)。
va_list args;
int i;
va_start(args, fmt);
write(1,printbuf,i=vsprintf(printbuf, fmt, args));
va_end(args);
return i;
}
static char * argv_rc[] = { "/bin/sh", NULL }; // 调用执行程序时参数的字符串数组。
static char * envp_rc[] = { "HOME=/", NULL }; // 调用执行程序时的环境字符串数组。
static char * argv[] = { "-/bin/sh",NULL }; // 同上
static char * envp[] = { "HOME=/usr/root", NULL };
void init(void)
{
int pid,i;
// 读取硬盘参数包括分区表信息并建立虚拟盘和安装根文件系统设备。
// 该函数是在上面宏定义的,对应函数是sys_setup(),在kernel/blk_drv/hd.c。
setup((void *) &drive_info);
(void) open("/dev/tty0",O_RDWR,0); // 用读写访问方式打开设备“/dev/tty0”
(void) dup(0); // 复制句柄,产生句柄1 号 -- stdout 标准输出设备。
(void) dup(0); // 复制句柄,产生句柄2 号 -- stderr 标准出错输出设备。
printf("%d buffers = %d bytes buffer space\n\r",NR_BUFFERS,
NR_BUFFERS*BLOCK_SIZE);
printf("Free mem: %d bytes\n\r",memory_end-main_memory_start);
// 下面fork()用于创建一个子进程(子任务)。对于被创建的子进程,fork()将返回0 值,对于
// 原(父进程)将返回子进程的进程号。下面是子进程执行的内容。该子进程关闭了句柄0(stdin),
// 以只读方式打开/etc/rc 文件,并执行/bin/sh 程序,所带参数和环境变量分别由argv_rc
// 和envp_rc 数组给出。关闭句柄0并立刻打开/etc/rc文件的作用是把标准输入stdin 重定向
// 到/etc/rc 文件。这样shell程序/bin/sh就可以运行rc文件中设置命令。由于这里sh的运行
// 方式是非交互式的,因此在执行完rc文件中的命令后就会立刻退出进程2也随之结束。关于
// execve()函数的说明请参见fs/exec.c 程序。函数 _exit()退出时的出错码:1-操作未
// 许可;2-文件或目录不存在
if (!(pid=fork())) {
close(0);
if (open("/etc/rc",O_RDONLY,0))
_exit(1); // 如果打开文件失败,则退出(/lib/_exit.c)。
execve("/bin/sh",argv_rc,envp_rc); // 装入/bin/sh 程序并执行。
_exit(2); // 若execve()执行失败则退出(出错码2,“文件或目录不存在”)。
}
// 下面是父进程执行的语句。wait()是等待子进程停止或终止,其返回值应是子进程的进程号(pid)。
// 这三句的作用是父进程等待子进程的结束。&i 是存放返回状态信息的位置。如果wait()返回值不
// 等于子进程号,则继续等待。
if (pid>0)
while (pid != wait(&i))
/* nothing */;
// 如果执行到这里,说明刚创建的子进程的执行已停止或终止了。下面循环中首先再创建一个子进程,
// 如果出错,则显示“初始化程序创建子进程失败”的信息并继续执行。对于所创建的子进程关闭所有
// 以前还遗留的句柄(stdin, stdout, stderr),新创建一个会话并设置进程组号,然后重新打开
// /dev/tty0 作为stdin,并复制成stdout 和stderr。再次执行系统解释程序/bin/sh。但这次执行所
// 选用的参数和环境数组另选了一套。然后父进程再次运行wait()等待。如果子进程又停止了执行,则
// 在标准输出上显示出错信息“子进程pid 停止了运行,返回码是i”,然后继续重试下去…,形成“大”死循环。
while (1) {
if ((pid=fork())<0) {
printf("Fork failed in init\r\n");
continue;
}
if (!pid) {
close(0);close(1);close(2);
setsid();
(void) open("/dev/tty0",O_RDWR,0);
(void) dup(0);
(void) dup(0);
_exit(execve("/bin/sh",argv,envp));
}
while (1)
if (pid == wait(&i))
break;
printf("\n\rchild %d died with code %04x\n\r",pid,i);
sync(); // 同步操作,刷新缓冲区
}
_exit(0); /* NOTE! _exit, not exit() */
// _exit() 和 exit()都用于正常终止一个函数。但 _exit()直接是一个sys_exit系统调用,而 exit()
// 通常是普通函数库中的一个函数。它会先执行一些清除操作,例如调用执行各终止处理程序。关闭所有标准IO
// 等,然后调用 sys_exit.
}
/*
* linux/kernel/asm.s
*
* (C) 1991 Linus Torvalds
*/
/*
* asm.s contains the low-level code for most hardware faults.
* page_exception is handled by the mm, so that isn't here. This
* file also handles (hopefully) fpu-exceptions due to TS-bit, as
* the fpu must be properly saved/resored. This hasn't been tested.
*/
/*
* asm.s 程序中包括大部分的硬件故障(或出错)处理的底层次代码。页异常是由内存管理程序
* mm 处理的,所以不在这里。此程序还处理(希望是这样)由于TS-位而造成的fpu 异常,
* 因为fpu 必须正确地进行保存/恢复处理,这些还没有测试过。
*/
# 本代码文件主要涉及对Intel 保留的中断int0--int16 的处理(int17-int31 留作今后使用)。
# 以下是一些全局函数名的声明,其原形在traps.c 中说明。
.globl _divide_error, _debug, _nmi, _int3, _overflow,_bounds,_invalid_op
.globl _double_fault, _coprocessor_segment_overrun
.globl _invalid_TSS, _segment_not_present, _stack_segment
.globl _general_protection, _coprocessor_error,_irq13, _reserved
# 下面这段程序处理无出错的情况
# int0-- 处理被零除出错的情况。 类型:错误;错误号:无
# 在执行 DIV 或 IDIV 指令时,若除数是 0,CPU 就会产生这个异常,当 EAX (或AX , AL)容纳不了
# 一个合法除操作的结果时也会产生这个异常。标号‘_do_divide_error’实际上是 C 语言函数
# ‘do_divide_error()’编译后所生产模块中对应的函数。函数‘do_divide_error’在trap.c中实现
_divide_error:
pushl $_do_divide_error # 首先把将要调用的函数地址入栈。这段程序的出错号为0。
no_error_code: # 这里是无出错号处理的入口处
xchgl %eax,(%esp) # _do_divide_error 的地址 -> eax,eax 被交换入栈。
pushl %ebx
pushl %ecx
pushl %edx
pushl %edi
pushl %esi
pushl %ebp
push %ds # 16 位的段寄存器入栈后也要占用4 个字节。
push %es
push %fs
pushl $0 # "error code" # 将出错码入栈。
lea 44(%esp),%edx # 取原调用返回地址处堆栈指针位置,并压入堆栈。
pushl %edx
movl $0x10,%edx # 初始化段寄存器,内核代码数据段选择符。
mov %dx,%ds
mov %dx,%es
mov %dx,%fs
call *%eax # 调用C 函数do_divide_error()。
addl $8,%esp # 相当于执行两次pop操作,即丢弃最后入栈的两个 C 函数参数,
# 让堆栈指针重新指向寄存器fs 入栈处。
pop %fs
pop %es
pop %ds
popl %ebp
popl %esi
popl %edi
popl %edx
popl %ecx
popl %ebx
popl %eax # 弹出原来eax 中的内容。
iret
# int1 -- debug 调试中断入口点。处理过程同上。
_debug:
pushl $_do_int3 # _do_debug
jmp no_error_code
# int2 -- 非屏蔽中断调用入口点。
_nmi:
pushl $_do_nmi
jmp no_error_code
# int3 -- 断点指令引起中断的入口点
_int3:
pushl $_do_int3
jmp no_error_code
# int4 -- 溢出出错处理中断入口点。
_overflow:
pushl $_do_overflow
jmp no_error_code
# int5 -- 边界检查出错中断入口点。
_bounds:
pushl $_do_bounds
jmp no_error_code
# int6 -- 无效操作指令出错中断入口点。
_invalid_op:
pushl $_do_invalid_op
jmp no_error_code
# int9 -- 协处理器段超出出错中断入口点。
_coprocessor_segment_overrun:
pushl $_do_coprocessor_segment_overrun
jmp no_error_code
# int15 – 保留。
_reserved:
pushl $_do_reserved
jmp no_error_code
# int45 -- ( = 0x20 + 13 ) 数学协处理器(Coprocessor)发出的中断。
# 当协处理器执行完一个操作时就会发出IRQ13 中断信号,以通知CPU 操作完成。
_irq13:
pushl %eax
xorb %al,%al # 80387 在执行计算时,CPU 会等待其操作的完成。
outb %al,$0xF0 # 通过写0xF0 端口,本中断将消除CPU 的BUSY 延续信号,并重新
# 激活80387 的处理器扩展请求引脚PEREQ。该操作主要是为了确保
# 在继续执行80387 的任何指令之前,响应本中断。
movb $0x20,%al
outb %al,$0x20 # 向8259 主中断控制芯片发送EOI(中断结束)信号。
jmp 1f # 这两个跳转指令起延时作用。
1: jmp 1f
1: outb %al,$0xA0 # 再向8259 从中断控制芯片发送EOI(中断结束)信号。
popl %eax
jmp _coprocessor_error # _coprocessor_error 原来在本文件中,现在已经放到system_call.s中
# 以下中断在调用时会在中断返回地址之后将出错号压入堆栈,因此返回时也需要将出错号弹出。
_double_fault:
pushl $_do_double_fault # C 函数地址入栈。
error_code:
xchgl %eax,4(%esp) # error code <-> %eax # error code <-> %eax,eax 原来的值被保存在堆栈上。
xchgl %ebx,(%esp) # &function <-> %ebx # &function <-> %ebx,ebx 原来的值被保存在堆栈上。
pushl %ecx
pushl %edx
pushl %edi
pushl %esi
pushl %ebp
push %ds
push %es
push %fs
pushl %eax # error code # 出错号入栈。
lea 44(%esp),%eax # offset # 程序返回地址处堆栈指针位置值入栈。
pushl %eax
movl $0x10,%eax # 置内核数据段选择符。
mov %ax,%ds
mov %ax,%es
mov %ax,%fs
call *%ebx # 调用相应的C 函数,其参数已入栈。
addl $8,%esp # 堆栈指针重新指向栈中放置fs 内容的位置。
pop %fs
pop %es
pop %ds
popl %ebp
popl %esi
popl %edi
popl %edx
popl %ecx
popl %ebx
popl %eax
iret
# int10 -- 无效的任务状态段(TSS)。
_invalid_TSS:
pushl $_do_invalid_TSS
jmp error_code
# int11 -- 段不存在。
_segment_not_present:
pushl $_do_segment_not_present
jmp error_code
# int12 -- 堆栈段错误。
_stack_segment:
pushl $_do_stack_segment
jmp error_code
# int13 -- 一般保护性出错。
_general_protection:
pushl $_do_general_protection
jmp error_code
# int7 -- 设备不存在(_device_not_available)在(kernel/system_call.s)
# int14 -- 页错误(_page_fault)在(mm/page.s)
# int16 -- 协处理器错误(_coprocessor_error)在(kernel/system_call.s)
# 时钟中断int 0x20 (_timer_interrupt)在(kernel/system_call.s)
# 系统调用int 0x80 (_system_call)在(kernel/system_call.s)
#ifndef _BLK_H
#define _BLK_H
#define NR_BLK_DEV 7
/*
* NR_REQUEST is the number of entries in the request-queue.
* NOTE that writes may use only the low 2/3 of these: reads
* take precedence.
*
* 32 seems to be a reasonable number: enough to get some benefit
* from the elevator-mechanism, but not so much as to lock a lot of
* buffers when they are in the queue. 64 seems to be too many (easily
* long pauses in reading when heavy writing/syncing is going on)
*/
/*
* 下面定义的NR_REQUEST 是请求队列中所包含的项数。
* 注意,读操作仅使用这些项低端的2/3;读操作优先处理。
*
* 32 项好象是一个合理的数字:已经足够从电梯算法中获得好处,
* 但当缓冲区在队列中而锁住时又不显得是很大的数。64 就看上
* 去太大了(当大量的写/同步操作运行时很容易引起长时间的暂停)。
*/
#define NR_REQUEST 32
/*
* Ok, this is an expanded form so that we can use the same
* request for paging requests when that is implemented. In
* paging, 'bh' is NULL, and 'waiting' is used to wait for
* read/write completion.
*/
/*
* OK,下面是request 结构的一个扩展形式,因而当实现以后,我们就可以在分页请求中
* 使用同样的request 结构。在分页处理中,'bh'是NULL,而'waiting'则用于等待读/写的完成。
*/
// 下面是请求队列中项的结构。其中如果字段 dev=-1,则表示队列中该项没有被使用
struct request {
int dev; /* -1 if no request */ // 发请求的设备号
int cmd; /* READ or WRITE */ // READ 或WRITE命令
int errors; //操作时产生的错误次数。
unsigned long sector; // 起始扇区。(1 块=2 扇区)
unsigned long nr_sectors; // 读/写扇区数。
char * buffer; // 数据缓冲区。
struct task_struct * waiting; // 任务等待操作执行完成的地方。
struct buffer_head * bh; // 缓冲区头指针(include/linux/fs.h)。
struct request * next; // 指向下一请求项。
};
/*
* This is used in the elevator algorithm: Note that
* reads always go before writes. This is natural: reads
* are much more time-critical than writes.
*/
/*
* 下面的定义用于电梯算法:注意读操作总是在写操作之前进行。
* 这是很自然的:读操作对时间的要求要比写严格得多。
*/
#define IN_ORDER(s1,s2) \
((s1)->cmd<(s2)->cmd || ((s1)->cmd==(s2)->cmd && \
((s1)->dev < (s2)->dev || ((s1)->dev == (s2)->dev && \
(s1)->sector < (s2)->sector))))
// 块设备结构。
struct blk_dev_struct {
void (*request_fn)(void); // 请求操作的函数指针。
struct request * current_request; // 请求信息结构。
};
extern struct blk_dev_struct blk_dev[NR_BLK_DEV]; // 块设备数组,每种块设备占用一项。
extern struct request request[NR_REQUEST]; // 请求队列数组。
extern struct task_struct * wait_for_request; // 等待请求的任务结构。
#ifdef MAJOR_NR // 主设备号。
/*
* Add entries as needed. Currently the only block devices
* supported are hard-disks and floppies.
*/
/*
* 需要时加入条目。目前块设备仅支持硬盘和软盘(还有虚拟盘)。
*/
#if (MAJOR_NR == 1) // RAM 盘的主设备号是1。根据这里的定义可以推理内存块主设备号也为1。
/* ram disk */ /* RAM 盘(内存虚拟盘) */
#define DEVICE_NAME "ramdisk" // 设备名称ramdisk。
#define DEVICE_REQUEST do_rd_request // 设备请求函数do_rd_request()。
#define DEVICE_NR(device) ((device) & 7)// 设备号(0--7)。
#define DEVICE_ON(device) // 开启设备。虚拟盘无须开启和关闭。
#define DEVICE_OFF(device) // 关闭设备。
#elif (MAJOR_NR == 2) // 软驱的主设备号是2。
/* floppy */
#define DEVICE_NAME "floppy" // 设备名称floppy。
#define DEVICE_INTR do_floppy // 设备中断处理程序do_floppy()。
#define DEVICE_REQUEST do_fd_request // 设备请求函数do_fd_request()。
#define DEVICE_NR(device) ((device) & 3) // 设备号(0--3)。
#define DEVICE_ON(device) floppy_on(DEVICE_NR(device)) // 开启设备函数floppyon()。
#define DEVICE_OFF(device) floppy_off(DEVICE_NR(device)) // 关闭设备函数floppyoff()。
#elif (MAJOR_NR == 3) // 硬盘主设备号是3。
/* harddisk */
#define DEVICE_NAME "harddisk" // 硬盘名称harddisk。
#define DEVICE_INTR do_hd // 设备中断处理程序do_hd()。
#define DEVICE_REQUEST do_hd_request // 设备请求函数do_hd_request()。
#define DEVICE_NR(device) (MINOR(device)/5) // 设备号(0--1)。每个硬盘可以有4 个分区。
#define DEVICE_ON(device ) // 硬盘一直在工作,无须开启和关闭。
#define DEVICE_OFF(device)
#elif
/* unknown blk device *//* 未知块设备 */
#error "unknown blk device"
#endif
#define CURRENT (blk_dev[MAJOR_NR].current_request) // CURRENT 为指定主设备号的当前请求结构。
#define CURRENT_DEV DEVICE_NR(CURRENT->dev) // CURRENT_DEV 为CURRENT 的设备号。
#ifdef DEVICE_INTR
void (*DEVICE_INTR)(void) = NULL;
#endif
static void (DEVICE_REQUEST)(void);
// 释放锁定的缓冲区。
static inline void unlock_buffer(struct buffer_head * bh)
{
if (!bh->b_lock) // 如果指定的缓冲区bh 并没有被上锁,则显示警告信息。
printk(DEVICE_NAME ": free buffer being unlocked\n");
bh->b_lock=0; // 否则将该缓冲区解锁。
wake_up(&bh->b_wait); // 唤醒等待该缓冲区的进程。
}
// 结束请求。
static inline void end_request(int uptodate)
{
DEVICE_OFF(CURRENT->dev); // 关闭设备。
if (CURRENT->bh) {
// CURRENT 为指定主设备号的当前请求结构。
CURRENT->bh->b_uptodate = uptodate; // 置更新标志。
unlock_buffer(CURRENT->bh); // 解锁缓冲区。
}
if (!uptodate) {
// 如果更新标志为0 则显示设备错误信息。
printk(DEVICE_NAME " I/O error\n\r");
printk("dev %04x, block %d\n\r",CURRENT->dev,
CURRENT->bh->b_blocknr);
}
wake_up(&CURRENT->waiting); // 唤醒等待该请求项的进程。
wake_up(&wait_for_request); // 唤醒等待请求的进程。
CURRENT->dev = -1; // 释放该请求项。
CURRENT = CURRENT->next; // 从请求链表中删除该请求项。
}
// 定义初始化请求宏。
#define INIT_REQUEST \
repeat: \
if (!CURRENT) \
return; \
if (MAJOR(CURRENT->dev) != MAJOR_NR) \
panic(DEVICE_NAME ": request list destroyed"); \
if (CURRENT->bh) { \
if (!CURRENT->bh->b_lock) \
panic(DEVICE_NAME ": block not locked"); \
}
#endif
#endif
/*
* linux/kernel/floppy.c
*
* (C) 1991 Linus Torvalds
*/
/*
* 02.12.91 - Changed to static variables to indicate need for reset
* and recalibrate. This makes some things easier (output_byte reset
* checking etc), and means less interrupt jumping in case of errors,
* so the code is hopefully easier to understand.
*/
/*
* 02.12.91 - 修改成静态变量,以适应复位和重新校正操作。这使得某些事情
* 做起来较为方便(output_byte 复位检查等),并且意味着在出错时中断跳转
* 要少一些,所以希望代码能更容易被理解。
*/
/*
* This file is certainly a mess. I've tried my best to get it working,
* but I don't like programming floppies, and I have only one anyway.
* Urgel. I should check for more errors, and do more graceful error
* recovery. Seems there are problems with several drives. I've tried to
* correct them. No promises.
*/
/*
* 这个文件当然比较混乱。我已经尽我所能使其能够工作,但我不喜欢软驱编程,
* 而且我也只有一个软驱。另外,我应该做更多的查错工作,以及改正更多的错误。
* 对于某些软盘驱动器好象还存在一些问题。我已经尝试着进行纠正了,但不能保证
* 问题已消失。
*/
/*
* As with hd.c, all routines within this file can (and will) be called
* by interrupts, so extreme caution is needed. A hardware interrupt
* handler may not sleep, or a kernel panic will happen. Thus I cannot
* call "floppy-on" directly, but have to set a special timer interrupt
* etc.
*
* Also, I'm not certain this works on more than 1 floppy. Bugs may
* abund.
*/
/*
* 如同hd.c 文件一样,该文件中的所有子程序都能够被中断调用,所以需要特别
* 地小心。硬件中断处理程序是不能睡眠的,否则内核就会傻掉(死机)?。因此不能
* 直接调用"floppy-on",而只能设置一个特殊的时间中断等。
*
* 另外,我不能保证该程序能在多于1 个软驱的系统上工作,有可能存在错误。
*/
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/fs.h> // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/fdreg.h> // 软驱头文件。含有软盘控制器参数的一些定义。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#include <asm/io.h> // io 头文件。定义硬件端口输入/输出宏汇编语句。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#define MAJOR_NR 2 // 软驱的主设备号是2。
#include "blk.h" // 块设备头文件。定义请求数据结构、块设备数据结构和宏函数等信息。
static int recalibrate = 0; // 标志:需要重新校正。
static int reset = 0; // 标志:需要进行复位操作。
static int seek = 0; // 标志:需要执行寻道操作。
extern unsigned char current_DOR; // 当前数字输出寄存器(Digital Output Register)。
// 字节直接输出(嵌入汇编语言宏)。把值 val 输出到 port 端口.
#define immoutb_p(val,port) \
__asm__("outb %0,%1\n\tjmp 1f\n1:\tjmp 1f\n1:"::"a" ((char) (val)),"i" (port))
// 这两个定义用于计算软驱的设备号。次设备号 = TYPE*4 + DRIVE。
#define TYPE(x) ((x)>>2) // 软驱类型(2--1.2Mb,7--1.44Mb)。
#define DRIVE(x) ((x)&0x03) // 软驱序号(0--3 对应A--D)。
/*
* Note that MAX_ERRORS=8 doesn't imply that we retry every bad read
* max 8 times - some types of errors increase the errorcount by 2,
* so we might actually retry only 5-6 times before giving up.
*/
/*
* 注意,下面定义MAX_ERRORS=8 并不表示对每次读错误尝试最多8 次 - 有些类型
* 的错误将把出错计数值乘2,所以我们实际上在放弃操作之前只需尝试5-6 遍即可。
*/
#define MAX_ERRORS 8
/*
* globals used by 'result()'
*/
/* 下面是函数'result()'使用的全局变量 */
// 这些状态字节中各比特位的含义请参见include/linux/fdreg.h 头文件。
#define MAX_REPLIES 7 // FDC 最多返回7 字节的结果信息。
static unsigned char reply_buffer[MAX_REPLIES];
#define ST0 (reply_buffer[0])
#define ST1 (reply_buffer[1])
#define ST2 (reply_buffer[2])
#define ST3 (reply_buffer[3])
/*
* This struct defines the different floppy types. Unlike minix
* linux doesn't have a "search for right type"-type, as the code
* for that is convoluted and weird. I've got enough problems with
* this driver as it is.
*
* The 'stretch' tells if the tracks need to be boubled for some
* types (ie 360kB diskette in 1.2MB drive etc). Others should
* be self-explanatory.
*/
/*
* 下面的软盘结构定义了不同的软盘类型。与minix 不同的是,linux 没有
* "搜索正确的类型"-类型,因为对其处理的代码令人费解且怪怪的。本程序
* 已经让我遇到了许多的问题了。
*
* 对某些类型的软盘(例如在1.2MB 驱动器中的360kB 软盘等),'stretch'用于
* 检测磁道是否需要特殊处理。其它参数应该是自明的。
*/
// 软盘参数有:
// size 大小(扇区数);
// sect 每磁道扇区数;
// head 磁头数;
// track 磁道数;
// stretch 对磁道是否要特殊处理(标志);
// gap 扇区间隙长度(字节数);
// rate 数据传输速率;
// spec1 参数(高4 位步进速率,低四位磁头卸载时间)。
static struct floppy_struct {
unsigned int size, sect, head, track, stretch;
unsigned char gap,rate,spec1;
} floppy_type[] = {
{ 0, 0,0, 0,0,0x00,0x00,0x00 }, /* no testing */
{ 720, 9,2,40,0,0x2A,0x02,0xDF }, /* 360kB PC diskettes */
{ 2400,15,2,80,0,0x1B,0x00,0xDF }, /* 1.2 MB AT-diskettes */
{ 720, 9,2,40,1,0x2A,0x02,0xDF }, /* 360kB in 720kB drive */
{ 1440, 9,2,80,0,0x2A,0x02,0xDF }, /* 3.5" 720kB diskette */
{ 720, 9,2,40,1,0x23,0x01,0xDF }, /* 360kB in 1.2MB drive */
{ 1440, 9,2,80,0,0x23,0x01,0xDF }, /* 720kB in 1.2MB drive */
{ 2880,18,2,80,0,0x1B,0x00,0xCF }, /* 1.44MB diskette */
};
/*
* Rate is 0 for 500kb/s, 2 for 300kbps, 1 for 250kbps
* Spec1 is 0xSH, where S is stepping rate (F=1ms, E=2ms, D=3ms etc),
* H is head unload time (1=16ms, 2=32ms, etc)
*
* Spec2 is (HLD<<1 | ND), where HLD is head load time (1=2ms, 2=4 ms etc)
* and ND is set means no DMA. Hardcoded to 6 (HLD=6ms, use DMA).
*/
/*
* 上面速率rate:0 表示500kb/s,1 表示300kbps,2 表示250kbps。
* 参数spec1 是0xSH,其中S 是步进速率(F-1 毫秒,E-2ms,D=3ms 等),
* H 是磁头卸载时间(1=16ms,2=32ms 等)
*
* spec2 是(HLD<<1 | ND),其中HLD 是磁头加载时间(1=2ms,2=4ms 等)
* ND 置位表示不使用DMA(No DMA),在程序中硬编码成6(HLD=6ms,使用DMA)。
*/
extern void floppy_interrupt(void);
extern char tmp_floppy_area[1024];
/*
* These are global variables, as that's the easiest way to give
* information to interrupts. They are the data used for the current
* request.
*/
/*
* 下面是一些全局变量,因为这是将信息传给中断程序最简单的方式。它们是
* 用于当前请求的数据。
*/
static int cur_spec1 = -1;
static int cur_rate = -1;
static struct floppy_struct * floppy = floppy_type;
static unsigned char current_drive = 0;
static unsigned char sector = 0;
static unsigned char head = 0;
static unsigned char track = 0;
static unsigned char seek_track = 0;
static unsigned char current_track = 255;
static unsigned char command = 0;
unsigned char selected = 0;
struct task_struct * wait_on_floppy_select = NULL;
//// 释放(取消选定的)软盘(软驱)。
// 数字输出寄存器(DOR)的低2 位用于指定选择的软驱(0-3 对应A-D)。
void floppy_deselect(unsigned int nr)
{
if (nr != (current_DOR & 3))
printk("floppy_deselect: drive not selected\n\r");
selected = 0;
wake_up(&wait_on_floppy_select);
}
/*
* floppy-change is never called from an interrupt, so we can relax a bit
* here, sleep etc. Note that floppy-on tries to set current_DOR to point
* to the desired drive, but it will probably not survive the sleep if
* several floppies are used at the same time: thus the loop.
*/
/*
* floppy-change()不是从中断程序中调用的,所以这里我们可以轻松一下,睡觉等。
* 注意floppy-on()会尝试设置current_DOR 指向所需的驱动器,但当同时使用几个
* 软盘时不能睡眠:因此此时只能使用循环方式。
*/
//// 检测指定软驱中软盘更换情况。如果软盘更换了则返回1,否则返回0。
int floppy_change(unsigned int nr)
{
repeat:
floppy_on(nr); // 开启指定软驱nr(kernel/sched.c)。
// 如果当前选择的软驱不是指定的软驱nr,并且已经选择其它了软驱,则让当前任务进入可中断
// 等待状态。
while ((current_DOR & 3) != nr && selected)
interruptible_sleep_on(&wait_on_floppy_select);
// 如果当前没有选择其它软驱或者当前任务被唤醒时,当前软驱仍然不是指定的软驱nr,则循环等待。
if ((current_DOR & 3) != nr)
goto repeat;
// 取数字输入寄存器值,如果最高位(位7)置位,则表示软盘已更换,此时关闭马达并退出返回1。
// 否则关闭马达退出返回0。
if (inb(FD_DIR) & 0x80) {
floppy_off(nr);
return 1;
}
floppy_off(nr);
return 0;
}
//// 复制内存块。
#define copy_buffer(from,to) \
__asm__("cld ; rep ; movsl" \
::"c" (BLOCK_SIZE/4),"S" ((long)(from)),"D" ((long)(to)) \
)
//// 设置(初始化)软盘DMA 通道。
static void setup_DMA(void)
{
long addr = (long) CURRENT->buffer; // 当前请求项缓冲区所处内存中位置(地址)。
cli();
// 如果缓冲区处于内存1M 以上的地方,则将DMA 缓冲区设在临时缓冲区域(tmp_floppy_area 数组)
// (因为8237A 芯片只能在1M 地址范围内寻址)。如果是写盘命令,则还需将数据复制到该临时区域。
if (addr >= 0x100000) {
addr = (long) tmp_floppy_area;
if (command == FD_WRITE)
copy_buffer(CURRENT->buffer,tmp_floppy_area);
}
/* mask DMA 2 */
// 单通道屏蔽寄存器端口为0x10。位0-1 指定DMA 通道(0--3),位2:1 表示屏蔽,0 表示允许请求。
immoutb_p(4|2,10);
/* output command byte. I don't know why, but everyone (minix, */
/* sanches & canton) output this twice, first to 12 then to 11 */
/* 输出命令字节。我是不知道为什么,但是每个人(minix,*/
/* sanches 和canton)都输出两次,首先是12 口,然后是11 口 */
// 下面嵌入汇编代码向DMA 控制器端口12 和11 写方式字(读盘0x46,写盘0x4A)。
__asm__("outb %%al,$12\n\tjmp 1f\n1:\tjmp 1f\n1:\t"
"outb %%al,$11\n\tjmp 1f\n1:\tjmp 1f\n1:"::
"a" ((char) ((command == FD_READ)?DMA_READ:DMA_WRITE)));
/* 8 low bits of addr *//* 地址低0-7 位 */
// 向DMA 通道2 写入基/当前地址寄存器(端口4)。
immoutb_p(addr,4);
addr >>= 8;
/* bits 8-15 of addr *//* 地址高8-15 位 */
immoutb_p(addr,4);
addr >>= 8;
/* bits 16-19 of addr *//* 地址16-19 位 */
// DMA 只可以在1M 内存空间内寻址,其高16-19 位地址需放入页面寄存器(端口0x81)。
immoutb_p(addr,0x81);
/* low 8 bits of count-1 (1024-1=0x3ff) *//* 计数器低8 位(1024-1=0x3ff) */
// 向DMA 通道2 写入基/当前字节计数器值(端口5)。
immoutb_p(0xff,5);
/* high 8 bits of count-1 *//* 计数器高8 位 */
// 一次共传输1024 字节(两个扇区)。
immoutb_p(3,5);
/* activate DMA 2 *//* 开启DMA 通道2 的请求 */
// 复位对DMA 通道2 的屏蔽,开放DMA2 请求DREQ 信号。
immoutb_p(0|2,10);
sti();
}
//// 向软盘控制器输出一个字节数据(命令或参数)。
static void output_byte(char byte)
{
int counter;
unsigned char status;
if (reset)
return;
// 循环读取主状态控制器FD_STATUS(0x3f4)的状态。如果状态是STATUS_READY 并且STATUS_DIR=0
// (CPU->FDC),则向数据端口输出指定字节。
for(counter = 0 ; counter < 10000 ; counter++) {
status = inb_p(FD_STATUS) & (STATUS_READY | STATUS_DIR);
if (status == STATUS_READY) {
outb(byte,FD_DATA);
return;
}
}
// 如果到循环1 万次结束还不能发送,则置复位标志,并打印出错信息。
reset = 1;
printk("Unable to send byte to FDC\n\r");
}
//// 读取FDC 执行的结果信息。
// 结果信息最多7 个字节,存放在reply_buffer[]中。返回读入的结果字节数,若返回值=-1
// 表示出错。
static int result(void)
{
int i = 0, counter, status;
if (reset)
return -1;
for (counter = 0 ; counter < 10000 ; counter++) {
status = inb_p(FD_STATUS)&(STATUS_DIR|STATUS_READY|STATUS_BUSY);
if (status == STATUS_READY)
return i;
if (status == (STATUS_DIR|STATUS_READY|STATUS_BUSY)) {
if (i >= MAX_REPLIES)
break;
reply_buffer[i++] = inb_p(FD_DATA);
}
}
reset = 1;
printk("Getstatus times out\n\r");
return -1;
}
//// 软盘操作出错中断调用函数。由软驱中断处理程序调用。
static void bad_flp_intr(void)
{
CURRENT->errors++; // 当前请求项出错次数增1。
// 如果当前请求项出错次数大于最大允许出错次数,则取消选定当前软驱,并结束该请求项(不更新)。
if (CURRENT->errors > MAX_ERRORS) {
floppy_deselect(current_drive);
end_request(0);
}
// 如果当前请求项出错次数大于最大允许出错次数的一半,则置复位标志,需对软驱进行复位操作,
// 然后再试。否则软驱需重新校正一下,再试。
if (CURRENT->errors > MAX_ERRORS/2)
reset = 1;
else
recalibrate = 1;
}
/*
* Ok, this interrupt is called after a DMA read/write has succeeded,
* so we check the results, and copy any buffers.
*/
/*
* OK,下面该中断处理函数是在DMA 读/写成功后调用的,这样我们就可以检查执行结果,
* 并复制缓冲区中的数据。
*/
//// 软盘读写操作成功中断调用函数。。
static void rw_interrupt(void)
{
// 如果返回结果字节数不等于7,或者状态字节0、1 或2 中存在出错标志,则若是写保护
// 就显示出错信息,释放当前驱动器,并结束当前请求项。否则就执行出错计数处理。
// 然后继续执行软盘请求操作。
// ( 0xf8 = ST0_INTR | ST0_SE | ST0_ECE | ST0_NR )
// ( 0xbf = ST1_EOC | ST1_CRC | ST1_OR | ST1_ND | ST1_WP | ST1_MAM,应该是0xb7)
// ( 0x73 = ST2_CM | ST2_CRC | ST2_WC | ST2_BC | ST2_MAM )
if (result() != 7 || (ST0 & 0xf8) || (ST1 & 0xbf) || (ST2 & 0x73)) {
if (ST1 & 0x02) {
printk("Drive %d is write protected\n\r",current_drive);
floppy_deselect(current_drive);
end_request(0);
} else
bad_flp_intr();
do_fd_request();
return;
}
// 如果当前请求项的缓冲区位于1M 地址以上,则说明此次软盘读操作的内容还放在临时缓冲区内,
// 需要复制到请求项的缓冲区中(因为DMA 只能在1M 地址范围寻址)。
if (command == FD_READ && (unsigned long)(CURRENT->buffer) >= 0x100000)
copy_buffer(tmp_floppy_area,CURRENT->buffer);
// 释放当前软盘,结束当前请求项(置更新标志),再继续执行其它软盘请求项。
floppy_deselect(current_drive);
end_request(1);
do_fd_request();
}
//// 设置DMA 并输出软盘操作命令和参数(输出1 字节命令+ 0~7 字节参数)。
inline void setup_rw_floppy(void)
{
setup_DMA (); // 初始化软盘DMA 通道。
do_floppy = rw_interrupt; // 置软盘中断调用函数指针。
output_byte (command); // 发送命令字节。
output_byte (head << 2 | current_drive); // 发送参数(磁头号+驱动器号)。
output_byte (track); // 发送参数(磁道号)。
output_byte (head); // 发送参数(磁头号)。
output_byte (sector); // 发送参数(起始扇区号)。
output_byte (2); /* sector size = 512 */
// 发送参数(字节数(N=2)512 字节)。
output_byte (floppy->sect); // 发送参数(每磁道扇区数)。
output_byte (floppy->gap); // 发送参数(扇区间隔长度)。
output_byte (0xFF); /* sector size (0xff when n!=0 ?) */
// 发送参数(当N=0 时,扇区定义的字节长度),这里无用。
// 若在发送命令和参数时发生错误,则继续执行下一软盘操作请求。
if (reset)
do_fd_request();
}
/*
* This is the routine called after every seek (or recalibrate) interrupt
* from the floppy controller. Note that the "unexpected interrupt" routine
* also does a recalibrate, but doesn't come here.
*/
/*
* 该子程序是在每次软盘控制器寻道(或重新校正)中断后被调用的。注意
* "unexpected interrupt"(意外中断)子程序也会执行重新校正操作,但不在此地。
*/
//// 寻道处理中断调用函数。
// 首先发送检测中断状态命令,获得状态信息ST0 和磁头所在磁道信息。若出错则执行错误计数
// 检测处理或取消本次软盘操作请求项。否则根据状态信息设置当前磁道变量,然后调用函数
// setup_rw_floppy()设置DMA 并输出软盘读写命令和参数。
static void seek_interrupt(void)
{
/* sense drive status *//* 检测中断状态 */
// 发送检测中断状态命令,该命令不带参数。返回结果信息两个字节:ST0 和磁头当前磁道号。
output_byte(FD_SENSEI);
// 如果返回结果字节数不等于2,或者ST0 不为寻道结束,或者磁头所在磁道(ST1)不等于设定磁道,
// 则说明发生了错误,于是执行检测错误计数处理,然后继续执行软盘请求项,并退出。
if (result() != 2 || (ST0 & 0xF8) != 0x20 || ST1 != seek_track) {
bad_flp_intr();
do_fd_request();
return;
}
current_track = ST1; // 设置当前磁道。
setup_rw_floppy (); // 设置DMA 并输出软盘操作命令和参数。
}
/*
* This routine is called when everything should be correctly set up
* for the transfer (ie floppy motor is on and the correct floppy is
* selected).
*/
/*
* 该函数是在传输操作的所有信息都正确设置好后被调用的(也即软驱马达已开启
* 并且已选择了正确的软盘(软驱)。
*/
//// 读写数据传输函数。
static void transfer(void)
{
// 首先看当前驱动器参数是否就是指定驱动器的参数,若不是就发送设置驱动器参数命令及相应
// 参数(参数1:高4 位步进速率,低四位磁头卸载时间;参数2:磁头加载时间)。
if (cur_spec1 != floppy->spec1) {
cur_spec1 = floppy->spec1;
output_byte(FD_SPECIFY); // 发送设置磁盘参数命令。
output_byte(cur_spec1); /* hut etc */// 发送参数
output_byte(6); /* Head load time =6ms, DMA */
}
// 判断当前数据传输速率是否与指定驱动器的一致,若不是就发送指定软驱的速率值到数据传输
// 速率控制寄存器(FD_DCR)。
if (cur_rate != floppy->rate)
outb_p(cur_rate = floppy->rate,FD_DCR);
// 若返回结果信息表明出错,则再调用软盘请求函数,并返回。
if (reset) {
do_fd_request();
return;
}
// 若寻道标志为零(不需要寻道),则设置DMA 并发送相应读写操作命令和参数,然后返回。
if (!seek) {
setup_rw_floppy();
return;
}
// 否则执行寻道处理。置软盘中断处理调用函数为寻道中断函数。
do_floppy = seek_interrupt;
// 如果器始磁道号不等于零则发送磁头寻道命令和参数
if (seek_track) {
output_byte(FD_SEEK); // 发送磁头寻道命令。
output_byte(head<<2 | current_drive); //发送参数:磁头号+当前软驱号。
output_byte(seek_track); // 发送参数:磁道号。
} else {
output_byte(FD_RECALIBRATE); // 发送重新校正命令。
output_byte(head<<2 | current_drive); //发送参数:磁头号+当前软驱号。
}
// 如果复位标志已置位,则继续执行软盘请求项。
if (reset)
do_fd_request();
}
/*
* Special case - used after a unexpected interrupt (or reset)
*/
/*
* 特殊情况 - 用于意外中断(或复位)处理后。
*/
//// 软驱重新校正中断调用函数。
// 首先发送检测中断状态命令(无参数),如果返回结果表明出错,则置复位标志,否则复位重新
// 校正标志。然后再次执行软盘请求。
static void recal_interrupt(void)
{
output_byte(FD_SENSEI); // 发送检测中断状态命令。
if (result()!=2 || (ST0 & 0xE0) == 0x60)// 如果返回结果字节数不等于2 或命令
reset = 1; // 异常结束,则置复位标志。
else // 否则复位重新校正标志。
recalibrate = 0;
do_fd_request(); // 执行软盘请求项。
}
//// 意外软盘中断请求中断调用函数。
// 首先发送检测中断状态命令(无参数),如果返回结果表明出错,则置复位标志,否则置重新
// 校正标志。
void unexpected_floppy_interrupt(void)
{
output_byte(FD_SENSEI); // 发送检测中断状态命令。
if (result()!=2 || (ST0 & 0xE0) == 0x60)// 如果返回结果字节数不等于2 或命令
reset = 1; // 异常结束,则置复位标志。
else // 否则置重新校正标志。
recalibrate = 1;
}
//// 软盘重新校正处理函数。
// 向软盘控制器FDC 发送重新校正命令和参数,并复位重新校正标志。
static void recalibrate_floppy(void)
{
recalibrate = 0; // 复位重新校正标志。
current_track = 0; // 当前磁道号归零。
do_floppy = recal_interrupt; // 置软盘中断调用函数指针指向重新校正调用函数。
output_byte(FD_RECALIBRATE); // 发送命令:重新校正。
output_byte(head<<2 | current_drive); // 发送参数:(磁头号加)当前驱动器号
if (reset) // 如果出错(复位标志被置位)则继续执行软盘请求。
do_fd_request();
}
//// 软盘控制器FDC 复位中断调用函数。在软盘中断处理程序中调用。
// 首先发送检测中断状态命令(无参数),然后读出返回的结果字节。接着发送设定软驱参数命令
// 和相关参数,最后再次调用执行软盘请求。
static void reset_interrupt(void)
{
output_byte(FD_SENSEI); // 发送检测中断状态命令。
(void) result(); // 读取命令执行结果字节。
output_byte(FD_SPECIFY); // 发送设定软驱参数命令。
output_byte(cur_spec1); /* hut etc */// 发送参数。
output_byte(6); /* Head load time =6ms, DMA */
do_fd_request(); // 调用执行软盘请求。
}
/*
* reset is done by pulling bit 2 of DOR low for a while.
*/
/* FDC 复位是通过将数字输出寄存器(DOR)位2 置0 一会儿实现的 */
//// 复位软盘控制器。
static void reset_floppy(void)
{
int i;
reset = 0; // 复位标志置0。
cur_spec1 = -1;
cur_rate = -1;
recalibrate = 1; // 重新校正标志置位。
printk("Reset-floppy called\n\r"); // 显示执行软盘复位操作信息。
cli();
do_floppy = reset_interrupt; // 设置在软盘中断处理程序中调用的函数。
outb_p(current_DOR & ~0x04,FD_DOR); // 对软盘控制器FDC 执行复位操作。
for (i=0 ; i<100 ; i++) // 空操作,延迟。
__asm__("nop");
outb(current_DOR,FD_DOR); // 再启动软盘控制器。
sti();
}
//// 软驱启动定时中断调用函数。
// 首先检查数字输出寄存器(DOR),使其选择当前指定的驱动器。然后调用执行软盘读写传输
// 函数transfer()。
static void floppy_on_interrupt(void)
{
/* We cannot do a floppy-select, as that might sleep. We just force it */
/* 我们不能任意设置选择的软驱,因为这样做可能会引起进程睡眠。我们只是迫使它自己选择 */
selected = 1; // 置已选择当前驱动器标志。
// 如果当前驱动器号与数字输出寄存器DOR 中的不同,则重新设置DOR 为当前驱动器current_drive。
// 定时延迟2 个滴答时间,然后调用软盘读写传输函数transfer()。否则直接调用软盘读写传输函数。
if (current_drive != (current_DOR & 3)) {
current_DOR &= 0xFC;
current_DOR |= current_drive;
outb(current_DOR,FD_DOR); // 向数字输出寄存器输出当前DOR。
add_timer(2,&transfer); // 添加定时器并执行传输函数。
} else
transfer(); // 执行软盘读写传输函数。
}
//// 软盘读写请求项处理函数。
//
void do_fd_request(void)
{
unsigned int block;
seek = 0;
// 如果复位标志已置位,则执行软盘复位操作,并返回。
if (reset) {
reset_floppy();
return;
}
// 如果重新校正标志已置位,则执行软盘重新校正操作,并返回。
if (recalibrate) {
recalibrate_floppy();
return;
}
INIT_REQUEST; // 检测请求项的合法性(参见kernel/blk_drv/blk.h)。
floppy = (MINOR(CURRENT->dev)>>2) + floppy_type; // 将请求项结构中软盘设备号中的软盘类型(MINOR(CURRENT->dev)>>2)作为索引取得软盘参数块。
// 如果当前驱动器不是请求项中指定的驱动器,则置标志 seek,表示需要进行寻道操作。
// 然后置请求项设备为当前驱动器。
if (current_drive != CURRENT_DEV)
seek = 1;
current_drive = CURRENT_DEV;
// 设置读写起始扇区。因为每次读写是以块为单位(1 块2 个扇区),所以起始扇区需要起码比
// 磁盘总扇区数小2 个扇区。否则结束该次软盘请求项,执行下一个请求项。
block = CURRENT->sector; // 取当前软盘请求项中起始扇区号。
if (block+2 > floppy->size) { // 如果block+2 大于磁盘扇区总数,则
end_request(0); // 结束本次软盘请求项。
goto repeat;
}
// 求对应在磁道上的扇区号,磁头号,磁道号,搜寻磁道号(对于软驱读不同格式的盘)。
sector = block % floppy->sect; // 起始扇区对每磁道扇区数取模,得磁道上扇区号。
block /= floppy->sect; // 起始扇区对每磁道扇区数取整,得起始磁道数。
head = block % floppy->head; // 起始磁道数对磁头数取模,得操作的磁头号。
track = block / floppy->head; // 起始磁道数对磁头数取整,得操作的磁道号。
seek_track = track << floppy->stretch; // 相应于驱动器中盘类型进行调整,得寻道号。
// 如果寻道号与当前磁头所在磁道不同,则置需要寻道标志seek。
if (seek_track != current_track)
seek = 1;
sector++; // 磁盘上实际扇区计数是从1 算起。
if (CURRENT->cmd == READ) // 如果请求项中是读操作,则置软盘读命令码。
command = FD_READ;
else if (CURRENT->cmd == WRITE) // 如果请求项中是写操作,则置软盘写命令码。
command = FD_WRITE;
else
panic("do_fd_request: unknown command");
// 添加定时器,用于指定驱动器到能正常运行所需延迟的时间(滴答数),当定时时间到时就调用
// 函数floppy_on_interrupt()
add_timer(ticks_to_floppy_on(current_drive),&floppy_on_interrupt);
}
//// 软盘系统初始化。
// 设置软盘块设备的请求处理函数(do_fd_request()),并设置软盘中断门(int 0x26,对应硬件
// 中断请求信号IRQ6),然后取消对该中断信号的屏蔽,允许软盘控制器FDC 发送中断请求信号。
void floppy_init(void)
{
blk_dev[MAJOR_NR].request_fn = DEVICE_REQUEST; // = do_fd_request()。
set_trap_gate(0x26,&floppy_interrupt); // 设置软盘中断门 int 0x26(38)。
outb(inb_p(0x21)&~0x40,0x21); // 复位软盘的中断请求屏蔽位,允许
}
/*
* linux/kernel/hd.c
*
* (C) 1991 Linus Torvalds
*/
/*
* This is the low-level hd interrupt support. It traverses the
* request-list, using interrupts to jump between functions. As
* all the functions are called within interrupts, we may not
* sleep. Special care is recommended.
*
* modified by Drew Eckhardt to check nr of hd's from the CMOS.
*/
/*
* 本程序是底层硬盘中断辅助程序。主要用于扫描请求列表,使用中断在函数之间跳转。
* 由于所有的函数都是在中断里调用的,所以这些函数不可以睡眠。请特别注意。
* 由Drew Eckhardt 修改,利用CMOS 信息检测硬盘数。
*/
#include <linux/config.h> // 内核配置头文件。定义键盘语言和硬盘类型(HD_TYPE)可选项。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/fs.h> // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/hdreg.h> // 硬盘参数头文件。定义访问硬盘寄存器端口,状态码,分区表等信息。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#include <asm/io.h> // io 头文件。定义硬件端口输入/输出宏汇编语句。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#define MAJOR_NR 3 // 硬盘主设备号是3。
#include "blk.h" // 块设备头文件。定义请求数据结构、块设备数据结构和宏函数等信息。
// 读CMOS 参数宏函数
#define CMOS_READ(addr) ({ \
outb_p(0x80|addr,0x70); \
inb_p(0x71); \
})
/* Max read/write errors/sector */
/* 每扇区读/写操作允许的最多出错次数 */
#define MAX_ERRORS 7 // 读/写一个扇区时允许的最多出错次数。
#define MAX_HD 2 // 系统支持的最多硬盘数。
static void recal_intr(void); // 硬盘中断程序在复位操作时会调用的重新校正函数。
static int recalibrate = 1; // 重新校正标志。
static int reset = 1; // 复位标志。
/*
* This struct defines the HD's and their types.
*/
/* 下面结构定义了硬盘参数及类型 */
// 各字段分别是磁头数、每磁道扇区数、柱面数、写前预补偿柱面号、磁头着陆区柱面号、控制字节。
struct hd_i_struct {
int head,sect,cyl,wpcom,lzone,ctl;
};
#ifdef HD_TYPE // 如果已经在include/linux/config.h 中定义了HD_TYPE…
struct hd_i_struct hd_info[] = { HD_TYPE };
#define NR_HD ((sizeof (hd_info))/(sizeof (struct hd_i_struct))) // 计算硬盘数。
#else // 否则,都设为0 值。
struct hd_i_struct hd_info[] = { {0,0,0,0,0,0},{0,0,0,0,0,0} };
static int NR_HD = 0;
#endif
// 定义硬盘分区结构。给出每个分区的物理起始扇区号、分区扇区总数。
// 其中5 的倍数处的项(例如hd[0]和hd[5]等)代表整个硬盘中的参数。
static struct hd_struct {
long start_sect;
long nr_sects;
} hd[5*MAX_HD]={{0,0},};
// 读端口port,共读nr 字,保存在buf 中。
#define port_read(port,buf,nr) \
__asm__("cld;rep;insw"::"d" (port),"D" (buf),"c" (nr))
// 写端口port,共写nr 字,从buf 中取数据。
#define port_write(port,buf,nr) \
__asm__("cld;rep;outsw"::"d" (port),"S" (buf),"c" (nr))
extern void hd_interrupt(void); // 硬盘中断过程(system_call.s)
extern void rd_load(void); // 虚拟盘创建加载函数(ramdisk.c)
/* This may be used only once, enforced by 'static int callable' */
/* 下面该函数只在初始化时被调用一次。用静态变量callable 作为可调用标志。*/
// 该函数的参数由初始化程序init/main.c 的init 子程序设置为指向0x90080 处,此处存放着setup.s
// 程序从BIOS 取得的2 个硬盘的基本参数表(32 字节)。硬盘参数表信息参见下面列表后的说明。
// 本函数主要功能是读取CMOS 和硬盘参数表信息,用于设置硬盘分区结构hd,并加载RAM 虚拟盘和
// 根文件系统。
int sys_setup(void * BIOS)
{
static int callable = 1;
int i,drive;
unsigned char cmos_disks;
struct partition *p;
struct buffer_head * bh;
// 初始化时callable=1,当运行该函数时将其设置为0,使本函数只能执行一次。
if (!callable)
return -1;
callable = 0;
// 如果没有在config.h 中定义硬盘参数,就从0x90080 处读入。
#ifndef HD_TYPE
for (drive=0 ; drive<2 ; drive++) {
hd_info[drive].cyl = *(unsigned short *) BIOS; // 柱面数。
hd_info[drive].head = *(unsigned char *) (2+BIOS); // 磁头数。
hd_info[drive].wpcom = *(unsigned short *) (5+BIOS); // 写前预补偿柱面号。
hd_info[drive].ctl = *(unsigned char *) (8+BIOS); // 控制字节。
hd_info[drive].lzone = *(unsigned short *) (12+BIOS); // 磁头着陆区柱面号。
hd_info[drive].sect = *(unsigned char *) (14+BIOS); // 每磁道扇区数
BIOS += 16; // 每个硬盘的参数表长16 字节,这里BIOS 指向下一个表。
}
// setup.s 程序在取BIOS 中的硬盘参数表信息时,如果只有1 个硬盘,就会将对应第2 个硬盘的
// 16 字节全部清零。因此这里只要判断第2 个硬盘柱面数是否为0 就可以知道有没有第2 个硬盘了。
if (hd_info[1].cyl)
NR_HD=2; // 硬盘数置为2。
else
NR_HD=1;
#endif
// 设置每个硬盘的起始扇区号和扇区总数。
for (i=0 ; i<NR_HD ; i++) {
hd[i*5].start_sect = 0;
hd[i*5].nr_sects = hd_info[i].head*
hd_info[i].sect*hd_info[i].cyl;
}
/*
We querry CMOS about hard disks : it could be that
we have a SCSI/ESDI/etc controller that is BIOS
compatable with ST-506, and thus showing up in our
BIOS table, but not register compatable, and therefore
not present in CMOS.
Furthurmore, we will assume that our ST-506 drives
<if any> are the primary drives in the system, and
the ones reflected as drive 1 or 2.
The first drive is stored in the high nibble of CMOS
byte 0x12, the second in the low nibble. This will be
either a 4 bit drive type or 0xf indicating use byte 0x19
for an 8 bit type, drive 1, 0x1a for drive 2 in CMOS.
Needless to say, a non-zero value means we have
an AT controller hard disk for that drive.
*/
/*
* 我们对CMOS 有关硬盘的信息有些怀疑:可能会出现这样的情况,我们有一块SCSI/ESDI/等的
* 控制器,它是以ST-506 方式与BIOS 兼容的,因而会出现在我们的BIOS 参数表中,但却又不
* 是寄存器兼容的,因此这些参数在CMOS 中又不存在。
*
* 另外,我们假设ST-506 驱动器(如果有的话)是系统中的基本驱动器,也即以驱动器1 或2
* 出现的驱动器。
*
* 第1 个驱动器参数存放在CMOS 字节0x12 的高半字节中,第2 个存放在低半字节中。该4 位字节
* 信息可以是驱动器类型,也可能仅是0xf。0xf 表示使用CMOS 中0x19 字节作为驱动器1 的8 位
* 类型字节,使用CMOS 中0x1A 字节作为驱动器2 的类型字节。
*
* 总之,一个非零值意味着我们有一个AT 控制器硬盘兼容的驱动器。
*/
// 这里根据上述原理来检测硬盘到底是否是AT 控制器兼容的。
if ((cmos_disks = CMOS_READ(0x12)) & 0xf0)
if (cmos_disks & 0x0f)
NR_HD = 2;
else
NR_HD = 1;
else
NR_HD = 0;
// 若NR_HD=0,则两个硬盘都不是AT 控制器兼容的,硬盘数据结构清零。
// 若NR_HD=1,则将第2 个硬盘的参数清零。
for (i = NR_HD ; i < 2 ; i++) {
hd[i*5].start_sect = 0;
hd[i*5].nr_sects = 0;
}
// 读取每一个硬盘上第1 块数据(第1 个扇区有用),获取其中的分区表信息。
// 首先利用函数bread()读硬盘第1 块数据(fs/buffer.c),参数中的0x300 是硬盘的主设备号
// 然后根据硬盘头1 个扇区位置0x1fe 处的两个字节是否为'55AA'来判断
// 该扇区中位于0x1BE 开始的分区表是否有效。最后将分区表信息放入硬盘分区数据结构hd 中。
for (drive=0 ; drive<NR_HD ; drive++) {
if (!(bh = bread(0x300 + drive*5,0))) {
// 0x300, 0x305 逻辑设备号。
printk("Unable to read partition table of drive %d\n\r",
drive);
panic("");
}
if (bh->b_data[510] != 0x55 || (unsigned char)
bh->b_data[511] != 0xAA) {
// 判断硬盘信息有效标志'55AA'。
printk("Bad partition table on drive %d\n\r",drive);
panic("");
}
p = 0x1BE + (void *)bh->b_data; // 分区表位于硬盘第1 扇区的0x1BE 处。
for (i=1;i<5;i++,p++) {
hd[i+5*drive].start_sect = p->start_sect;
hd[i+5*drive].nr_sects = p->nr_sects;
}
brelse(bh); // 释放为存放硬盘块而申请的内存缓冲区页。
}
if (NR_HD) // 如果有硬盘存在并且已读入分区表,则打印分区表正常信息。
printk("Partition table%s ok.\n\r",(NR_HD>1)?"s":"");
rd_load(); // 加载(创建)RAMDISK(kernel/blk_drv/ramdisk.c)。
mount_root(); // 安装根文件系统(fs/super.c)。
return (0);
}
//// 判断并循环等待驱动器就绪。
// 读硬盘控制器状态寄存器端口HD_STATUS(0x1f7),并循环检测驱动器就绪比特位和控制器忙位。
static int controller_ready(void)
{
int retries=10000;
while (--retries && (inb_p(HD_STATUS)&0xc0)!=0x40);
return (retries); // 返回等待循环的次数。
}
//// 检测硬盘执行命令后的状态。(win_表示温切斯特硬盘的缩写)
// 读取状态寄存器中的命令执行结果状态。返回0 表示正常,1 出错。如果执行命令错,
// 则再读错误寄存器HD_ERROR(0x1f1)。
static int win_result(void)
{
int i=inb_p(HD_STATUS);
if ((i & (BUSY_STAT | READY_STAT | WRERR_STAT | SEEK_STAT | ERR_STAT))
== (READY_STAT | SEEK_STAT))
return(0); /* ok */
if (i&1) i=inb(HD_ERROR); // 若ERR_STAT 置位,则读取错误寄存器。
return (1);
}
//// 向硬盘控制器发送命令块(参见列表后的说明)。
// 调用参数:drive - 硬盘号(0-1); nsect - 读写扇区数;
// sect - 起始扇区; head - 磁头号;
// cyl - 柱面号; cmd - 命令码;
// *intr_addr() - 硬盘中断处理程序中将调用的C 处理函数。
static void hd_out(unsigned int drive,unsigned int nsect,unsigned int sect,
unsigned int head,unsigned int cyl,unsigned int cmd,
void (*intr_addr)(void))
{
register int port asm("dx"); // port 变量对应寄存器dx。
if (drive>1 || head>15) // 如果驱动器号(0,1)>1 或磁头号>15,则程序不支持。
panic("Trying to write bad sector");
if (!controller_ready()) // 如果等待一段时间后仍未就绪则出错,死机。
panic("HD controller not ready");
do_hd = intr_addr; // do_hd 函数指针将在硬盘中断程序中被调用。
outb_p(hd_info[drive].ctl,HD_CMD); // 向控制寄存器(0x3f6)输出控制字节。
port=HD_DATA; // 置dx 为数据寄存器端口(0x1f0)。
outb_p(hd_info[drive].wpcom>>2,++port); // 参数:写预补偿柱面号(需除4)。
outb_p(nsect,++port); // 参数:读/写扇区总数。
outb_p(sect,++port); // 参数:起始扇区。
outb_p(cyl,++port); // 参数:柱面号低8 位。
outb_p(cyl>>8,++port); // 参数:柱面号高8 位。
outb_p(0xA0|(drive<<4)|head,++port); // 参数:驱动器号+磁头号。
outb(cmd,++port); // 命令:硬盘控制命令。
}
//// 等待硬盘就绪。也即循环等待主状态控制器忙标志位复位。若仅有就绪或寻道结束标志
// 置位,则成功,返回0。若经过一段时间仍为忙,则返回1。
static int drive_busy(void)
{
unsigned int i;
for (i = 0; i < 10000; i++) // 循环等待就绪标志位置位
if (READY_STAT == (inb_p(HD_STATUS) & (BUSY_STAT|READY_STAT)))
break;
i = inb(HD_STATUS); // 再取主控制器状态字节。
i &= BUSY_STAT | READY_STAT | SEEK_STAT;// 检测忙位、就绪位和寻道结束位。
if (i == (READY_STAT | SEEK_STAT)) // 若仅有就绪或寻道结束标志,则返回0。
return(0);
printk("HD controller times out\n\r"); // 否则等待超时,显示信息。并返回1。
return(1);
}
//// 诊断复位(重新校正)硬盘控制器。
static void reset_controller(void)
{
int i;
outb (4, HD_CMD); // 向控制寄存器端口发送控制字节(4-复位)。
for (i = 0; i < 100; i++)
nop (); // 等待一段时间(循环空操作)。
outb (hd_info[0].ctl & 0x0f, HD_CMD); // 再发送正常的控制字节(不禁止重试、重读)。
if (drive_busy ()) // 若等待硬盘就绪超时,则显示出错信息。
printk ("HD-controller still busy\n\r");
if ((i = inb (HD_ERROR)) != 1) // 取错误寄存器,若不等于1(无错误)则出错。
printk ("HD-controller reset failed: %02x\n\r", i);
}
//// 复位硬盘nr。首先复位(重新校正)硬盘控制器。然后发送硬盘控制器命令“建立驱动器参数”,
// 其中recal_intr()是在硬盘中断处理程序中调用的重新校正处理函数。
static void reset_hd(int nr)
{
reset_controller();
hd_out(nr,hd_info[nr].sect,hd_info[nr].sect,hd_info[nr].head-1,
hd_info[nr].cyl,WIN_SPECIFY,&recal_intr);
}
//// 意外硬盘中断调用函数。
// 发生意外硬盘中断时,硬盘中断处理程序中调用的默认C 处理函数。在被调用函数指针为空时
// 调用该函数。参见(kernel/system_call.s)。
void unexpected_hd_interrupt(void)
{
printk("Unexpected HD interrupt\n\r");
}
//// 读写硬盘失败处理调用函数。
static void bad_rw_intr (void)
{
if (++CURRENT->errors >= MAX_ERRORS) // 如果读扇区时的出错次数大于或等于7 次时,
end_request (0); // 则结束请求并唤醒等待该请求的进程,而且
// 对应缓冲区更新标志复位(没有更新)。
if (CURRENT->errors > MAX_ERRORS / 2) // 如果读一扇区时的出错次数已经大于3 次,
reset = 1; // 则要求执行复位硬盘控制器操作。
}
//// 读操作中断调用函数。将在执行硬盘中断处理程序中被调用。
static void read_intr (void)
{
if (win_result ())
{ // 若控制器忙、读写错或命令执行错,
bad_rw_intr (); // 则进行读写硬盘失败处理
do_hd_request (); // 然后再次请求硬盘作相应(复位)处理。
return;
}
port_read (HD_DATA, CURRENT->buffer, 256); // 将数据从数据寄存器口读到请求结构缓冲区。
CURRENT->errors = 0; // 清出错次数。
CURRENT->buffer += 512; // 调整缓冲区指针,指向新的空区。
CURRENT->sector++; // 起始扇区号加1,
if (--CURRENT->nr_sectors)
{ // 如果所需读出的扇区数还没有读完,则
do_hd = &read_intr; // 再次置硬盘调用C 函数指针为read_intr()
return; // 因为硬盘中断处理程序每次调用do_hd 时
} // 都会将该函数指针置空。参见system_call.s
end_request (1); // 若全部扇区数据已经读完,则处理请求结束事宜,
do_hd_request (); // 执行其它硬盘请求操作。
}
//// 写扇区中断调用函数。在硬盘中断处理程序中被调用。
// 在写命令执行后,会产生硬盘中断信号,执行硬盘中断处理程序,此时在硬盘中断处理程序中调用的
// C 函数指针do_hd()已经指向write_intr(),因此会在写操作完成(或出错)后,执行该函数。
static void write_intr (void)
{
if (win_result ())
{ // 如果硬盘控制器返回错误信息,
bad_rw_intr (); // 则首先进行硬盘读写失败处理,
do_hd_request (); // 然后再次请求硬盘作相应(复位)处理,
return; // 然后返回(也退出了此次硬盘中断)。
}
if (--CURRENT->nr_sectors)
{ // 否则将欲写扇区数减1,若还有扇区要写,则
CURRENT->sector++; // 当前请求起始扇区号+1,
CURRENT->buffer += 512; // 调整请求缓冲区指针,
do_hd = &write_intr; // 置硬盘中断程序调用函数指针为write_intr(),
port_write (HD_DATA, CURRENT->buffer, 256); // 再向数据寄存器端口写256 字节。
return; // 返回等待硬盘再次完成写操作后的中断处理。
}
end_request (1); // 若全部扇区数据已经写完,则处理请求结束事宜,
do_hd_request (); // 执行其它硬盘请求操作。
}
//// 硬盘重新校正(复位)中断调用函数。在硬盘中断处理程序中被调用。
// 如果硬盘控制器返回错误信息,则首先进行硬盘读写失败处理,然后请求硬盘作相应(复位)处理。
static void recal_intr (void)
{
if (win_result ())
bad_rw_intr ();
do_hd_request ();
}
// 执行硬盘读写请求操作。
void do_hd_request(void)
{
int i,r = 0;
unsigned int block,dev;
unsigned int sec,head,cyl;
unsigned int nsect;
INIT_REQUEST; // 检测请求项的合法性(参见kernel/blk_drv/blk.h)。
// 取设备号中的子设备号。子设备号即是硬盘上的分区号。
dev = MINOR(CURRENT->dev); // CURRENT 定义为(blk_dev[MAJOR_NR].current_request)。
block = CURRENT->sector; // 请求的起始扇区。
// 如果子设备号不存在或者起始扇区大于该分区扇区数-2,则结束该请求,并跳转到标号repeat 处
// (定义在INIT_REQUEST 开始处)。因为一次要求读写2 个扇区(512*2 字节),所以请求的扇区号
// 不能大于分区中最后倒数第二个扇区号。
if (dev >= 5*NR_HD || block+2 > hd[dev].nr_sects) {
end_request(0);
goto repeat;
}
block += hd[dev].start_sect; // 将所需读的块对应到整个硬盘上的绝对扇区号。
dev /= 5; // 此时dev 代表硬盘号(0 或1)。
// 下面嵌入汇编代码用来从硬盘信息结构中根据起始扇区号和每磁道扇区数计算在磁道中的
// 扇区号(sec)、所在柱面号(cyl)和磁头号(head)。
__asm__("divl %4":"=a" (block),"=d" (sec):"0" (block),"1" (0),
"r" (hd_info[dev].sect));
__asm__("divl %4":"=a" (cyl),"=d" (head):"0" (block),"1" (0),
"r" (hd_info[dev].head));
sec++;
nsect = CURRENT->nr_sectors; // 欲读/写的扇区数。
// 如果reset 置1,则执行复位操作。复位硬盘和控制器,并置需要重新校正标志,返回。
if (reset) {
reset = 0;
recalibrate = 1;
reset_hd(CURRENT_DEV);
return;
}
// 如果重新校正标志(recalibrate)置位,则首先复位该标志,然后向硬盘控制器发送重新校正命令。
if (recalibrate) {
recalibrate = 0;
hd_out(dev,hd_info[CURRENT_DEV].sect,0,0,0,
WIN_RESTORE,&recal_intr);
return;
}
// 如果当前请求是写扇区操作,则发送写命令,循环读取状态寄存器信息并判断请求服务标志
// DRQ_STAT 是否置位。DRQ_STAT 是硬盘状态寄存器的请求服务位(include/linux/hdreg.h)。
if (CURRENT->cmd == WRITE) {
hd_out(dev,nsect,sec,head,cyl,WIN_WRITE,&write_intr);
for(i=0 ; i<3000 && !(r=inb_p(HD_STATUS)&DRQ_STAT) ; i++)
/* nothing */ ;
// 如果请求服务位置位则退出循环。若等到循环结束也没有置位,则此次写硬盘操作失败,去处理
// 下一个硬盘请求。否则向硬盘控制器数据寄存器端口HD_DATA 写入1 个扇区的数据。
if (!r) {
bad_rw_intr();
goto repeat;
}
port_write(HD_DATA,CURRENT->buffer,256);
// 如果当前请求是读硬盘扇区,则向硬盘控制器发送读扇区命令。
} else if (CURRENT->cmd == READ) {
hd_out(dev,nsect,sec,head,cyl,WIN_READ,&read_intr);
} else
panic("unknown hd-command");
}
// 硬盘系统初始化。
void hd_init (void)
{
blk_dev[MAJOR_NR].request_fn = DEVICE_REQUEST; // do_hd_request()。
set_intr_gate (0x2E, &hd_interrupt); // 设置硬盘中断门向量 int 0x2E(46)。
// hd_interrupt 在(kernel/system_call.s,221)。
outb_p (inb_p (0x21) & 0xfb, 0x21); // 复位接联的主8259A int2 的屏蔽位,允许从片
// 发出中断请求信号。
outb (inb_p (0xA1) & 0xbf, 0xA1); // 复位硬盘的中断请求屏蔽位(在从片上),允许
// 硬盘控制器发送中断请求信号。
}
/*
* linux/kernel/blk_dev/ll_rw.c
*
* (C) 1991 Linus Torvalds
*/
/*
* This handles all read/write requests to block devices
*/
/*
* 该程序处理块设备的所有读/写操作。
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。(Linus 从minix 中引进的)
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#include "blk.h" // 块设备头文件。定义请求数据结构、块设备数据结构和宏函数等信息。
/*
* The request-struct contains all necessary data
* to load a nr of sectors into memory
*/
/*
* 请求结构中含有加载nr 扇区数据到内存的所有必须的信息。
*/
// 请求项数据队列。共有 NR_REQUEST = 32个请求项.
struct request request[NR_REQUEST];
/*
* used to wait on when there are no free requests
*/
/* 是用于请求数组没有空闲项时的临时等待处 */
struct task_struct * wait_for_request = NULL;
/* blk_dev_struct is:
* do_request-address
* next-request
*/
/* blk_dev_struct 块设备结构是:(kernel/blk_drv/blk.h)
* do_request-address //对应主设备号的请求处理程序指针。
* current-request // 该设备的下一个请求。
*/
// 该数组使用主设备号作为索引(下标)。
struct blk_dev_struct blk_dev[NR_BLK_DEV] = {
{NULL, NULL}, /* no_dev */ // 0 - 无设备。
{NULL, NULL}, /* dev mem */ // 1 - 内存。
{NULL, NULL}, /* dev fd */ // 2 - 软驱设备。
{NULL, NULL}, /* dev hd */ // 3 - 硬盘设备。
{NULL, NULL}, /* dev ttyx */ // 4 - ttyx 设备。
{NULL, NULL}, /* dev tty */ // 5 - tty 设备。
{NULL, NULL} /* dev lp */ // 6 - lp 打印机设备。
};
// 锁定指定的缓冲区bh。如果指定的缓冲区已经被其它任务锁定,则使自己睡眠(不可中断地等待),
// 直到被执行解锁缓冲区的任务明确地唤醒。
static inline void
lock_buffer (struct buffer_head *bh)
{
cli (); // 清中断许可。
while (bh->b_lock) // 如果缓冲区已被锁定,则睡眠,直到缓冲区解锁。
sleep_on (&bh->b_wait);
bh->b_lock = 1; // 立刻锁定该缓冲区。
sti (); // 开中断。
}
// 释放(解锁)锁定的缓冲区。
static inline void unlock_buffer(struct buffer_head * bh)
{
if (!bh->b_lock) // 如果该缓冲区并没有被锁定,则打印出错信息。
printk ("ll_rw_block.c: buffer not locked\n\r");
bh->b_lock = 0; // 清锁定标志。
wake_up (&bh->b_wait); // 唤醒等待该缓冲区的任务。
}
/*
* add-request adds a request to the linked list.
* It disables interrupts so that it can muck with the
* request-lists in peace.
*/
/* add-request()向连表中加入一项请求。它关闭中断,
* 这样就能安全地处理请求连表了
*/
//// 向链表中加入请求项。参数dev 指定块设备,req 是请求的结构信息。
static void add_request(struct blk_dev_struct * dev, struct request * req)
{
struct request * tmp;
req->next = NULL;
cli();
if (req->bh)
req->bh->b_dirt = 0; // 清缓冲区“脏”标志。
// 如果dev 的当前请求(current_request)子段为空,则表示目前该设备没有请求项,本次是第1 个
// 请求项,因此可将块设备当前请求指针直接指向请求项,并立刻执行相应设备的请求函数。
if (!(tmp = dev->current_request)) {
dev->current_request = req;
sti();
(dev->request_fn)();// 执行设备请求函数,对于硬盘(3)是do_hd_request()。
return;
}
// 如果目前该设备已经有请求项在等待,则首先利用电梯算法搜索最佳位置,然后将当前请求插入
// 请求链表中。
for ( ; tmp->next ; tmp=tmp->next)
if ((IN_ORDER(tmp,req) ||
!IN_ORDER(tmp,tmp->next)) &&
IN_ORDER(req,tmp->next))
break;
req->next=tmp->next;
tmp->next=req;
sti();
}
//// 创建请求项并插入请求队列。参数是:主设备号major,命令rw,存放数据的缓冲区头指针bh。
static void make_request(int major,int rw, struct buffer_head * bh)
{
struct request * req;
int rw_ahead;
/* WRITEA/READA is special case - it is not really needed, so if the */
/* buffer is locked, we just forget about it, else it's a normal read */
/* WRITEA/READA 是特殊的情况 - 它们并不是必要的,所以如果缓冲区已经上锁,*/
/* 我们就不管它而退出,否则的话就执行一般的读/写操作。 */
// 这里'READ'和'WRITE'后面的'A'字符代表英文单词Ahead,表示提前预读/写数据块的意思。
// 当指定的缓冲区正在使用,已被上锁时,就放弃预读/写请求。
if ((rw_ahead = (rw == READA || rw == WRITEA))) {
if (bh->b_lock)
return;
if (rw == READA)
rw = READ;
else
rw = WRITE;
}
// 如果命令不是READ 或WRITE 则表示内核程序有错,显示出错信息并死机。
if (rw!=READ && rw!=WRITE)
panic("Bad block dev command, must be R/W/RA/WA");
// 锁定缓冲区,如果缓冲区已经上锁,则当前任务(进程)就会睡眠,直到被明确地唤醒。
lock_buffer(bh);
// 如果命令是写并且缓冲区数据不脏,或者命令是读并且缓冲区数据是更新过的,则不用添加
// 这个请求。将缓冲区解锁并退出。
if ((rw == WRITE && !bh->b_dirt) || (rw == READ && bh->b_uptodate)) {
unlock_buffer(bh);
return;
}
repeat:
/* we don't allow the write-requests to fill up the queue completely:
* we want some room for reads: they take precedence. The last third
* of the requests are only for reads.
*/
/* 我们不能让队列中全都是写请求项:我们需要为读请求保留一些空间:读操作
* 是优先的。请求队列的后三分之一空间是为读准备的。
*/
// 请求项是从请求数组末尾开始搜索空项填入的。根据上述要求,对于读命令请求,可以直接
// 从队列末尾开始操作,而写请求则只能从队列的2/3 处向头上搜索空项填入。
if (rw == READ)
req = request+NR_REQUEST; // 对于读请求,将队列指针指向队列尾部。
else
req = request+((NR_REQUEST*2)/3);// 对于写请求,队列指针指向队列2/3 处。
/* find an empty request */
/* 搜索一个空请求项 */
// 从后向前搜索,当请求结构request 的dev 字段值=-1 时,表示该项未被占用。
while (--req >= request)
if (req->dev<0)
break;
/* if none found, sleep on new requests: check for rw_ahead */
/* 如果没有找到空闲项,则让该次新请求睡眠:需检查是否提前读/写 */
// 如果没有一项是空闲的(此时request 数组指针已经搜索越过头部),则查看此次请求是否是
// 提前读/写(READA 或WRITEA),如果是则放弃此次请求。否则让本次请求睡眠(等待请求队列
// 腾出空项),过一会再来搜索请求队列。
if (req < request) { // 如果请求队列中没有空项
if (rw_ahead) { // 如果是提前读/写请求,则解锁缓冲区,退出。
unlock_buffer(bh);
return;
}
sleep_on(&wait_for_request);// 否则让本次请求睡眠,过会再查看请求队列。
goto repeat;
}
/* fill up the request-info, and add it to the queue */
/* 向空闲请求项中填写请求信息,并将其加入队列中 */
// 请求结构参见(kernel/blk_drv/blk.h)。
req->dev = bh->b_dev; // 设备号。
req->cmd = rw; // 命令(READ/WRITE)。
req->errors = 0; // 操作时产生的错误次数。
req->sector = bh->b_blocknr << 1; // 起始扇区。(1 块=2 扇区)
req->nr_sectors = 2; // 读写扇区数。
req->buffer = bh->b_data; // 数据缓冲区。
req->waiting = NULL; // 任务等待操作执行完成的地方。
req->bh = bh; // 缓冲区头指针。
req->next = NULL; // 指向下一请求项。
add_request (major + blk_dev, req); // 将请求项加入队列中(blk_dev[major],req)。
}
//// 低层读写数据块函数。
// 该函数主要是在fs/buffer.c 中被调用。实际的读写操作是由设备的request_fn()函数完成。
// 对于硬盘操作,该函数是do_hd_request()。(kernel/blk_drv/hd.c)
void ll_rw_block(int rw, struct buffer_head * bh)
{
unsigned int major; // 主设备号(对于硬盘是3)。
// 如果设备的主设备号不存在或者该设备的读写操作函数不存在,则显示出错信息,并返回。
if ((major=MAJOR(bh->b_dev)) >= NR_BLK_DEV ||
!(blk_dev[major].request_fn)) {
printk("Trying to read nonexistent block-device\n\r");
return;
}
make_request(major,rw,bh); // 创建请求项并插入请求队列。
}
//// 块设备初始化函数,由初始化程序main.c 调用(init/main.c)。
// 初始化请求数组,将所有请求项置为空闲项(dev = -1)。有32 项(NR_REQUEST = 32)。
void blk_dev_init(void)
{
int i;
for (i=0 ; i<NR_REQUEST ; i++) {
request[i].dev = -1;
request[i].next = NULL;
}
}
/*
* linux/kernel/blk_drv/ramdisk.c
*
* Written by Theodore Ts'o, 12/2/91
*/
/* 由Theodore Ts'o 编制,12/2/91
*/
// Theodore Ts'o (Ted Ts'o)是linux 社区中的著名人物。Linux 在世界范围内的流行也有他很大的
// 功劳,早在Linux 操作系统刚问世时,他就怀着极大的热情为linux 的发展提供了maillist,并
// 在北美洲地区最早设立了linux 的ftp 站点(tsx-11.mit.edu),而且至今仍然为广大linux 用户
// 提供服务。他对linux 作出的最大贡献之一是提出并实现了ext2 文件系统。该文件系统已成为
// linux 世界中事实上的文件系统标准。最近他又推出了ext3 文件系统,大大提高了文件系统的
// 稳定性和访问效率。作为对他的推崇,第97 期(2002 年5 月)的linuxjournal 期刊将他作为
// 了封面人物,并对他进行了采访。目前,他为IBM linux 技术中心工作,并从事着有关LSB
// (Linux Standard Base)等方面的工作。(他的主页:http://thunk.org/tytso/)
#include <string.h> // 字符串头文件。主要定义了一些有关字符串操作的嵌入函数。
#include <linux/config.h> // 内核配置头文件。定义键盘语言和硬盘类型(HD_TYPE)可选项。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/fs.h> // 文件系统头文件。定义文件表结构(file,buffer_head,m_inode 等)。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <asm/memory.h> // 内存拷贝头文件。含有memcpy()嵌入式汇编宏函数。
#define MAJOR_NR 1 // 内存主设备号是1。
#include "blk.h"
char *rd_start; // 虚拟盘在内存中的起始位置。在初始化函数rd_init()中
// 确定。参见(init/main.c)(缩写rd_代表ramdisk_)。
int rd_length = 0; // 虚拟盘所占内存大小(字节)。
// 执行虚拟盘(ramdisk)读写操作。程序结构与do_hd_request()类似(kernel/blk_drv/hd.c)。
void do_rd_request(void)
{
int len;
char *addr;
INIT_REQUEST; // 检测请求的合法性(参见kernel/blk_drv/blk.h)。
// 下面语句取得ramdisk 的起始扇区对应的内存起始位置和内存长度。
// 其中sector << 9 表示sector * 512,CURRENT 定义为(blk_dev[MAJOR_NR].current_request)。
addr = rd_start + (CURRENT->sector << 9);
len = CURRENT->nr_sectors << 9;
// 如果子设备号不为1 或者对应内存起始位置>虚拟盘末尾,则结束该请求,并跳转到repeat 处
// (定义在INIT_REQUEST 内开始处)。
if ((MINOR(CURRENT->dev) != 1) || (addr+len > rd_start+rd_length)) {
end_request(0);
goto repeat;
}
// 如果是写命令(WRITE),则将请求项中缓冲区的内容复制到addr 处,长度为len 字节。
if (CURRENT-> cmd == WRITE) {
(void ) memcpy(addr,
CURRENT->buffer,
len);
}
// 如果是读命令(READ),则将addr 开始的内容复制到请求项中缓冲区中,长度为len 字节。
else if (CURRENT->cmd == READ) {
(void) memcpy(CURRENT->buffer,
addr,
len);
}
// 否则显示命令不存在,死机。
else
panic("unknown ramdisk-command");
// 请求项成功后处理,置更新标志。并继续处理本设备的下一请求项。
end_request(1);
goto repeat;
}
/*
* Returns amount of memory which needs to be reserved.
*/
/* 返回内存虚拟盘ramdisk 所需的内存量 */
// 虚拟盘初始化函数。确定虚拟盘在内存中的起始地址,长度。并对整个虚拟盘区清零。
long rd_init(long mem_start, int length)
{
int i;
char *cp;
blk_dev[MAJOR_NR].request_fn = DEVICE_REQUEST;
rd_start = (char *) mem_start;
rd_length = length;
cp = rd_start;
for (i=0; i < length; i++)
*cp++ = '\0';
return(length);
}
/*
* If the root device is the ram disk, try to load it.
* In order to do this, the root device is originally set to the
* floppy, and we later change it to be ram disk.
*/
/*
* 如果根文件系统设备(root device)是ramdisk 的话,则尝试加载它。root device 原先是指向
* 软盘的,我们将它改成指向ramdisk。
*/
//// 加载根文件系统到ramdisk。
void rd_load(void)
{
struct buffer_head *bh; // 高速缓冲块头指针
struct super_block s; // 文件超级块结构
int block = 256; /* Start at block 256 */ /* 开始于256 */
int i = 1;
int nblocks; // 文件系统盘块总数。
char *cp; /* Move pointer */
if (!rd_length) // 如果ramdisk 的长度为零,则退出。
return;
printk("Ram disk: %d bytes, starting at 0x%x\n", rd_length,
(int) rd_start);
if (MAJOR(ROOT_DEV) != 2)// 如果此时根文件设备不是软盘,则退出。
return;
// 读软盘块256+1,256,256+2。breada()用于读取指定的数据块,并标出还需要读的块,然后返回
// 含有数据块的缓冲区指针。如果返回NULL,则表示数据块不可读(fs/buffer.c)。
// 这里block+1 是指磁盘上的超级块。
bh = breada(ROOT_DEV,block+1,block,block+2,-1);
if (!bh) {
printk("Disk error while looking for ramdisk!\n");
return;
}
// 将s 指向缓冲区中的磁盘超级块。(d_super_block 磁盘中超级块结构)。
*((struct d_super_block *) &s) = *((struct d_super_block *) bh->b_data);
brelse(bh);
if (s.s_magic != SUPER_MAGIC)// 如果超级块中魔数不对,则说明不是minix 文件系统
/* No ram disk image present, assume normal floppy boot */
/* 磁盘中没有ramdisk 映像文件,退出执行通常的软盘引导 */
return;
// 块数 = 逻辑块数(区段数) * 2^(每区段块数的次方)。
// 如果数据块数大于内存中虚拟盘所能容纳的块数,则不能加载,显示出错信息并返回。否则显示
// 加载数据块信息。
nblocks = s.s_nzones << s.s_log_zone_size;
if (nblocks > (rd_length >> BLOCK_SIZE_BITS)) {
printk("Ram disk image too big! (%d blocks, %d avail)\n",
nblocks, rd_length >> BLOCK_SIZE_BITS);
return;
}
printk("Loading %d bytes into ram disk... 0000k",
nblocks << BLOCK_SIZE_BITS);
// cp 指向虚拟盘起始处,然后将磁盘上的根文件系统映象文件复制到虚拟盘上。
cp = rd_start;
while (nblocks) {
if (nblocks > 2) // 如果需读取的块数多于3 快则采用超前预读方式读数据块。
bh = breada(ROOT_DEV, block, block+1, block+2, -1);
else // 否则就单块读取。
bh = bread(ROOT_DEV, block);
if (!bh) {
printk("I/O error on block %d, aborting load\n",
block);
return;
}
(void) memcpy(cp, bh->b_data, BLOCK_SIZE); // 将缓冲区中的数据复制到cp 处。
brelse(bh); // 释放缓冲区。
printk("\010\010\010\010\010%4dk",i); // 打印加载块计数值。
cp += BLOCK_SIZE; // 虚拟盘指针前移。
block++;
nblocks--;
i++;
}
printk("\010\010\010\010\010done \n");
ROOT_DEV=0x0101; // 修改ROOT_DEV 使其指向虚拟盘ramdisk。
}
/*
* linux/kernel/console.c
*
* (C) 1991 Linus Torvalds
*/
/*
* console.c
*
* This module implements the console io functions
* 'void con_init(void)'
* 'void con_write(struct tty_queue * queue)'
* Hopefully this will be a rather complete VT102 implementation.
*
* Beeping thanks to John T Kohl.
*/
/*
* 该模块实现控制台输入输出功能
* 'void con_init(void)'
* 'void con_write(struct tty_queue * queue)'
* 希望这是一个非常完整的VT102 实现。
*
* 感谢John T Kohl 实现了蜂鸣指示。
*/
/*
* NOTE!!! We sometimes disable and enable interrupts for a short while
* (to put a word in video IO), but this will work even for keyboard
* interrupts. We know interrupts aren't enabled when getting a keyboard
* interrupt, as we use trap-gates. Hopefully all is well.
*/
/*
* 注意!!! 我们有时短暂地禁止和允许中断(在将一个字(word)放到视频IO),但即使
* 对于键盘中断这也是可以工作的。因为我们使用陷阱门,所以我们知道在获得一个
* 键盘中断时中断是不允许的。希望一切均正常。
*/
/*
* Code to check for different video-cards mostly by Galen Hunt,
* <g-hunt@ee.utah.edu>
*/
/*
* 检测不同显示卡的代码大多数是Galen Hunt 编写的,
* <g-hunt@ee.utah.edu>
*/
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/tty.h> // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
#include <asm/io.h> // io 头文件。定义硬件端口输入/输出宏汇编语句。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
/*
* These are set up by the setup-routine at boot-time:
*/
/*
* 这些是设置子程序setup 在引导启动系统时设置的参数:
*/
#define ORIG_X (*(unsigned char *)0x90000) // 光标列号。
#define ORIG_Y (*(unsigned char *)0x90001) // 光标行号。
#define ORIG_VIDEO_PAGE (*(unsigned short *)0x90004) // 显示页面。
#define ORIG_VIDEO_MODE ((*(unsigned short *)0x90006) & 0xff) // 显示模式。
#define ORIG_VIDEO_COLS (((*(unsigned short *)0x90006) & 0xff00) >> 8) // 字符列数。
#define ORIG_VIDEO_LINES (25) // 显示行数。
#define ORIG_VIDEO_EGA_AX (*(unsigned short *)0x90008) // [??]
#define ORIG_VIDEO_EGA_BX (*(unsigned short *)0x9000a) // 显示内存大小和色彩模式。
#define ORIG_VIDEO_EGA_CX (*(unsigned short *)0x9000c) // 显示卡特性参数。
// 定义显示器单色/彩色显示模式类型符号常数。
#define VIDEO_TYPE_MDA 0x10 /* Monochrome Text Display */ /* 单色文本 */
#define VIDEO_TYPE_CGA 0x11 /* CGA Display */ /* CGA 显示器 */
#define VIDEO_TYPE_EGAM 0x20 /* EGA/VGA in Monochrome Mode */ /* EGA/VGA 单色 */
#define VIDEO_TYPE_EGAC 0x21 /* EGA/VGA in Color Mode */ /* EGA/VGA 彩色 */
#define NPAR 16
extern void keyboard_interrupt(void); // 键盘中断处理程序(keyboard.S)。
static unsigned char video_type; /* Type of display being used */
/* 使用的显示类型 */
static unsigned long video_num_columns; /* Number of text columns */
/* 屏幕文本列数 */
static unsigned long video_size_row; /* Bytes per row */
/* 每行使用的字节数 */
static unsigned long video_num_lines; /* Number of test lines */
/* 屏幕文本行数 */
static unsigned char video_page; /* Initial video page */
/* 初始显示页面 */
static unsigned long video_mem_start; /* Start of video RAM */
/* 显示内存起始地址 */
static unsigned long video_mem_end; /* End of video RAM (sort of) */
/* 显示内存结束(末端)地址 */
static unsigned short video_port_reg; /* Video register select port */
/* 显示控制索引寄存器端口 */
static unsigned short video_port_val; /* Video register value port */
/* 显示控制数据寄存器端口 */
static unsigned short video_erase_char; /* Char+Attrib to erase with */
/* 擦除字符属性与字符(0x0720) */
// 以下这些变量用于屏幕卷屏操作。
static unsigned long origin; /* Used for EGA/VGA fast scroll */// scr_start。
/* 用于EGA/VGA 快速滚屏 */// 滚屏起始内存地址。
static unsigned long scr_end; /* Used for EGA/VGA fast scroll */
/* 用于EGA/VGA 快速滚屏 */// 滚屏末端内存地址。
static unsigned long pos; // 当前光标对应的显示内存位置。
static unsigned long x, y; // 当前光标位置。
static unsigned long top, bottom; // 滚动时顶行行号;底行行号。
// state 用于标明处理ESC 转义序列时的当前步骤。npar,par[]用于存放ESC 序列的中间处理参数。
static unsigned long state = 0; // ANSI 转义字符序列处理状态。
static unsigned long npar, par[NPAR]; // ANSI 转义字符序列参数个数和参数数组。
static unsigned long ques = 0;
static unsigned char attr = 0x07; // 字符属性(黑底白字)。
static void sysbeep (void); // 系统蜂鸣函数。
/*
* this is what the terminal answers to a ESC-Z or csi0c
* query (= vt100 response).
*/
/*
* 下面是终端回应ESC-Z 或csi0c 请求的应答(=vt100 响应)。
*/
// csi - 控制序列引导码(Control Sequence Introducer)。
#define RESPONSE "\033[?1;2c"
/* NOTE! gotoxy thinks x==video_num_columns is ok */
/* 注意!gotoxy 函数认为x==video_num_columns,这是正确的 */
//// 跟踪光标当前位置。
// 参数:new_x - 光标所在列号;new_y - 光标所在行号。
// 更新当前光标位置变量x,y,并修正pos 指向光标在显示内存中的对应位置。
static inline void gotoxy(unsigned int new_x,unsigned int new_y)
{
// 如果输入的光标行号超出显示器列数,或者光标行号超出显示的最大行数,则退出。
if (new_x > video_num_columns || new_y >= video_num_lines)
return;
// 更新当前光标变量;更新光标位置对应的在显示内存中位置变量pos。
x = new_x;
y=new_y;
pos=origin + y*video_size_row + (x<<1);
}
//// 设置滚屏起始显示内存地址。
static inline void set_origin(void)
{
cli();
// 首先选择显示控制数据寄存器r12,然后写入卷屏起始地址高字节。向右移动9 位,表示向右移动
// 8 位,再除以2(2 字节代表屏幕上1 字符)。是相对于默认显示内存操作的。
outb_p(12, video_port_reg);
outb_p(0xff&((origin-video_mem_start)>>9), video_port_val);
// 再选择显示控制数据寄存器r13,然后写入卷屏起始地址底字节。向右移动1 位表示除以2。
outb_p(13, video_port_reg);
outb_p(0xff&((origin-video_mem_start)>>1), video_port_val);
sti();
}
//// 向上卷动一行(屏幕窗口向下移动)。
// 将屏幕窗口向下移动一行。
static void scrup(void)
{
// 如果显示类型是EGA,则执行以下操作。
if (video_type == VIDEO_TYPE_EGAC || video_type == VIDEO_TYPE_EGAM)
{
// 如果移动起始行top=0,移动最底行bottom=video_num_lines=25,则表示整屏窗口向下移动。
if (!top && bottom == video_num_lines) {
// 调整屏幕显示对应内存的起始位置指针origin 为向下移一行屏幕字符对应的内存位置,同时也调整
// 当前光标对应的内存位置以及屏幕末行末端字符指针scr_end 的位置。
origin += video_size_row;
pos += video_size_row;
scr_end += video_size_row;
// 如果屏幕末端最后一个显示字符所对应的显示内存指针scr_end 超出了实际显示内存的末端,则将
// 屏幕内容内存数据移动到显示内存的起始位置video_mem_start 处,并在出现的新行上填入空格字符。
if (scr_end > video_mem_end) {
// %0 - eax(擦除字符+属性);%1 - ecx((显示器字符行数-1)所对应的字符数/2,是以长字移动);
// %2 - edi(显示内存起始位置video_mem_start);%3 - esi(屏幕内容对应的内存起始位置origin)。
// 移动方向:[edi]??[esi],移动ecx 个长字。
__asm__("cld\n\t" // 清方向位。
"rep\n\t" // 重复操作,将当前屏幕内存数据
"movsl\n\t" // 移动到显示内存起始处。
"movl _video_num_columns,%1\n\t"// ecx=1 行字符数。
"rep\n\t" // 在新行上填入空格字符。
"stosw"
::"a" (video_erase_char),
"c" ((video_num_lines-1)*video_num_columns>>1),
"D" (video_mem_start),
"S" (origin)
);
// 根据屏幕内存数据移动后的情况,重新调整当前屏幕对应内存的起始指针、光标位置指针和屏幕末端
// 对应内存指针scr_end。
scr_end -= origin-video_mem_start;
pos -= origin-video_mem_start;
origin = video_mem_start;
} else {
// 如果调整后的屏幕末端对应的内存指针scr_end 没有超出显示内存的末端video_mem_end,则只需在
// 新行上填入擦除字符(空格字符)。
// %0 - eax(擦除字符+属性);%1 - ecx(显示器字符行数);%2 - edi(屏幕对应内存最后一行开始处);
__asm__(
"cld\n\t" // 清方向位。
"rep\n\t" // 重复操作,在新出现行上
"stosw" // 填入擦除字符(空格字符)。
::"a" (video_erase_char),
"c" (video_num_columns),
"D" (scr_end-video_size_row)
);
}
// 向显示控制器中写入新的屏幕内容对应的内存起始位置值。
set_origin();
// 否则表示不是整屏移动。也即表示从指定行top 开始的所有行向上移动1 行(删除1 行)。此时直接
// 将屏幕从指定行top 到屏幕末端所有行对应的显示内存数据向上移动1 行,并在新出现的行上填入擦
// 除字符。
// %0-eax(擦除字符+属性);%1-ecx(top 行下1 行开始到屏幕末行的行数所对应的内存长字数);
// %2-edi(top 行所处的内存位置);%3-esi(top+1 行所处的内存位置)。
} else {
__asm__("cld\n\t"
"rep\n\t"
"movsl\n\t"
"movl _video_num_columns,%%ecx\n\t"
"rep\n\t"
"stosw"
::"a" (video_erase_char),
"c" ((bottom-top-1)*video_num_columns>>1),
"D" (origin+video_size_row*top),
"S" (origin+video_size_row*(top+1))
);
}
}
// 如果显示类型不是EGA(是MDA),则执行下面移动操作。因为MDA 显示控制卡会自动调整超出显示范围
// 的情况,也即会自动翻卷指针,所以这里不对屏幕内容对应内存超出显示内存的情况单独处理。处理
// 方法与EGA 非整屏移动情况完全一样。
else /* Not EGA/VGA */
{
__asm__("cld\n\t"
"rep\n\t"
"movsl\n\t"
"movl _video_num_columns,%%ecx\n\t"
"rep\n\t"
"stosw"
::"a" (video_erase_char),
"c" ((bottom-top-1)*video_num_columns>>1),
"D" (origin+video_size_row*top),
"S" (origin+video_size_row*(top+1))
);
}
}
//// 向下卷动一行(屏幕窗口向上移动)。
// 将屏幕窗口向上移动一行,屏幕显示的内容向下移动1 行,在被移动开始行的上方出现一新行。参见
// 程序列表后说明。处理方法与scrup()相似,只是为了在移动显示内存数据时不出现数据覆盖错误情
// 况,复制是以反方向进行的,也即从屏幕倒数第2 行的最后一个字符开始复制
static void scrdown(void)
{
// 如果显示类型是EGA,则执行下列操作。
if (video_type == VIDEO_TYPE_EGAC || video_type == VIDEO_TYPE_EGAM)
{
// %0-eax(擦除字符+属性);%1-ecx(top 行开始到屏幕末行-1 行的行数所对应的内存长字数);
// %2-edi(屏幕右下角最后一个长字位置);%3-esi(屏幕倒数第2 行最后一个长字位置)。
// 移动方向:[esi]->[edi],移动ecx 个长字。
__asm__("std\n\t" // 置方向位。
"rep\n\t" // 重复操作,向下移动从top 行到bottom-1 行
"movsl\n\t" // 对应的内存数据。
"addl $2,%%edi\n\t" /* %edi has been decremented by 4 */
/* %edi 已经减4,因为也是方向填擦除字符 */
"movl _video_num_columns,%%ecx\n\t" // 置ecx=1 行字符数。
"rep\n\t" // 将擦除字符填入上方新行中。
"stosw"
::"a" (video_erase_char),
"c" ((bottom-top-1)*video_num_columns>>1),
"D" (origin+video_size_row*bottom-4),
"S" (origin+video_size_row*(bottom-1)-4)
);
}
else /* Not EGA/VGA */// 如果不是EGA 显示类型,则执行以下操作(目前与上面完全一样)。
{
__asm__(
"std\n\t"
"rep\n\t"
"movsl\n\t"
"addl $2,%%edi\n\t" /* %edi has been decremented by 4 */
"movl _video_num_columns,%%ecx\n\t"
"rep\n\t"
"stosw"
::"a" (video_erase_char),
"c" ((bottom-top-1)*video_num_columns>>1),
"D" (origin+video_size_row*bottom-4),
"S" (origin+video_size_row*(bottom-1)-4)
);
}
}
//// 光标位置下移一行(lf - line feed 换行)。
static void lf(void)
{
// 如果光标没有处在倒数第2 行之后,则直接修改光标当前行变量y++,并调整光标对应显示内存位置
// pos(加上屏幕一行字符所对应的内存长度)。
if (y+1<bottom) {
y++;
pos += video_size_row;
return;
}
// 否则需要将屏幕内容上移一行。
scrup();
}
//// 光标上移一行(ri - reverse line feed 反向换行)。
static void ri (void)
{
// 如果光标不在第1 行上,则直接修改光标当前行标量y--,并调整光标对应显示内存位置pos,减去
// 屏幕上一行字符所对应的内存长度字节数。
if (y > top)
{
y--;
pos -= video_size_row;
return;
}
// 否则需要将屏幕内容下移一行。
scrdown ();
}
// 光标回到第1 列(0 列)左端(cr - carriage return 回车)。
static void cr (void)
{
// 光标所在的列号*2 即0 列到光标所在列对应的内存字节长度。
pos -= x << 1;
x = 0;
}
// 擦除光标前一字符(用空格替代)(del - delete 删除)。
static void del (void)
{
// 如果光标没有处在0 列,则将光标对应内存位置指针pos 后退2 字节(对应屏幕上一个字符),然后
// 将当前光标变量列值减1,并将光标所在位置字符擦除。
if (x)
{
pos -= 2;
x--;
*(unsigned short *) pos = video_erase_char;
}
}
//// 删除屏幕上与光标位置相关的部分,以屏幕为单位。csi - 控制序列引导码(Control Sequence
// Introducer)。
// ANSI 转义序列:'ESC [sJ'(s = 0 删除光标到屏幕底端;1 删除屏幕开始到光标处;2 整屏删除)。
// 参数:par - 对应上面s。
static void csi_J(int par)
{
long count;
long start;
// 首先根据三种情况分别设置需要删除的字符数和删除开始的显示内存位置。
switch (par) {
case 0: /* erase from cursor to end of display *//* 擦除光标到屏幕底端 */
count = (scr_end-pos)>>1;
start = pos;
break;
case 1: /* erase from start to cursor *//* 删除从屏幕开始到光标处的字符 */
count = (pos-origin)>>1;
start = origin;
break;
case 2: /* erase whole display *//* 删除整个屏幕上的字符 */
count = video_num_columns * video_num_lines;
start = origin;
break;
default:
return;
}
// 然后使用擦除字符填写删除字符的地方。
// %0 - ecx(要删除的字符数count);%1 - edi(删除操作开始地址);%2 - eax(填入的擦除字符)。
__asm__("cld\n\t"
"rep\n\t"
"stosw\n\t"
::"c" (count),
"D" (start),"a" (video_erase_char)
);
}
//// 删除行内与光标位置相关的部分,以一行为单位。
// ANSI 转义字符序列:'ESC [sK'(s = 0 删除到行尾;1 从开始删除;2 整行都删除)。
static void csi_K(int par)
{
long count;
long start;
// 首先根据三种情况分别设置需要删除的字符数和删除开始的显示内存位置。
switch (par)
{
case 0: /* erase from cursor to end of line *//* 删除光标到行尾字符 */
if (x >= video_num_columns)
return;
count = video_num_columns - x;
start = pos;
break;
case 1: /* erase from start of line to cursor *//* 删除从行开始到光标处 */
start = pos - (x << 1);
count = (x < video_num_columns) ? x : video_num_columns;
break;
case 2: /* erase whole line *//* 将整行字符全删除 */
start = pos - (x << 1);
count = video_num_columns;
break;
default:
return;
}
// 然后使用擦除字符填写删除字符的地方。
// %0 - ecx(要删除的字符数count);%1 - edi(删除操作开始地址);%2 - eax(填入的擦除字符)。
__asm__("cld\n\t"
"rep\n\t"
"stosw\n\t"
::"c" (count),
"D" (start),"a" (video_erase_char)
);
}
//// 允许翻译(重显)(允许重新设置字符显示方式,比如加粗、加下划线、闪烁、反显等)。
// ANSI 转义字符序列:'ESC [nm'。n = 0 正常显示;1 加粗;4 加下划线;7 反显;27 正常显示。
void csi_m(void)
{
int i;
for (i=0;i<=npar;i++)
switch (par[i]) {
case 0:attr=0x07;break;
case 1:attr=0x0f;break;
case 4:attr=0x0f;break;
case 7:attr=0x70;break;
case 27:attr=0x07;break;
}
}
//// 根据设置显示光标。
// 根据显示内存光标对应位置pos,设置显示控制器光标的显示位置。
static inline void set_cursor(void)
{
cli();
// 首先使用索引寄存器端口选择显示控制数据寄存器r14(光标当前显示位置高字节),然后写入光标
// 当前位置高字节(向右移动9 位表示高字节移到低字节再除以2)。是相对于默认显示内存操作的。
outb_p (14, video_port_reg);
outb_p (0xff & ((pos - video_mem_start) >> 9), video_port_val);
// 再使用索引寄存器选择r15,并将光标当前位置低字节写入其中。
outb_p(15, video_port_reg);
outb_p(0xff&((pos-video_mem_start)>>1), video_port_val);
sti();
}
//// 发送对终端VT100 的响应序列。
// 将响应序列放入读缓冲队列中。
static void respond(struct tty_struct * tty)
{
char * p = RESPONSE;
cli();
while (*p) { // 将字符序列放入写队列。
PUTCH(*p,tty->read_q);
p++;
}
sti();
copy_to_cooked(tty); // 转换成规范模式(放入辅助队列中)。
}
//// 在光标处插入一空格字符。
static void insert_char(void)
{
int i=x;
unsigned short tmp, old = video_erase_char;
unsigned short * p = (unsigned short *) pos;
// 光标开始的所有字符右移一格,并将擦除字符插入在光标所在处。
// 若一行上都有字符的话,则行最后一个字符将不会更动??
while (i++<video_num_columns) {
tmp=*p;
*p=old;
old=tmp;
p++;
}
}
//// 在光标处插入一行(则光标将处在新的空行上)。
// 将屏幕从光标所在行到屏幕底向下卷动一行。
static void insert_line(void)
{
int oldtop,oldbottom;
oldtop=top; // 保存原top,bottom 值。
oldbottom=bottom;
top=y; // 设置屏幕卷动开始行。
bottom = video_num_lines; // 设置屏幕卷动最后行。
scrdown(); // 从光标开始处,屏幕内容向下滚动一行。
top=oldtop; // 恢复原top,bottom 值。
bottom=oldbottom;
}
//// 删除光标处的一个字符。
static void delete_char(void)
{
int i;
unsigned short * p = (unsigned short *) pos;
// 如果光标超出屏幕最右列,则返回。
if (x>=video_num_columns)
return;
// 从光标右一个字符开始到行末所有字符左移一格。
i = x;
while (++i < video_num_columns) {
*p = *(p+1);
p++;
}
// 最后一个字符处填入擦除字符(空格字符)。
*p = video_erase_char;
}
//// 删除光标所在行。
// 从光标所在行开始屏幕内容上卷一行。
static void delete_line(void)
{
int oldtop,oldbottom;
oldtop = top; // 保存原top,bottom 值。
oldbottom = bottom;
top = y; // 设置屏幕卷动开始行。
bottom = video_num_lines; // 设置屏幕卷动最后行。
scrup (); // 从光标开始处,屏幕内容向上滚动一行。
top = oldtop; // 恢复原top,bottom 值。
bottom=oldbottom;
}
//// 在光标处插入nr 个字符。
// ANSI 转义字符序列:'ESC [n@ '。
// 参数 nr = 上面n。
static void csi_at(unsigned int nr)
{
// 如果插入的字符数大于一行字符数,则截为一行字符数;若插入字符数nr 为0,则插入1 个字符。
if (nr > video_num_columns)
nr = video_num_columns;
else if (!nr)
nr = 1;
// 循环插入指定的字符数。
while (nr--)
insert_char();
}
//// 在光标位置处插入nr 行。
// ANSI 转义字符序列'ESC [nL'。
static void csi_L(unsigned int nr)
{
// 如果插入的行数大于屏幕最多行数,则截为屏幕显示行数;若插入行数nr 为0,则插入1 行。
if (nr > video_num_lines)
nr = video_num_lines;
else if (!nr)
nr = 1;
// 循环插入指定行数nr。
while (nr--)
insert_line();
}
//// 删除光标处的nr 个字符。
// ANSI 转义序列:'ESC [nP'。
static void csi_P (unsigned int nr)
{
// 如果删除的字符数大于一行字符数,则截为一行字符数;若删除字符数nr 为0,则删除1 个字符。
if (nr > video_num_columns)
nr = video_num_columns;
else if (!nr)
nr = 1;
// 循环删除指定字符数nr。
while (nr--)
delete_char ();
}
//// 删除光标处的nr 行。
// ANSI 转义序列:'ESC [nM'。
static void csi_M (unsigned int nr)
{
// 如果删除的行数大于屏幕最多行数,则截为屏幕显示行数;若删除的行数nr 为0,则删除1 行。
if (nr > video_num_lines)
nr = video_num_lines;
else if (!nr)
nr = 1;
// 循环删除指定行数nr。
while (nr--)
delete_line ();
}
static int saved_x = 0; // 保存的光标列号。
static int saved_y = 0; // 保存的光标行号。
//// 保存当前光标位置。
static void save_cur(void)
{
saved_x=x;
saved_y=y;
}
//// 恢复保存的光标位置。
static void restore_cur(void)
{
gotoxy(saved_x, saved_y);
}
//// 控制台写函数。
// 从终端对应的tty 写缓冲队列中取字符,并显示在屏幕上。
void con_write(struct tty_struct * tty)
{
int nr;
char c;
// 首先取得写缓冲队列中现有字符数nr,然后针对每个字符进行处理。
nr = CHARS(tty->write_q);
while (nr--) {
// 从写队列中取一字符c,根据前面所处理字符的状态state 分别处理。状态之间的转换关系为:
// state = 0:初始状态;或者原是状态4;或者原是状态1,但字符不是'[';
// 1:原是状态0,并且字符是转义字符ESC(0x1b = 033 = 27);
// 2:原是状态1,并且字符是'[';
// 3:原是状态2;或者原是状态3,并且字符是';'或数字。
// 4:原是状态3,并且字符不是';'或数字;
GETCH(tty->write_q,c);
switch(state) {
case 0:
// 如果字符不是控制字符(c>31),并且也不是扩展字符(c<127),则
if (c>31 && c<127) {
// 若当前光标处在行末端或末端以外,则将光标移到下行头列。并调整光标位置对应的内存指针pos。
if (x>=video_num_columns) {
x -= video_num_columns;
pos -= video_size_row;
lf();
}
// 将字符c 写到显示内存中pos 处,并将光标右移1 列,同时也将pos 对应地移动2 个字节。
__asm__("movb _attr,%%ah\n\t"
"movw %%ax,%1\n\t"
::"a" (c),"m" (*(short *)pos)
);
pos += 2;
x++;
// 如果字符c 是转义字符ESC,则转换状态state 到1。
} else if (c==27)
state=1;
// 如果字符c 是换行符(10),或是垂直制表符VT(11),或者是换页符FF(12),则移动光标到下一行。
else if (c==10 || c==11 || c==12)
lf();
// 如果字符c 是回车符CR(13),则将光标移动到头列(0 列)。
else if (c==13)
cr();
// 如果字符c 是DEL(127),则将光标右边一字符擦除(用空格字符替代),并将光标移到被擦除位置。
else if (c == ERASE_CHAR (tty))
del ();
// 如果字符c 是BS(backspace,8),则将光标右移1 格,并相应调整光标对应内存位置指针pos。
else if (c==8) {
if (x) {
x--;
pos -= 2;
}
// 如果字符c 是水平制表符TAB(9),则将光标移到8 的倍数列上。若此时光标列数超出屏幕最大列数,
// 则将光标移到下一行上。
} else if (c==9) {
c=8-(x&7);
x += c;
pos += c<<1;
if (x>video_num_columns) {
x -= video_num_columns;
pos -= video_size_row;
lf();
}
c=9;
// 如果字符c 是响铃符BEL(7),则调用蜂鸣函数,是扬声器发声。
} else if (c==7)
sysbeep();
break;
// 如果原状态是0,并且字符是转义字符ESC(0x1b = 033 = 27),则转到状态1 处理。
case 1:
state = 0;
// 如果字符c 是'[',则将状态state 转到2。
if (c == '[')
state = 2;
// 如果字符c 是'E',则光标移到下一行开始处(0 列)。
else if (c == 'E')
gotoxy (0, y + 1);
// 如果字符c 是'M',则光标上移一行。
else if (c == 'M')
ri ();
// 如果字符c 是'D',则光标下移一行。
else if (c == 'D')
lf ();
// 如果字符c 是'Z',则发送终端应答字符序列。
else if (c == 'Z')
respond (tty);
// 如果字符c 是'7',则保存当前光标位置。注意这里代码写错!应该是(c=='7')。
else if (x == '7')
save_cur ();
// 如果字符c 是'8',则恢复到原保存的光标位置。注意这里代码写错!应该是(c=='8')。
else if (x == '8')
restore_cur ();
break;
// 如果原状态是1,并且上一字符是'[',则转到状态2 来处理。
case 2:
// 首先对ESC 转义字符序列参数使用的处理数组par[]清零,索引变量npar 指向首项,并且设置状态
// 为3。若此时字符不是'?',则直接转到状态3 去处理,否则去读一字符,再到状态3 处理代码处。
for(npar=0;npar<NPAR;npar++)
par[npar]=0;
npar=0;
state=3;
if ((ques=(c=='?')))
break;
// 如果原来是状态2;或者原来就是状态3,但原字符是';'或数字,则在下面处理。
case 3:
// 如果字符c 是分号';',并且数组par 未满,则索引值加1。
if (c==';' && npar<NPAR-1) {
npar++;
break;
// 如果字符c 是数字字符'0'-'9',则将该字符转换成数值并与npar 所索引的项组成10 进制数。
} else if (c>='0' && c<='9') {
par[npar]=10*par[npar]+c-'0';
break;
// 否则转到状态4。
} else state=4;
// 如果原状态是状态3,并且字符不是';'或数字,则转到状态4 处理。首先复位状态state=0。
case 4:
state=0;
switch(c) {
// 如果字符c 是'G'或'`',则par[]中第一个参数代表列号。若列号不为零,则将光标右移一格。
case 'G':
case '`':
if (par[0])
par[0]--;
gotoxy (par[0], y);
break;
// 如果字符c 是'A',则第一个参数代表光标上移的行数。若参数为0 则上移一行。
case 'A':
if (!par[0])
par[0]++;
gotoxy (x, y - par[0]);
break;
// 如果字符c 是'B'或'e',则第一个参数代表光标下移的行数。若参数为0 则下移一行。
case 'B':
case 'e':
if (!par[0])
par[0]++;
gotoxy (x, y + par[0]);
break;
// 如果字符c 是'C'或'a',则第一个参数代表光标右移的格数。若参数为0 则右移一格。
case 'C': case 'a':
if (!par[0]) par[0]++;
gotoxy(x+par[0],y);
break;
// 如果字符c 是'D',则第一个参数代表光标左移的格数。若参数为0 则左移一格。
case 'D':
if (!par[0]) par[0]++;
gotoxy(x-par[0],y);
break;
// 如果字符c 是'E',则第一个参数代表光标向下移动的行数,并回到0 列。若参数为0 则下移一行。
case 'E':
if (!par[0]) par[0]++;
gotoxy(0,y+par[0]);
break;
// 如果字符c 是'F',则第一个参数代表光标向上移动的行数,并回到0 列。若参数为0 则上移一行。
case 'F':
if (!par[0]) par[0]++;
gotoxy(0,y-par[0]);
break;
// 如果字符c 是'd',则第一个参数代表光标所需在的行号(从0 计数)。
case 'd':
if (par[0]) par[0]--;
gotoxy(x,par[0]);
break;
// 如果字符c 是'H'或'f',则第一个参数代表光标移到的行号,第二个参数代表光标移到的列号。
case 'H': case 'f':
if (par[0]) par[0]--;
if (par[1]) par[1]--;
gotoxy(par[1],par[0]);
break;
// 如果字符c 是'J',则第一个参数代表以光标所处位置清屏的方式:
// ANSI 转义序列:'ESC [sJ'(s = 0 删除光标到屏幕底端;1 删除屏幕开始到光标处;2 整屏删除)。
case 'J':
csi_J (par[0]);
break;
// 如果字符c 是'K',则第一个参数代表以光标所在位置对行中字符进行删除处理的方式。
// ANSI 转义字符序列:'ESC [sK'(s = 0 删除到行尾;1 从开始删除;2 整行都删除)。
case 'K':
csi_K (par[0]);
break;
// 如果字符c 是'L',表示在光标位置处插入n 行(ANSI 转义字符序列'ESC [nL')。
case 'L':
csi_L (par[0]);
break;
// 如果字符c 是'M',表示在光标位置处删除n 行(ANSI 转义字符序列'ESC [nM')。
case 'M':
csi_M (par[0]);
break;
// 如果字符c 是'P',表示在光标位置处删除n 个字符(ANSI 转义字符序列'ESC [nP')。
case 'P':
csi_P (par[0]);
break;
// 如果字符c 是'@',表示在光标位置处插入n 个字符(ANSI 转义字符序列'ESC [n@')。
case '@':
csi_at (par[0]);
break;
// 如果字符c 是'm',表示改变光标处字符的显示属性,比如加粗、加下划线、闪烁、反显等。
// ANSI 转义字符序列:'ESC [nm'。n = 0 正常显示;1 加粗;4 加下划线;7 反显;27 正常显示。
case 'm':
csi_m ();
break;
// 如果字符c 是'r',则表示用两个参数设置滚屏的起始行号和终止行号。
case 'r':
if (par[0])
par[0]--;
if (!par[1])
par[1] = video_num_lines;
if (par[0] < par[1] && par[1] <= video_num_lines)
{
top = par[0];
bottom = par[1];
}
break;
// 如果字符c 是's',则表示保存当前光标所在位置。
case 's':
save_cur ();
break;
// 如果字符c 是'u',则表示恢复光标到原保存的位置处。
case 'u':
restore_cur ();
break;
}
}
}
set_cursor();
}
/*
* void con_init(void);
*
* This routine initalizes console interrupts, and does nothing
* else. If you want the screen to clear, call tty_write with
* the appropriate escape-sequece.
*
* Reads the information preserved by setup.s to determine the current display
* type and sets everything accordingly.
*/
/*
* void con_init(void);
* 这个子程序初始化控制台中断,其它什么都不做。如果你想让屏幕干净的话,就使用
* 适当的转义字符序列调用tty_write()函数。
*
* 读取setup.s 程序保存的信息,用以确定当前显示器类型,并且设置所有相关参数。
*/
void con_init(void)
{
register unsigned char a;
char *display_desc = "????";
char *display_ptr;
video_num_columns = ORIG_VIDEO_COLS; // 显示器显示字符列数。
video_size_row = video_num_columns * 2; // 每行需使用字节数。
video_num_lines = ORIG_VIDEO_LINES; // 显示器显示字符行数。
video_page = ORIG_VIDEO_PAGE; // 当前显示页面。
video_erase_char = 0x0720; // 擦除字符(0x20 显示字符, 0x07 是属性)。
// 如果原始显示模式等于7,则表示是单色显示器。
if (ORIG_VIDEO_MODE == 7) /* Is this a monochrome display? */
{
video_mem_start = 0xb0000; // 设置单显映象内存起始地址。
video_port_reg = 0x3b4; // 设置单显索引寄存器端口。
video_port_val = 0x3b5; // 设置单显数据寄存器端口。
// 根据BIOS 中断int 0x10 功能0x12 获得的显示模式信息,判断显示卡单色显示卡还是彩色显示卡。
// 如果使用上述中断功能所得到的BX 寄存器返回值不等于0x10,则说明是EGA 卡。因此初始
// 显示类型为EGA 单色;所使用映象内存末端地址为0xb8000;并置显示器描述字符串为'EGAm'。
// 在系统初始化期间显示器描述字符串将显示在屏幕的右上角。
if ((ORIG_VIDEO_EGA_BX & 0xff) != 0x10)
{
video_type = VIDEO_TYPE_EGAM; // 设置显示类型(EGA 单色)。
video_mem_end = 0xb8000; // 设置显示内存末端地址。
display_desc = "EGAm"; // 设置显示描述字符串。
}
// 如果BX 寄存器的值等于0x10,则说明是单色显示卡MDA。则设置相应参数。
else
{
video_type = VIDEO_TYPE_MDA; // 设置显示类型(MDA 单色)。
video_mem_end = 0xb2000; // 设置显示内存末端地址。
display_desc = "*MDA"; // 设置显示描述字符串。
}
}
// 如果显示模式不为7,则为彩色模式。此时所用的显示内存起始地址为0xb800;显示控制索引寄存
// 器端口地址为0x3d4;数据寄存器端口地址为0x3d5。
else /* If not, it is color. */
{
video_mem_start = 0xb8000; // 显示内存起始地址。
video_port_reg = 0x3d4; // 设置彩色显示索引寄存器端口。
video_port_val = 0x3d5; // 设置彩色显示数据寄存器端口。
// 再判断显示卡类别。如果BX 不等于0x10,则说明是EGA 显示卡。
if ((ORIG_VIDEO_EGA_BX & 0xff) != 0x10)
{
video_type = VIDEO_TYPE_EGAC; // 设置显示类型(EGA 彩色)。
video_mem_end = 0xbc000; // 设置显示内存末端地址。
display_desc = "EGAc"; // 设置显示描述字符串。
}
// 如果BX 寄存器的值等于0x10,则说明是CGA 显示卡。则设置相应参数。
else
{
video_type = VIDEO_TYPE_CGA; // 设置显示类型(CGA)。
video_mem_end = 0xba000; // 设置显示内存末端地址。
display_desc = "*CGA"; // 设置显示描述字符串。
}
}
/* Let the user known what kind of display driver we are using */
/* 让用户知道我们正在使用哪一类显示驱动程序 */
// 在屏幕的右上角显示显示描述字符串。采用的方法是直接将字符串写到显示内存的相应位置处。
// 首先将显示指针display_ptr 指到屏幕第一行右端差4 个字符处(每个字符需2 个字节,因此减8)。
display_ptr = ((char *)video_mem_start) + video_size_row - 8;
// 然后循环复制字符串中的字符,并且每复制一个字符都空开一个属性字节。
while (*display_desc)
{
*display_ptr++ = *display_desc++; // 复制字符。
display_ptr++; // 空开属性字节位置。
}
/* Initialize the variables used for scrolling (mostly EGA/VGA) */
/* 初始化用于滚屏的变量(主要用于EGA/VGA) */
origin = video_mem_start; // 滚屏起始显示内存地址。
scr_end = video_mem_start + video_num_lines * video_size_row; // 滚屏结束内存地址。
top = 0; // 最顶行号。
bottom = video_num_lines; // 最底行号。
gotoxy (ORIG_X, ORIG_Y); // 初始化光标位置x,y 和对应的内存位置pos。
set_trap_gate (0x21, &keyboard_interrupt); // 设置键盘中断陷阱门。
outb_p (inb_p (0x21) & 0xfd, 0x21); // 取消8259A 中对键盘中断的屏蔽,允许IRQ1。
a = inb_p (0x61); // 延迟读取键盘端口0x61(8255A 端口PB)。
outb_p (a | 0x80, 0x61); // 设置禁止键盘工作(位7 置位),
outb (a, 0x61); // 再允许键盘工作,用以复位键盘操作。
}
/* from bsd-net-2: */
//// 停止蜂鸣。
// 复位8255A PB 端口的位1 和位0。
void sysbeepstop(void)
{
/* disable counter 2 *//* 禁止定时器2 */
outb(inb_p(0x61)&0xFC, 0x61);
}
int beepcount = 0;
// 开通蜂鸣。
// 8255A 芯片PB 端口的位1 用作扬声器的开门信号;位0 用作8253 定时器2 的门信号,该定时器的
// 输出脉冲送往扬声器,作为扬声器发声的频率。因此要使扬声器蜂鸣,需要两步:首先开启PB 端口
// 位1 和位0(置位),然后设置定时器发送一定的定时频率即可。
static void sysbeep(void)
{
/* enable counter 2 *//* 开启定时器2 */
outb_p(inb_p(0x61)|3, 0x61);
/* set command for counter 2, 2 byte write *//* 送设置定时器2 命令 */
outb_p(0xB6, 0x43);
/* send 0x637 for 750 HZ *//* 设置频率为750HZ,因此送定时值0x637 */
outb_p(0x37, 0x42);
outb(0x06, 0x42);
/* 1/8 second *//* 蜂鸣时间为1/8 秒 */
beepcount = HZ/8;
}
/*
* linux/kernel/keyboard.S
*
* (C) 1991 Linus Torvalds
*/
/*
* Thanks to Alfred Leung for US keyboard patches
* Wolfgang Thiel for German keyboard patches
* Marc Corsini for the French keyboard
*/
/*
* 感谢Alfred Leung 添加了US 键盘补丁程序;
* Wolfgang Thiel 添加了德语键盘补丁程序;
* Marc Corsini 添加了法文键盘补丁程序。
*/
#include <linux/config.h> // 内核配置头文件。定义键盘语言和硬盘类型(HD_TYPE)可选项。
.text
.globl _keyboard_interrupt
/*
* these are for the keyboard read functions
*/
/*
* 以下这些是用于键盘读操作。
*/
// size 是键盘缓冲区的长度(字节数)。
size = 1024 /* must be a power of two ! And MUST be the same
as in tty_io.c !!!! */
/* 数值必须是2 的次方!并且与tty_io.c 中的值匹配!!!! */
// 以下这些是缓冲队列结构中的偏移量 */
head = 4 # 缓冲区中头指针字段偏移。
tail = 8 # 缓冲区中尾指针字段偏移。
proc_list = 12 # 等待该缓冲队列的进程字段偏移。
buf = 16 # 缓冲区字段偏移。
// mode 是键盘特殊键的按下状态标志。
// 表示大小写转换键(caps)、交换键(alt)、控制键(ctrl)和换档键(shift)的状态。
// 位7 caps 键按下;
// 位6 caps 键的状态(应该与leds 中的对应标志位一样);
// 位5 右alt 键按下;
// 位4 左alt 键按下;
// 位3 右ctrl 键按下;
// 位2 左ctrl 键按下;
// 位1 右shift 键按下;
// 位0 左shift 键按下。
mode: .byte 0 /* caps, alt, ctrl and shift mode */
// 数字锁定键(num-lock)、大小写转换键(caps-lock)和滚动锁定键(scroll-lock)的LED 发光管状态。
// 位7-3 全0 不用;
// 位2 caps-lock;
// 位1 num-lock(初始置1,也即设置数字锁定键(num-lock)发光管为亮);
// 位0 scroll-lock。
leds: .byte 2 /* num-lock, caps, scroll-lock mode (nom-lock on) */
// 当扫描码是0xe0 或0xe1 时,置该标志。表示其后还跟随着1 个或2 个字符扫描码。
// 位1 =1 收到0xe1 标志;
// 位0 =1 收到0xe0 标志。
e0: .byte 0
/*
* con_int is the real interrupt routine that reads the
* keyboard scan-code and converts it into the appropriate
* ascii character(s).
*/
/*
* con_int 是实际的中断处理子程序,用于读键盘扫描码并将其转换
* 成相应的ascii 字符。
*/
//// 键盘中断处理程序入口点。
_keyboard_interrupt:
pushl %eax
pushl %ebx
pushl %ecx
pushl %edx
push %ds
push %es
movl $0x10,%eax # 将ds、es 段寄存器置为内核数据段。
mov %ax,%ds
mov %ax,%es
xor %al,%al /* %eax is scan code */ /* eax 是扫描码*/
inb $0x60,%al
cmpb $0xe0,%al
je set_e0
cmpb $0xe1,%al
je set_e1
call *key_table(,%eax,4) # 调用键处理程序ker_table + eax * 4
movb $0,e0 # 复位e0 标志。
// 下面这段代码是针对使用 8255A 的 PC 标准键盘电路进行硬件复位处理。端口 0x61 是
// 8255A 输出口 B 的地址,该输出端口的第 7 位(PB7)用于禁止和允许对键盘数据的处理。
// 这段程序用于对收到的扫描码做出应答。方法是首先禁止键盘,然后立刻重新允许键盘工作。
e0_e1: inb $0x61,%al # 取PPI 端口 B 状态,其位7 用于允许/禁止(0/1)键盘。
jmp 1f # 延时
1: jmp 1f
1: orb $0x80,%al # al 位7 置位(禁止键盘工作)
jmp 1f # 延时
1: jmp 1f
1: outb %al,$0x61 # 使PPI PB7 位置位。
jmp 1f # 延时
1: jmp 1f
1: andb $0x7F,%al # al 位7 复位。
outb %al,$0x61 # 使PPI PB7 位复位(允许键盘工作)。
movb $0x20,%al # 向8259 中断芯片发送EOI(中断结束)信号。
outb %al,$0x20
pushl $0 # 控制台tty 号=0,作为参数入栈。
call _do_tty_interrupt # 将收到的数据复制成规范模式数据并存放在规范字符缓冲队列中。
addl $4,%esp # 丢弃入栈的参数,弹出保留的寄存器,并中断返回。
pop %es
pop %ds
popl %edx
popl %ecx
popl %ebx
popl %eax
iret
set_e0: movb $1,e0 # 收到扫描前导码0xe0 时,设置e0 标志(位0)。
jmp e0_e1
set_e1: movb $2,e0 # 收到扫描前导码0xe1 时,设置e1 标志(位1)。
jmp e0_e1
/*
* This routine fills the buffer with max 8 bytes, taken from
* %ebx:%eax. (%edx is high). The bytes are written in the
* order %al,%ah,%eal,%eah,%bl,%bh ... until %eax is zero.
*/
/*
* 下面该子程序把ebx:eax 中的最多8 个字符添入缓冲队列中。(edx 是
* 所写入字符的顺序是al,ah,eal,eah,bl,bh...直到eax 等于0。
*/
put_queue:
pushl %ecx # 保存ecx,edx 内容。
pushl %edx # 取控制台tty 结构中读缓冲队列指针。
movl _table_list,%edx # read-queue for console
movl head(%edx),%ecx # 取缓冲队列中头指针->ecx。
1: movb %al,buf(%edx,%ecx) # 将al 中的字符放入缓冲队列头指针位置处。
incl %ecx # 头指针前移1 字节。
andl $size-1,%ecx # 以缓冲区大小调整头指针(若超出则返回缓冲区开始)。
cmpl tail(%edx),%ecx # buffer full - discard everything
# 头指针==尾指针吗(缓冲队列满)?
je 3f # 如果已满,则后面未放入的字符全抛弃。
shrdl $8,%ebx,%eax # 将ebx 中8 位比特位右移8 位到eax 中,但ebx 不变。
je 2f # 还有字符吗?若没有(等于0)则跳转。
shrl $8,%ebx # 将ebx 中比特位右移8 位,并跳转到标号1 继续操作。
jmp 1b
2: movl %ecx,head(%edx) # 若已将所有字符都放入了队列,则保存头指针。
movl proc_list(%edx),%ecx # 该队列的等待进程指针?
testl %ecx,%ecx # 检测任务结构指针是否为空(有等待该队列的进程吗?)。
je 3f # 无,则跳转;
movl $0,(%ecx) # 有,则置该进程为可运行就绪状态(唤醒该进程)。
3: popl %edx # 弹出保留的寄存器并返回。
popl %ecx
ret
// 下面这段代码根据ctrl 或alt 的扫描码,分别设置模式标志中相应位。如果该扫描码之前收到过
// 0xe0 扫描码(e0 标志置位),则说明按下的是键盘右边的ctrl 或alt 键,则对应设置ctrl 或alt
// 在模式标志mode 中的比特位。
ctrl: movb $0x04,%al # 0x4 是模式标志mode 中左ctrl 键对应的比特位(位2)。
jmp 1f
alt: movb $0x10,%al # 0x10 是模式标志mode 中左alt 键对应的比特位(位4)。
1: cmpb $0,e0 # e0 标志置位了吗(按下的是右边的ctrl 或alt 键吗)?
je 2f # 不是则转。
addb %al,%al # 是,则改成置相应右键的标志位(位3 或位5)。
2: orb %al,mode # 设置模式标志mode 中对应的比特位。
ret
// 这段代码处理ctrl 或alt 键松开的扫描码,对应复位模式标志mode 中的比特位。在处理时要根据
// e0 标志是否置位来判断是否是键盘右边的ctrl 或alt 键。
unctrl: movb $0x04,%al # 模式标志mode 中左ctrl 键对应的比特位(位2)。
jmp 1f
unalt: movb $0x10,%al # 0x10 是模式标志mode 中左alt 键对应的比特位(位4)。
1: cmpb $0,e0 # e0 标志置位了吗(释放的是右边的ctrl 或alt 键吗)?
je 2f # 不是,则转。
addb %al,%al
2: notb %al
andb %al,mode
ret
lshift:
orb $0x01,mode # 是左shift 键按下,设置mode 中对应的标志位(位0)。
ret
unlshift:
andb $0xfe,mode # 是左shift 键松开,复位mode 中对应的标志位(位0)。
ret
rshift:
orb $0x02,mode # 是右shift 键按下,设置mode 中对应的标志位(位1)。
ret
unrshift:
andb $0xfd,mode # 是右shift 键松开,复位mode 中对应的标志位(位1)。
ret
caps:
testb $0x80,mode # 测试模式标志mode 中位7 是否已经置位(按下状态)。
jne 1f # 如果已处于按下状态,则返回(ret)。
xorb $4,leds # 翻转leds 标志中caps-lock 比特位(位2)。
xorb $0x40,mode # 翻转mode 标志中caps 键按下的比特位(位6)。
orb $0x80,mode # 设置mode 标志中caps 键已按下标志位(位7)。
// 这段代码根据 leds 标志,开启或关闭 LED 指示器。
set_leds:
call kb_wait # 等待键盘控制器输入缓冲空。
movb $0xed,%al /* set leds command */ /* 设置 LED 的命令 */
outb %al,$0x60 # 发送键盘命令0xed 到0x60 端口。
call kb_wait # 等待键盘控制器输入缓冲空。
movb leds,%al # 取leds 标志,作为参数。
outb %al,$0x60 # 发送该参数。
ret
uncaps: andb $0x7f,mode # caps 键松开,则复位模式标志mode 中的对应位(位7)。
ret
scroll:
xorb $1,leds # scroll 键按下,则翻转leds 标志中的对应位(位0)。
jmp set_leds # 根据leds 标志重新开启或关闭LED 指示器。
num:
xorb $2,leds # num 键按下,则翻转leds 标志中的对应位(位1)。
jmp set_leds # 根据leds 标志重新开启或关闭LED 指示器。
/*
* curosr-key/numeric keypad cursor keys are handled here.
* checking for numeric keypad etc.
*/
/*
* 这里处理方向键/数字小键盘方向键,检测数字小键盘等。
*/
cursor:
subb $0x47,%al # 扫描码是小数字键盘上的键(其扫描码>=0x47)发出的?
jb 1f # 如果小于则不处理,返回。
cmpb $12,%al # 如果扫描码 > 0x53(0x53 - 0x47= 12),则
ja 1f # 扫描码值超过83(0x53),不处理,返回。
jne cur2 /* check for ctrl-alt-del *//* 检查是否ctrl-alt-del */
// 如果等于12,则说明del 键已被按下,则继续判断ctrl
// 和alt 是否也同时按下。
testb $0x0c,mode # 有ctrl 键按下吗?
je cur2 # 无,则跳转
testb $0x30,mode # 有alt 键按下吗?
jne reboot # 有,则跳转到重启动处理。
cur2: cmpb $0x01,e0 /* e0 forces cursor movement */
je cur
testb $0x02,leds /* not num-lock forces cursor *//* e0 置位表示光标移动 */
// e0 标志置位了吗?
je cur # 置位了,则跳转光标移动处理处cur。
testb $0x03,mode /* shift forces cursor *//* num-lock 键则不许 */
// 测试模式标志mode 中shift 按下标志。
jne cur # 如果有shift 键按下,则也进行光标移动处理。
xorl %ebx,%ebx # 否则查询扫数字表(下面),取对应键的数字ASCII 码。
movb num_table(%eax),%al # 以eax 作为索引值,取对应数字字符al。
jmp put_queue # 将该字符放入缓冲队列中。
1: ret
// 这段代码处理光标的移动。
cur:
movb cur_table(%eax),%al # 取光标字符表中相应键的代表字符al。
cmpb $'9,%al # 取光标字符表中相应键的代表字符al。
ja ok_cur # 则功能字符序列中要添入字符'~'。
movb $'~,%ah
ok_cur:
shll $16,%eax # 将ax 中内容移到eax 高字中。
movw $0x5b1b,%ax # 在ax 中放入'esc ['字符,与eax 高字中字符组成移动序列。
xorl %ebx,%ebx
jmp put_queue # 将该字符放入缓冲队列中。
num_table:
.ascii "789 456 1230," # 数字小键盘上键对应的数字ASCII 码表。
cur_table:
.ascii "HA5 DGC YB623" # 数字小键盘上方向键或插入删除键对应的移动表示字符表。
/*
* this routine handles function keys
*/
// 下面子程序处理功能键。
func:
pushl %eax
pushl %ecx
pushl %edx
call _show_stat # 调用显示各任务状态函数(kernl/sched.c)。
popl %edx
popl %ecx
popl %eax
subb $0x3B,%al # 功能键'F1'的扫描码是0x3B,因此此时al 中是功能键索引号。
jb end_func # 如果扫描码小于0x3b,则不处理,返回。
cmpb $9,%al # 功能键是F1-F10?
jbe ok_func # 是,则跳转。
subb $18,%al # 是功能键F11,F12 吗?
cmpb $10,%al # 是功能键F11?
jb end_func # 不是,则不处理,返回。
cmpb $11,%al # 是功能键F12?
ja end_func # 不是,则不处理,返回。
ok_func:
cmpl $4,%ecx /* check that there is enough room *//* 检查是否有足够空间*/
jl end_func # 需要放入4 个字符序列,如果放不下,则返回。
movl func_table(,%eax,4),%eax # 取功能键对应字符序列。
xorl %ebx,%ebx
jmp put_queue # 放入缓冲队列中。
end_func:
ret
/*
* function keys send F1:'esc [ [ A' F2:'esc [ [ B' etc.
*/
/*
* 功能键发送的扫描码,F1 键为:'esc [ [ A', F2 键为:'esc [ [ B'等。
*/
func_table:
.long 0x415b5b1b,0x425b5b1b,0x435b5b1b,0x445b5b1b
.long 0x455b5b1b,0x465b5b1b,0x475b5b1b,0x485b5b1b
.long 0x495b5b1b,0x4a5b5b1b,0x4b5b5b1b,0x4c5b5b1b
// 扫描码-ASCII 字符映射表。
// 根据在config.h 中定义的键盘类型(FINNISH,US,GERMEN,FRANCH),将相应键的扫描码映射
// 到ASCII 字符。
#if defined(KBD_US)
// 以下是芬兰语键盘的扫描码映射表。
key_map:
.byte 0,27
.ascii "1234567890-="
.byte 127,9
.ascii "qwertyuiop[]"
.byte 13,0
.ascii "asdfghjkl;'"
.byte '`,0
.ascii "\\zxcvbnm,./"
.byte 0,'*,0,32 /* 36-39 */
.fill 16,1,0 /* 3A-49 */
.byte '-,0,0,0,'+ /* 4A-4E */
.byte 0,0,0,0,0,0,0 /* 4F-55 */
.byte '<
.fill 10,1,0
// shift 键同时按下时的映射表。
shift_map:
.byte 0,27
.ascii "!@#$%^&*()_+"
.byte 127,9
.ascii "QWERTYUIOP{}"
.byte 13,0
.ascii "ASDFGHJKL:\""
.byte '~,0
.ascii "|ZXCVBNM<>?"
.byte 0,'*,0,32 /* 36-39 */
.fill 16,1,0 /* 3A-49 */
.byte '-,0,0,0,'+ /* 4A-4E */
.byte 0,0,0,0,0,0,0 /* 4F-55 */
.byte '>
.fill 10,1,0
// alt 键同时按下时的映射表。
alt_map:
.byte 0,0
.ascii "\0@\0$\0\0{[]}\\\0"
.byte 0,0
.byte 0,0,0,0,0,0,0,0,0,0,0
.byte '~,13,0
.byte 0,0,0,0,0,0,0,0,0,0,0
.byte 0,0
.byte 0,0,0,0,0,0,0,0,0,0,0
.byte 0,0,0,0 /* 36-39 */
.fill 16,1,0 /* 3A-49 */
.byte 0,0,0,0,0 /* 4A-4E */
.byte 0,0,0,0,0,0,0 /* 4F-55 */
.byte '|
.fill 10,1,0
#else
#error "KBD-type not defined"
#endif
/*
* do_self handles "normal" keys, ie keys that don't change meaning
* and which have just one character returns.
*/
/*
* do_self 用于处理“普通”键,也即含义没有变化并且只有一个字符返回的键。
*/
do_self:
lea alt_map,%ebx # alt 键同时按下时的映射表基址alt_map->ebx
testb $0x20,mode /* alt-gr *//* 右alt 键同时按下了? */
jne 1f # 是,则向前跳转到标号1 处。
lea shift_map,%ebx # shift 键同时按下时的映射表基址shift_map->ebx。
testb $0x03,mode # 有shift 键同时按下了吗?
jne 1f # 有,则向前跳转到标号1 处
lea key_map,%ebx # 否则使用普通映射表key_map。
// 取映射表中对应扫描码的ASCII 字符,若没有对应字符,则返回(转none)。
1: movb (%ebx,%eax),%al # 将扫描码作为索引值,取对应的ASCII 码->al。
orb %al,%al # 检测看是否有对应的ASCII 码。
je none # 若没有(对应的ASCII 码=0),则返回。
// 若ctrl 键已按下或caps 键锁定,并且字符在'a'-'}'(0x61-0x7D)范围内,则将其转成大写字符
// (0x41-0x5D)。
testb $0x4c,mode /* ctrl or caps */ /* 控制键已按下或caps 亮?*/
je 2f # 没有,则向前跳转标号2 处。
cmpb $'a,%al # 将al 中的字符与'a'比较。
jb 2f # 若al 值<'a',则转标号2 处。
cmpb $'},%al # 将al 中的字符与'}'比较。
ja 2f # 若al 值>'}',则转标号2 处。
subb $32,%al # 将al 转换为大写字符(减0x20)。
// 若ctrl 键已按下,并且字符在'`'--'_'(0x40-0x5F)之间(是大写字符),则将其转换为控制字符
// (0x00-0x1F)。
2: testb $0x0c,mode /* ctrl *//* ctrl 键同时按下了吗?*/
je 3f # 若没有则转标号3。
cmpb $64,%al # 将al 与'@'(64)字符比较(即判断字符所属范围)。
jb 3f # 若值<'@',则转标号3。
cmpb $64+32,%al # 将al 与'`'(96)字符比较(即判断字符所属范围)。
jae 3f # 若值>='`',则转标号3。
subb $64,%al # 否则al 值减0x40,
// 即将字符转换为0x00-0x1f 之间的控制字符。
// 若左alt 键同时按下,则将字符的位7 置位。
3: testb $0x10,mode /* left alt *//* 左alt 键同时按下?*/
je 4f # 没有,则转标号4
orb $0x80,%al # 字符的位7 置位。
// 将al 中的字符放入读缓冲队列中。
4: andl $0xff,%eax # 清eax 的高字和ah。
xorl %ebx,%ebx
call put_queue # 将字符放入缓冲队列中。
none: ret
/*
* minus has a routine of it's own, as a 'E0h' before
* the scan code for minus means that the numeric keypad
* slash was pushed.
*/
/*
* 减号有它自己的处理子程序,因为在减号扫描码之前的0xe0
* 意味着按下了数字小键盘上的斜杠键。
*/
minus:
cmpb $1,e0 # e0 标志置位了吗?
jne do_self # 没有,则调用do_self 对减号符进行普通处理。
movl $'/,%eax # 否则用'/'替换减号'-'>al。
xorl %ebx,%ebx
jmp put_queue # 并将字符放入缓冲队列中。
/*
* This table decides which routine to call when a scan-code has been
* gotten. Most routines just call do_self, or none, depending if
* they are make or break.
*/
/* 下面是一张子程序地址跳转表。当取得扫描码后就根据此表调用相应的扫描码处理子程序。
* 大多数调用的子程序是do_self,或者是none,这起决于是按键(make)还是释放键(break)。
*/
key_table:
.long none,do_self,do_self,do_self /* 00-03 s0 esc 1 2 */
.long do_self,do_self,do_self,do_self /* 04-07 3 4 5 6 */
.long do_self,do_self,do_self,do_self /* 08-0B 7 8 9 0 */
.long do_self,do_self,do_self,do_self /* 0C-0F + ' bs tab */
.long do_self,do_self,do_self,do_self /* 10-13 q w e r */
.long do_self,do_self,do_self,do_self /* 14-17 t y u i */
.long do_self,do_self,do_self,do_self /* 18-1B o p } ^ */
.long do_self,ctrl,do_self,do_self /* 1C-1F enter ctrl a s */
.long do_self,do_self,do_self,do_self /* 20-23 d f g h */
.long do_self,do_self,do_self,do_self /* 24-27 j k l | */
.long do_self,do_self,lshift,do_self /* 28-2B { para lshift , */
.long do_self,do_self,do_self,do_self /* 2C-2F z x c v */
.long do_self,do_self,do_self,do_self /* 30-33 b n m , */
.long do_self,minus,rshift,do_self /* 34-37 . - rshift * */
.long alt,do_self,caps,func /* 38-3B alt sp caps f1 */
.long func,func,func,func /* 3C-3F f2 f3 f4 f5 */
.long func,func,func,func /* 40-43 f6 f7 f8 f9 */
.long func,num,scroll,cursor /* 44-47 f10 num scr home */
.long cursor,cursor,do_self,cursor /* 48-4B up pgup - left */
.long cursor,cursor,do_self,cursor /* 4C-4F n5 right + end */
.long cursor,cursor,cursor,cursor /* 50-53 dn pgdn ins del */
.long none,none,do_self,func /* 54-57 sysreq ? < f11 */
.long func,none,none,none /* 58-5B f12 ? ? ? */
.long none,none,none,none /* 5C-5F ? ? ? ? */
.long none,none,none,none /* 60-63 ? ? ? ? */
.long none,none,none,none /* 64-67 ? ? ? ? */
.long none,none,none,none /* 68-6B ? ? ? ? */
.long none,none,none,none /* 6C-6F ? ? ? ? */
.long none,none,none,none /* 70-73 ? ? ? ? */
.long none,none,none,none /* 74-77 ? ? ? ? */
.long none,none,none,none /* 78-7B ? ? ? ? */
.long none,none,none,none /* 7C-7F ? ? ? ? */
.long none,none,none,none /* 80-83 ? br br br */
.long none,none,none,none /* 84-87 br br br br */
.long none,none,none,none /* 88-8B br br br br */
.long none,none,none,none /* 8C-8F br br br br */
.long none,none,none,none /* 90-93 br br br br */
.long none,none,none,none /* 94-97 br br br br */
.long none,none,none,none /* 98-9B br br br br */
.long none,unctrl,none,none /* 9C-9F br unctrl br br */
.long none,none,none,none /* A0-A3 br br br br */
.long none,none,none,none /* A4-A7 br br br br */
.long none,none,unlshift,none /* A8-AB br br unlshift br */
.long none,none,none,none /* AC-AF br br br br */
.long none,none,none,none /* B0-B3 br br br br */
.long none,none,unrshift,none /* B4-B7 br br unrshift br */
.long unalt,none,uncaps,none /* B8-BB unalt br uncaps br */
.long none,none,none,none /* BC-BF br br br br */
.long none,none,none,none /* C0-C3 br br br br */
.long none,none,none,none /* C4-C7 br br br br */
.long none,none,none,none /* C8-CB br br br br */
.long none,none,none,none /* CC-CF br br br br */
.long none,none,none,none /* D0-D3 br br br br */
.long none,none,none,none /* D4-D7 br br br br */
.long none,none,none,none /* D8-DB br ? ? ? */
.long none,none,none,none /* DC-DF ? ? ? ? */
.long none,none,none,none /* E0-E3 e0 e1 ? ? */
.long none,none,none,none /* E4-E7 ? ? ? ? */
.long none,none,none,none /* E8-EB ? ? ? ? */
.long none,none,none,none /* EC-EF ? ? ? ? */
.long none,none,none,none /* F0-F3 ? ? ? ? */
.long none,none,none,none /* F4-F7 ? ? ? ? */
.long none,none,none,none /* F8-FB ? ? ? ? */
.long none,none,none,none /* FC-FF ? ? ? ? */
/*
* kb_wait waits for the keyboard controller buffer to empty.
* there is no timeout - if the buffer doesn't empty, we hang.
*/
/*
* 子程序kb_wait 用于等待键盘控制器缓冲空。不存在超时处理 - 如果
* 缓冲永远不空的话,程序就会永远等待(死掉)。
*/
kb_wait:
pushl %eax
1: inb $0x64,%al # 读键盘控制器状态。
testb $0x02,%al # 测试输入缓冲器是否为空(等于0)。
jne 1b # 若不空,则跳转循环等待。
popl %eax
ret
/*
* This routine reboots the machine by asking the keyboard
* controller to pulse the reset-line low.
*/
/*
* 该子程序通过设置键盘控制器,向复位线输出负脉冲,使系统复位重启(reboot)。
*/
reboot:
call kb_wait # 首先等待键盘控制器输入缓冲器空。
movw $0x1234,0x472 /* don't do memory check */
movb $0xfc,%al /* pulse reset and A20 low */
outb %al,$0x64 # 向系统复位和A20 线输出负脉冲。
die: jmp die # 死机。
/*
* linux/kernel/rs_io.s
*
* (C) 1991 Linus Torvalds
*/
/*
* rs_io.s
*
* This module implements the rs232 io interrupts.
*/
/*
* 该程序模块实现rs232 输入输出中断处理程序。
*/
.text
.globl _rs1_interrupt,_rs2_interrupt
// size 是读写队列缓冲区的字节长度。
size = 1024 /* must be power of two !and must match the value in tty_io.c!!! */
/*必须是 2 的次方并且需要与tty_io.c中的值匹配*/
/* these are the offsets into the read/write buffer structures */
/* 以下这些是读写缓冲结构中的偏移量 */
rs_addr = 0 /* 串行端口号字段偏移(端口号是0x3f8 或0x2f8)。*/
head = 4 /* 缓冲区中头指针字段偏移。*/
tail = 8 /* 缓冲区中尾指针字段偏移。*/
proc_list = 12 /* 等待该缓冲的进程字段偏移。*/
buf = 16 /* 缓冲区字段偏移。*/
startup = 256 /* chars left in write queue when we restart it */
/* 当写队列里还剩256 个字符空间(WAKEUP_CHARS)时,我们就可以写 */
/*
* These are the actual interrupt routines. They look where
* the interrupt is coming from, and take appropriate action.
*/
/*
* 这些是实际的中断程序。程序首先检查中断的来源,然后执行相应
* 的处理。
*/
.align 2
//// 串行端口1 中断处理程序入口点。
_rs1_interrupt:
pushl $_table_list+8 /* tty 表中对应串口1 的读写缓冲指针的地址入栈(tty_io.c)。*/
jmp rs_int
.align 2
//// 串行端口2 中断处理程序入口点。
_rs2_interrupt:
pushl $_table_list+16 /* tty 表中对应串口2 的读写缓冲队列指针的地址入栈。*/
rs_int:
pushl %edx
pushl %ecx
pushl %ebx
pushl %eax
push %es
push %ds /* as this is an interrupt, we cannot */
pushl $0x10 /* know that bs is ok. Load it */
pop %ds /* 由于这是一个中断程序,我们不知道ds 是否正确,*/
pushl $0x10 /* 所以加载它们(让ds、es 指向内核数据段 */
pop %es
movl 24(%esp),%edx /* 将缓冲队列指针地址存入edx 寄存器。*/
movl (%edx),%edx /* 取读队列指针(地址)->edx。*/
movl rs_addr(%edx),%edx
addl $2,%edx /* interrupt ident. reg */ /* edx 指向中断标识寄存器 */
rep_int: /* 中断标识寄存器端口是0x3fa(0x2fa)*/
xorl %eax,%eax
inb %dx,%al /* 取中断标识字节,用以判断中断来源(有4 种中断情况)。*/
testb $1,%al /* 首先判断有无待处理的中断(位0=1 无中断;=0 有中断)。*/
jne end /* 若无待处理中断,则跳转至退出处理处end。*/
cmpb $6,%al /* this shouldn't happen, but ... *//* 这不会发生,但是…*/
ja end /* al 值>6? 是则跳转至end(没有这种状态)。*/
movl 24(%esp),%ecx /* 再取缓冲队列指针地址->ecx。*/
pushl %edx /* 将端口号0x3fa(0x2fa)入栈。 */
subl $2,%edx
call *jmp_table(,%eax,2) /* NOTE! not *4, bit0 is 0 already *//* 不乘4,位0 已是0*/
// 上面语句是指,当有待处理中断时,al 中位0=0,位2-1 是中断类型,因此相当于已经将中断类型
// 乘了2,这里再乘2,得到跳转表对应各中断类型地址,并跳转到那里去作相应处理。
popl %edx /* 弹出中断标识寄存器端口号0x3fa(或0x2fa)。*/
jmp rep_int /* 跳转,继续判断有无待处理中断并继续处理。*/
end: movb $0x20,%al /* 向中断控制器发送结束中断指令EOI。*/
outb %al,$0x20 /* EOI */
pop %ds
pop %es
popl %eax
popl %ebx
popl %ecx
popl %edx
addl $4,%esp # jump over _table_list entry # 丢弃缓冲队列指针地址。
iret
// 各中断类型处理程序地址跳转表,共有4 种中断来源:
// modem 状态变化中断,写字符中断,读字符中断,线路状态有问题中断。
jmp_table:
.long modem_status,write_char,read_char,line_status
.align 2
modem_status:
addl $6,%edx /* clear intr by reading modem status reg */
inb %dx,%al /* 通过读modem 状态寄存器进行复位(0x3fe) */
ret
.align 2
line_status:
addl $5,%edx /* clear intr by reading line status reg. */
inb %dx,%al /* 通过读线路状态寄存器进行复位(0x3fd) */
ret
.align 2
read_char:
inb %dx,%al /*读取接收缓冲寄存器 RBR 中的字符->al*/
movl %ecx,%edx /* 当前串口缓冲队列指针地址->edx。 */
subl $_table_list,%edx /* 缓冲队列指针表首址 - 当前串口队列指针地址 -> edx*/
shrl $3,%edx /* 差值/8。对于串口1 是1,对于串口2 是2。*/
movl (%ecx),%ecx # read-queue # 取读缓冲队列结构地址 -> ecx。
movl head(%ecx),%ebx /* 取读队列中缓冲头指针 -> ebx。*/
movb %al,buf(%ecx,%ebx) /* 将字符放在缓冲区中头指针所指的位置。*/
incl %ebx /* 将头指针前移一字节。*/
andl $size-1,%ebx /* 用缓冲区大小对头指针进行模操作。指针不能超过缓冲区大小。*/
cmpl tail(%ecx),%ebx /* 缓冲区头指针与尾指针比较。*/
je 1f /* 若相等,表示缓冲区满,跳转到标号1 处。*/
movl %ebx,head(%ecx) /* 保存修改过的头指针。*/
1: pushl %edx /* 将串口号压入堆栈(1- 串口1,2 - 串口2),作为参数*/
call _do_tty_interrupt /* 调用tty 中断处理C 函数*/
addl $4,%esp /* 丢弃入栈参数,并返回。*/
ret
.align 2
write_char:
movl 4(%ecx),%ecx # write-queue # 取写缓冲队列结构地址->ecx。
movl head(%ecx),%ebx /* 取写队列头指针->ebx。*/
subl tail(%ecx),%ebx /* 头指针 - 尾指针 = 队列中字符数。*/
andl $size-1,%ebx # nr chars in queue # 对指针取模运算。
je write_buffer_empty /* 如果头指针 = 尾指针,说明写队列无字符,跳转处理。*/
cmpl $startup,%ebx /* 队列中字符数超过256 个?*/
ja 1f /* 超过,则跳转处理*/
movl proc_list(%ecx),%ebx # wake up sleeping process # 唤醒等待的进程。
// 取等待该队列的进程的指针,并判断是否为空。
testl %ebx,%ebx # is there any? # 有等待的进程吗?
je 1f /* 是空的,则向前跳转到标号1 处。*/
movl $0,(%ebx) /* 否则将进程置为可运行状态(唤醒进程)*/
1: movl tail(%ecx),%ebx /* 取尾指针。*/
movb buf(%ecx,%ebx),%al /* 从缓冲中尾指针处取一字符->al。*/
outb %al,%dx /* 向端口0x3f8(0x2f8)送出到保持寄存器中。*/
incl %ebx /* 尾指针前移。*/
andl $size-1,%ebx /* 尾指针若到缓冲区末端,则折回。*/
movl %ebx,tail(%ecx) /* 保存已修改过的尾指针。*/
cmpl head(%ecx),%ebx /* 尾指针与头指针比较.*/
je write_buffer_empty /* 若相等,表示队列已空,则跳转。*/
ret
.align 2
write_buffer_empty:
movl proc_list(%ecx),%ebx # wake up sleeping process # 唤醒等待的进程。
// 取等待该队列的进程的指针,并判断是否为空。
testl %ebx,%ebx # is there any? # 有等待的进程吗?
je 1f # 无,则向前跳转到标号1 处。
movl $0,(%ebx) # 否则将进程置为可运行状态(唤醒进程)。
1: incl %edx # 指向端口0x3f9(0x2f9)。
inb %dx,%al # 读取中断允许寄存器。
jmp 1f
1: jmp 1f
1: andb $0xd,%al /* disable transmit interrupt *//* 屏蔽发送保持寄存器空中断(位1) */
outb %al,%dx
ret
/*
* linux/kernel/serial.c
*
* (C) 1991 Linus Torvalds
*/
/*
* serial.c
*
* This module implements the rs232 io functions
* void rs_write(struct tty_struct * queue);
* void rs_init(void);
* and all interrupts pertaining to serial IO.
*/
/*
* serial.c
* 该程序用于实现rs232 的输入输出功能
* void rs_write(struct tty_struct *queue);
* void rs_init(void);
* 以及与传输IO 有关系的所有中断处理程序。
*/
#include <linux/tty.h> // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <asm/system.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <asm/io.h> // io 头文件。定义硬件端口输入/输出宏汇编语句。
#define WAKEUP_CHARS (TTY_BUF_SIZE/4) // 当写队列中含有WAKEUP_CHARS 个字符时,就开始发送。
extern void rs1_interrupt (void); // 串行口1 的中断处理程序(rs_io.s)。
extern void rs2_interrupt (void); // 串行口2 的中断处理程序(rs_io.s)。
//// 初始化串行端口
// port: 串口1 - 0x3F8,串口2 - 0x2F8。
static void init(int port)
{
outb_p (0x80, port + 3); /* set DLAB of line control reg */
/* 设置线路控制寄存器的DLAB 位(位7) */
outb_p (0x30, port); /* LS of divisor (48 -> 2400 bps */
/* 发送波特率因子低字节,0x30->2400bps */
outb_p (0x00, port + 1); /* MS of divisor */
/* 发送波特率因子高字节,0x00 */
outb_p (0x03, port + 3); /* reset DLAB */
/* 复位DLAB 位,数据位为8 位 */
outb_p (0x0b, port + 4); /* set DTR,RTS, OUT_2 */
/* 设置DTR,RTS,辅助用户输出2 */
outb_p (0x0d, port + 1); /* enable all intrs but writes */
/* 除了写(写保持空)以外,允许所有中断源中断 */
(void) inb (port); /* read data port to reset things (?) */
/* 读数据口,以进行复位操作(?) */
}
//// 初始化串行中断程序和串行接口。
void rs_init(void)
{
set_intr_gate (0x24, rs1_interrupt); // 设置串行口1 的中断门向量(硬件IRQ4 信号)。
set_intr_gate (0x23, rs2_interrupt); // 设置串行口2 的中断门向量(硬件IRQ3 信号)。
init (tty_table[1].read_q.data); // 初始化串行口1(.data 是端口号)。
init (tty_table[2].read_q.data); // 初始化串行口2。
outb (inb_p (0x21) & 0xE7, 0x21); // 允许主8259A 芯片的IRQ3,IRQ4 中断信号请求。
}
/*
* This routine gets called when tty_write has put something into
* the write_queue. It must check wheter the queue is empty, and
* set the interrupt register accordingly
*
* void _rs_write(struct tty_struct * tty);
*/
/*
* 在tty_write()已将数据放入输出(写)队列时会调用下面的子程序。必须首先
* 检查写队列是否为空,并相应设置中断寄存器。
*/
//// 串行数据发送输出。
// 实际上只是开启串行发送保持寄存器已空中断标志,在UART 将数据发送出去后允许发中断信号。
void rs_write(struct tty_struct * tty)
{
cli();
// 如果写队列不空,则从0x3f9(或0x2f9) 首先读取中断允许寄存器内容,添上发送保持寄存器
// 中断允许标志(位1)后,再写回该寄存器。
if (!EMPTY(tty->write_q))
outb(inb_p(tty->write_q.data+1)|0x02,tty->write_q.data+1);
sti();
}
/*
* linux/kernel/tty_io.c
*
* (C) 1991 Linus Torvalds
*/
/*
* 'tty_io.c' gives an orthogonal feeling to tty's, be they consoles
* or rs-channels. It also implements echoing, cooked mode etc.
*
* Kill-line thanks to John T Kohl.
*/
/*
* 'tty_io.c'给tty 一种非相关的感觉,是控制台还是串行通道。该程序同样
* 实现了回显、规范(熟)模式等。
*
* Kill-line,谢谢John T Kahl。
*/
#include <ctype.h> // 字符类型头文件。定义了一些有关字符类型判断和转换的宏。
#include <errno.h> // 错误号头文件。包含系统中各种出错号。(Linus 从minix 中引进的)。
#include <signal.h> // 信号头文件。定义信号符号常量,信号结构以及信号操作函数原型。
// 下面给出相应信号在信号位图中的对应比特位。
#define ALRMMASK (1<<(SIGALRM-1)) // 警告(alarm)信号屏蔽位。
#define KILLMASK (1<<(SIGKILL-1)) // 终止(kill)信号屏蔽位。
#define INTMASK (1<<(SIGINT-1)) // 键盘中断(int)信号屏蔽位。
#define QUITMASK (1<<(SIGQUIT-1)) // 键盘退出(quit)信号屏蔽位。
#define TSTPMASK (1<<(SIGTSTP-1)) // tty 发出的停止进程(tty stop)信号屏蔽位。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/tty.h> // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#define _L_FLAG(tty,f) ((tty)->termios.c_lflag & f) // 取termios 结构中的本地模式标志。
#define _I_FLAG(tty,f) ((tty)->termios.c_iflag & f) // 取termios 结构中的输入模式标志。
#define _O_FLAG(tty,f) ((tty)->termios.c_oflag & f) // 取termios 结构中的输出模式标志。
// 取termios 结构中本地模式标志集中的一个标志位。
#define L_CANON(tty) _L_FLAG((tty),ICANON) // 取本地模式标志集中规范(熟)模式标志位。
#define L_ISIG(tty) _L_FLAG((tty),ISIG) // 取信号标志位。
#define L_ECHO(tty) _L_FLAG((tty),ECHO) // 取回显字符标志位。
#define L_ECHOE(tty) _L_FLAG((tty),ECHOE) // 规范模式时,取回显擦出标志位。
#define L_ECHOK(tty) _L_FLAG((tty),ECHOK) // 规范模式时,取KILL 擦除当前行标志位。
#define L_ECHOCTL(tty) _L_FLAG((tty),ECHOCTL) // 取回显控制字符标志位。
#define L_ECHOKE(tty) _L_FLAG((tty),ECHOKE) // 规范模式时,取KILL 擦除行并回显标志位。
// 取termios 结构中输入模式标志中的一个标志位。
#define I_UCLC(tty) _I_FLAG((tty),IUCLC) // 取输入模式标志集中大写到小写转换标志位。
#define I_NLCR(tty) _I_FLAG((tty),INLCR) // 取换行符NL 转回车符CR 标志位。
#define I_CRNL(tty) _I_FLAG((tty),ICRNL) // 取回车符CR 转换行符NL 标志位。
#define I_NOCR(tty) _I_FLAG((tty),IGNCR) // 取忽略回车符CR 标志位。
// 取termios 结构中输出模式标志中的一个标志位。
#define O_POST(tty) _O_FLAG((tty),OPOST) // 取输出模式标志集中执行输出处理标志。
#define O_NLCR(tty) _O_FLAG((tty),ONLCR) // 取换行符NL 转回车换行符CR-NL 标志。
#define O_CRNL(tty) _O_FLAG((tty),OCRNL) // 取回车符CR 转换行符NL 标志。
#define O_NLRET(tty) _O_FLAG((tty),ONLRET) // 取换行符NL 执行回车功能的标志。
#define O_LCUC(tty) _O_FLAG((tty),OLCUC) // 取小写转大写字符标志。
// tty 数据结构的tty_table 数组。其中包含三个初始化项数据,分别对应控制台、串口终端1 和
// 串口终端2 的初始化数据。
struct tty_struct tty_table[] = {
{
{ICRNL, /* change incoming CR to NL *//* 将输入的CR 转换为NL */
OPOST | ONLCR, /* change outgoing NL to CRNL *//* 将输出的NL 转CRNL */
0,
ISIG | ICANON | ECHO | ECHOCTL | ECHOKE, // 本地模式标志。
0, /* console termio */ // 控制台termio。
INIT_C_CC}, // 控制字符数组。
0, /* initial pgrp */ // 所属初始进程组。
0, /* initial stopped */ // 初始停止标志。
con_write, // tty 写函数指针。
{0, 0, 0, 0, ""}, /* console read-queue */ // tty 控制台读队列。
{0, 0, 0, 0, ""}, /* console write-queue */ // tty 控制台写队列。
{0, 0, 0, 0, ""} /* console secondary queue */ // tty 控制台辅助(第二)队列。
},{
{0, /* no translation */ // 输入模式标志。0,无须转换。
0, /* no translation */ // 输出模式标志。0,无须转换。
B2400 | CS8, // 控制模式标志。波特率2400bps,8 位数据位。
0, // 本地模式标志0。
0, // 行规程0。
INIT_C_CC}, // 控制字符数组。
0, // 所属初始进程组。
0, // 初始停止标志。
rs_write, // 串口1 tty 写函数指针。
{0x3f8, 0, 0, 0, ""}, /* rs 1 */ // 串行终端1 读缓冲队列。
{0x3f8, 0, 0, 0, ""}, // 串行终端1 写缓冲队列。
{0, 0, 0, 0, ""} // 串行终端1 辅助缓冲队列。
},{
{0, /* no translation */ // 输入模式标志。0,无须转换。
0, /* no translation */ // 输出模式标志。0,无须转换。
B2400 | CS8, // 控制模式标志。波特率2400bps,8 位数据位。
0, // 本地模式标志0。
0, // 行规程0。
INIT_C_CC}, // 控制字符数组。
0, // 所属初始进程组。
0, // 初始停止标志。
rs_write, // 串口2 tty 写函数指针。
{0x2f8, 0, 0, 0, ""}, /* rs 2 */ // 串行终端2 读缓冲队列。
{0x2f8, 0, 0, 0, ""}, // 串行终端2 写缓冲队列。
{0, 0, 0, 0, ""} // 串行终端2 辅助缓冲队列。
}
};
/*
* these are the tables used by the machine code handlers.
* you can implement pseudo-tty's or something by changing
* them. Currently not done.
*/
/*
* 下面是汇编程序使用的缓冲队列地址表。通过修改你可以实现
* 伪tty 终端或其它终端类型。目前还没有这样做。
*/
// tty 缓冲队列地址表。rs_io.s 汇编程序使用,用于取得读写缓冲队列地址。
struct tty_queue * table_list[]={
&tty_table[0].read_q, &tty_table[0].write_q, // 控制台终端读、写缓冲队列地址。
&tty_table[1].read_q, &tty_table[1].write_q, // 串行口1 终端读、写缓冲队列地址。
&tty_table[2].read_q, &tty_table[2].write_q // 串行口2 终端读、写缓冲队列地址。
};
//// tty 终端初始化函数。
// 初始化串口终端和控制台终端。
void tty_init(void)
{
rs_init(); // 初始化串行中断程序和串行接口1 和2。(serial.c)
con_init (); // 初始化控制台终端。(console.c)
}
//// tty 键盘终端字符处理函数。
// 参数:tty - 相应tty 终端结构指针;mask - 信号屏蔽位。
void tty_intr(struct tty_struct * tty, int mask)
{
int i;
// 如果tty 所属组号小于等于0,则退出。
if (tty->pgrp <= 0)
return;
// 扫描任务数组,向tty 相应组的所有任务发送指定的信号。
for (i=0;i<NR_TASKS;i++)
// 如果该项任务指针不为空,并且其组号等于tty 组号,则设置该任务指定的信号mask。
if (task[i] && task[i]->pgrp==tty->pgrp)
task[i]->signal |= mask;
}
//// 如果队列缓冲区空则让进程进入可中断的睡眠状态。
// 参数:queue - 指定队列的指针。
// 进程在取队列缓冲区中字符时调用此函数。
static void sleep_if_empty(struct tty_queue * queue)
{
cli();
// 若当前进程没有信号要处理并且指定的队列缓冲区空,则让进程进入可中断睡眠状态,并让
// 队列的进程等待指针指向该进程。
while (!current->signal && EMPTY(*queue))
interruptible_sleep_on(&queue->proc_list);
sti();
}
//// 若队列缓冲区满则让进程进入可中断的睡眠状态。
// 参数:queue - 指定队列的指针。
// 进程在往队列缓冲区中写入时调用此函数。
static void sleep_if_full(struct tty_queue * queue)
{
// 若队列缓冲区不满,则返回退出。
if (!FULL(*queue))
return;
cli();
// 如果进程没有信号需要处理并且队列缓冲区中空闲剩余区长度<128,则让进程进入可中断睡眠状态,
// 并让该队列的进程等待指针指向该进程。
while (!current->signal && LEFT(*queue)<128)
interruptible_sleep_on(&queue->proc_list);
sti();
}
//// 等待按键。
// 如果控制台的读队列缓冲区空则让进程进入可中断的睡眠状态。
void wait_for_keypress(void)
{
sleep_if_empty(&tty_table[0].secondary);
}
//// 复制成规范模式字符序列。
// 将指定tty 终端队列缓冲区中的字符复制成规范(熟)模式字符并存放在辅助队列(规范模式队列)中。
// 参数:tty - 指定终端的tty 结构。
void copy_to_cooked(struct tty_struct * tty)
{
signed char c;
// 如果tty 的读队列缓冲区不空并且辅助队列缓冲区为空,则循环执行下列代码。
while (!EMPTY(tty->read_q) && !FULL(tty->secondary)) {
// 从队列尾处取一字符到c,并前移尾指针。
GETCH(tty->read_q,c);
// 下面对输入字符,利用输入模式标志集进行处理。
// 如果该字符是回车符CR(13),则:若回车转换行标志CRNL 置位则将该字符转换为换行符NL(10);
// 否则若忽略回车标志NOCR 置位,则忽略该字符,继续处理其它字符。
if (c==13)
if (I_CRNL(tty))
c=10;
else if (I_NOCR(tty))
continue;
else ;
// 如果该字符是换行符NL(10)并且换行转回车标志NLCR 置位,则将其转换为回车符CR(13)。
else if (c==10 && I_NLCR(tty))
c=13;
// 如果大写转小写标志UCLC 置位,则将该字符转换为小写字符。
if (I_UCLC(tty))
c=tolower(c);
// 如果本地模式标志集中规范(熟)模式标志CANON 置位,则进行以下处理。
if (L_CANON(tty)) {
// 如果该字符是键盘终止控制字符KILL(^U),则进行删除输入行处理。
if (c==KILL_CHAR(tty)) {
/* deal with killing the input line *//* 删除输入行处理 */
// 如果tty 辅助队列不空,或者辅助队列中最后一个字符是换行NL(10),或者该字符是文件结束字符
// (^D),则循环执行下列代码。
while(!(EMPTY(tty->secondary) ||
(c=LAST(tty->secondary))==10 ||
c==EOF_CHAR(tty))) {
// 如果本地回显标志ECHO 置位,那么:若字符是控制字符(值<32),则往tty 的写队列中放入擦除
// 字符ERASE。再放入一个擦除字符ERASE,并且调用该tty 的写函数。
if (L_ECHO(tty)) {
if (c<32)
PUTCH(127,tty->write_q);
PUTCH(127,tty->write_q);
tty->write(tty);
}
// 将tty 辅助队列头指针后退1 字节。
DEC(tty->secondary.head);
}
continue; // 继续读取并处理其它字符。
}
// 如果该字符是删除控制字符ERASE(^H),那么:
if (c==ERASE_CHAR(tty)) {
// 若tty 的辅助队列为空,或者其最后一个字符是换行符NL(10),或者是文件结束符,继续处理
// 其它字符。
if (EMPTY(tty->secondary) ||
(c=LAST(tty->secondary))==10 ||
c==EOF_CHAR(tty))
continue;
// 如果本地回显标志ECHO 置位,那么:若字符是控制字符(值<32),则往tty 的写队列中放入擦除
// 字符ERASE。再放入一个擦除字符ERASE,并且调用该tty 的写函数。
if (L_ECHO(tty)) {
if (c<32)
PUTCH(127,tty->write_q);
PUTCH(127,tty->write_q);
tty->write(tty);
}
// 将tty 辅助队列头指针后退1 字节,继续处理其它字符。
DEC(tty->secondary.head);
continue;
}
//如果该字符是停止字符(^S),则置tty 停止标志,继续处理其它字符。
if (c==STOP_CHAR(tty)) {
tty->stopped=1;
continue;
}
// 如果该字符是停止字符(^Q),则复位tty 停止标志,继续处理其它字符。
if (c==START_CHAR(tty)) {
tty->stopped=0;
continue;
}
}
// 若输入模式标志集中ISIG 标志置位,则在收到INTR、QUIT、SUSP 或DSUSP 字符时,需要为进程
// 产生相应的信号。
if (L_ISIG(tty)) {
// 如果该字符是键盘中断符(^C),则向当前进程发送键盘中断信号,并继续处理下一字符。
if (c==INTR_CHAR(tty)) {
tty_intr(tty,INTMASK);
continue;
}
// 如果该字符是键盘中断符(^\),则向当前进程发送键盘退出信号,并继续处理下一字符.
if (c==QUIT_CHAR(tty)) {
tty_intr(tty,QUITMASK);
continue;
}
}
// 如果该字符是换行符NL(10),或者是文件结束符EOF(^D),辅助缓冲队列字符数加1。
if (c==10 || c==EOF_CHAR(tty))
tty->secondary.data++;
// 如果本地模式标志集中回显标志ECHO 置位,那么,如果字符是换行符NL(10),则将换行符NL(10)
// 和回车符CR(13)放入tty 写队列缓冲区中;如果字符是控制字符(字符值<32)并且回显控制字符标志
// ECHOCTL 置位,则将字符'^'和字符c+64 放入tty 写队列中(也即会显示^C、^H 等);否则将该字符
// 直接放入tty 写缓冲队列中。最后调用该tty 的写操作函数。
if (L_ECHO(tty)) {
if (c==10) {
PUTCH(10,tty->write_q);
PUTCH(13,tty->write_q);
} else if (c<32) {
if (L_ECHOCTL(tty)) {
PUTCH('^',tty->write_q);
PUTCH(c+64,tty->write_q);
}
} else
PUTCH(c,tty->write_q);
tty->write(tty);
}
// 将该字符放入辅助队列中。
PUTCH(c,tty->secondary);
}
// 唤醒等待该辅助缓冲队列的进程(如果有的话)。
wake_up(&tty->secondary.proc_list);
}
//// tty 读函数。
// 参数:channel - 子设备号;buf - 缓冲区指针;nr - 欲读字节数。
// 返回已读字节数。
int tty_read(unsigned channel, char * buf, int nr)
{
struct tty_struct * tty;
char c, * b=buf;
int minimum,time,flag=0;
long oldalarm;
// 本版本linux 内核的终端只有3 个子设备,分别是控制台(0)、串口终端1(1)和串口终端2(2)。
// 所以任何大于2 的子设备号都是非法的。写的字节数当然也不能小于0 的。
if (channel>2 || nr<0)
return -1;
// tty 指针指向子设备号对应ttb_table 表中的tty 结构。
tty = &tty_table[channel];
// 下面首先保存进程原定时值,然后根据控制字符VTIME 和VMIN 设置读字符操作的超时定时值。
// 在非规范模式下,这两个值是超时定时值。MIN 表示为了满足读操作,需要读取的最少字符数。
// TIME 是一个十分之一秒计数的计时值。
// 首先取进程中的(报警)定时值(滴答数)。
oldalarm = current->alarm;
// 并设置读操作超时定时值time 和需要最少读取的字符个数minimum。
time = 10L*tty->termios.c_cc[VTIME];
minimum = tty->termios.c_cc[VMIN];
// 如果设置了读超时定时值time 但没有设置最少读取个数minimum,那么在读到至少一个字符或者
// 定时超时后读操作将立刻返回。所以这里置minimum=1。
if (time && !minimum) {
minimum=1;
// 如果进程原定时值是0 或者time+当前系统时间值小于进程原定时值的话,则置重新设置进程定时
// 值为time+当前系统时间,并置flag 标志。
if ((flag=(!oldalarm || time+jiffies<oldalarm)))
current->alarm = time+jiffies;
}
// 如果设置的最少读取字符数>欲读的字符数,则令其等于此次欲读取的字符数。
if (minimum>nr)
minimum=nr;
// 当欲读的字节数>0,则循环执行以下操作。
while (nr>0) {
// 如果flag 不为0(即进程原定时值是0 或者time+当前系统时间值小于进程原定时值)并且进程有定
// 时信号SIGALRM,则复位进程的定时信号并中断循环。
if (flag && (current->signal & ALRMMASK)) {
current->signal &= ~ALRMMASK;
break;
}
// 如果当前进程有信号要处理,则退出,返回0。
if (current->signal)
break;
// 如果辅助缓冲队列(规范模式队列)为空,或者设置了规范模式标志并且辅助队列中字符数为0 以及
// 辅助模式缓冲队列空闲空间>20,则进入可中断睡眠状态,返回后继续处理。
if (EMPTY(tty->secondary) || (L_CANON(tty) &&
!tty->secondary.data && LEFT(tty->secondary)>20)) {
sleep_if_empty(&tty->secondary);
continue;
}
// 执行以下操作,直到nr=0 或者辅助缓冲队列为空。
do {
// 取辅助缓冲队列字符c。
GETCH(tty->secondary,c);
// 如果该字符是文件结束符(^D)或者是换行符NL(10),则辅助缓冲队列字符数减1。
if (c==EOF_CHAR(tty) || c==10)
tty->secondary.data--;
// 如果该字符是文件结束符(^D)并且规范模式标志置位,则返回已读字符数,并退出。
if (c==EOF_CHAR(tty) && L_CANON(tty))
return (b-buf);
// 否则将该字符放入用户数据段缓冲区buf 中,欲读字符数减1,如果欲读字符数已为0,则中断循环。
else {
put_fs_byte(c,b++);
if (!--nr)
break;
}
} while (nr>0 && !EMPTY(tty->secondary));
if (time && !L_CANON(tty)) {
if ((flag=(!oldalarm || time+jiffies<oldalarm)))
current->alarm = time+jiffies;
else
current->alarm = oldalarm;
}
if (L_CANON(tty)) {
if (b-buf)
break;
} else if (b-buf >= minimum)
break;
}
// 让进程的定时值等于进程原定时值。
current->alarm = oldalarm;
if (current->signal && !(b-buf))
return -EINTR;
return (b-buf);
}
//// tty 写函数。
// 参数:channel - 子设备号;buf - 缓冲区指针;nr - 写字节数。
// 返回已写字节数。
int tty_write(unsigned channel, char * buf, int nr)
{
static int cr_flag=0;
struct tty_struct * tty;
char c, *b=buf;
// 本版本linux 内核的终端只有3 个子设备,分别是控制台(0)、串口终端1(1)和串口终端2(2)。
// 所以任何大于2 的子设备号都是非法的。写的字节数当然也不能小于0 的。
if (channel>2 || nr<0) return -1;
// tty 指针指向子设备号对应tty_table 表中的tty 结构。
tty = channel + tty_table;
// 字符设备是一个一个字符进行处理的,所以这里对于nr 大于0 时对每个字符进行循环处理。
while (nr>0) {
// 如果此时tty 的写队列已满,则当前进程进入可中断的睡眠状态。
sleep_if_full(&tty->write_q);
// 如果当前进程有信号要处理,则退出,返回0。
if (current->signal)
break;
while (nr>0 && !FULL(tty->write_q)) {
// 从用户数据段内存中取一字节c。
c=get_fs_byte(b);
// 如果终端输出模式标志集中的执行输出处理标志OPOST 置位,则执行下列输出时处理过程。
if (O_POST(tty)) {
// 如果该字符是回车符'\r'(CR,13)并且回车符转换行符标志OCRNL 置位,则将该字符换成换行符
// '\n'(NL,10);否则如果该字符是换行符'\n'(NL,10)并且换行转回车功能标志ONLRET 置位的话,
// 则将该字符换成回车符'\r'(CR,13)。
if (c=='\r' && O_CRNL(tty))
c='\n';
else if (c=='\n' && O_NLRET(tty))
c='\r';
// 如果该字符是换行符'\n'并且回车标志cr_flag 没有置位,换行转回车-换行标志ONLCR 置位的话,
// 则将cr_flag 置位,并将一回车符放入写队列中。然后继续处理下一个字符。
if (c=='\n' && !cr_flag && O_NLCR(tty)) {
cr_flag = 1;
PUTCH(13,tty->write_q);
continue;
}
// 如果小写转大写标志OLCUC 置位的话,就将该字符转成大写字符。
if (O_LCUC(tty))
c=toupper(c);
}
// 用户数据缓冲指针b 前进1 字节;欲写字节数减1 字节;复位cr_flag 标志,并将该字节放入tty
// 写队列中。
b++; nr--;
cr_flag = 0;
PUTCH(c,tty->write_q);
}
// 若字节全部写完,或者写队列已满,则程序执行到这里。调用对应tty 的写函数,若还有字节要写,
// 则等待写队列不满,所以调用调度程序,先去执行其它任务。
tty->write(tty);
if (nr>0)
schedule();
}
return (b-buf); // 返回写入的字节数。
}
/*
* Jeh, sometimes I really like the 386.
* This routine is called from an interrupt,
* and there should be absolutely no problem
* with sleeping even in an interrupt (I hope).
* Of course, if somebody proves me wrong, I'll
* hate intel for all time :-). We'll have to
* be careful and see to reinstating the interrupt
* chips before calling this, though.
*
* I don't think we sleep here under normal circumstances
* anyway, which is good, as the task sleeping might be
* totally innocent.
*/
/*
* 呵,有时我是真得很喜欢386。该子程序是从一个中断处理程序中调用的,即使在
* 中断处理程序中睡眠也应该绝对没有问题(我希望如此)。当然,如果有人证明我是
* 错的,那么我将憎恨intel 一辈子?。但是我们必须小心,在调用该子程序之前需
* 要恢复中断。
*
* 我不认为在通常环境下会处在这里睡眠,这样很好,因为任务睡眠是完全任意的。
*/
//// tty 中断处理调用函数 - 执行tty 中断处理。
// 参数:tty - 指定的tty 终端号(0,1 或2)。
// 将指定tty 终端队列缓冲区中的字符复制成规范(熟)模式字符并存放在辅助队列(规范模式队列)中。
// 在串口读字符中断(rs_io.s, 109)和键盘中断(kerboard.S, 69)中调用。
void do_tty_interrupt (int tty)
{
copy_to_cooked (tty_table + tty);
}
//// 字符设备初始化函数。空,为以后扩展做准备。
void chr_dev_init (void)
{
}
/*
* linux/kernel/chr_drv/tty_ioctl.c
*
* (C) 1991 Linus Torvalds
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。(Linus 从minix 中引进的)。
#include <termios.h> // 终端输入输出函数头文件。主要定义控制异步通信口的终端接口。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/tty.h> // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
#include <asm/io.h> // io 头文件。定义硬件端口输入/输出宏汇编语句。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
// 这是波特率因子数组(或称为除数数组)。
static unsigned short quotient[] = {
0, 2304, 1536, 1047, 857,
768, 576, 384, 192, 96,
64, 48, 24, 12, 6, 3
};
//// 修改传输速率。
// 参数:tty - 终端对应的tty 数据结构。
// 在除数锁存标志DLAB(线路控制寄存器位7)置位情况下,通过端口0x3f8 和0x3f9 向UART 分别写入
// 波特率因子低字节和高字节。
static void change_speed(struct tty_struct * tty)
{
unsigned short port,quot;
// 对于串口终端,其tty 结构的读缓冲队列data 字段存放的是串行端口号(0x3f8 或0x2f8)。
if (!(port = tty->read_q.data))
return;
// 从tty 的termios 结构控制模式标志集中取得设置的波特率索引号,据此从波特率因子数组中取得
// 对应的波特率因子值。CBAUD 是控制模式标志集中波特率位屏蔽码。
quot = quotient[tty->termios.c_cflag & CBAUD];
cli();
outb_p(0x80,port+3); /* set DLAB */ // 首先设置除数锁定标志DLAB。
outb_p(quot & 0xff,port); /* LS of divisor */ // 输出因子低字节。
outb_p(quot >> 8,port+1); /* MS of divisor */ // 输出因子高字节。
outb(0x03,port+3); /* reset DLAB */ // 复位DLAB。
sti();
}
//// 刷新tty 缓冲队列。
// 参数:gueue - 指定的缓冲队列指针。
// 令缓冲队列的头指针等于尾指针,从而达到清空缓冲区(零字符)的目的。
static void flush(struct tty_queue * queue)
{
cli();
queue->head = queue->tail;
sti();
}
//// 等待字符发送出去。
static void wait_until_sent(struct tty_struct * tty)
{
/* do nothing - not implemented *//* 什么都没做 - 还未实现 */
}
//// 发送BREAK 控制符。
static void send_break(struct tty_struct * tty)
{
/* do nothing - not implemented */
}
//// 取终端termios 结构信息。
// 参数:tty - 指定终端的tty 结构指针;termios - 用户数据区termios 结构缓冲区指针。
// 返回0 。
static int get_termios(struct tty_struct * tty, struct termios * termios)
{
int i;
// 首先验证一下用户的缓冲区指针所指内存区是否足够,如不够则分配内存。
verify_area(termios, sizeof (*termios));
// 复制指定tty 结构中的termios 结构信息到用户 termios 结构缓冲区。
for (i=0 ; i< (sizeof (*termios)) ; i++)
put_fs_byte( ((char *)&tty->termios)[i] , i+(char *)termios );
return 0;
}
//// 设置终端termios 结构信息。
// 参数:tty - 指定终端的tty 结构指针;termios - 用户数据区termios 结构指针。
// 返回0 。
static int set_termios(struct tty_struct * tty, struct termios * termios)
{
int i;
// 首先复制用户数据区中termios 结构信息到指定tty 结构中。
for (i=0 ; i< (sizeof (*termios)) ; i++)
((char *)&tty->termios)[i]=get_fs_byte(i+(char *)termios);
// 用户有可能已修改了tty 的串行口传输波特率,所以根据termios 结构中的控制模式标志c_cflag
// 修改串行芯片UART 的传输波特率。
change_speed(tty);
return 0;
}
//// 读取termio 结构中的信息。
// 参数:tty - 指定终端的tty 结构指针;termio - 用户数据区termio 结构缓冲区指针。
// 返回0。
static int get_termio(struct tty_struct * tty, struct termio * termio)
{
int i;
struct termio tmp_termio;
// 首先验证一下用户的缓冲区指针所指内存区是否足够,如不够则分配内存。
verify_area(termio, sizeof (*termio));
// 将termios 结构的信息复制到termio 结构中。目的是为了其中模式标志集的类型进行转换,也即
// 从termios 的长整数类型转换为termio 的短整数类型。
tmp_termio.c_iflag = tty->termios.c_iflag;
tmp_termio.c_oflag = tty->termios.c_oflag;
tmp_termio.c_cflag = tty->termios.c_cflag;
tmp_termio.c_lflag = tty->termios.c_lflag;
// 两种结构的c_line 和c_cc[]字段是完全相同的。
tmp_termio.c_line = tty->termios.c_line;
for(i=0 ; i < NCC ; i++)
tmp_termio.c_cc[i] = tty->termios.c_cc[i];
// 最后复制指定tty 结构中的termio 结构信息到用户 termio 结构缓冲区。
for (i=0 ; i< (sizeof (*termio)) ; i++)
put_fs_byte( ((char *)&tmp_termio)[i] , i+(char *)termio );
return 0;
}
/*
* This only works as the 386 is low-byt-first
*/
/*
* 下面的termio 设置函数仅在386 低字节在前的方式下可用。
*/
//// 设置终端termio 结构信息。
// 参数:tty - 指定终端的tty 结构指针;termio - 用户数据区termio 结构指针。
// 将用户缓冲区termio 的信息复制到终端的termios 结构中。返回0 。
static int set_termio(struct tty_struct * tty, struct termio * termio)
{
int i;
struct termio tmp_termio;
// 首先复制用户数据区中termio 结构信息到临时termio 结构中。
for (i=0 ; i< (sizeof (*termio)) ; i++)
((char *)&tmp_termio)[i]=get_fs_byte(i+(char *)termio);
// 再将termio 结构的信息复制到tty 的termios 结构中。目的是为了其中模式标志集的类型进行转换,
// 也即从termio 的短整数类型转换成termios 的长整数类型。
*(unsigned short *)&tty->termios.c_iflag = tmp_termio.c_iflag;
*(unsigned short *)&tty->termios.c_oflag = tmp_termio.c_oflag;
*(unsigned short *)&tty->termios.c_cflag = tmp_termio.c_cflag;
*(unsigned short *)&tty->termios.c_lflag = tmp_termio.c_lflag;
// 两种结构的c_line 和c_cc[]字段是完全相同的。
tty->termios.c_line = tmp_termio.c_line;
for(i=0 ; i < NCC ; i++)
tty->termios.c_cc[i] = tmp_termio.c_cc[i];
// 用户可能已修改了tty 的串行口传输波特率,所以根据termios 结构中的控制模式标志集c_cflag
// 修改串行芯片UART 的传输波特率。
change_speed(tty);
return 0;
}
//// tty 终端设备的ioctl 函数。
// 参数:dev - 设备号;cmd - ioctl 命令;arg - 操作参数指针。
int tty_ioctl(int dev, int cmd, int arg)
{
struct tty_struct * tty;
// 首先取tty 的子设备号。如果主设备号是5(tty 终端),则进程的tty 字段即是子设备号;如果进程
// 的tty 子设备号是负数,表明该进程没有控制终端,也即不能发出该ioctl 调用,出错死机。
if (MAJOR(dev) == 5) {
dev=current->tty;
if (dev<0)
panic("tty_ioctl: dev<0");
// 否则直接从设备号中取出子设备号。
} else
dev=MINOR(dev);
// 子设备号可以是0(控制台终端)、1(串口1 终端)、2(串口2 终端)。
// 让tty 指向对应子设备号的tty 结构。
tty = dev + tty_table;
// 根据tty 的ioctl 命令进行分别处理。
switch (cmd) {
case TCGETS:
//取相应终端termios 结构中的信息。
return get_termios (tty, (struct termios *) arg);
case TCSETSF:
// 在设置termios 的信息之前,需要先等待输出队列中所有数据处理完,并且刷新(清空)输入队列。
// 再设置。
flush (&tty->read_q); /* fallthrough */
case TCSETSW:
// 在设置终端termios 的信息之前,需要先等待输出队列中所有数据处理完(耗尽)。对于修改参数
// 会影响输出的情况,就需要使用这种形式。
wait_until_sent (tty); /* fallthrough */
case TCSETS:
// 设置相应终端termios 结构中的信息。
return set_termios (tty, (struct termios *) arg);
case TCGETA:
// 取相应终端termio 结构中的信息。
return get_termio (tty, (struct termio *) arg);
case TCSETAF:
// 在设置termio 的信息之前,需要先等待输出队列中所有数据处理完,并且刷新(清空)输入队列。
// 再设置。
flush (&tty->read_q); /* fallthrough */
case TCSETAW:
// 在设置终端termio 的信息之前,需要先等待输出队列中所有数据处理完(耗尽)。对于修改参数
// 会影响输出的情况,就需要使用这种形式。
wait_until_sent (tty); /* fallthrough *//* 继续执行 */
case TCSETA:
// 设置相应终端termio 结构中的信息。
return set_termio (tty, (struct termio *) arg);
case TCSBRK:
// 等待输出队列处理完毕(空),如果参数值是0,则发送一个break。
if (!arg) {
wait_until_sent(tty);
send_break(tty);
}
return 0;
case TCXONC:
// 开始/停止控制。如果参数值是0,则挂起输出;如果是1,则重新开启挂起的输出;如果是2,则挂起
// 输入;如果是3,则重新开启挂起的输入。
return -EINVAL; /* not implemented */
case TCFLSH:
//刷新已写输出但还没发送或已收但还没有读数据。如果参数是0,则刷新(清空)输入队列;如果是1,
// 则刷新输出队列;如果是2,则刷新输入和输出队列。
if (arg==0)
flush(&tty->read_q);
else if (arg==1)
flush(&tty->write_q);
else if (arg==2) {
flush(&tty->read_q);
flush(&tty->write_q);
} else
return -EINVAL;
return 0;
case TIOCEXCL:
// 设置终端串行线路专用模式。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCNXCL:
// 复位终端串行线路专用模式。
return -EINVAL; /* not implemented */
case TIOCSCTTY:
// 设置tty 为控制终端。(TIOCNOTTY - 禁止tty 为控制终端)。
return -EINVAL; /* set controlling term NI *//* 设置控制终端NI */
case TIOCGPGRP: // NI - Not Implemented。
// 读取指定终端设备进程的组id。首先验证用户缓冲区长度,然后复制tty 的pgrp 字段到用户缓冲区。
verify_area ((void *) arg, 4);
put_fs_long (tty->pgrp, (unsigned long *) arg);
return 0;
case TIOCSPGRP:
// 设置指定终端设备进程的组id。
tty->pgrp = get_fs_long ((unsigned long *) arg);
return 0;
case TIOCOUTQ:
// 返回输出队列中还未送出的字符数。首先验证用户缓冲区长度,然后复制队列中字符数给用户。
verify_area ((void *) arg, 4);
put_fs_long (CHARS (tty->write_q), (unsigned long *) arg);
return 0;
case TIOCINQ:
// 返回输入队列中还未读取的字符数。首先验证用户缓冲区长度,然后复制队列中字符数给用户。
verify_area ((void *) arg, 4);
put_fs_long (CHARS (tty->secondary), (unsigned long *) arg);
return 0;
case TIOCSTI:
// 模拟终端输入。该命令以一个指向字符的指针作为参数,并假装该字符是在终端上键入的。用户必须
// 在该控制终端上具有超级用户权限或具有读许可权限。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCGWINSZ:
// 读取终端设备窗口大小信息(参见termios.h 中的winsize 结构)。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCSWINSZ:
// 设置终端设备窗口大小信息(参见winsize 结构)。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCMGET:
// 返回modem 状态控制引线的当前状态比特位标志集(参见termios.h)。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCMBIS:
// 设置单个modem 状态控制引线的状态(true 或false)。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCMBIC:
// 复位单个modem 状态控制引线的状态。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCMSET:
// 设置modem 状态引线的状态。如果某一比特位置位,则modem 对应的状态引线将置为有效。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCGSOFTCAR:
// 读取软件载波检测标志(1 - 开启;0 - 关闭)。
return -EINVAL; /* not implemented *//* 未实现 */
case TIOCSSOFTCAR:
// 设置软件载波检测标志(1 - 开启;0 - 关闭)。
return -EINVAL; /* not implemented *//* 未实现 */
default:
return -EINVAL;
}
}
/*
* linux/kernel/exit.c
*
* (C) 1991 Linus Torvalds
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。(Linus 从minix 中引进的)
#include <signal.h> // 信号头文件。定义信号符号常量,信号结构以及信号操作函数原型。
#include <sys/wait.h> // 等待调用头文件。定义系统调用wait()和waitpid()及相关常数符号。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/tty.h> // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
int sys_pause(void); // 把进程置为睡眠状态,直到收到信号(kernel/sched.c)
int sys_close(int fd); // 关闭指定文件的系统调用(fs/open.c)
//// 释放指定进程占用的任务槽及其任务数据结构占用的内存页面。
void release(struct task_struct * p)
{
int i;
if (!p) // 如果任务的结构为空,退出
return;
for (i=1 ; i<NR_TASKS ; i++) // 扫描任务数组,寻找指定任务。
if (task[i]==p) {
task[i]=NULL; // 置空该任务项并释放相关内存页。
free_page((long)p);
schedule(); // 重新调度。
return;
}
panic("trying to release non-existent task");// 指定任务若不存在则死机。
}
//// 向指定任务(*p)发送信号(sig),权限为priv。
static inline int send_sig(long sig,struct task_struct * p,int priv)
{
if (!p || sig<1 || sig>32) // 若信号不正确或任务指针为空则出错退出。
return -EINVAL;
// 若有权或进程有效用户标识符(euid)就是指定进程的euid 或者是超级用户,则在进程位图中添加
// 该信号,否则出错退出。其中suser()定义为(current->euid==0),用于判断是否超级用户。
if (priv || (current->euid==p->euid) || suser())
p->signal |= (1<<(sig-1));
else
return -EPERM;
return 0;
}
//// 终止会话(session)。
static void kill_session(void)
{
struct task_struct **p = NR_TASKS + task; // 指针*p 首先指向任务数组最末端。
// 对于所有的任务(除任务0 以外),如果其会话等于当前进程的会话就向它发送挂断进程信号。
while (--p > &FIRST_TASK) {
if (*p && (*p)->session == current->session)
(*p)->signal |= 1<<(SIGHUP-1); // 发送挂断进程信号。
}
}
/*
* XXX need to check permissions needed to send signals to process
* groups, etc. etc. kill() permissions semantics are tricky!
*/
/*
* 为了向进程组等发送信号,XXX 需要检查许可。kill()的许可机制非常巧妙!
*/
//// kill()系统调用可用于向任何进程或进程组发送任何信号。
// 如果pid 值>0,则信号被发送给pid。
// 如果pid=0,那么信号就会被发送给当前进程的进程组中的所有进程。
// 如果pid=-1,则信号sig 就会发送给除第一个进程外的所有进程。
// 如果pid < -1,则信号sig 将发送给进程组-pid 的所有进程。
// 如果信号sig 为0,则不发送信号,但仍会进行错误检查。如果成功则返回0。
int sys_kill(int pid,int sig)
{
struct task_struct **p = NR_TASKS + task;
int err, retval = 0;
if (!pid) while (--p > &FIRST_TASK) {
if (*p && (*p)->pgrp == current->pid)
if ((err=send_sig(sig,*p,1)))
retval = err; // 强制发送信号
} else if (pid>0) while (--p > &FIRST_TASK) {
if (*p && (*p)->pid == pid)
if ((err=send_sig(sig,*p,0)))
retval = err;
} else if (pid == -1) while (--p > &FIRST_TASK) {
if ((err = send_sig(sig,*p,0)))
retval = err;
} else while (--p > &FIRST_TASK)
if (*p && (*p)->pgrp == -pid)
if ((err = send_sig(sig,*p,0)))
retval = err;
return retval;
}
//// 通知父进程 -- 向进程pid 发送信号SIGCHLD:默认情况下子进程将停止或终止。
// 如果没有找到父进程,则自己释放。
static void tell_father(int pid)
{
int i;
if (pid)
for (i=0;i<NR_TASKS;i++) {
if (!task[i])
continue;
if (task[i]->pid != pid)
continue;
task[i]->signal |= (1<<(SIGCHLD-1));
return;
}
/* if we don't find any fathers, we just release ourselves */
/* This is not really OK. Must change it to make father 1 */
/* 如果没有找到父进程,则进程就自己释放。这样做并不好,必须改成由进程 1 充当其父进程.*/
printk("BAD BAD - no father found\n\r");
release(current); // 如果没有找到父进程,则自己释放。
}
//// 程序退出处理程序。在系统调用的中断处理程序中被调用。
int do_exit(long code)
{
int i;
// 释放当前进程代码段和数据段所占的内存页(free_page_tables()在mm/memory.c)。
free_page_tables(get_base(current->ldt[1]),get_limit(0x0f));
free_page_tables(get_base(current->ldt[2]),get_limit(0x17));
// 如果当前进程有子进程,就将子进程的father 置为1(其父进程改为进程1)。如果该子进程已经
// 处于僵死(ZOMBIE)状态,则向进程1 发送子进程终止信号SIGCHLD。
for (i=0 ; i<NR_TASKS ; i++)
if (task[i] && task[i]->father == current->pid) {
task[i]->father = 1;
if (task[i]->state == TASK_ZOMBIE)
/* assumption task[1] is always init */
(void) send_sig(SIGCHLD, task[1], 1);
}
// 关闭当前进程打开着的所有文件。
for (i=0 ; i<NR_OPEN ; i++)
if (current->filp[i])
sys_close(i);
// 对当前进程工作目录pwd、根目录root 以及运行程序的i 节点进行同步操作,并分别置空。
iput(current->pwd);
current->pwd=NULL;
iput(current->root);
current->root=NULL;
iput(current->executable);
current->executable=NULL;
// 如果当前进程是领头(leader)进程并且其有控制的终端,则释放该终端。
if (current->leader && current->tty >= 0)
tty_table[current->tty].pgrp = 0;
// 如果当前进程上次使用过协处理器,则将last_task_used_math 置空。
if (last_task_used_math == current)
last_task_used_math = NULL;
// 如果当前进程是leader 进程,则终止所有相关进程。
if (current->leader)
kill_session();
// 把当前进程置为僵死状态,并设置退出码。
current->state = TASK_ZOMBIE;
current->exit_code = code;
// 通知父进程,也即向父进程发送信号SIGCHLD -- 子进程将停止或终止。
tell_father(current->father);
RECORD_TASK_STATE(current->pid, TS_STOPPED, jiffies);
schedule(); // 重新调度进程的运行。
return (-1); /* just to suppress warnings *//* 仅用于去掉警告信息。*/
}
//// 系统调用exit()。终止进程。
int sys_exit(int error_code)
{
return do_exit((error_code&0xff)<<8);
}
//// 系统调用waitpid()。挂起当前进程,直到pid 指定的子进程退出(终止)或者收到要求终止
// 该进程的信号,或者是需要调用一个信号句柄(信号处理程序)。如果pid 所指的子进程早已
// 退出(已成所谓的僵死进程),则本调用将立刻返回。子进程使用的所有资源将释放。
// 如果pid > 0, 表示等待进程号等于pid 的子进程。
// 如果pid = 0, 表示等待进程组号等于当前进程的任何一个子进程。
// 如果pid < -1, 表示等待进程组号等于pid 绝对值的任何一个子进程。
// [ 如果pid = -1, 表示等待任何一个子进程。]
// 若options = WUNTRACED,表示如果子进程是停止的,也马上返回。
// 若options = WNOHANG,表示如果没有子进程退出或终止就马上返回。
// 如果stat_addr 不为空,则就将状态信息保存到那里。
int sys_waitpid(pid_t pid,unsigned long * stat_addr, int options)
{
int flag, code; // flag 标志用于后面表示所选处的子进程处于就绪或睡眠态
struct task_struct ** p;
verify_area(stat_addr,4);
repeat:
flag=0;
for(p = &LAST_TASK ; p > &FIRST_TASK ; --p) {
// 从任务数组末端开始扫描所有任务。
if (!*p || *p == current) // 跳过空项和本进程项。
continue;
if ((*p)->father != current->pid) // 如果不是当前进程的子进程则跳过。
continue;
if (pid>0) {
if ((*p)->pid != pid) // 如果指定的pid>0,但扫描的进程pid
continue; // 与之不等,则跳过。
} else if (!pid) { // 如果指定的pid=0,但扫描的进程组号
if ((*p)->pgrp != current->pgrp) // 与当前进程的组号不等,则跳过。
continue;
} else if (pid != -1) { // 如果指定的pid<-1,但扫描的进程组号与其绝对值不等,则跳过。
if ((*p)->pgrp != -pid)
continue;
}
switch ((*p)->state) {
case TASK_STOPPED:
if (!(options & WUNTRACED))
continue;
put_fs_long(0x7f,stat_addr); // 置状态信息为0x7f。
return (*p)->pid; // 退出,返回子进程的进程号。
case TASK_ZOMBIE:
current->cutime += (*p)->utime; // 更新当前进程的子进程用户
current->cstime += (*p)->stime; // 态和核心态运行时间。
flag = (*p)->pid;
code = (*p)->exit_code; // 取子进程的退出码。
release(*p); // 释放该子进程。
put_fs_long(code,stat_addr); // 置状态信息为退出码值。
return flag; // 退出,返回子进程的pid.
default:
flag=1; // 如果子进程不在停止或僵死状态,则flag=1。
continue;
}
}
if (flag) {
// 如果子进程没有处于退出或僵死状态,并且options = WNOHANG,则立刻返回。
if (options & WNOHANG)
return 0;
current->state = TASK_INTERRUPTIBLE; // 置当前进程为可中断等待状态。
if (current->pid != 0) // 进程 0 会频繁重复进入此状态,所以需要被忽略
{
RECORD_TASK_STATE(current->pid, TS_WAIT, jiffies);
}
schedule(); // 重新调度。
if (!(current->signal &= ~(1<<(SIGCHLD-1)))) // 又开始执行本进程时,
// 如果进程没有收到除SIGCHLD 的信号,则还是重复处理。
goto repeat;
else
return -EINTR; // 退出,返回出错码。
}
// 若没有找到符合要求的子进程,则返回出错码(子进程不存在)。
return -ECHILD;
}
/*
* linux/kernel/fork.c
*
* (C) 1991 Linus Torvalds
*/
/*
* 'fork.c' contains the help-routines for the 'fork' system call
* (see also system_call.s), and some misc functions ('verify_area').
* Fork is rather simple, once you get the hang of it, but the memory
* management can be a bitch. See 'mm/mm.c': 'copy_page_tables()'
*/
/*
* 'fork.c'中含有系统调用'fork'的辅助子程序(参见system_call.s),以及一些其它函数
* ('verify_area')。一旦你了解了fork,就会发现它是非常简单的,但内存管理却有些难度。
* 参见'mm/mm.c'中的'copy_page_tables()'。
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。(Linus 从minix 中引进的)。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
// 写页面验证,若页面不可写,则复制页面。定义在 mm/memory.c中
extern void write_verify(unsigned long address);
// 最新进程号,其值会由get_empty_process()生成.
long last_pid=0;
//// 进程空间区域写前验证函数。
// 对当前进程的地址addr 到addr+size 这一段进程空间以页为单位执行写操作前的检测操作。
// 若页面是只读的,则执行共享检验和复制页面操作(写时复制)。
void verify_area(void * addr,int size)
{
unsigned long start;
start = (unsigned long) addr;
// 将起始地址start 调整为其所在页的左边界开始位置,同时相应地调整验证区域大小。
// 此时start 是当前进程空间中的线性地址。
size += start & 0xfff;
start &= 0xfffff000;
start += get_base(current->ldt[2]); // 此时start 变成系统整个线性空间中的地址位置。
while (size>0) {
size -= 4096;
write_verify(start); // 写页面验证。若页面不可写,则复制页面。(mm/memory.c)
start += 4096;
}
}
// 设置新任务的代码和数据段基址、限长并复制页表。
// nr 为新任务号;p 是新任务数据结构的指针。
int copy_mem(int nr,struct task_struct * p)
{
unsigned long old_data_base,new_data_base,data_limit;
unsigned long old_code_base,new_code_base,code_limit;
code_limit = get_limit (0x0f); // 取局部描述符表中代码段描述符项中段限长。
data_limit = get_limit (0x17); // 取局部描述符表中数据段描述符项中段限长。
old_code_base = get_base (current->ldt[1]); // 取原代码段基址。
old_data_base = get_base (current->ldt[2]); // 取原数据段基址。
if (old_data_base != old_code_base) // 0.11 版不支持代码和数据段分立的情况。
panic ("We don't support separate I&D");
if (data_limit < code_limit) // 如果数据段长度 < 代码段长度也不对。
panic ("Bad data_limit");
new_data_base = new_code_base = nr * 0x4000000; // 新基址=任务号*64Mb(任务大小)。
p->start_code = new_code_base;
set_base (p->ldt[1], new_code_base); // 设置代码段描述符中基址域。
set_base (p->ldt[2], new_data_base); // 设置数据段描述符中基址域。
if (copy_page_tables (old_data_base, new_data_base, data_limit))
{ // 复制代码和数据段。
free_page_tables (new_data_base, data_limit); // 如果出错则释放申请的内存。
return -ENOMEM;
}
return 0;
}
/*
* Ok, this is the main fork-routine. It copies the system process
* information (task[nr]) and sets up the necessary registers. It
* also copies the data segment in it's entirety.
*/
/*
* OK,下面是主要的fork 子程序。它复制系统进程信息(task[n])并且设置必要的寄存器。
* 它还整个地复制数据段。
*/
// 复制进程。
int copy_process(int nr,long child_ebp,long child_edi,long child_esi,long child_gs,long none,
long child_ebx,long child_ecx,long child_edx,
long child_fs,long child_es,long child_ds,
long child_eip,long child_cs,long child_eflags,long child_esp,long child_ss)
{
struct task_struct *p;
int i;
struct file *f;
p = (struct task_struct *) get_free_page(); // 为新任务数据结构分配内存。
if (!p) return -EAGAIN; // 如果内存分配出错,则返回出错码并退出。
task[nr] = p; // 将新任务结构指针放入任务数组中。
// 其中nr 为任务号,由前面find_empty_process()返回。
*p = *current; /* NOTE! this doesn't copy the supervisor stack *//* 注意!这样做不会复制超级用户的堆栈 */
p->state = TASK_UNINTERRUPTIBLE; // 将新进程的状态先置为不可中断等待状态。
p->pid = last_pid; // 新进程号。由前面调用find_empty_process()得到。
p->father = current->pid; // 设置父进程号。
p->counter = p->priority;
p->signal = 0; // 信号位图置0。
p->alarm = 0;
p->leader = 0; /* process leadership doesn't inherit */
/* 进程的领导权是不能继承的 */
p->utime = p->stime = 0; // 初始化用户态时间和核心态时间。
p->cutime = p->cstime = 0; // 初始化子进程用户态和核心态时间。
p->start_time = jiffies; // 当前滴答数时间。
RECORD_TASK_STATE(p->pid, TS_CREATE, jiffies);
// 以下设置任务状态段TSS 所需的数据。
p->tss.back_link = 0;
p->tss.esp0 = PAGE_SIZE + (long) p; // 堆栈指针(由于是给任务结构p 分配了1 页
// 新内存,所以此时esp0 正好指向该页顶端)。
p->tss.ss0 = 0x10; // 堆栈段选择符(内核数据段)[??]。
p->tss.eip = child_eip; // 指令代码指针。
p->tss.eflags = child_eflags; // 标志寄存器。
p->tss.eax = 0;
p->tss.ecx = child_ecx;
p->tss.edx = child_edx;
p->tss.ebx = child_ebx;
p->tss.esp = child_esp;
p->tss.ebp = child_ebp;
p->tss.esi = child_esi;
p->tss.edi = child_edi;
p->tss.es = child_es & 0xffff; // 段寄存器仅16 位有效。
p->tss.cs = child_cs & 0xffff;
p->tss.ss = child_ss & 0xffff;
p->tss.ds = child_ds & 0xffff;
p->tss.fs = child_fs & 0xffff;
p->tss.gs = child_gs & 0xffff;
p->tss.ldt = _LDT(nr); // 该新任务nr 的局部描述符表选择符(LDT 的描述符在GDT 中)。
p->tss.trace_bitmap = 0x80000000;
// 如果当前任务使用了协处理器,就保存其上下文。
if (last_task_used_math == current)
__asm__("clts ; fnsave %0"::"m" (p->tss.i387));
// 设置新任务的代码和数据段基址、限长并复制页表。如果出错(返回值不是0),则复位任务数组中
// 相应项并释放为该新任务分配的内存页。
if (copy_mem(nr,p)) { // 返回不为0 表示出错。
task[nr] = NULL;
free_page((long) p);
return -EAGAIN;
}
// 如果父进程中有文件是打开的,则将对应文件的打开次数增1。
for (i=0; i<NR_OPEN;i++)
if ((f=p->filp[i]))
f->f_count++;
// 将当前进程(父进程)的pwd, root 和executable 引用次数均增1。
if (current->pwd)
current->pwd->i_count++;
if (current->root)
current->root->i_count++;
if (current->executable)
current->executable->i_count++;
// 在GDT 中设置新任务的TSS 和LDT 描述符项,数据从task 结构中取。
// 在任务切换时,任务寄存器tr 由CPU 自动加载。
set_tss_desc(gdt+(nr<<1)+FIRST_TSS_ENTRY,&(p->tss));
set_ldt_desc(gdt+(nr<<1)+FIRST_LDT_ENTRY,&(p->ldt));
p->state = TASK_RUNNING; /* do this last, just in case */
/* 最后再将新任务设置成可运行状态,以防万一 */
RECORD_TASK_STATE(p->pid, TS_READY, jiffies);
return last_pid; // 返回新进程号(与任务号是不同的)。
}
// 为新进程取得不重复的进程号last_pid,并返回在任务数组中的任务号(数组index)。
int find_empty_process(void)
{
int i;
repeat:
if ((++last_pid)<0) last_pid=1;
for(i=0 ; i<NR_TASKS ; i++)
if (task[i] && task[i]->pid == last_pid) goto repeat;
for(i=1 ; i<NR_TASKS ; i++)
if (!task[i])
return i;
return -EAGAIN;
}
/*
* linux/kernel/math/math_emulate.c
*
* (C) 1991 Linus Torvalds
*/
/*
* This directory should contain the math-emulation code.
* Currently only results in a signal.
*/
/*
* 该目录里应该包含数学仿真代码。目前仅产生一个信号。
*/
#include <signal.h> // 信号头文件。定义信号符号常量,信号结构以及信号操作函数原型。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
//// 协处理器仿真函数。
// 中断处理程序调用的C 函数,参见(kernel/math/system_call.s)。
void math_emulate(long edi, long esi, long ebp, long sys_call_ret,
long eax,long ebx,long ecx,long edx,
unsigned short fs,unsigned short es,unsigned short ds,
unsigned long eip,unsigned short cs,unsigned long eflags,
unsigned short ss, unsigned long esp)
{
unsigned char first, second;
/* 0x0007 means user code space */
/* 0x0007 表示用户代码空间 */
// 选择符0x000F 表示在局部描述符表中描述符索引值=1,即代码空间。如果段寄存器cs 不等于0x000F
// 则表示cs 一定是内核代码选择符,是在内核代码空间,则出错,显示此时的cs:eip 值,并显示信息
// “内核中需要数学仿真”,然后进入死机状态。
if (cs != 0x000F) {
printk("math_emulate: %04x:%08x\n\r",cs,eip);
panic("Math emulation needed in kernel");
}
// 取用户数据区堆栈数据first 和second,显示这些数据,并给进程设置浮点异常信号SIGFPE。
first = get_fs_byte((char *)((*&eip)++));
second = get_fs_byte((char *)((*&eip)++));
printk("%04x:%08x %02x %02x\n\r",cs,eip-2,first,second);
current->signal |= 1<<(SIGFPE-1);
}
//// 协处理器出错处理函数。
// 中断处理程序调用的C 函数,参见(kernel/math/system_call.s)。
void math_error(void)
{
// 协处理器指令。(以非等待形式)清除所有异常标志、忙标志和状态字位7。
__asm__ ("fnclex");
// 如果上个任务使用过协处理器,则向上个任务发送协处理器异常信号。
if (last_task_used_math)
last_task_used_math->signal |= 1<<(SIGFPE-1);
}
/*
* linux/kernel/mktime.c
*
* (C) 1991 Linus Torvalds
*/
#include <time.h> // 时间头文件,定义了标准时间数据结构tm 和一些处理时间函数原型。
/*
* This isn't the library routine, it is only used in the kernel.
* as such, we don't care about years<1970 etc, but assume everything
* is ok. Similarly, TZ etc is happily ignored. We just do everything
* as easily as possible. Let's find something public for the library
* routines (although I think minix times is public).
*/
/*
* PS. I hate whoever though up the year 1970 - couldn't they have gotten
* a leap-year instead? I also hate Gregorius, pope or no. I'm grumpy.
*/
/*
* 这不是库函数,它仅供内核使用。因此我们不关心小于1970 年的年份等,但假定一切均很正常。
* 同样,时间区域TZ 问题也先忽略。我们只是尽可能简单地处理问题。最好能找到一些公开的库函数
* (尽管我认为minix 的时间函数是公开的)。
*
* 另外,我恨那个设置1970 年开始的人 - 难道他们就不能选择从一个闰年开始?我恨格里高利历、
* 罗马教皇、主教,我什么都不在乎。我是个脾气暴躁的人。
*/
#define MINUTE 60 // 1 分钟的秒数。
#define HOUR (60*MINUTE) // 1 小时的秒数。
#define DAY (24*HOUR) // 1 天的秒数。
#define YEAR (365*DAY) // 1 年的秒数。
/* interestingly, we assume leap-years */
/* 有趣的是我们考虑进了闰年 */
// 下面以年为界限,定义了每个月开始时的秒数时间数组。
static int month[12] = {
0,
DAY*(31),
DAY*(31+29),
DAY*(31+29+31),
DAY*(31+29+31+30),
DAY*(31+29+31+30+31),
DAY*(31+29+31+30+31+30),
DAY*(31+29+31+30+31+30+31),
DAY*(31+29+31+30+31+30+31+31),
DAY*(31+29+31+30+31+30+31+31+30),
DAY*(31+29+31+30+31+30+31+31+30+31),
DAY*(31+29+31+30+31+30+31+31+30+31+30)
};
// 该函数计算从1970 年1 月1 日0 时起到开机当日经过的秒数,作为开机时间。
long kernel_mktime(struct tm * tm)
{
long res;
int year;
year = tm->tm_year - 70; // 从70 年到现在经过的年数(2 位表示方式),
// 因此会有2000 年问题。
/* magic offsets (y+1) needed to get leapyears right.*/
/* 为了获得正确的闰年数,这里需要这样一个魔幻偏值(y+1) */
res = YEAR*year + DAY*((year+1)/4); // 这些年经过的秒数时间 + 每个闰年时多1 天
res += month[tm->tm_mon]; // 的秒数时间,在加上当年到当月时的秒数。
/* and (y+2) here. If it wasn't a leap-year, we have to adjust */
/* 以及(y+2)。如果(y+2)不是闰年,那么我们就必须进行调整(减去一天的秒数时间)。 */
if (tm->tm_mon>1 && ((year+2)%4))
res -= DAY;
res += DAY*(tm->tm_mday-1); // 再加上本月过去的天数的秒数时间。
res += HOUR*tm->tm_hour; // 再加上当天过去的小时数的秒数时间。
res += MINUTE*tm->tm_min; // 再加上1 小时内过去的分钟数的秒数时间。
res += tm->tm_sec; // 再加上1 分钟内已过的秒数。
return res; // 即等于从1970 年以来经过的秒数时间。
}
/*
* linux/kernel/panic.c
*
* (C) 1991 Linus Torvalds
*/
/*
* This function is used through-out the kernel (includeinh mm and fs)
* to indicate a major problem.
*/
/*
* 该函数在整个内核中使用(包括在 头文件*.h, 内存管理程序mm 和文件系统fs 中),
* 用以指出主要的出错问题。
*/
#define PANIC
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
void sys_sync (void); /* it's really int *//* 实际上是整型int (fs/buffer.c) */
// 该函数用来显示内核中出现的重大错误信息,并运行文件系统同步函数,然后进入死循环 -- 死机。
// 如果当前进程是任务0 的话,还说明是交换任务出错,并且还没有运行文件系统同步函数。
volatile void
panic (const char *s)
{
printk ("Kernel panic: %s\n\r", s);
if (current == task[0])
printk ("In swapper task - not syncing\n\r");
else
sys_sync ();
for (;;);
}
/*
* linux/kernel/printk.c
*
* (C) 1991 Linus Torvalds
*/
/*
* When in kernel-mode, we cannot use printf, as fs is liable to
* point to 'interesting' things. Make a printf with fs-saving, and
* all is well.
*/
/*
* 当处于内核模式时,我们不能使用printf,因为寄存器fs 指向其它不感兴趣的地方。
* 自己编制一个printf 并在使用前保存fs,一切就解决了。
*/
#include <stdarg.h> // 标准参数头文件。以宏的形式定义变量参数列表。主要说明了-个
// 类型(va_list)和三个宏(va_start, va_arg 和va_end),用于
// vsprintf、vprintf、vfprintf 函数。
#include <stddef.h> // 标准定义头文件。定义了NULL, offsetof(TYPE, MEMBER)。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
static char buf[1024];
// 下面该函数vsprintf()在linux/kernel/vsprintf.c 中
extern int vsprintf(char * buf, const char * fmt, va_list args);
// 内核使用的显示函数。
int printk(const char *fmt, ...)
{
va_list args;
int i;
va_start (args, fmt); // 参数处理开始函数。在(include/stdarg.h)
i = vsprintf (buf, fmt, args); // 使用格式串fmt 将参数列表args 输出到buf 中。
// 返回值i 等于输出字符串的长度。
va_end (args); // 参数处理结束函数。
__asm__ ("push %%fs\n\t" // 保存fs。
"push %%ds\n\t" "pop %%fs\n\t" // 令fs = ds。
"pushl %0\n\t" // 将字符串长度压入堆栈(这三个入栈是调用参数)。
"pushl $_buf\n\t" // 将buf 的地址压入堆栈。
"pushl $0\n\t" // 将数值0 压入堆栈。是通道号channel。
"call _tty_write\n\t" // 调用tty_write 函数。(kernel/chr_drv/tty_io.c)。
"addl $8,%%esp\n\t" // 跳过(丢弃)两个入栈参数(buf,channel)。
"popl %0\n\t" // 弹出字符串长度值,作为返回值。
"pop %%fs" // 恢复原fs 寄存器。
::"r" (i):"ax", "cx", "dx"); // 通知编译器,寄存器ax,cx,dx 值可能已经改变。
return i; // 返回字符串长度。
}
/*
* linux/kernel/sched.c
*
* (C) 1991 Linus Torvalds
*/
/*
* 'sched.c' is the main kernel file. It contains scheduling primitives
* (sleep_on, wakeup, schedule etc) as well as a number of simple system
* call functions (type getpid(), which just extracts a field from
* current-task
*/
/*
* 'sched.c'是主要的内核文件。其中包括有关调度的基本函数(sleep_on、wakeup、schedule 等)以及
* 一些简单的系统调用函数(比如getpid(),仅从当前任务中获取一个字段)。
*/
#include <linux/sched.h> // 调度程序头文件。定义了任务结构task_struct、第1 个初始任务
// 的数据。还有一些以宏的形式定义的有关描述符参数设置和获取的
// 嵌入式汇编函数程序。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/sys.h> // 系统调用头文件。含有72 个系统调用C 函数处理程序,以'sys_'开头。
#include <linux/fdreg.h> // 软驱头文件。含有软盘控制器参数的一些定义。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#include <asm/io.h> // io 头文件。定义硬件端口输入/输出宏汇编语句。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <signal.h> // 信号头文件。定义信号符号常量,sigaction 结构,操作函数原型。
#include <string.h>
#define _S(nr) (1<<((nr)-1)) // 取信号nr 在信号位图中对应位的二进制数值。信号编号1-32。
// 比如信号5 的位图数值 = 1<<(5-1) = 16 = 00010000b。
#define _BLOCKABLE (~(_S(SIGKILL) | _S(SIGSTOP))) // 除了SIGKILL 和SIGSTOP 信号以外其它都是
// 可阻塞的(…10111111111011111111b)。
/*
定义了一个线性表,用于记录进程状态转换的轨迹。
*/
struct task_state_entry
{
long pid;
long new_state;
long jiffies;
char fun_name[64];
int line_num;
};
#define MAX_TASK_TRANS 100 // 直接将此值修改的更大一些,就可以记录更多进程状态变换的轨迹。不要设定的太大,否则会导致绘制轨迹变慢或内存不足。
struct task_state_entry task_trans_table[MAX_TASK_TRANS];
long task_trans_count = 0;
void record_task_state(long pid, long new_state, long jiffies, const char* fun_name, int line_num)
{
if(task_trans_count >= MAX_TASK_TRANS)
return;
task_trans_table[task_trans_count].pid = pid;
task_trans_table[task_trans_count].new_state = new_state;
task_trans_table[task_trans_count].jiffies = jiffies;
strcpy(task_trans_table[task_trans_count].fun_name, fun_name);
task_trans_table[task_trans_count].line_num = line_num;
task_trans_count++;
}
// 显示任务号nr 的进程号、进程状态和内核堆栈空闲字节数(大约)。
void show_task(int nr,struct task_struct * p)
{
int i,j = 4096-sizeof(struct task_struct);
printk("%d: pid=%d, state=%d, ",nr,p->pid,p->state);
i=0;
while (i<j && !((char *)(p+1))[i]) // 检测指定任务数据结构以后等于0 的字节数。
i++;
printk("%d (of %d) chars free in kernel stack\n\r",i,j);
}
// 显示所有任务的任务号、进程号、进程状态和内核堆栈空闲字节数(大约)。
void show_stat(void)
{
int i;
for (i=0;i<NR_TASKS;i++) // NR_TASKS 是系统能容纳的最大进程(任务)数量(64 个),
if (task[i]) // 定义在include/kernel/sched.h
show_task(i,task[i]);
}
#define LATCH (1193180/HZ) // 定义每个时间片的滴答数。
extern void mem_use(void); // 没有任何地方定义和引用该函数。
extern int timer_interrupt(void); // 时钟中断处理程序(kernel/system_call.s)。
extern int system_call(void); // 系统调用中断处理程序(kernel/system_call.s)。
// 每个任务(进程)在内核态运行时都有自己的内核态堆栈。这里定义了任务的内核态堆栈结构.
union task_union {
struct task_struct task; // 因为一个任务数据结构与其堆栈放在同一内存页中,所以
char stack[PAGE_SIZE]; // 从堆栈段寄存器ss 可以获得其数据段选择符。
};
static union task_union init_task = {INIT_TASK,}; // 定义初始任务的数据(sched.h 中)。
long volatile jiffies=0; // 从开机开始算起的滴答数时间值(10ms/滴答)。
// 前面的限定符volatile,英文解释是易变、不稳定的意思。这里是要求gcc 不要对该变量进行优化
// 处理,也不要挪动位置,因为也许别的程序会来修改它的值。
long startup_time=0; // 开机时间。从1970:0:0:0 开始计时的秒数。
struct task_struct *current = &(init_task.task); // 当前任务指针(初始化为初始任务)。
struct task_struct *last_task_used_math = NULL; // 使用过协处理器任务的指针。
struct task_struct * task[NR_TASKS] = {&(init_task.task), };// 定义任务指针数组。
/*
定义了一个任务指针数组的缓冲区,可以用来存储任务指针数组中的数据。
其中只存储有效的任务指针,从而可以大大加快获取进程数据的速度。
*/
long user_stack [ PAGE_SIZE>>2 ] ; // 定义系统堆栈指针,4K。指针指在最后一项。
// 该结构用于设置堆栈ss:esp(数据段选择符,指针),见head.s
struct {
long * a;
short b;
} stack_start = { & user_stack [PAGE_SIZE>>2] , 0x10 };
/*
* 'math_state_restore()' saves the current math information in the
* old math state array, and gets the new ones from the current task
*/
/*
* 将当前协处理器内容保存到旧协处理器状态数组中,并将当前任务的协处理器
* 内容加载进协处理器。
*/
// 当任务被调度交换过以后,该函数用以保存原任务的协处理器状态(上下文)并恢复新调度进来的
// 当前任务的协处理器执行状态。
void math_state_restore()
{
if (last_task_used_math == current) // 如果任务没变则返回(上一个任务就是当前任务)。
return; // 这里所指的"上一个任务"是刚被交换出去的任务。
__asm__("fwait"); // 在发送协处理器命令之前要先发WAIT 指令。
if (last_task_used_math) { // 如果上个任务使用了协处理器,则保存其状态。
__asm__("fnsave %0"::"m" (last_task_used_math->tss.i387));
}
last_task_used_math=current; // 现在,last_task_used_math 指向当前任务,
// 以备当前任务被交换出去时使用。
if (current->used_math) {
// 如果当前任务用过协处理器,则恢复其状态。
__asm__("frstor %0"::"m" (current->tss.i387));
} else { // 否则的话说明是第一次使用,
__asm__("fninit"::); // 于是就向协处理器发初始化命令,
current->used_math=1; // 并设置使用了协处理器标志。
}
}
/*
* 'schedule()' is the scheduler function. This is GOOD CODE! There
* probably won't be any reason to change this, as it should work well
* in all circumstances (ie gives IO-bound processes good response etc).
* The one thing you might take a look at is the signal-handler code here.
*
* NOTE!! Task 0 is the 'idle' task, which gets called when no other
* tasks can run. It can not be killed, and it cannot sleep. The 'state'
* information in task[0] is never used.
*/
/*
* 'schedule()'是调度函数。这是个很好的代码!没有任何理由对它进行修改,因为它可以在所有的
* 环境下工作(比如能够对IO-边界处理很好的响应等)。只有一件事值得留意,那就是这里的信号
* 处理代码。
*
* 注意!!任务0 是个闲置('idle')任务,只有当没有其它任务可以运行时才调用它。它不能被杀
* 死,也不能睡眠。任务0 中的状态信息'state'是从来不用的。
*/
void schedule(void)
{
int i,next,c;
struct task_struct ** p;
/* check alarm, wake up any interruptible tasks that have got a signal */
/* 检测alarm(进程的报警定时值),唤醒任何已得到信号的可中断任务 */
// 从任务数组中最后一个任务开始检测alarm。
for(p = &LAST_TASK ; p > &FIRST_TASK ; --p)
if (*p) {
// 如果任务的alarm 时间已经过期(alarm<jiffies),则在信号位图中置SIGALRM 信号,然后清alarm。
// jiffies 是系统从开机开始算起的滴答数(10ms/滴答)。定义在sched.h。
if ((*p)->alarm && (*p)->alarm < jiffies) {
(*p)->signal |= (1<<(SIGALRM-1));
(*p)->alarm = 0;
}
// 如果信号位图中除被阻塞的信号外还有其它信号,并且任务处于可中断状态,则置任务为就绪状态。
// 其中'~(_BLOCKABLE & (*p)->blocked)'用于忽略被阻塞的信号,但SIGKILL 和SIGSTOP 不能被阻塞。
if (((*p)->signal & ~(_BLOCKABLE & (*p)->blocked)) &&
(*p)->state==TASK_INTERRUPTIBLE)
{
(*p)->state=TASK_RUNNING; //置为就绪(可执行)状态。
RECORD_TASK_STATE((*p)->pid, TS_READY, jiffies);
}
}
/* this is the scheduler proper: */
/* 这里是调度程序的主要部分 */
while (1) {
c = -1;
next = 0;
i = NR_TASKS;
p = &task[NR_TASKS];
// 这段代码也是从任务数组的最后一个任务开始循环处理,并跳过不含任务的数组槽。比较每个就绪
// 状态任务的counter(任务运行时间的递减滴答计数)值,哪一个值大,运行时间还不长,next 就
// 指向哪个的任务号。
while (--i) {
if (!*--p)
continue;
if ((*p)->state == TASK_RUNNING && (*p)->counter > c)
c = (*p)->counter, next = i;
}
// 如果比较得出有counter 值大于0 的结果,则退出开始的循环,执行任务切换。
if (c) break;
// 否则就根据每个任务的优先权值,更新每一个任务的counter 值,然后回去重新比较。
// counter 值的计算方式为counter = counter /2 + priority。
for(p = &LAST_TASK ; p > &FIRST_TASK ; --p)
if (*p)
(*p)->counter = ((*p)->counter >> 1) +
(*p)->priority;
}
// 如果 current 进程处于运行态,而此调度程序选择的接下来要进入运行态的 next 进程与 current 进程不同,
// 则需要记录下 current 进程回到了就绪态。
// 言外之意,也就是如果 current 进程处于运行态,而此调度程序选择的接下来要进入运行态的 next 进程与
// current 进程相同,current 进程就会继续处于运行态,也就不需要记录了。
if(current->state == TASK_RUNNING && current != task[next])
{
RECORD_TASK_STATE(current->pid, TS_READY, jiffies);
}
if(current != task[next])
{
if(current->pid == 0 && current->state == TASK_INTERRUPTIBLE)
{
// 当没有其他进程可以运行时,进程 0 会频繁调用 pause 函数,从而进入可中断等待状态,
// 当运行到这里时,说明 next 进程可以进入运行态了,就需要将进程 0 恢复为就绪态。
current->state = TASK_RUNNING;
RECORD_TASK_STATE(current->pid, TS_READY, jiffies);
}
// 如果此调度程序选择的接下来要进入运行态的 next 进程与 current 进程不同,
// 则需要记录下 next 进程进入了运行态。
// 注意,next 进程进入运行态应该在最后记录,不要出现在 current 进程进入就绪态的记录的前面。
RECORD_TASK_STATE(task[next]->pid, TS_RUNNING, jiffies);
}
switch_to(next); // 切换到任务号为next 的任务,并运行之。
}
//// pause()系统调用。转换当前任务的状态为可中断的等待状态,并重新调度。
// 该系统调用将导致进程进入睡眠状态,直到收到一个信号。该信号用于终止进程或者使进程调用
// 一个信号捕获函数。只有当捕获了一个信号,并且信号捕获处理函数返回,pause()才会返回。
// 此时pause()返回值应该是-1,并且errno 被置为EINTR。这里还没有完全实现(直到0.95 版)。
int sys_pause(void)
{
current->state = TASK_INTERRUPTIBLE;
if(current->pid != 0) // 进程 0 会频繁重复进入此状态,所以需要被忽略
{
RECORD_TASK_STATE(current->pid, TS_WAIT, jiffies);
}
schedule();
return 0;
}
// 把当前任务置为不可中断的等待状态,并让睡眠队列头的指针指向当前任务。
// 只有明确地唤醒时才会返回。该函数提供了进程与中断处理程序之间的同步机制。
// 函数参数*p 是放置等待任务的队列头指针。
void sleep_on(struct task_struct **p)
{
struct task_struct *tmp;
// 若指针无效,则退出。(指针所指的对象可以是NULL,但指针本身不会为0)。
if (!p)
return;
if (current == &(init_task.task)) // 如果当前任务是任务0,则死机(impossible!)。
panic("task[0] trying to sleep");
tmp = *p; // 让tmp 指向已经在等待队列上的任务(如果有的话)。
*p = current; // 将睡眠队列头的等待指针指向当前任务。
current->state = TASK_UNINTERRUPTIBLE; // 将当前任务置为不可中断的等待状态。
if (current->pid != 0) // 进程 0 会频繁重复进入此状态,所以需要被忽略
{
RECORD_TASK_STATE(current->pid, TS_WAIT, jiffies);
}
schedule(); // 重新调度。
// 只有当这个等待任务被唤醒时,调度程序才又返回到这里,则表示进程已被明确地唤醒。
// 既然大家都在等待同样的资源,那么在资源可用时,就有必要唤醒所有等待该资源的进程。该函数
// 嵌套调用,也会嵌套唤醒所有等待该资源的进程。然后系统会根据这些进程的优先条件,重新调度
// 应该由哪个进程首先使用资源。也即让这些进程竞争上岗。
if (tmp)
{
tmp->state=TASK_RUNNING;
RECORD_TASK_STATE(tmp->pid, TS_READY, jiffies);
}
}
// 将当前任务置为可中断的等待状态,并放入*p 指定的等待队列中。
void interruptible_sleep_on(struct task_struct **p)
{
struct task_struct *tmp;
if (!p)
return;
if (current == &(init_task.task))
panic("task[0] trying to sleep");
tmp=*p;
*p=current;
repeat: current->state = TASK_INTERRUPTIBLE;
if (current->pid != 0) // 进程 0 会频繁重复进入此状态,所以需要被忽略
{
RECORD_TASK_STATE(current->pid, TS_WAIT, jiffies);
}
schedule();
// 如果等待队列中还有等待任务,并且队列头指针所指向的任务不是当前任务时,则将该等待任务置为
// 可运行的就绪状态,并重新执行调度程序。当指针*p 所指向的不是当前任务时,表示在当前任务被放
// 入队列后,又有新的任务被插入等待队列中,因此,既然本任务是可中断的,就应该首先执行所有
// 其它的等待任务。
if (*p && *p != current) {
(**p).state= TASK_RUNNING;
RECORD_TASK_STATE((**p).pid, TS_READY, jiffies);
goto repeat;
}
*p=tmp;
if (tmp)
{
tmp->state= TASK_RUNNING;
RECORD_TASK_STATE(tmp->pid, TS_READY, jiffies);
}
}
// 唤醒指定任务*p。
void wake_up(struct task_struct **p)
{
if (p && *p) {
(**p).state= TASK_RUNNING; // 置为就绪(可运行)状态。
RECORD_TASK_STATE((**p).pid, TS_READY, jiffies);
*p=NULL;
}
}
/*
* OK, here are some floppy things that shouldn't be in the kernel
* proper. They are here because the floppy needs a timer, and this
* was the easiest way of doing it.
*/
/*
* 好了,从这里开始是一些有关软盘的子程序,本不应该放在内核的主要部分中的。将它们放在这里
* 是因为软驱需要一个时钟,而放在这里是最方便的办法。
*/
static struct task_struct * wait_motor[4] = {NULL,NULL,NULL,NULL};
static int mon_timer[4]={0,0,0,0};
static int moff_timer[4]={0,0,0,0};
unsigned char current_DOR = 0x0C; // 数字输出寄存器(初值:允许DMA 和请求中断、启动FDC)。
// 指定软盘到正常运转状态所需延迟滴答数(时间)。
// nr -- 软驱号(0-3),返回值为滴答数。
int ticks_to_floppy_on(unsigned int nr)
{
extern unsigned char selected; // 当前选中的软盘号(kernel/blk_drv/floppy.c)。
unsigned char mask = 0x10 << nr; // 所选软驱对应数字输出寄存器中启动马达比特位。
if (nr>3) // 最多4 个软驱。
panic("floppy_on: nr>3");
moff_timer[nr]=10000; /* 100 s = very big :-) */
cli(); /* use floppy_off to turn it off */
mask |= current_DOR;
// 如果不是当前软驱,则首先复位其它软驱的选择位,然后置对应软驱选择位。
if (!selected) {
mask &= 0xFC;
mask |= nr;
}
// 如果数字输出寄存器的当前值与要求的值不同,则向FDC 数字输出端口输出新值(mask)。并且如果
// 要求启动的马达还没有启动,则置相应软驱的马达启动定时器值(HZ/2 = 0.5 秒或50 个滴答)。
// 此后更新当前数字输出寄存器值current_DOR。
if (mask != current_DOR) {
outb(mask,FD_DOR);
if ((mask ^ current_DOR) & 0xf0)
mon_timer[nr] = HZ/2;
else if (mon_timer[nr] < 2)
mon_timer[nr] = 2;
current_DOR = mask;
}
sti();
return mon_timer[nr];
}
// 等待指定软驱马达启动所需时间。
void floppy_on(unsigned int nr)
{
cli();
while (ticks_to_floppy_on(nr)) // 如果马达启动定时还没到,就一直把当前进程置
sleep_on(nr+wait_motor); // 为不可中断睡眠状态并放入等待马达运行的队列中。
sti();
}
// 置关闭相应软驱马达停转定时器(3 秒)。
void floppy_off(unsigned int nr)
{
moff_timer[nr]=3*HZ;
}
// 软盘定时处理子程序。更新马达启动定时值和马达关闭停转计时值。该子程序是在时钟定时
// 中断中被调用,因此每一个滴答(10ms)被调用一次,更新马达开启或停转定时器的值。如果某
// 一个马达停转定时到,则将数字输出寄存器马达启动位复位。
void do_floppy_timer(void)
{
int i;
unsigned char mask = 0x10;
for (i=0 ; i<4 ; i++,mask <<= 1) {
if (!(mask & current_DOR)) // 如果不是DOR 指定的马达则跳过。
continue;
if (mon_timer[i]) {
if (!--mon_timer[i])
wake_up(i+wait_motor); // 如果马达启动定时到则唤醒进程。
} else if (!moff_timer[i]) {
current_DOR &= ~mask; // 如果马达停转定时到则复位相应马达启动位,并
outb(current_DOR,FD_DOR); // 更新数字输出寄存器。
} else
moff_timer[i]--; // 马达停转计时递减。
}
}
#define TIME_REQUESTS 64 // 最多可有64 个定时器链表(64 个任务)。
// 定时器链表结构和定时器数组。
static struct timer_list {
long jiffies; // 定时滴答数。
void (*fn)(); // 定时处理程序。
struct timer_list * next; // 下一个定时器。
} timer_list[TIME_REQUESTS], * next_timer = NULL;
// 添加定时器。输入参数为指定的定时值(滴答数)和相应的处理程序指针。
// jiffies – 以10 毫秒计的滴答数;*fn()- 定时时间到时执行的函数。
void add_timer(long jiffies, void (*fn)(void))
{
struct timer_list * p;
// 如果定时处理程序指针为空,则退出。
if (!fn)
return;
cli();
// 如果定时值<=0,则立刻调用其处理程序。并且该定时器不加入链表中。
if (jiffies <= 0)
(fn)();
else {
// 从定时器数组中,找一个空闲项。
for (p = timer_list ; p < timer_list + TIME_REQUESTS ; p++)
if (!p->fn)
break;
// 如果已经用完了定时器数组,则系统崩溃?。
if (p >= timer_list + TIME_REQUESTS)
panic("No more time requests free");
// 向定时器数据结构填入相应信息。并链入链表头
p->fn = fn;
p->jiffies = jiffies;
p->next = next_timer;
next_timer = p;
// 链表项按定时值从小到大排序。在排序时减去排在前面需要的滴答数,这样在处理定时器时只要
// 查看链表头的第一项的定时是否到期即可。[[这段程序好象没有考虑周全。如果新插入的定时
// 器值 < 原来头一个定时器值时,也应该将所有后面的定时值均减去新的第1 个的定时值。]]
while (p->next && p->next->jiffies < p->jiffies) {
p->jiffies -= p->next->jiffies;
fn = p->fn;
p->fn = p->next->fn;
p->next->fn = fn;
jiffies = p->jiffies;
p->jiffies = p->next->jiffies;
p->next->jiffies = jiffies;
p = p->next;
}
}
sti();
}
//// 时钟中断C 函数处理程序,在kernel/system_call.s 中的_timer_interrupt 被调用。
// 参数cpl 是当前特权级0 或3,0 表示内核代码在执行。
// 对于一个进程由于执行时间片用完时,则进行任务切换。并执行一个计时更新工作。
void do_timer(long cpl)
{
extern int beepcount; // 扬声器发声时间滴答数(kernel/chr_drv/console.c)
extern void sysbeepstop(void); // 关闭扬声器(kernel/chr_drv/console.c)
// 如果发声计数次数到,则关闭发声。(向0x61 口发送命令,复位位0 和1。位0 控制8253
// 计数器2 的工作,位1 控制扬声器)。
if (beepcount)
if (!--beepcount)
sysbeepstop();
// 如果当前特权级(cpl)为0(最高,表示是内核程序在工作),则将超级用户运行时间stime 递增;
// 如果cpl > 0,则表示是一般用户程序在工作,增加utime。
if (cpl)
current->utime++;
else
current->stime++;
// 如果有用户的定时器存在,则将链表第1 个定时器的值减1。如果已等于0,则调用相应的处理
// 程序,并将该处理程序指针置为空。然后去掉该项定时器。
if (next_timer) {
next_timer->jiffies--; // next_timer 是定时器链表的头指针
while (next_timer && next_timer->jiffies <= 0) {
void (*fn)(void); // 这里插入了一个函数指针定义!!!
fn = next_timer->fn;
next_timer->fn = NULL;
next_timer = next_timer->next;
(fn)(); // 调用处理函数。
}
}
// 如果当前软盘控制器FDC 的数字输出寄存器中马达启动位有置位的,则执行软盘定时程序.
if (current_DOR & 0xf0)
do_floppy_timer();
if ((--current->counter)>0) return; // 如果进程运行时间还没完,则退出。
current->counter=0;
if (!cpl) return; // 对于超级用户程序,不依赖counter 值进行调度。
schedule();
}
// 系统调用功能 - 设置报警定时时间值(秒)。
// 如果已经设置过alarm 值,则返回旧值,否则返回0。
int sys_alarm(long seconds)
{
int old = current->alarm;
if (old)
old = (old - jiffies) / HZ;
current->alarm = (seconds>0)?(jiffies+HZ*seconds):0;
return (old);
}
// 取当前进程号pid。
int sys_getpid(void)
{
return current->pid;
}
// 取父进程号ppid。
int sys_getppid(void)
{
return current->father;
}
// 取用户号uid。
int sys_getuid(void)
{
return current->uid;
}
// 取euid。
int sys_geteuid(void)
{
return current->euid;
}
// 取组号gid。
int sys_getgid(void)
{
return current->gid;
}
// 取egid。
int sys_getegid(void)
{
return current->egid;
}
// 系统调用功能 -- 降低对CPU 的使用优先权(有人会用吗??)。
// 应该限制increment 大于0,否则的话,可使优先权增大!!
int sys_nice(long increment)
{
if (current->priority-increment>0)
current->priority -= increment;
return 0;
}
// 调度程序的初始化子程序。
void sched_init(void)
{
int i;
struct desc_struct * p; // 描述符表结构指针。
if (sizeof(struct sigaction) != 16) // sigaction 是存放有关信号状态的结构。
panic("Struct sigaction MUST be 16 bytes");
// 设置初始任务(任务0)的任务状态段描述符和局部数据表描述符(include/asm/system.h)。
set_tss_desc(gdt+FIRST_TSS_ENTRY,&(init_task.task.tss));
set_ldt_desc(gdt+FIRST_LDT_ENTRY,&(init_task.task.ldt));
// 清任务数组和描述符表项(注意i=1 开始,所以初始任务的描述符还在)。
p = gdt+2+FIRST_TSS_ENTRY;
for(i=1;i<NR_TASKS;i++) {
task[i] = NULL;
p->a=p->b=0;
p++;
p->a=p->b=0;
p++;
}
/* Clear NT, so that we won't have troubles with that later on */
/* 清除标志寄存器中的位NT,这样以后就不会有麻烦 */
// NT 标志用于控制程序的递归调用(Nested Task)。当NT 置位时,那么当前中断任务执行
// iret 指令时就会引起任务切换。NT 指出TSS 中的back_link 字段是否有效。
__asm__("pushfl ; andl $0xffffbfff,(%esp) ; popfl"); // 复位NT 标志。
ltr(0); // 将任务0 的TSS 加载到任务寄存器tr。
lldt(0); // 将局部描述符表加载到局部描述符表寄存器。
// 注意!!是将GDT 中相应LDT 描述符的选择符加载到ldtr。只明确加载这一次,以后新任务
// LDT 的加载,是CPU 根据TSS 中的LDT 项自动加载。
// 下面代码用于初始化8253 定时器。
outb_p(0x36,0x43); /* binary, mode 3, LSB/MSB, ch 0 */
outb_p(LATCH & 0xff , 0x40); /* LSB */ // 定时值低字节。
outb(LATCH >> 8 , 0x40); /* MSB */ // 定时值高字节。
set_intr_gate(0x20,&timer_interrupt); // 设置时钟中断处理程序句柄(设置时钟中断门)。
outb(inb_p(0x21)&~0x01,0x21); // 修改中断控制器屏蔽码,允许时钟中断。
set_system_gate(0x80,&system_call); // 设置系统调用中断门。
}
/*
* linux/kernel/signal.c
*
* (C) 1991 Linus Torvalds
*/
#include <errno.h>
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <signal.h> // 信号头文件。定义信号符号常量,信号结构以及信号操作函数原型。
volatile void do_exit(int error_code); // 前面的限定符volatile 要求编译器不要对其进行优化。
// 获取当前任务信号屏蔽位图(屏蔽码)。
int sys_sgetmask()
{
return current->blocked;
}
// 设置新的信号屏蔽位图。SIGKILL 不能被屏蔽。返回值是原信号屏蔽位图。
int sys_ssetmask(int newmask)
{
int old=current->blocked;
current->blocked = newmask & ~(1<<(SIGKILL-1));
return old;
}
// 复制sigaction 数据到fs 数据段to 处。。
static inline void save_old(char * from,char * to)
{
int i;
verify_area(to, sizeof(struct sigaction)); // 验证to 处的内存是否足够。
for (i=0 ; i< sizeof(struct sigaction) ; i++) {
put_fs_byte(*from,to); // 复制到fs 段。一般是用户数据段。
from++; // put_fs_byte()在include/asm/segment.h 中。
to++;
}
}
// 把sigaction 数据从fs 数据段from 位置复制到to 处。
static inline void get_new(char * from,char * to)
{
int i;
for (i=0 ; i< sizeof(struct sigaction) ; i++)
*(to++) = get_fs_byte(from++);
}
// signal()系统调用。类似于sigaction()。为指定的信号安装新的信号句柄(信号处理程序)。
// 信号句柄可以是用户指定的函数,也可以是SIG_DFL(默认句柄)或SIG_IGN(忽略)。
// 参数signum --指定的信号;handler -- 指定的句柄;restorer –原程序当前执行的地址位置。
// 函数返回原信号句柄。
int sys_signal(int signum, long handler, long restorer)
{
struct sigaction tmp;
if (signum<1 || signum>32 || signum==SIGKILL) // 信号值要在(1-32)范围内,
return -1; // 并且不得是SIGKILL。
tmp.sa_handler = (void (*)(int)) handler; // 指定的信号处理句柄。
tmp.sa_mask = 0; // 执行时的信号屏蔽码。
tmp.sa_flags = SA_ONESHOT | SA_NOMASK; // 该句柄只使用1 次后就恢复到默认值,
// 并允许信号在自己的处理句柄中收到。
tmp.sa_restorer = (void (*)(void)) restorer; // 保存返回地址。
handler = (long) current->sigaction[signum-1].sa_handler;
current->sigaction[signum-1] = tmp;
return handler;
}
// sigaction()系统调用。改变进程在收到一个信号时的操作。signum 是除了SIGKILL 以外的任何
// 信号。[如果新操作(action)不为空]则新操作被安装。如果oldaction 指针不为空,则原操作
// 被保留到oldaction。成功则返回0,否则为-1。
int sys_sigaction(int signum, const struct sigaction * action,
struct sigaction * oldaction)
{
struct sigaction tmp;
// 信号值要在(1-32)范围内,并且信号SIGKILL 的处理句柄不能被改变。
if (signum<1 || signum>32 || signum==SIGKILL)
return -1;
// 在信号的sigaction 结构中设置新的操作(动作)。
tmp = current->sigaction[signum-1];
get_new((char *) action,
(char *) (signum-1+current->sigaction));
// 如果oldaction 指针不为空的话,则将原操作指针保存到oldaction 所指的位置。
if (oldaction)
save_old((char *) &tmp,(char *) oldaction);
// 如果允许信号在自己的信号句柄中收到,则令屏蔽码为0,否则设置屏蔽本信号。
if (current->sigaction[signum-1].sa_flags & SA_NOMASK)
current->sigaction[signum-1].sa_mask = 0;
else
current->sigaction[signum-1].sa_mask |= (1<<(signum-1));
return 0;
}
int sys_sigsuspend()
{
return -ENOSYS;
}
int sys_sigpending()
{
return -ENOSYS;
}
// 系统调用中断处理程序中真正的信号处理程序(在kernel/system_call.s)。
// 该段代码的主要作用是将信号的处理句柄插入到用户程序堆栈中,并在本系统调用结束
// 返回后立刻执行信号句柄程序,然后继续执行用户的程序。这个函数处理比较粗略,尚不能
// 处理进程暂停 SIGSTOP等信号
void do_signal(long signr,long eax, long ebx, long ecx, long edx,
long fs, long es, long ds,
long eip, long cs, long eflags,
unsigned long * esp, long ss)
{
unsigned long sa_handler;
long old_eip=eip;
struct sigaction * sa = current->sigaction + signr - 1;
int longs;
unsigned long * tmp_esp;
sa_handler = (unsigned long) sa->sa_handler;
// 如果信号句柄为SIG_IGN(忽略),则返回;如果句柄为SIG_DFL(默认处理),则如果信号是
// SIGCHLD 则返回,否则终止进程的执行
if (sa_handler==1)
return;
if (!sa_handler) {
if (signr==SIGCHLD)
return;
else
do_exit(1<<(signr-1));
}
// 如果该信号句柄只需使用一次,则将该句柄置空(该信号句柄已经保存在sa_handler 指针中)。
if (sa->sa_flags & SA_ONESHOT)
sa->sa_handler = NULL;
// 下面这段代码将信号处理句柄插入到用户堆栈中,同时也将sa_restorer,signr,进程屏蔽码(如果
// SA_NOMASK 没置位),eax,ecx,edx 作为参数以及原调用系统调用的程序返回指针及标志寄存器值
// 压入堆栈。因此在本次系统调用中断(0x80)返回用户程序时会首先执行用户的信号句柄程序,然后
// 再继续执行用户程序。
// 将用户调用系统调用的代码指针eip 指向该信号处理句柄。
*(&eip) = sa_handler;
// 如果允许信号自己的处理句柄收到信号自己,则也需要将进程的阻塞码压入堆栈。
longs = (sa->sa_flags & SA_NOMASK)?7:8;
// 将原调用程序的用户的堆栈指针向下扩展7(或8)个长字(用来存放调用信号句柄的参数等),
// 并检查内存使用情况(例如如果内存超界则分配新页等)。
*(&esp) -= longs;
verify_area(esp,longs*4);
// 在用户堆栈中从下到上存放sa_restorer, 信号signr, 屏蔽码blocked(如果SA_NOMASK 置位),
// eax, ecx, edx, eflags 和用户程序原代码指针。
tmp_esp=esp;
put_fs_long((long) sa->sa_restorer,tmp_esp++);
put_fs_long(signr,tmp_esp++);
if (!(sa->sa_flags & SA_NOMASK))
put_fs_long(current->blocked,tmp_esp++);
put_fs_long(eax,tmp_esp++);
put_fs_long(ecx,tmp_esp++);
put_fs_long(edx,tmp_esp++);
put_fs_long(eflags,tmp_esp++);
put_fs_long(old_eip,tmp_esp++);
current->blocked |= sa->sa_mask;
}
/*
* linux/kernel/sys.c
*
* (C) 1991 Linus Torvalds
*/
#include <errno.h> // 错误号头文件。包含系统中各种出错号。(Linus 从minix 中引进的)。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/tty.h> // tty 头文件,定义了有关tty_io,串行通信方面的参数、常数。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数。
#include <sys/times.h> // 定义了进程中运行时间的结构tms 以及times()函数原型。
#include <sys/utsname.h> // 系统名称结构头文件。
// 返回日期和时间。
int
sys_ftime ()
{
return -ENOSYS;
}
//
int
sys_break ()
{
return -ENOSYS;
}
// 用于当前进程对子进程进行调试(degugging)。
int
sys_ptrace ()
{
return -ENOSYS;
}
// 改变并打印终端行设置。
int
sys_stty ()
{
return -ENOSYS;
}
// 取终端行设置信息。
int
sys_gtty ()
{
return -ENOSYS;
}
// 修改文件名。
int
sys_rename ()
{
return -ENOSYS;
}
int
sys_prof ()
{
return -ENOSYS;
}
// 设置当前任务的实际以及/或者有效组ID(gid)。如果任务没有超级用户特权,
// 那么只能互换其实际组ID 和有效组ID。如果任务具有超级用户特权,就能任意设置有效的和实际
// 的组ID。保留的gid(saved gid)被设置成与有效gid 同值。
int
sys_setregid (int rgid, int egid)
{
if (rgid > 0)
{
if ((current->gid == rgid) || suser ())
current->gid = rgid;
else
return (-EPERM);
}
if (egid > 0)
{
if ((current->gid == egid) ||
(current->egid == egid) || (current->sgid == egid) || suser ())
current->egid = egid;
else
return (-EPERM);
}
return 0;
}
// 设置进程组号(gid)。如果任务没有超级用户特权,它可以使用setgid()将其有效gid
// (effective gid)设置为成其保留gid(saved gid)或其实际gid(real gid)。如果任务有
// 超级用户特权,则实际gid、有效gid 和保留gid 都被设置成参数指定的gid。
int
sys_setgid (int gid)
{
return (sys_setregid (gid, gid));
}
// 打开或关闭进程计帐功能。
int
sys_acct ()
{
return -ENOSYS;
}
// 映射任意物理内存到进程的虚拟地址空间。
int
sys_phys ()
{
return -ENOSYS;
}
int
sys_lock ()
{
return -ENOSYS;
}
int
sys_mpx ()
{
return -ENOSYS;
}
int
sys_ulimit ()
{
return -ENOSYS;
}
// 返回从1970 年1 月1 日00:00:00 GMT 开始计时的时间值(秒)。如果tloc 不为null,则时间值
// 也存储在那里。
int
sys_time (long *tloc)
{
int i;
i = CURRENT_TIME;
if (tloc)
{
verify_area (tloc, 4); // 验证内存容量是否够(这里是4 字节)。
put_fs_long (i, (unsigned long *) tloc); // 也放入用户数据段tloc 处。
}
return i;
}
/*
* Unprivileged users may change the real user id to the effective uid
* or vice versa.
*/
/*
* 无特权的用户可以见实际用户标识符(real uid)改成有效用户标识符(effective uid),反之也然。
*/
// 设置任务的实际以及/或者有效用户ID(uid)。如果任务没有超级用户特权,那么只能互换其
// 实际用户ID 和有效用户ID。如果任务具有超级用户特权,就能任意设置有效的和实际的用户ID。
// 保留的uid(saved uid)被设置成与有效uid 同值。
int
sys_setreuid (int ruid, int euid)
{
int old_ruid = current->uid;
if (ruid > 0)
{
if ((current->euid == ruid) || (old_ruid == ruid) || suser ())
current->uid = ruid;
else
return (-EPERM);
}
if (euid > 0)
{
if ((old_ruid == euid) || (current->euid == euid) || suser ())
current->euid = euid;
else
{
current->uid = old_ruid;
return (-EPERM);
}
}
return 0;
}
// 设置任务用户号(uid)。如果任务没有超级用户特权,它可以使用setuid()将其有效uid
// (effective uid)设置成其保留uid(saved uid)或其实际uid(real uid)。如果任务有
// 超级用户特权,则实际uid、有效uid 和保留uid 都被设置成参数指定的uid。
int
sys_setuid (int uid)
{
return (sys_setreuid (uid, uid));
}
// 设置系统时间和日期。参数tptr 是从1970 年1 月1 日00:00:00 GMT 开始计时的时间值(秒)。
// 调用进程必须具有超级用户权限。
int
sys_stime (long *tptr)
{
if (!suser ()) // 如果不是超级用户则出错返回(许可)。
return -EPERM;
startup_time = get_fs_long ((unsigned long *) tptr) - jiffies / HZ;
return 0;
}
// 获取当前任务时间。tms 结构中包括用户时间、系统时间、子进程用户时间、子进程系统时间。
int
sys_times (struct tms *tbuf)
{
if (tbuf)
{
verify_area (tbuf, sizeof *tbuf);
put_fs_long (current->utime, (unsigned long *) &tbuf->tms_utime);
put_fs_long (current->stime, (unsigned long *) &tbuf->tms_stime);
put_fs_long (current->cutime, (unsigned long *) &tbuf->tms_cutime);
put_fs_long (current->cstime, (unsigned long *) &tbuf->tms_cstime);
}
return jiffies;
}
// 当参数end_data_seg 数值合理,并且系统确实有足够的内存,而且进程没有超越其最大数据段大小
// 时,该函数设置数据段末尾为end_data_seg 指定的值。该值必须大于代码结尾并且要小于堆栈
// 结尾16KB。返回值是数据段的新结尾值(如果返回值与要求值不同,则表明有错发生)。
// 该函数并不被用户直接调用,而由libc 库函数进行包装,并且返回值也不一样。
int
sys_brk (unsigned long end_data_seg)
{
if (end_data_seg >= current->end_code && // 如果参数>代码结尾,并且
end_data_seg < current->start_stack - 16384) // 小于堆栈-16KB,
current->brk = end_data_seg; // 则设置新数据段结尾值。
return current->brk; // 返回进程当前的数据段结尾值。
}
/*
* This needs some heave checking ...
* I just haven't get the stomach for it. I also don't fully
* understand sessions/pgrp etc. Let somebody who does explain it.
*/
/*
* 下面代码需要某些严格的检查…
* 我只是没有胃口来做这些。我也不完全明白sessions/pgrp 等。还是让了解它们的人来做吧。
*/
// 将参数pid 指定进程的进程组ID 设置成pgid。如果参数pid=0,则使用当前进程号。如果
// pgid 为0,则使用参数pid 指定的进程的组ID 作为pgid。如果该函数用于将进程从一个
// 进程组移到另一个进程组,则这两个进程组必须属于同一个会话(session)。在这种情况下,
// 参数pgid 指定了要加入的现有进程组ID,此时该组的会话ID 必须与将要加入进程的相同。
int
sys_setpgid (int pid, int pgid)
{
int i;
if (!pid) // 如果参数pid=0,则使用当前进程号。
pid = current->pid;
if (!pgid) // 如果pgid 为0,则使用当前进程pid 作为pgid。
pgid = current->pid; // [这里与POSIX 的描述有出入]
for (i = 0; i < NR_TASKS; i++) // 扫描任务数组,查找指定进程号的任务。
if (task[i] && task[i]->pid == pid)
{
if (task[i]->leader) // 如果该任务已经是首领,则出错返回。
return -EPERM;
if (task[i]->session != current->session) // 如果该任务的会话ID
return -EPERM; // 与当前进程的不同,则出错返回。
task[i]->pgrp = pgid; // 设置该任务的pgrp。
return 0;
}
return -ESRCH;
}
// 返回当前进程的组号。与getpgid(0)等同。
int
sys_getpgrp (void)
{
return current->pgrp;
}
// 创建一个会话(session)(即设置其leader=1),并且设置其会话=其组号=其进程号。
int
sys_setsid (void)
{
if (current->leader && !suser ()) // 如果当前进程已是会话首领并且不是超级用户
return -EPERM; // 则出错返回。
current->leader = 1; // 设置当前进程为新会话首领。
current->session = current->pgrp = current->pid; // 设置本进程session = pid。
current->tty = -1; // 表示当前进程没有控制终端。
return current->pgrp; // 返回会话ID。
}
// 获取系统信息。其中utsname 结构包含5 个字段,分别是:本版本操作系统的名称、网络节点名称、
// 当前发行级别、版本级别和硬件类型名称。
int
sys_uname (struct utsname *name)
{
static struct utsname thisname = { // 这里给出了结构中的信息,这种编码肯定会改变。
"linux .0", "nodename", "release ", "version ", "machine "
};
int i;
if (!name)
return -ERROR; // 如果存放信息的缓冲区指针为空则出错返回。
verify_area (name, sizeof *name); // 验证缓冲区大小是否超限(超出已分配的内存等)。
for (i = 0; i < sizeof *name; i++) // 将utsname 中的信息逐字节复制到用户缓冲区中。
put_fs_byte (((char *) &thisname)[i], i + (char *) name);
return 0;
}
// 设置当前进程创建文件属性屏蔽码为mask & 0777。并返回原屏蔽码。
int
sys_umask (int mask)
{
int old = current->umask;
current->umask = mask & 0777;
return (old);
}
int sys_getgroups()
{
return -ENOSYS;
}
int sys_setgroups()
{
return -ENOSYS;
}
int sys_sethostname()
{
return -ENOSYS;
}
int sys_getrlimit()
{
return -ENOSYS;
}
int sys_setrlimit()
{
return -ENOSYS;
}
int sys_getrusage()
{
return -ENOSYS;
}
int sys_gettimeofday()
{
return -ENOSYS;
}
int sys_settimeofday()
{
return -ENOSYS;
}
/*
* linux/kernel/system_call.s
*
* (C) 1991 Linus Torvalds
*/
/*
* system_call.s contains the system-call low-level handling routines.
* This also contains the timer-interrupt handler, as some of the code is
* the same. The hd- and flopppy-interrupts are also here.
*
* NOTE: This code handles signal-recognition, which happens every time
* after a timer-interrupt and after each system call. Ordinary interrupts
* don't handle signal-recognition, as that would clutter them up totally
* unnecessarily.
*
* Stack layout in 'ret_from_system_call':
*
* 0(%esp) - %eax
* 4(%esp) - %ebx
* 8(%esp) - %ecx
* C(%esp) - %edx
* 10(%esp) - %fs
* 14(%esp) - %es
* 18(%esp) - %ds
* 1C(%esp) - %eip
* 20(%esp) - %cs
* 24(%esp) - %eflags
* 28(%esp) - %oldesp
* 2C(%esp) - %oldss
*/
/*
* system_call.s 文件包含系统调用(system-call)底层处理子程序。由于有些代码比较类似,所以
* 同时也包括时钟中断处理(timer-interrupt)句柄。硬盘和软盘的中断处理程序也在这里。
*
* 注意:这段代码处理信号(signal)识别,在每次时钟中断和系统调用之后都会进行识别。一般
* 中断信号并不处理信号识别,因为会给系统造成混乱。
*
* 从系统调用返回('ret_from_system_call')时堆栈的内容。
*/
SIG_CHLD = 17 # 定义SIG_CHLD 信号(子进程停止或结束)。
EAX = 0x00 # 堆栈中各个寄存器的偏移位置。
EBX = 0x04
ECX = 0x08
EDX = 0x0C
FS = 0x10
ES = 0x14
DS = 0x18
EIP = 0x1C
CS = 0x20
EFLAGS = 0x24
OLDESP = 0x28 # 当有特权级变化时栈会切换,用户栈指针被保存在内核态栈中
OLDSS = 0x2C
# 以下这些是任务结构(task_struct)中变量的偏移值,参见include/linux/sched.h开始。
state = 0 # these are offsets into the task-struct. # 进程状态码
counter = 4 # 任务运行时间计数(递减)(滴答数),运行时间片。
priority = 8 # 运行优先数。任务开始运行时counter=priority,越大则运行时间越长。
signal = 12 # 是信号位图,每个比特位代表一种信号,信号值=位偏移值+1。
sigaction = 16 # MUST be 16 (=len of sigaction) #sigaction 结构长度必须是16 字节。
# 信号执行属性结构数组的偏移值,对应信号将要执行的操作和标志信息。
blocked = (33*16) # 受阻塞信号位图的偏移量。
# 以下定义在sigaction 结构中的偏移量,参见include/signal.h
# offsets within sigaction
sa_handler = 0 # 信号处理过程的句柄(描述符)。
sa_mask = 4 # 信号量屏蔽码
sa_flags = 8 # 信号集。
sa_restorer = 12 # 返回恢复执行的地址位置。参见kernel/signal.c
nr_system_calls = 87 # Linux 0.11 版内核中的系统调用总数。
/*
* Ok, I get parallel printer interrupts while using the floppy for some
* strange reason. Urgel. Now I just ignore them.
*/
/*
* 好了,在使用软驱时我收到了并行打印机中断,很奇怪。呵,现在不管它。
*/
# 定义入口点。
.globl _system_call,_sys_fork,_timer_interrupt,_sys_execve
.globl _hd_interrupt,_floppy_interrupt,_parallel_interrupt
.globl _device_not_available, _coprocessor_error
# 错误的系统调用号。
.align 2 # 内存4 字节对齐。
bad_sys_call:
movl $-1,%eax # eax 中置-1,退出中断。
iret
.align 2
# 重新执行调度程序入口。调度程序schedule 在(kernel/sched.c)。
reschedule:
pushl $ret_from_sys_call # 将ret_from_sys_call 的地址入栈
jmp _schedule
# int 0x80 --linux 系统调用入口点(调用中断int 0x80,eax 中是调用号)。
.align 2
_system_call:
cmpl $nr_system_calls-1,%eax # 调用号如果超出范围的话就在eax 中置-1 并退出。
ja bad_sys_call
push %ds # 保存原段寄存器值。
push %es
push %fs
pushl %edx # ebx,ecx,edx 中放着系统调用相应的C 语言函数的调用参数。
pushl %ecx # push %ebx,%ecx,%edx as parameters
pushl %ebx # to the system call
movl $0x10,%edx # set up ds,es to kernel space
mov %dx,%ds # ds,es 指向内核数据段(全局描述符表中数据段描述符)。
mov %dx,%es
# 注意在Linux0.11中内核给任务分配的代码和数据内存是重叠的。他们的段基址和段限长相同。 参见fork.c程序中copy_mem()函数。
movl $0x17,%edx # fs points to local data space
mov %dx,%fs # fs 指向局部数据段(局部描述符表中数据段描述符)。
# 下面这句操作数的含义是:调用地址 = _sys_call_table + %eax * 4。
# 对应的C 程序中的sys_call_table 在include/linux/sys.h 中,其中定义了一个包括87 个
# 系统调用C 处理函数的地址数组表。
call *_sys_call_table(,%eax,4)
pushl %eax # 把返回值入栈。
movl _current,%eax # 取当前任务(进程)数据结构地址->eax。
# 下面行查看当前任务的运行状态。如果不在就绪状态(state 不等于0)就去执行调度程序。
# 如果该任务在就绪状态但counter值等于0,则也去执行调度程序。
cmpl $0,state(%eax) # state
jne reschedule
cmpl $0,counter(%eax) # counter
je reschedule
# 以下这段代码执行从系统调用C 函数返回后,对信号量进行识别处理。
ret_from_sys_call:
# 首先判别当前任务是否是初始任务task0,如果是则不必对其进行信号量方面的处理,直接返回。
# _task 对应C 程序中的task[]数组,直接引用task 相当于引用task[0]。
movl _current,%eax # task[0] cannot have signals
cmpl _task,%eax
je 3f
# 通过对原调用程序代码选择符的检查来判断调用程序是否是超级用户。如果是超级用户就直接
# 退出中断,否则需进行信号量的处理。这里比较选择符是否为普通用户代码段的选择符0x000f
# (RPL=3,局部表,第1 个段(代码段)),如果不是则跳转退出中断程序。
cmpw $0x0f,CS(%esp) # was old code segment supervisor ?
jne 3f
# 如果原堆栈段选择符不为0x17(也即原堆栈不在用户数据段中),则也退出。
cmpw $0x17,OLDSS(%esp) # was stack segment = 0x17 ?
jne 3f
# 下面这段代码的用途是首先取当前任务结构中的信号位图(32 位,每位代表1 种信号),
# 然后用任务结构中的信号阻塞(屏蔽)码,阻塞不允许的信号位,取得数值最小的信号值,再把
# 原信号位图中该信号对应的位复位(置0),最后将该信号值作为参数之一调用do_signal()。
# do_signal()在(kernel/signal.c)中,其参数包括13 个入栈的信息。
movl signal(%eax),%ebx # 取信号位图->ebx,每1 位代表1 种信号,共32 个信号。
movl blocked(%eax),%ecx # 取阻塞(屏蔽)信号位图->ecx。
notl %ecx # 每位取反。
andl %ebx,%ecx # 获得许可的信号位图。
bsfl %ecx,%ecx # 从低位(位0)开始扫描位图,看是否有1 的位,
# 若有,则ecx 保留该位的偏移值(即第几位0-31)。
je 3f # 如果没有信号则向前跳转退出。
btrl %ecx,%ebx # 复位该信号(ebx 含有原signal 位图)。
movl %ebx,signal(%eax) # 重新保存signal 位图信息->current->signal。
incl %ecx # 将信号调整为从1 开始的数(1-32)。
pushl %ecx # 信号值入栈作为调用do_signal 的参数之一。
call _do_signal # 调用C 函数信号处理程序(kernel/signal.c)
popl %eax # 弹出信号值。
3: popl %eax
popl %ebx
popl %ecx
popl %edx
pop %fs
pop %es
pop %ds
iret
#### int16 -- 下面这段代码处理协处理器发出的出错信号。跳转执行C 函数math_error()
# (kernel/math/math_emulate.c),返回后将跳转到ret_from_sys_call 处继续执行。
.align 2
_coprocessor_error:
push %ds
push %es
push %fs
pushl %edx
pushl %ecx
pushl %ebx
pushl %eax
movl $0x10,%eax # ds,es 置为指向内核数据段。
mov %ax,%ds
mov %ax,%es
movl $0x17,%eax # fs 置为指向局部数据段(出错程序的数据段)。
mov %ax,%fs
pushl $ret_from_sys_call # 把下面调用返回的地址入栈。
jmp _math_error # 执行C 函数math_error()(kernel/math/math_emulate.c)
#### int7 -- 设备不存在或协处理器不存在(Coprocessor not available)。
# 如果控制寄存器CR0 的EM 标志置位,则当CPU 执行一个ESC 转义指令时就会引发该中断,这样就
# 可以有机会让这个中断处理程序模拟ESC 转义指令。
# CR0 的TS 标志是在CPU 执行任务转换时设置的。TS 可以用来确定什么时候协处理器中的内容(上下文)
# 与CPU 正在执行的任务不匹配了。当CPU 在运行一个转义指令时发现TS 置位了,就会引发该中断。
# 此时就应该恢复新任务的协处理器执行状态。参见(kernel/sched.c)中的说明。
# 该中断最后将转移到标号ret_from_sys_call 处执行下去(检测并处理信号)。
.align 2
_device_not_available:
push %ds
push %es
push %fs
pushl %edx
pushl %ecx
pushl %ebx
pushl %eax
movl $0x10,%eax # ds,es 置为指向内核数据段。
mov %ax,%ds
mov %ax,%es
movl $0x17,%eax # fs 置为指向局部数据段(出错程序的数据段)。
mov %ax,%fs
pushl $ret_from_sys_call # 把下面跳转或调用的返回地址入栈。
clts # clear TS so that we can use math
movl %cr0,%eax
testl $0x4,%eax # EM (math emulation bit)
# 如果不是EM 引起的中断,则恢复新任务协处理器状态,
je _math_state_restore # 执行C 函数math_state_restore()(kernel/sched.c)。
pushl %ebp
pushl %esi
pushl %edi
call _math_emulate # 调用C 函数math_emulate(kernel/math/math_emulate.c)。
popl %edi
popl %esi
popl %ebp
ret # 这里的ret 将跳转到ret_from_sys_call。
#### int32 -- (int 0x20) 时钟中断处理程序。中断频率被设置为100Hz(include/linux/sched.h),
# 定时芯片8253/8254 是在(kernel/sched.c)处初始化的。因此这里jiffies 每10 毫秒加1。
# 这段代码将jiffies 增1,发送结束中断指令给8259 控制器,然后用当前特权级作为参数调用
# C 函数do_timer(long CPL)。当调用返回时转去检测并处理信号。
.align 2
_timer_interrupt:
push %ds # save ds,es and put kernel data space
push %es # into them. %fs is used by _system_call
push %fs
pushl %edx # we save %eax,%ecx,%edx as gcc doesn't
pushl %ecx # save those across function calls. %ebx
pushl %ebx # is saved as we use that in ret_sys_call
pushl %eax
movl $0x10,%eax # ds,es 置为指向内核数据段。
mov %ax,%ds
mov %ax,%es
movl $0x17,%eax # fs 置为指向局部数据段(出错程序的数据段)。
mov %ax,%fs
incl _jiffies
# 由于初始化中断控制芯片时没有采用自动EOI,所以这里需要发指令结束该硬件中断。
movb $0x20,%al # EOI to interrupt controller #1
outb %al,$0x20 # 操作命令字OCW2 送0x20 端口。
# 下面3 句从选择符中取出当前特权级别(0 或3)并压入堆栈,作为do_timer 的参数。
movl CS(%esp),%eax
andl $3,%eax # %eax is CPL (0 or 3, 0=supervisor)
pushl %eax
# do_timer(CPL)执行任务切换、计时等工作,在kernel/shched.c,实现。
call _do_timer # 'do_timer(long CPL)' does everything from
addl $4,%esp # task switching to accounting ...
jmp ret_from_sys_call
#### 这是sys_execve()系统调用。取中断调用程序的代码指针作为参数调用C 函数do_execve()。
# do_execve()在(fs/exec.c)。
.align 2
_sys_execve:
lea EIP(%esp),%eax
pushl %eax
call _do_execve
addl $4,%esp # 丢弃调用时压入栈的EIP 值。
ret
#### sys_fork()调用,用于创建子进程,是system_call 功能2。原形在include/linux/sys.h 中。
# 首先调用C 函数find_empty_process(),取得一个进程号pid。若返回负数则说明目前任务数组
# 已满。然后调用copy_process()复制进程。
.align 2
_sys_fork:
call _find_empty_process # 调用find_empty_process()(kernel/fork.c)。
testl %eax,%eax
js 1f
push %gs
pushl %esi
pushl %edi
pushl %ebp
pushl %eax
call _copy_process # 调用C 函数copy_process()(kernel/fork.c)。
addl $20,%esp # 丢弃这里所有压栈内容。
1: ret
#### int 46 -- (int 0x2E) 硬盘中断处理程序,响应硬件中断请求IRQ14。
# 当硬盘操作完成或出错就会发出此中断信号。(参见kernel/blk_drv/hd.c)。
# 首先向8259A 中断控制从芯片发送结束硬件中断指令(EOI),然后取变量do_hd 中的函数指针放入edx
# 寄存器中,并置do_hd 为NULL,接着判断edx 函数指针是否为空。如果为空,则给edx 赋值指向
# unexpected_hd_interrupt(),用于显示出错信息。随后向8259A 主芯片送EOI 指令,并调用edx 中
# 指针指向的函数: read_intr()、write_intr()或unexpected_hd_interrupt()。
_hd_interrupt:
pushl %eax
pushl %ecx
pushl %edx
push %ds
push %es
push %fs
movl $0x10,%eax # ds,es 置为内核数据段。
mov %ax,%ds
mov %ax,%es
movl $0x17,%eax # fs 置为调用程序的局部数据段。
mov %ax,%fs
# 由于初始化中断控制芯片时没有采用自动EOI,所以这里需要发指令结束该硬件中断。
movb $0x20,%al
outb %al,$0xA0 # EOI to interrupt controller #1 #送从8259A.
jmp 1f # give port chance to breathe
1: jmp 1f # 延时作用。
1: xorl %edx,%edx
xchgl _do_hd,%edx # do_hd 定义为一个函数指针,将被赋值read_intr()或
# write_intr()函数地址。(kernel/blk_drv/hd.c)
# 放到edx 寄存器后就将do_hd 指针变量置为NULL。
testl %edx,%edx # 测试函数指针是否为Null。
jne 1f # 若空,则使指针指向C 函数unexpected_hd_interrupt()。
movl $_unexpected_hd_interrupt,%edx
1: outb %al,$0x20 # 送主8259A 中断控制器EOI 指令(结束硬件中断)。
call *%edx # "interesting" way of handling intr.
pop %fs # 上句调用do_hd 指向的C 函数。
pop %es
pop %ds
popl %edx
popl %ecx
popl %eax
iret
#### int38 -- (int 0x26) 软盘驱动器中断处理程序,响应硬件中断请求IRQ6。
# 其处理过程与上面对硬盘的处理基本一样。(kernel/blk_drv/floppy.c)。
# 首先向8259A 中断控制器主芯片发送EOI 指令,然后取变量do_floppy 中的函数指针放入eax
# 寄存器中,并置do_floppy 为NULL,接着判断eax 函数指针是否为空。如为空,则给eax 赋值指向
# unexpected_floppy_interrupt (),用于显示出错信息。随后调用eax 指向的函数: rw_interrupt,
# seek_interrupt,recal_interrupt,reset_interrupt 或unexpected_floppy_interrupt。
_floppy_interrupt:
pushl %eax
pushl %ecx
pushl %edx
push %ds
push %es
push %fs
movl $0x10,%eax # ds,es 置为内核数据段。
mov %ax,%ds
mov %ax,%es
movl $0x17,%eax # fs 置为调用程序的局部数据段。
mov %ax,%fs
movb $0x20,%al # 送主8259A 中断控制器EOI 指令(结束硬件中断)。
outb %al,$0x20 # EOI to interrupt controller #1
xorl %eax,%eax
xchgl _do_floppy,%eax # do_floppy 为一函数指针,将被赋值实际处理C 函数程序,
# 放到eax 寄存器后就将do_floppy 指针变量置空。
testl %eax,%eax
jne 1f
movl $_unexpected_floppy_interrupt,%eax
1: call *%eax # "interesting" way of handling intr.
pop %fs
pop %es
pop %ds
popl %edx
popl %ecx
popl %eax
iret
#### int 39 -- (int 0x27) 并行口中断处理程序,对应硬件中断请求信号IRQ7。
# 本版本内核还未实现。这里只是发送EOI 指令。
_parallel_interrupt:
pushl %eax
movb $0x20,%al
outb %al,$0x20
popl %eax
iret
/*
* linux/kernel/traps.c
*
* (C) 1991 Linus Torvalds
*/
/*
* 'Traps.c' handles hardware traps and faults after we have saved some
* state in 'asm.s'. Currently mostly a debugging-aid, will be extended
* to mainly kill the offending process (probably by giving it a signal,
* but possibly by killing it outright if necessary).
*/
/*
* 在程序 asm.s 中保存了一些状态后,本程序用来处理硬件陷阱和故障。目前主要用于调试
* 目的, 以后将扩展用来杀死损坏的进程(主要是通过发送一个信号,但如果必要也会直接
* 杀死)
*/
#include <string.h> // 字符串头文件。主要定义了一些有关内存或字符串操作的嵌入函数
#include <linux/head.h> // 定义了段描述符的简单结构,和几个选择符常量
#include <linux/sched.h> // 调度程序头文件,定义了任务结构 task_struct、初始任务
// 0的数据,还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原型定义
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏
#include <asm/segment.h> // 段操作头文件。定义了有关段寄存器操作的嵌入式汇编函数
#include <asm/io.h> // 输入/输出头文件。定义硬件端口输入/输出宏汇编语句
// 取段 seg 中地址addr 处的一个字节
// 参数 seg-段选择符;addr-段内指定地址
// 输出:%0-eax(_res);输入:%1-eax(seg);%2-内存地址(*(addr))。
#define get_seg_byte(seg,addr) ({ \
register char __res; \
__asm__("push %%fs;mov %%ax,%%fs;movb %%fs:%2,%%al;pop %%fs" \
:"=a" (__res):"0" (seg),"m" (*(addr))); \
__res;})
// 取 seg 中地址addr 处的一个长字(4字节)
// 参数:seg-段选择符;addr-段内指定地址
#define get_seg_long(seg,addr) ({ \
register unsigned long __res; \
__asm__("push %%fs;mov %%ax,%%fs;movl %%fs:%2,%%eax;pop %%fs" \
:"=a" (__res):"0" (seg),"m" (*(addr))); \
__res;})
// 取fs段寄存器的值(段选择符)
#define _fs() ({ \
register unsigned short __res; \
__asm__("mov %%fs,%%ax":"=a" (__res):); \
__res;})
int do_exit(long code); // 程序退出处理。(kernel/exit.c)
void page_exception(void); // 页异常。实际是page_fault(mm/page.s)
// 下面定义了一些中断程序原型,用于在函数trap_init()中设置相应中断门描述符。
// 这些函数的代码在(kernel/asm.s 或 system_call.s).
void divide_error(void); // int0 (kernel/asm.s)
void debug(void); // int1 (kernel/asm.s)
void nmi(void); // int2 (kernel/asm.s)
void int3(void); // int3 (kernel/asm.s)
void overflow(void); // int4 (kernel/asm.s)
void bounds(void); // int5 (kernel/asm.s)
void invalid_op(void); // int6 (kernel/asm.s)
void device_not_available(void); // int7 (kernel/system_call.s)
void double_fault(void); // int8 (kernel/asm.s)
void coprocessor_segment_overrun(void); // int9 (kernel/asm.s)
void invalid_TSS(void); // int10 (kernel/asm.s)
void segment_not_present(void); // int11 (kernel/asm.s)
void stack_segment(void); // int12 (kernel/asm.s)
void general_protection(void); // int13 (kernel/asm.s)
void page_fault(void); // int14 (mm/page.s)
void coprocessor_error(void); // int16 (kernel/system_call.s)
void reserved(void); // int15 (kernel/asm.s)
void parallel_interrupt(void); // int39 (kernel/system_call.s)
void irq13(void); // int45 协处理器中断处理(kernel/asm.s)
// 该子程序用来打印出错中断的名称、出错号、调用程序的EIP、EFLAGS、ESP、fs段寄存器值、
// 段的基质、段的长度、进程号、任务号、10字节指令码。如果堆栈在用户数据段,则还打印16
// 字节的堆栈内容
static void die(char * str,long esp_ptr,long nr)
{
long * esp = (long *) esp_ptr;
int i;
printk("%s: %04x\n\r",str,nr&0xffff);
printk("EIP:\t%04x:%p\nEFLAGS:\t%p\nESP:\t%04x:%p\n",
esp[1],esp[0],esp[2],esp[4],esp[3]);
printk("fs: %04x\n",_fs());
printk("base: %p, limit: %p\n",get_base(current->ldt[1]),get_limit(0x17));
if (esp[4] == 0x17) {
printk("Stack: ");
for (i=0;i<4;i++)
printk("%p ",get_seg_long(0x17,i+(long *)esp[3]));
printk("\n");
}
str(i);
printk("Pid: %d, process nr: %d\n\r",current->pid,0xffff & i);
for(i=0;i<10;i++)
printk("%02x ",0xff & get_seg_byte(esp[1],(i+(char *)esp[0])));
printk("\n\r");
do_exit(11); /* play segment exception */
}
// 以下这些以do_开头的函数式asm.s中对应中断处理程序调用的C函数
void do_double_fault(long esp, long error_code)
{
die("double fault",esp,error_code);
}
void do_general_protection(long esp, long error_code)
{
die("general protection",esp,error_code);
}
void do_divide_error(long esp, long error_code)
{
die("divide error",esp,error_code);
}
// 参数是进入中断后被顺序压入堆栈的寄存器值。参见asm.s
void do_int3(long * esp, long error_code,
long fs,long es,long ds,
long ebp,long esi,long edi,
long edx,long ecx,long ebx,long eax)
{
int tr;
__asm__("str %%ax":"=a" (tr):"0" (0));
printk("eax\t\tebx\t\tecx\t\tedx\n\r%8x\t%8x\t%8x\t%8x\n\r",
eax,ebx,ecx,edx);
printk("esi\t\tedi\t\tebp\t\tesp\n\r%8x\t%8x\t%8x\t%8x\n\r",
esi,edi,ebp,(long) esp);
printk("\n\rds\tes\tfs\ttr\n\r%4x\t%4x\t%4x\t%4x\n\r",
ds,es,fs,tr);
printk("EIP: %8x CS: %4x EFLAGS: %8x\n\r",esp[0],esp[1],esp[2]);
}
void do_nmi(long esp, long error_code)
{
die("nmi",esp,error_code);
}
void do_debug(long esp, long error_code)
{
die("debug",esp,error_code);
}
void do_overflow(long esp, long error_code)
{
die("overflow",esp,error_code);
}
void do_bounds(long esp, long error_code)
{
die("bounds",esp,error_code);
}
void do_invalid_op(long esp, long error_code)
{
die("invalid operand",esp,error_code);
}
void do_device_not_available(long esp, long error_code)
{
die("device not available",esp,error_code);
}
void do_coprocessor_segment_overrun(long esp, long error_code)
{
die("coprocessor segment overrun",esp,error_code);
}
void do_invalid_TSS(long esp,long error_code)
{
die("invalid TSS",esp,error_code);
}
void do_segment_not_present(long esp,long error_code)
{
die("segment not present",esp,error_code);
}
void do_stack_segment(long esp,long error_code)
{
die("stack segment",esp,error_code);
}
void do_coprocessor_error(long esp, long error_code)
{
if (last_task_used_math != current)
return;
die("coprocessor error",esp,error_code);
}
void do_reserved(long esp, long error_code)
{
die("reserved (15,17-47) error",esp,error_code);
}
// 下面是异常(陷阱)中断程序初始化子程序。设置他们的中断调用门(中断向量)。
// set_trap_gate() 与 set_system_gate()都使用了中断描述符表IDT中的陷阱门(trap gate)
// 他们之间的主要区别在于前者设置的特权级为0,后者是3.因此断点陷阱中断 int3 、溢出中断
// ouvrflow 和边界出错中断bounds可以由任何程序产生。
void trap_init(void)
{
int i;
set_trap_gate(0,&divide_error);
set_trap_gate(1,&debug);
set_trap_gate(2,&nmi);
set_system_gate(3,&int3); /* int3-5 can be called from all */ // int3 - int 5 可以被所有程序执行
set_system_gate(4,&overflow);
set_system_gate(5,&bounds);
set_trap_gate(6,&invalid_op);
set_trap_gate(7,&device_not_available);
set_trap_gate(8,&double_fault);
set_trap_gate(9,&coprocessor_segment_overrun);
set_trap_gate(10,&invalid_TSS);
set_trap_gate(11,&segment_not_present);
set_trap_gate(12,&stack_segment);
set_trap_gate(13,&general_protection);
set_trap_gate(14,&page_fault);
set_trap_gate(15,&reserved);
set_trap_gate(16,&coprocessor_error);
// 把int17 - int48 的陷阱门先均设置为reserved,以后各硬件的初始化会重新设置自己的陷阱门
for (i=17;i<48;i++)
set_trap_gate(i,&reserved);
// 设置协处理器中断 0x2d(45) 陷阱门描述符,并允许其产生中断请求。设置并行口中断描述符。
set_trap_gate(45,&irq13);
outb_p(inb_p(0x21)&0xfb,0x21); // 允许 8259A 主芯片的 IRQ2 中断请求。
outb(inb_p(0xA1)&0xdf,0xA1); // 允许 8259A 从芯片的 IRQ13 中断请求。
set_trap_gate(39,&parallel_interrupt); // 设置并行口 1 的中断0x27 陷阱门描述符
}
/*
* linux/kernel/vsprintf.c
*
* (C) 1991 Linus Torvalds
*/
/* vsprintf.c -- Lars Wirzenius & Linus Torvalds. */
/*
* Wirzenius wrote this portably, Torvalds fucked it up :-)
*/
#include <stdarg.h> // 标准参数头文件。以宏的形式定义变量参数列表。主要说明了-个
// 类型(va_list)和三个宏(va_start, va_arg 和va_end),用于
// vsprintf、vprintf、vfprintf 函数。
#include <string.h> // 字符串头文件。主要定义了一些有关字符串操作的嵌入函数。
/* we use this so that we can do without the ctype library */
/* 我们使用下面的定义,这样我们就可以不使用ctype 库了 */
#define is_digit(c) ((c) >= '0' && (c) <= '9')
// 该函数将字符数字串转换成整数。输入是数字串指针的指针,返回是结果数值。另外指针将前移。
static int skip_atoi(const char **s)
{
int i=0;
while (is_digit(**s))
i = i*10 + *((*s)++) - '0';
return i;
}
// 这里定义转换类型的各种符号常数。
#define ZEROPAD 1 /* pad with zero */ /* 填充零 */
#define SIGN 2 /* unsigned/signed long */ /* 无符号/符号长整数 */
#define PLUS 4 /* show plus */ /* 显示加 */
#define SPACE 8 /* space if plus */ /* 如是加,则置空格 */
#define LEFT 16 /* left justified */ /* 左调整 */
#define SPECIAL 32 /* 0x */ /* 0x */
#define SMALL 64 /* use 'abcdef' instead of 'ABCDEF' */ /* 使用小写字母 */
// 除操作。输入:n 为被除数,base 为除数;结果:n 为商,函数返回值为余数。
#define do_div(n,base) ({ \
int __res; \
__asm__("divl %4":"=a" (n),"=d" (__res):"0" (n),"1" (0),"r" (base)); \
__res; })
// 将整数转换为指定进制的字符串。
// 输入:num-整数;base-进制;size-字符串长度;precision-数字长度(精度);type-类型选项。
// 输出:str 字符串指针。
static char * number(char * str, int num, int base, int size, int precision
,int type)
{
char c,sign,tmp[36];
const char *digits="0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ";
int i;
// 如果类型type 指出用小写字母,则定义小写字母集。
// 如果类型指出要左调整(靠左边界),则屏蔽类型中的填零标志。
// 如果进制基数小于2 或大于36,则退出处理,也即本程序只能处理基数在2-32 之间的数。
if (type&SMALL) digits="0123456789abcdefghijklmnopqrstuvwxyz";
if (type&LEFT) type &= ~ZEROPAD;
if (base<2 || base>36)
return 0;
// 如果类型指出要填零,则置字符变量c='0'(也即''),否则c 等于空格字符。
// 如果类型指出是带符号数并且数值num 小于0,则置符号变量sign=负号,并使num 取绝对值。
// 否则如果类型指出是加号,则置sign=加号,否则若类型带空格标志则sign=空格,否则置0。
c = (type & ZEROPAD) ? '0' : ' ' ;
if (type&SIGN && num<0) {
sign='-';
num = -num;
} else
sign=(type&PLUS) ? '+' : ((type&SPACE) ? ' ' : 0);
// 若带符号,则宽度值减1。若类型指出是特殊转换,则对于十六进制宽度再减少2 位(用于0x),
// 对于八进制宽度减1(用于八进制转换结果前放一个零)。
if (sign) size--;
if (type&SPECIAL) {
if (base==16) size -= 2;
else if (base==8) size--;
}
// 如果数值num 为0,则临时字符串='0';否则根据给定的基数将数值num 转换成字符形式。
i=0;
if (num==0)
tmp[i++]='0';
else while (num!=0)
tmp[i++]=digits[do_div(num,base)];
// 若数值字符个数大于精度值,则精度值扩展为数字个数值。
// 宽度值size 减去用于存放数值字符的个数。
if (i>precision) precision=i;
size -= precision;
// 从这里真正开始形成所需要的转换结果,并暂时放在字符串str 中。
// 若类型中没有填零(ZEROPAD)和左靠齐(左调整)标志,则在str 中首先
// 填放剩余宽度值指出的空格数。若需带符号位,则存入符号。
if (!(type&(ZEROPAD+LEFT)))
while(size-->0)
*str++ = ' ';
if (sign)
*str++ = sign;
// 若类型指出是特殊转换,则对于八进制转换结果头一位放置一个'0';而对于十六进制则存放'0x'。
if (type&SPECIAL) {
if (base==8)
*str++ = '0';
else if (base==16) {
*str++ = '0';
*str++ = digits[33]; // 'X'或'x'
}
}
// 若类型中没有左调整(左靠齐)标志,则在剩余宽度中存放c 字符('0'或空格),见51 行。
if (!(type & LEFT))
while (size-- > 0)
*str++ = c;
// 此时i 存有数值num 的数字个数。若数字个数小于精度值,则str 中放入(精度值-i)个'0'。
while (i < precision--)
*str++ = '0';
// 将转数值换好的数字字符填入str 中。共i 个。
while (i-- > 0)
*str++ = tmp[i];
// 若宽度值仍大于零,则表示类型标志中有左靠齐标志标志。则在剩余宽度中放入空格。
while (size-- > 0)
*str++ = ' ';
return str; // 返回转换好的字符串。
}
// 下面函数是送格式化输出到字符串中。
// 为了能在内核中使用格式化的输出,Linus 在内核实现了该C 标准函数。
// 其中参数fmt 是格式字符串;args 是个数变化的值;buf 是输出字符串缓冲区。
int vsprintf(char *buf, const char *fmt, va_list args)
{
int len;
int i;
char * str; // 用于存放转换过程中的字符串。
char *s;
int *ip;
int flags; /* flags to number() */
/* number()函数使用的标志 */
int field_width; /* width of output field */
/* 输出字段宽度*/
int precision; /* min. # of digits for integers; max
number of chars for from string */
/* min. 整数数字个数;max. 字符串中字符个数 */
int qualifier; /* 'h', 'l', or 'L' for integer fields */
/* 'h', 'l',或'L'用于整数字段 */
for (str=buf ; *fmt ; ++fmt) { // 首先将字符指针指向buf,然后扫描格式字符串,对各个格式转换指示进行相应的处理。
// 格式转换指示字符串均以'%'开始,这里从fmt 格式字符串中扫描'%',寻找格式转换字符串的开始。
// 不是格式指示的一般字符均被依次存入str。
if (*fmt != '%') {
*str++ = *fmt;
continue;
}
// 下面取得格式指示字符串中的标志域,并将标志常量放入flags 变量中。
/* process flags */
flags = 0;
repeat:
++fmt; /* this also skips first '%' */
switch (*fmt) {
case '-': flags |= LEFT; goto repeat; // 左靠齐调整。
case '+': flags |= PLUS; goto repeat; // 放加号。
case ' ': flags |= SPACE; goto repeat; // 放空格。
case '#': flags |= SPECIAL; goto repeat; // 是特殊转换。
case '0': flags |= ZEROPAD; goto repeat; // 要填零(即'0')。
}
// 取当前参数字段宽度域值,放入field_width 变量中。如果宽度域中是数值则直接取其为宽度值。
// 如果宽度域中是字符'*',表示下一个参数指定宽度。因此调用va_arg 取宽度值。若此时宽度值
// 小于0,则该负数表示其带有标志域'-'标志(左靠齐),因此还需在标志变量中添入该标志,并
// 将字段宽度值取为其绝对值。
/* get field width */
field_width = -1;
if (is_digit(*fmt))
field_width = skip_atoi(&fmt);
else if (*fmt == '*') {
/* it's the next argument */
field_width = va_arg(args, int);
if (field_width < 0) {
field_width = -field_width;
flags |= LEFT;
}
}
// 下面这段代码,取格式转换串的精度域,并放入precision 变量中。精度域开始的标志是'.'。
// 其处理过程与上面宽度域的类似。如果精度域中是数值则直接取其为精度值。如果精度域中是
// 字符'*',表示下一个参数指定精度。因此调用va_arg 取精度值。若此时宽度值小于0,则
// 将字段精度值取为其绝对值。
/* get the precision */
precision = -1;
if (*fmt == '.') {
++fmt;
if (is_digit(*fmt))
precision = skip_atoi(&fmt);
else if (*fmt == '*') {
/* it's the next argument */
precision = va_arg(args, int);
}
if (precision < 0)
precision = 0;
}
// 下面这段代码分析长度修饰符,并将其存入qualifer 变量。
/* get the conversion qualifier */
qualifier = -1;
if (*fmt == 'h' || *fmt == 'l' || *fmt == 'L') {
qualifier = *fmt;
++fmt;
}
// 下面分析转换指示符。
switch (*fmt) {
// 如果转换指示符是'c',则表示对应参数应是字符。此时如果标志域表明不是左靠齐,则该字段前面
// 放入宽度域值-1 个空格字符,然后再放入参数字符。如果宽度域还大于0,则表示为左靠齐,则在
// 参数字符后面添加宽度值-1 个空格字符。
case 'c':
if (!(flags & LEFT))
while (--field_width > 0)
*str++ = ' ';
*str++ = (unsigned char) va_arg(args, int);
while (--field_width > 0)
*str++ = ' ';
break;
// 如果转换指示符是's',则表示对应参数是字符串。首先取参数字符串的长度,若其超过了精度域值,
// 则扩展精度域=字符串长度。此时如果标志域表明不是左靠齐,则该字段前放入(宽度值-字符串长度)
// 个空格字符。然后再放入参数字符串。如果宽度域还大于0,则表示为左靠齐,则在参数字符串后面
// 添加(宽度值-字符串长度)个空格字符。
case 's':
s = va_arg(args, char *);
len = strlen(s);
if (precision < 0)
precision = len;
else if (len > precision)
len = precision;
if (!(flags & LEFT))
while (len < field_width--)
*str++ = ' ';
for (i = 0; i < len; ++i)
*str++ = *s++;
while (len < field_width--)
*str++ = ' ';
break;
// 如果格式转换符是'o',表示需将对应的参数转换成八进制数的字符串。调用number()函数处理。
case 'o':
str = number(str, va_arg(args, unsigned long), 8,
field_width, precision, flags);
break;
// 如果格式转换符是'p',表示对应参数的一个指针类型。此时若该参数没有设置宽度域,则默认宽度
// 为8,并且需要添零。然后调用number()函数进行处理。
case 'p':
if (field_width == -1) {
field_width = 8;
flags |= ZEROPAD;
}
str = number(str,
(unsigned long) va_arg(args, void *), 16,
field_width, precision, flags);
break;
// 若格式转换指示是'x'或'X',则表示对应参数需要打印成十六进制数输出。'x'表示用小写字母表示。
case 'x':
flags |= SMALL;
case 'X':
str = number(str, va_arg(args, unsigned long), 16,
field_width, precision, flags);
break;
// 如果格式转换字符是'd','i'或'u',则表示对应参数是整数,'d', 'i'代表符号整数,因此需要加上
// 带符号标志。'u'代表无符号整数。
case 'd':
case 'i':
flags |= SIGN;
case 'u':
str = number(str, va_arg(args, unsigned long), 10,
field_width, precision, flags);
break;
// 若格式转换指示符是'n',则表示要把到目前为止转换输出的字符数保存到对应参数指针指定的位置
// 首先利用va_arg()取得该参数指针,然后将已经转换好的字符数存入该指针所指的位置。
case 'n':
ip = va_arg(args, int *);
*ip = (str - buf);
break;
// 若格式转换符不是'%',则表示格式字符串有错,直接将一个'%'写入输出串中。
// 如果格式转换符的位置处还有字符,则也直接将该字符写入输出串中,并返回到107 行继续处理
// 格式字符串。否则表示已经处理到格式字符串的结尾处,则退出循环。
default:
if (*fmt != '%')
*str++ = '%';
if (*fmt)
*str++ = *fmt;
else
--fmt;
break;
}
}
*str = '\0'; // 最后在转换好的字符串结尾处添上null。
return str-buf; // 返回转换好的字符串长度值。
}
/*
* linux/lib/_exit.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__ // 定义一个符号常量,见下行说明。
#include <unistd.h> // Linux 标准头文件。定义了各种符号常数和类型,并申明了各种函数。
// 如定义了__LIBRARY__,则还包括系统调用号和内嵌汇编_syscall0()等。
//// 内核使用的程序(退出)终止函数。
// 直接调用系统中断int 0x80,功能号__NR_exit。
// 参数:exit_code - 退出码。
volatile void _exit(int exit_code)
{
__asm("INT $0x03");
// %0 - eax(系统调用号__NR_exit);%1 - ebx(退出码exit_code)。
__asm__("int $0x80"::"a" (__NR_exit),"b" (exit_code));
}
/*
* linux/lib/close.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__
#include <unistd.h> // Linux 标准头文件。定义了各种符号常数和类型,并申明了各种函数。
// 如定义了__LIBRARY__,则还包括系统调用号和内嵌汇编_syscall0()等。
// 关闭文件函数。
// 下面该调用宏函数对应:int close(int fd)。直接调用了系统中断int 0x80,参数是__NR_close。
// 其中fd 是文件描述符。
_syscall1(int,close,int,fd)
/*
* linux/lib/ctype.c
*
* (C) 1991 Linus Torvalds
*/
#include <ctype.h> // 字符类型头文件。定义了一些有关字符类型判断和转换的宏
char _ctmp; // 一个临时字符变量,供ctype.h 文件中转换字符宏函数使用。
// 字符特性数组(表),定义了各个字符对应的属性,这些属性类型(如_C 等)在ctype.h 中定义。
// 用于判断字符是控制字符(_C)、大写字符(_U)、小写字符(_L)等所属类型。
unsigned char _ctype[] = {0x00, /* EOF */
_C,_C,_C,_C,_C,_C,_C,_C, /* 0-7 */
_C,_C|_S,_C|_S,_C|_S,_C|_S,_C|_S,_C,_C, /* 8-15 */
_C,_C,_C,_C,_C,_C,_C,_C, /* 16-23 */
_C,_C,_C,_C,_C,_C,_C,_C, /* 24-31 */
_S|_SP,_P,_P,_P,_P,_P,_P,_P, /* 32-39 */
_P,_P,_P,_P,_P,_P,_P,_P, /* 40-47 */
_D,_D,_D,_D,_D,_D,_D,_D, /* 48-55 */
_D,_D,_P,_P,_P,_P,_P,_P, /* 56-63 */
_P,_U|_X,_U|_X,_U|_X,_U|_X,_U|_X,_U|_X,_U, /* 64-71 */
_U,_U,_U,_U,_U,_U,_U,_U, /* 72-79 */
_U,_U,_U,_U,_U,_U,_U,_U, /* 80-87 */
_U,_U,_U,_P,_P,_P,_P,_P, /* 88-95 */
_P,_L|_X,_L|_X,_L|_X,_L|_X,_L|_X,_L|_X,_L, /* 96-103 */
_L,_L,_L,_L,_L,_L,_L,_L, /* 104-111 */
_L,_L,_L,_L,_L,_L,_L,_L, /* 112-119 */
_L,_L,_L,_P,_P,_P,_P,_C, /* 120-127 */
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 128-143 */
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 144-159 */
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 160-175 */
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 176-191 */
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 192-207 */
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 208-223 */
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, /* 224-239 */
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0}; /* 240-255 */
/*
* linux/lib/dup.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__
#include <unistd.h> // Linux 标准头文件。定义了各种符号常数和类型,并申明了各种函数。
// 如定义了__LIBRARY__,则还包括系统调用号和内嵌汇编_syscall0()等。
//// 复制文件描述符函数。
// 下面该调用宏函数对应:int dup(int fd)。直接调用了系统中断int 0x80,参数是__NR_dup。
// 其中fd 是文件描述符。
_syscall1(int,dup,int,fd)
/*
* linux/lib/errno.c
*
* (C) 1991 Linus Torvalds
*/
int errno;
/*
* linux/lib/execve.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__
#include <unistd.h> // Linux 标准头文件。定义了各种符号常数和类型,并申明了各种函数。
// 如定义了__LIBRARY__,则还包括系统调用号和内嵌汇编_syscall0()等。
//// 加载并执行子进程(其它程序)函数。
// 下面该调用宏函数对应:int execve(const char * file, char ** argv, char ** envp)。
// 参数:file - 被执行程序文件名;argv - 命令行参数指针数组;envp - 环境变量指针数组。
// 直接调用了系统中断int 0x80,参数是__NR_execve。参见include/unistd.h 和fs/exec.c 程序。
_syscall3(int,execve,const char *,file,char **,argv,char **,envp)
/*
* malloc.c --- a general purpose kernel memory allocator for Linux.
*
* Written by Theodore Ts'o (tytso@mit.edu), 11/29/91
*
* This routine is written to be as fast as possible, so that it
* can be called from the interrupt level.
*
* Limitations: maximum size of memory we can allocate using this routine
* is 4k, the size of a page in Linux.
*
* The general game plan is that each page (called a bucket) will only hold
* objects of a given size. When all of the object on a page are released,
* the page can be returned to the general free pool. When malloc() is
* called, it looks for the smallest bucket size which will fulfill its
* request, and allocate a piece of memory from that bucket pool.
*
* Each bucket has as its control block a bucket descriptor which keeps
* track of how many objects are in use on that page, and the free list
* for that page. Like the buckets themselves, bucket descriptors are
* stored on pages requested from get_free_page(). However, unlike buckets,
* pages devoted to bucket descriptor pages are never released back to the
* system. Fortunately, a system should probably only need 1 or 2 bucket
* descriptor pages, since a page can hold 256 bucket descriptors (which
* corresponds to 1 megabyte worth of bucket pages.) If the kernel is using
* that much allocated memory, it's probably doing something wrong. :-)
*
* Note: malloc() and free() both call get_free_page() and free_page()
* in sections of code where interrupts are turned off, to allow
* malloc() and free() to be safely called from an interrupt routine.
* (We will probably need this functionality when networking code,
* particularily things like NFS, is added to Linux.) However, this
* presumes that get_free_page() and free_page() are interrupt-level
* safe, which they may not be once paging is added. If this is the
* case, we will need to modify malloc() to keep a few unused pages
* "pre-allocated" so that it can safely draw upon those pages if
* it is called from an interrupt routine.
*
* Another concern is that get_free_page() should not sleep; if it
* does, the code is carefully ordered so as to avoid any race
* conditions. The catch is that if malloc() is called re-entrantly,
* there is a chance that unecessary pages will be grabbed from the
* system. Except for the pages for the bucket descriptor page, the
* extra pages will eventually get released back to the system, though,
* so it isn't all that bad.
*/
/*
* malloc.c - Linux 的通用内核内存分配函数。
*
* 由Theodore Ts'o 编制 (tytso@mit.edu), 11/29/91
*
* 该函数被编写成尽可能地快,从而可以从中断层调用此函数。
*
* 限制:使用该函数一次所能分配的最大内存是4k,也即Linux 中内存页面的大小。
*
* 编写该函数所遵循的一般规则是每页(被称为一个存储桶)仅分配所要容纳对象的大小。
* 当一页上的所有对象都释放后,该页就可以返回通用空闲内存池。当malloc()被调用
* 时,它会寻找满足要求的最小的存储桶,并从该存储桶中分配一块内存。
*
* 每个存储桶都有一个作为其控制用的存储桶描述符,其中记录了页面上有多少对象正被
* 使用以及该页上空闲内存的列表。就象存储桶自身一样,存储桶描述符也是存储在使用
* get_free_page()申请到的页面上的,但是与存储桶不同的是,桶描述符所占用的页面
* 将不再会释放给系统。幸运的是一个系统大约只需要1 到2 页的桶描述符页面,因为一
* 个页面可以存放256 个桶描述符(对应1MB 内存的存储桶页面)。如果系统为桶描述符分
* 配了许多内存,那么肯定系统什么地方出了问题?。
*
* 注意!malloc()和free()两者关闭了中断的代码部分都调用了get_free_page()和
* free_page()函数,以使malloc()和free()可以安全地被从中断程序中调用
* (当网络代码,尤其是NFS 等被加入到Linux 中时就可能需要这种功能)。但前
* 提是假设get_free_page()和free_page()是可以安全地在中断级程序中使用的,
* 这在一旦加入了分页处理之后就可能不是安全的。如果真是这种情况,那么我们
* 就需要修改malloc()来“预先分配”几页不用的内存,如果malloc()和free()
* 被从中断程序中调用时就可以安全地使用这些页面。
*
* 另外需要考虑到的是get_free_page()不应该睡眠;如果会睡眠的话,则为了防止
* 任何竞争条件,代码需要仔细地安排顺序。 关键在于如果malloc()是可以重入地
* 被调用的话,那么就会存在不必要的页面被从系统中取走的机会。除了用于桶描述
* 符的页面,这些额外的页面最终会释放给系统,所以并不是象想象的那样不好。
*/
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
#include <linux/mm.h> // 内存管理头文件。含有页面大小定义和一些页面释放函数原型。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
// 存储桶描述符结构。
struct bucket_desc
{ /* 16 bytes */
void *page; // 该桶描述符对应的内存页面指针。
struct bucket_desc *next; // 下一个描述符指针。
void *freeptr; // 指向本桶中空闲内存位置的指针。
unsigned short refcnt; // 引用计数。
unsigned short bucket_size; // 本描述符对应存储桶的大小。
};
// 存储桶描述符目录结构。
struct _bucket_dir
{ /* 8 bytes */
int size; // 该存储桶的大小(字节数)。
struct bucket_desc *chain; // 该存储桶目录项的桶描述符链表指针。
};
/*
* The following is the where we store a pointer to the first bucket
* descriptor for a given size.
*
* If it turns out that the Linux kernel allocates a lot of objects of a
* specific size, then we may want to add that specific size to this list,
* since that will allow the memory to be allocated more efficiently.
* However, since an entire page must be dedicated to each specific size
* on this list, some amount of temperance must be exercised here.
*
* Note that this list *must* be kept in order.
*/
/*
* 下面是我们存放第一个给定大小存储桶描述符指针的地方。
*
* 如果Linux 内核分配了许多指定大小的对象,那么我们就希望将该指定的大小加到
* 该列表(链表)中,因为这样可以使内存的分配更有效。但是,因为一页完整内存页面
* 必须用于列表中指定大小的所有对象,所以需要做总数方面的测试操作。
*/
// 存储桶目录列表(数组)。
struct _bucket_dir bucket_dir[] = {
{ 16, (struct bucket_desc *) 0}, // 16 字节长度的内存块。
{ 32, (struct bucket_desc *) 0}, // 32 字节长度的内存块。
{ 64, (struct bucket_desc *) 0}, // 64 字节长度的内存块。
{ 128, (struct bucket_desc *) 0}, // 128 字节长度的内存块。
{ 256, (struct bucket_desc *) 0}, // 256 字节长度的内存块。
{ 512, (struct bucket_desc *) 0}, // 512 字节长度的内存块。
{ 1024, (struct bucket_desc *) 0}, // 1024 字节长度的内存块。
{ 2048, (struct bucket_desc *) 0}, // 2048 字节长度的内存块。
{ 4096, (struct bucket_desc *) 0}, // 4096 字节(1 页)内存。
{ 0, (struct bucket_desc *) 0}}; /* End of list marker */
/*
* This contains a linked list of free bucket descriptor blocks
*/
/*
* 下面是含有空闲桶描述符内存块的链表。
*/
struct bucket_desc *free_bucket_desc = (struct bucket_desc *) 0;
/*
* This routine initializes a bucket description page.
*/
/*
* 下面的子程序用于初始化一页桶描述符页面。
*/
//// 初始化桶描述符。
// 建立空闲桶描述符链表,并让free_bucket_desc 指向第一个空闲桶描述符。
static inline void init_bucket_desc()
{
struct bucket_desc *bdesc, *first;
int i;
// 申请一页内存,用于存放桶描述符。如果失败,则显示初始化桶描述符时内存不够出错信息,死机。
first = bdesc = (struct bucket_desc *) get_free_page();
if (!bdesc)
panic("Out of memory in init_bucket_desc()");
// 首先计算一页内存中可存放的桶描述符数量,然后对其建立单向连接指针。
for (i = PAGE_SIZE/sizeof(struct bucket_desc); i > 1; i--) {
bdesc->next = bdesc+1;
bdesc++;
}
/*
* This is done last, to avoid race conditions in case
* get_free_page() sleeps and this routine gets called again....
*/
/*
* 这是在最后处理的,目的是为了避免在get_free_page()睡眠时该子程序又被
* 调用而引起的竞争条件。
*/
bdesc->next = free_bucket_desc;
free_bucket_desc = first;
}
//// 分配动态内存函数。
// 参数:len - 请求的内存块长度。
// 返回:指向被分配内存的指针。如果失败则返回NULL。
void *malloc(unsigned int len)
{
struct _bucket_dir *bdir;
struct bucket_desc *bdesc;
void *retval;
/*
* First we search the bucket_dir to find the right bucket change
* for this request.
*/
/*
* 首先我们搜索存储桶目录bucket_dir 来寻找适合请求的桶大小。
*/
// 搜索存储桶目录,寻找适合申请内存块大小的桶描述符链表。如果目录项的桶字节数大于请求的字节
// 数,就找到了对应的桶目录项。
for (bdir = bucket_dir; bdir->size; bdir++)
if (bdir->size >= len)
break;
// 如果搜索完整个目录都没有找到合适大小的目录项,则表明所请求的内存块大小太大,超出了该
// 程序的分配限制(最长为1 个页面)。于是显示出错信息,死机。
if (!bdir->size) {
printk("malloc called with impossibly large argument (%d)\n",
len);
panic("malloc: bad arg");
}
/*
* Now we search for a bucket descriptor which has free space
*/
/*
* 现在我们来搜索具有空闲空间的桶描述符。
*/
cli(); /* Avoid race conditions *//* 为了避免出现竞争条件,首先关中断 */
// 搜索对应桶目录项中描述符链表,查找具有空闲空间的桶描述符。如果桶描述符的空闲内存指针
// freeptr 不为空,则表示找到了相应的桶描述符。
for (bdesc = bdir->chain; bdesc; bdesc = bdesc->next)
if (bdesc->freeptr)
break;
/*
* If we didn't find a bucket with free space, then we'll
* allocate a new one.
*/
/*
* 如果没有找到具有空闲空间的桶描述符,那么我们就要新建立一个该目录项的描述符。
*/
if (!bdesc) {
char *cp;
int i;
// 若free_bucket_desc 还为空时,表示第一次调用该程序,则对描述符链表进行初始化。
// free_bucket_desc 指向第一个空闲桶描述符。
if (!free_bucket_desc)
init_bucket_desc();
// 取free_bucket_desc 指向的空闲桶描述符,并让free_bucket_desc 指向下一个空闲桶描述符。
bdesc = free_bucket_desc;
free_bucket_desc = bdesc->next;
// 初始化该新的桶描述符。令其引用数量等于0;桶的大小等于对应桶目录的大小;申请一内存页面,
// 让描述符的页面指针page 指向该页面;空闲内存指针也指向该页开头,因为此时全为空闲。
bdesc->refcnt = 0;
bdesc->bucket_size = bdir->size;
bdesc->page = bdesc->freeptr = (void *) (cp = (char*)get_free_page());
// 如果申请内存页面操作失败,则显示出错信息,死机。
if (!cp)
panic("Out of memory in kernel malloc()");
/* Set up the chain of free objects */
/* 在该页空闲内存中建立空闲对象链表 */
// 以该桶目录项指定的桶大小为对象长度,对该页内存进行划分,并使每个对象的开始4 字节设置
// 成指向下一对象的指针。
for (i=PAGE_SIZE/bdir->size; i > 1; i--) {
*((char **) cp) = cp + bdir->size;
cp += bdir->size;
}
// 最后一个对象开始处的指针设置为0(NULL)。
// 然后让该桶描述符的下一描述符指针字段指向对应桶目录项指针chain 所指的描述符,而桶目录的
// chain 指向该桶描述符,也即将该描述符插入到描述符链链头处。
*((char **) cp) = 0;
bdesc->next = bdir->chain; /* OK, link it in! *//* OK,将其链入! */
bdir->chain = bdesc;
}
// 返回指针即等于该描述符对应页面的当前空闲指针。然后调整该空闲空间指针指向下一个空闲对象,
// 并使描述符中对应页面中对象引用计数增1。
retval = (void *) bdesc->freeptr;
bdesc->freeptr = *((void **) retval);
bdesc->refcnt++;
// 最后开放中断,并返回指向空闲内存对象的指针。
sti(); /* OK, we're safe again */ /* OK,现在我们又安全了 */
return(retval);
}
/*
* Here is the free routine. If you know the size of the object that you
* are freeing, then free_s() will use that information to speed up the
* search for the bucket descriptor.
*
* We will #define a macro so that "free(x)" is becomes "free_s(x, 0)"
*/
/*
* 下面是释放子程序。如果你知道释放对象的大小,则free_s()将使用该信息加速
* 搜寻对应桶描述符的速度。
*
* 我们将定义一个宏,使得"free(x)"成为"free_s(x, 0)"。
*/
//// 释放存储桶对象。
// 参数:obj - 对应对象指针;size - 大小。
void free_s(void *obj, int size)
{
void *page;
struct _bucket_dir *bdir;
struct bucket_desc *bdesc, *prev;
bdesc = prev = 0;
/* Calculate what page this object lives in */
/* 计算该对象所在的页面 */
page = (void *) ((unsigned long) obj & 0xfffff000);
/* Now search the buckets looking for that page */
/* 现在搜索存储桶目录项所链接的桶描述符,寻找该页面 */
for (bdir = bucket_dir; bdir->size; bdir++) {
prev = 0;
/* If size is zero then this conditional is always false */
/* 如果参数size 是0,则下面条件肯定是false */
if (bdir->size < size)
continue;
// 搜索对应目录项中链接的所有描述符,查找对应页面。如果某描述符页面指针等于page 则表示找到
// 了相应的描述符,跳转到found。如果描述符不含有对应page,则让描述符指针prev 指向该描述符。
for (bdesc = bdir->chain; bdesc; bdesc = bdesc->next) {
if (bdesc->page == page)
goto found;
prev = bdesc;
}
}
// 若搜索了对应目录项的所有描述符都没有找到指定的页面,则显示出错信息,死机。
panic("Bad address passed to kernel free_s()");
found:
// 找到对应的桶描述符后,首先关中断。然后将该对象内存块链入空闲块对象链表中,并使该描述符
// 的对象引用计数减1。
cli(); /* To avoid race conditions *//* 为了避免竞争条件 */
*((void **)obj) = bdesc->freeptr;
bdesc->freeptr = obj;
bdesc->refcnt--;
// 如果引用计数已等于0,则我们就可以释放对应的内存页面和该桶描述符。
if (bdesc->refcnt == 0) {
/*
* We need to make sure that prev is still accurate. It
* may not be, if someone rudely interrupted us....
*/
/*
* 我们需要确信prev 仍然是正确的,若某程序粗鲁地中断了我们
* 就有可能不是了。
*/
// 如果prev 已经不是搜索到的描述符的前一个描述符,则重新搜索当前描述符的前一个描述符。
if ((prev && (prev->next != bdesc)) ||
(!prev && (bdir->chain != bdesc)))
for (prev = bdir->chain; prev; prev = prev->next)
if (prev->next == bdesc)
break;
// 如果找到该前一个描述符,则从描述符链中删除当前描述符。
if (prev)
prev->next = bdesc->next;
// 如果prev==NULL,则说明当前一个描述符是该目录项首个描述符,也即目录项中chain 应该直接
// 指向当前描述符bdesc,否则表示链表有问题,则显示出错信息,死机。因此,为了将当前描述符
// 从链表中删除,应该让chain 指向下一个描述符。
else {
if (bdir->chain != bdesc)
panic("malloc bucket chains corrupted");
bdir->chain = bdesc->next;
}
// 释放当前描述符所操作的内存页面,并将该描述符插入空闲描述符链表开始处。
free_page((unsigned long) bdesc->page);
bdesc->next = free_bucket_desc;
free_bucket_desc = bdesc;
}
// 开中断,返回。
sti();
return;
}
/*
* linux/lib/open.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__
#include <unistd.h> // Linux 标准头文件。定义了各种符号常数和类型,并申明了各种函数。
// 如定义了__LIBRARY__,则还包括系统调用号和内嵌汇编_syscall0()等。
#include <stdarg.h> // 标准参数头文件。以宏的形式定义变量参数列表。主要说明了-个
// 类型(va_list)和三个宏(va_start, va_arg 和va_end),用于
// vsprintf、vprintf、vfprintf 函数。
//// 打开文件函数。
// 打开并有可能创建一个文件。
// 参数:filename - 文件名;flag - 文件打开标志;...
// 返回:文件描述符,若出错则置出错码,并返回-1。
int open (const char *filename, int flag, ...)
{
register int res;
va_list arg;
// 利用va_start()宏函数,取得flag 后面参数的指针,然后调用系统中断int 0x80,功能open 进行
// 文件打开操作。
// %0 - eax(返回的描述符或出错码);%1 - eax(系统中断调用功能号__NR_open);
// %2 - ebx(文件名filename);%3 - ecx(打开文件标志flag);%4 - edx(后随参数文件属性mode)。
va_start(arg,flag);
__asm__("int $0x80"
:"=a" (res)
:"0" (__NR_open),"b" (filename),"c" (flag),
"d" (va_arg(arg,int)));
// 系统中断调用返回值大于或等于0,表示是一个文件描述符,则直接返回之。
if (res >= 0)
return res;
// 否则说明返回值小于0,则代表一个出错码。设置该出错码并返回-1。
errno = -res;
return -1;
}
/*
* linux/lib/setsid.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__
#include <unistd.h> // Linux 标准头文件。定义了各种符号常数和类型,并申明了各种函数。
// 如定义了__LIBRARY__,则还包括系统调用号和内嵌汇编_syscall0()等。
//// 创建一个会话并设置进程组号。
// 下面系统调用宏对应于函数:pid_t setsid()。
// 返回:调用进程的会话标识符(session ID)。
_syscall0(pid_t,setsid)
/*
* linux/lib/string.c
*
* (C) 1991 Linus Torvalds
*/
#ifndef __GNUC__ // ҪGNU C 롣
#error I want gcc!
#endif
#define extern
#define inline
#define __LIBRARY__
#include <string.h>
/*
* linux/lib/wait.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__
#include <unistd.h> // Linux 标准头文件。定义了各种符号常数和类型,并申明了各种函数。
// 如定义了__LIBRARY__,则还包括系统调用号和内嵌汇编_syscall0()等。
#include <sys/wait.h> // 等待调用头文件。定义系统调用wait()和waitpid()及相关常数符号。
//// 等待进程终止系统调用函数。
// 该下面宏结构对应于函数:pid_t waitpid(pid_t pid, int * wait_stat, int options)
//
// 参数:pid - 等待被终止进程的进程id,或者是用于指定特殊情况的其它特定数值;
// wait_stat - 用于存放状态信息;options - WNOHANG 或WUNTRACED 或是0。
_syscall3 (pid_t, waitpid, pid_t, pid, int *, wait_stat, int, options)
//// wait()系统调用。直接调用waitpid()函数。
pid_t wait (int *wait_stat)
{
return waitpid (-1, wait_stat, 0);
}
/*
* linux/lib/write.c
*
* (C) 1991 Linus Torvalds
*/
#define __LIBRARY__
#include <unistd.h> // Linux 标准头文件。定义了各种符号常数和类型,并申明了各种函数。
// 如定义了__LIBRARY__,则还包括系统调用号和内嵌汇编_syscall0()等。
//// 写文件系统调用函数。
// 该宏结构对应于函数:int write(int fd, const char * buf, off_t count)
// 参数:fd - 文件描述符;buf - 写缓冲区指针;count - 写字节数。
// 返回:成功时返回写入的字节数(0 表示写入0 字节);出错时将返回-1,并且设置了出错号。
_syscall3(int,write,int,fd,const char *,buf,off_t,count)
<?xml version="1.0" encoding="gb2312"?>
<OSLProject Version="1.00" Name="linux011" ProjectType="linux011" SubjectID="1580a23c-aa04-4cf3-8cca-488dc577df8d" IncrementalUpload="-1">
<Configurations>
<Configuration Name="Debug" DebuggerFlavor="1" RemoteMachine="5" PreDebugCommand="">
<Tool Name="PreBuildEventTool"/>
<Tool Name="CustomBuildTool"/>
<Tool Name="GCCCompilerTool" AdditionalIncludeDirectories="include" ObjectFile="$(InputDir)$(InputName).o" GenerateDebugInformation="-1" DefaultCharIsUnsigned="0" AdditionalOptions="-Wall -nostdinc -fno-builtin"/>
<Tool Name="NASMAssemblerTool" ObjectFile="$(InputDir)$(InputName).o" ListFile="$(InputDir)$(InputName).lst"/>
<Tool Name="PreLinkEventTool"/>
<Tool Name="GCCLinkerTool" OutputFile="$(OutDir)\linux011.exe" IgnoreStandardLibraries="-1" EntryPointSymbol="startup_11" BaseAddress="0x0000" AdditionalOptions="-Wl,-Ttext,&quot;0&quot;"/>
<Tool Name="PostBuildEventTool" CommandLine="echo 正在生成内核映像文件...&#xA;copy &quot;$(TargetPath)&quot; &quot;$(TargetDir)$(TargetName).tmp&quot;&#xA;strip &quot;$(TargetDir)$(TargetName).tmp&quot;&#xA;pe2bin.exe &quot;$(TargetDir)$(TargetName).tmp&quot; &quot;$(TargetDir)$(TargetName).bin&quot;&#xA;del &quot;$(TargetDir)$(TargetName).tmp&quot;&#xA;echo 正在制作引导软盘映像文件...&#xA;mkfloppy.exe &quot;$(OutDir)\bootsect.bin&quot; &quot;$(OutDir)\setup.bin&quot; &quot;$(TargetDir)$(TargetName).bin&quot; &quot;floppya.img&quot;&#xA;" Description=""/>
</Configuration>
</Configurations>
<Files>
<Filter Name="bochs">
<File RelativePath=".\bochs\BIOS-bochs-latest" NoUpload="-1">
</File>
<File RelativePath=".\bochs\bochs.exe" NoUpload="-1">
</File>
<File RelativePath=".\bochs\bochsdbg.exe" NoUpload="-1">
</File>
<File RelativePath=".\bochs\bochsrc.bxrc" NoUpload="-1">
</File>
<File RelativePath=".\bochs\bochsrcdbg.bxrc" NoUpload="-1">
</File>
<File RelativePath=".\bochs\VGABIOS-lgpl-latest" NoUpload="-1">
</File>
</Filter>
<Filter Name="boot">
<File RelativePath=".\boot\bootsect.asm">
<FileConfiguration Name="Debug">
<Tool Name="NASMAssemblerTool" ObjectFile="$(IntDir)\$(InputName).bin" ObjectFormate="bin"/>
</FileConfiguration>
</File>
<File RelativePath=".\boot\head.s">
<FileConfiguration Name="Debug">
<Tool Name="GCCCompilerTool" ListFile="$(InputDir)$(InputName).lst" AdditionalOptions=""/>
</FileConfiguration>
</File>
<File RelativePath=".\boot\setup.asm">
<FileConfiguration Name="Debug">
<Tool Name="NASMAssemblerTool" ObjectFile="$(IntDir)\$(InputName).bin" ObjectFormate="bin"/>
</FileConfiguration>
</File>
</Filter>
<Filter Name="fs">
<File RelativePath=".\fs\bitmap.c">
</File>
<File RelativePath=".\fs\block_dev.c">
</File>
<File RelativePath=".\fs\buffer.c">
</File>
<File RelativePath=".\fs\char_dev.c">
</File>
<File RelativePath=".\fs\exec.c">
</File>
<File RelativePath=".\fs\fcntl.c">
</File>
<File RelativePath=".\fs\file_dev.c">
</File>
<File RelativePath=".\fs\file_table.c">
</File>
<File RelativePath=".\fs\inode.c">
</File>
<File RelativePath=".\fs\ioctl.c">
</File>
<File RelativePath=".\fs\namei.c">
</File>
<File RelativePath=".\fs\open.c">
</File>
<File RelativePath=".\fs\pipe.c">
</File>
<File RelativePath=".\fs\read_write.c">
</File>
<File RelativePath=".\fs\select.c">
</File>
<File RelativePath=".\fs\stat.c">
</File>
<File RelativePath=".\fs\super.c">
</File>
<File RelativePath=".\fs\truncate.c">
</File>
</Filter>
<Filter Name="include">
<Filter Name="asm">
<File RelativePath=".\include\asm\io.h">
</File>
<File RelativePath=".\include\asm\memory.h">
</File>
<File RelativePath=".\include\asm\segment.h">
</File>
<File RelativePath=".\include\asm\system.h">
</File>
</Filter>
<Filter Name="linux">
<File RelativePath=".\include\linux\config.h">
</File>
<File RelativePath=".\include\linux\fdreg.h">
</File>
<File RelativePath=".\include\linux\fs.h">
</File>
<File RelativePath=".\include\linux\hdreg.h">
</File>
<File RelativePath=".\include\linux\head.h">
</File>
<File RelativePath=".\include\linux\kernel.h">
</File>
<File RelativePath=".\include\linux\mm.h">
</File>
<File RelativePath=".\include\linux\sched.h">
</File>
<File RelativePath=".\include\linux\sys.h">
</File>
<File RelativePath=".\include\linux\tty.h">
</File>
</Filter>
<Filter Name="sys">
<File RelativePath=".\include\sys\stat.h">
</File>
<File RelativePath=".\include\sys\times.h">
</File>
<File RelativePath=".\include\sys\types.h">
</File>
<File RelativePath=".\include\sys\utsname.h">
</File>
<File RelativePath=".\include\sys\wait.h">
</File>
</Filter>
<File RelativePath=".\include\a.out.h">
</File>
<File RelativePath=".\include\const.h">
</File>
<File RelativePath=".\include\ctype.h">
</File>
<File RelativePath=".\include\errno.h">
</File>
<File RelativePath=".\include\fcntl.h">
</File>
<File RelativePath=".\include\signal.h">
</File>
<File RelativePath=".\include\stdarg.h">
</File>
<File RelativePath=".\include\stddef.h">
</File>
<File RelativePath=".\include\string.h">
</File>
<File RelativePath=".\include\termios.h">
</File>
<File RelativePath=".\include\time.h">
</File>
<File RelativePath=".\include\unistd.h">
</File>
<File RelativePath=".\include\utime.h">
</File>
</Filter>
<Filter Name="init">
<File RelativePath=".\init\main.c">
<FileConfiguration Name="Debug">
<Tool Name="GCCCompilerTool" AdditionalOptions="-Wall -nostdinc -fno-builtin -O"/>
</FileConfiguration>
</File>
</Filter>
<Filter Name="kernel">
<Filter Name="blk_drv">
<File RelativePath=".\kernel\blk_drv\blk.h">
</File>
<File RelativePath=".\kernel\blk_drv\floppy.c">
</File>
<File RelativePath=".\kernel\blk_drv\hd.c">
</File>
<File RelativePath=".\kernel\blk_drv\ll_rw_blk.c">
</File>
<File RelativePath=".\kernel\blk_drv\ramdisk.c">
</File>
</Filter>
<Filter Name="chr_drv">
<File RelativePath=".\kernel\chr_drv\console.c">
</File>
<File RelativePath=".\kernel\chr_drv\keyboard.s">
<FileConfiguration Name="Debug">
<Tool Name="GCCCompilerTool" AdditionalOptions=""/>
</FileConfiguration>
</File>
<File RelativePath=".\kernel\chr_drv\rs_io.s">
<FileConfiguration Name="Debug">
<Tool Name="GCCCompilerTool" AdditionalOptions=""/>
</FileConfiguration>
</File>
<File RelativePath=".\kernel\chr_drv\serial.c">
</File>
<File RelativePath=".\kernel\chr_drv\tty_io.c">
</File>
<File RelativePath=".\kernel\chr_drv\tty_ioctl.c">
</File>
</Filter>
<Filter Name="math">
<File RelativePath=".\kernel\math\math_emulate.c">
</File>
</Filter>
<File RelativePath=".\kernel\asm.s">
<FileConfiguration Name="Debug">
<Tool Name="GCCCompilerTool" AdditionalOptions=""/>
</FileConfiguration>
</File>
<File RelativePath=".\kernel\exit.c">
</File>
<File RelativePath=".\kernel\fork.c">
<FileConfiguration Name="Debug">
<Tool Name="GCCCompilerTool" AdditionalOptions="-Wall -nostdinc -fno-builtin -O"/>
</FileConfiguration>
</File>
<File RelativePath=".\kernel\mktime.c">
</File>
<File RelativePath=".\kernel\panic.c">
</File>
<File RelativePath=".\kernel\printk.c">
</File>
<File RelativePath=".\kernel\sched.c">
</File>
<File RelativePath=".\kernel\signal.c">
</File>
<File RelativePath=".\kernel\sys.c">
</File>
<File RelativePath=".\kernel\system_call.s">
<FileConfiguration Name="Debug">
<Tool Name="GCCCompilerTool" AdditionalOptions=""/>
</FileConfiguration>
</File>
<File RelativePath=".\kernel\traps.c">
</File>
<File RelativePath=".\kernel\vsprintf.c">
</File>
</Filter>
<Filter Name="lib">
<File RelativePath=".\lib\_exit.c">
</File>
<File RelativePath=".\lib\close.c">
</File>
<File RelativePath=".\lib\ctype.c">
</File>
<File RelativePath=".\lib\dup.c">
</File>
<File RelativePath=".\lib\errno.c">
</File>
<File RelativePath=".\lib\execve.c">
</File>
<File RelativePath=".\lib\malloc.c">
</File>
<File RelativePath=".\lib\open.c">
</File>
<File RelativePath=".\lib\setsid.c">
</File>
<File RelativePath=".\lib\string.c">
</File>
<File RelativePath=".\lib\wait.c">
</File>
<File RelativePath=".\lib\write.c">
</File>
</Filter>
<Filter Name="mm">
<File RelativePath=".\mm\memory.c">
</File>
<File RelativePath=".\mm\page.s">
<FileConfiguration Name="Debug">
<Tool Name="GCCCompilerTool" AdditionalOptions=""/>
</FileConfiguration>
</File>
</Filter>
<File RelativePath=".\floppya.img">
</File>
<File RelativePath=".\floppyb.img">
</File>
<File RelativePath=".\harddisk.img" NoUpload="-1">
</File>
</Files>
</OSLProject>
添加文件
/*
* linux/mm/memory.c
*
* (C) 1991 Linus Torvalds
*/
/*
* demand-loading started 01.12.91 - seems it is high on the list of
* things wanted, and it should be easy to implement. - Linus
*/
/*
* 按需加载是从01.12.91 开始编写的 - 在需求列表中似乎是最重要的程序,
* 并且应该是很容易编制的 - linus
*/
/*
* Ok, demand-loading was easy, shared pages a little bit tricker. Shared
* pages started 02.12.91, seems to work. - Linus.
*
* Tested sharing by executing about 30 /bin/sh: under the old kernel it
* would have taken more than the 6M I have free, but it worked well as
* far as I could see.
*
* Also corrected some "invalidate()"s - I wasn't doing enough of them.
*/
/*
* OK,需求加载是比较容易编写的,而共享页面却需要有点技巧。共享页面程序是
* 02.12.91 开始编写的,好象能够工作 - Linus。
*
* 通过执行大约30 个/bin/sh 对共享操作进行了测试:在老内核当中需要占用多于
* 6M 的内存,而目前却不用。现在看来工作得很好。
*
* 对"invalidate()"函数也进行了修正 - 在这方面我还做的不够。
*/
#include <signal.h> // 信号头文件。定义信号符号常量,信号结构以及信号操作函数原型。
#include <asm/system.h> // 系统头文件。定义了设置或修改描述符/中断门等的嵌入式汇编宏。
#include <linux/sched.h> // 调度程序头文件,定义了任务结构task_struct、初始任务0 的数据,
// 还有一些有关描述符参数设置和获取的嵌入式汇编函数宏语句。
#include <linux/head.h> // head 头文件,定义了段描述符的简单结构,和几个选择符常量。
#include <linux/kernel.h> // 内核头文件。含有一些内核常用函数的原形定义。
/*
定义了一个页表的缓冲区,大小为 8 * 1024 字节,可以用来存储页目录或页表中的数据。
其中只存储有效的页表项,从而可以大大加快获取页表的速度。
*/
struct page_table_entry
{
unsigned long index;
unsigned long pte;
};
struct page_table_entry page_table_buffer[1024];
unsigned long page_entry_count;
void snapshot_page_table(unsigned long* page_table_base)
{
unsigned long i, pte;
page_entry_count = 0;
for(i = 0; i < 1024; i++)
{
pte = page_table_base[i];
/* 跳过无效的 PTE */
if(!(pte & 1))
continue;
page_table_buffer[page_entry_count].index = i;
page_table_buffer[page_entry_count].pte = pte;
page_entry_count++;
}
}
/*
定义了一个全局描述符表的缓冲区,大小为 12 * 256 字节,可以用来存储全局描述符表中的数据。
其中只存储有效的表项,从而可以大大加快获取全局描述符表的速度。
*/
struct gdt_entry
{
unsigned long index;
unsigned long a;
unsigned long b;
};
struct gdt_entry gdt_buffer[256];
unsigned long gdt_entry_count;
void get_gdt_value()
{
unsigned long i;
gdt_entry_count = 0;
for(i = 0; i < 256; i++)
{
if(!(gdt[i].b & 0x00008000) && i >= 4)
{
continue;
}
gdt_buffer[gdt_entry_count].index = i;
gdt_buffer[gdt_entry_count].a = gdt[i].a;
gdt_buffer[gdt_entry_count].b = gdt[i].b;
gdt_entry_count++;
}
}
// 函数名前的关键字 volatile 用于告诉编译器 gcc 该函数不会返回。这样可让 gcc 产生更好一些的代码
// 更重要的是使用这个关键字可以避免产生某些(未初始化的变量)假警告信息。
volatile void do_exit(long code); // 进程退出处理函数。 在kernel/exit.c中。
// 显示内存已用完出错信息。并退出.
static inline volatile void oom(void)
{
printk("out of memory\n\r");
do_exit(SIGSEGV); // do_exit()应该使用退出代码,这里用了信号值SIGSEGV(11)
} // 相同值得出错码含义是“资源暂时不可用”,正好同义
// 刷新页变换高速缓冲宏函数。
// 为了提高地址转换的效率,CPU 将最近使用的页表数据存放在芯片高速缓冲中。在修改过
// 页表信息之后,就需要刷新该缓冲区。这里使用重新加载页目录基质寄存器cr3的方法来
// 进行刷新。下面 eax = 0,是页目录的基址。
#define invalidate() \
__asm__("movl %%eax,%%cr3"::"a" (0))
/* these are not to be changed without changing head.s etc */
/* 下面定义若需要改动,则需要与head.s 等文件中的相关信息一起改变 */
#define LOW_MEM 0x100000 // 内存低端(1MB)。
#define PAGING_MEMORY (15*1024*1024) // 分页内存15MB。主内存区最多15M。
#define PAGING_PAGES (PAGING_MEMORY>>12) // 分页后的物理内存页数。
#define MAP_NR(addr) (((addr)-LOW_MEM)>>12) // 指定内存地址映射为页号。物理地址减去低端内存位置,再除以4KB,得页面号。
#define USED 100 // 页面被占用标志
// 该宏用于判断给定线性地址是否位于当前进程的代码段中
#define CODE_SPACE(addr) ((((addr)+4095)&~4095) < \
current->start_code + current->end_code)
static long HIGH_MEMORY = 0; // 全局变量,存放实际物理内存最高端地址。
// 从 from 复制 1 页内存到 to 处(4K 字节)。
#define copy_page(from,to) \
__asm__("cld ; rep ; movsl"::"S" (from),"D" (to),"c" (1024))
// 内存映射字节图(1 字节代表1 页内存),每个页面对应的字节用于标志页面当前被引用(占用)次数。
static unsigned char mem_map [ PAGING_PAGES ] = {0,};
// 取得内存映射字节图中的区块数据,在一个区块中的物理页是连续的,且引用次数相同。
struct used_page_section_entry
{
unsigned long begin;
unsigned long end;
unsigned long ref;
};
#define MAX_SECTION_COUNT 32
struct used_page_section_entry used_page_section_table[MAX_SECTION_COUNT];
unsigned long used_page_section_count;
unsigned long free_page_count;
void get_mem_map_section()
{
int i;
used_page_section_count = 0;
free_page_count = 0;
for(i=0; i<PAGING_PAGES; i++)
{
if(mem_map[i])
{
if(used_page_section_count == MAX_SECTION_COUNT)
{
continue;
}
if(used_page_section_count == 0)
{
used_page_section_table[used_page_section_count].begin = i;
used_page_section_table[used_page_section_count].end = i;
used_page_section_table[used_page_section_count].ref = mem_map[i];
used_page_section_count++;
}
else if(used_page_section_table[used_page_section_count - 1].ref == mem_map[i]
&& i == used_page_section_table[used_page_section_count - 1].end + 1)
{
used_page_section_table[used_page_section_count - 1].end = i;
}
else
{
used_page_section_table[used_page_section_count].begin = i;
used_page_section_table[used_page_section_count].end = i;
used_page_section_table[used_page_section_count].ref = mem_map[i];
used_page_section_count++;
}
}
else
{
free_page_count++;
}
}
}
/*
* Get physical address of first (actually last :-) free page, and mark it
* used. If no free pages left, return 0.
*/
/*
* 获取首个(实际上是最后1 个:-)空闲页面,并标记为已使用。如果没有空闲页面,
* 就返回0。
*/
//// 在主内存中取空闲页面。如果已经没有可用内存了,则返回0。
// 输入:%1(ax=0) - 0;%2(LOW_MEM);%3(cx=PAGING PAGES);%4(edi=mem_map+PAGING_PAGES-1)。
// 输出:返回%0(ax=页面起始地址)。
// 上面%4 寄存器实际指向mem_map[]内存字节图的最后一个字节。本函数从字节图末端开始向前扫描
// 所有页面标志(页面总数为PAGING_PAGES),若有页面空闲(其内存映像字节为0)则返回页面地址。
// 注意!本函数只是指出在主内存区的一页空闲页面,但并没有映射到某个进程的线性地址去。后面
// 的put_page()函数就是用来作映射的。
unsigned long get_free_page(void)
{
register unsigned long __res asm("ax");
__asm__("std ; repne ; scasb\n\t" // 方向位置位,将al(0)与对应每个页面的(di)内容比较,
"jne 1f\n\t" // 如果没有等于0的字节,则跳转结束(返回0)。
"movb $1,1(%%edi)\n\t" // 将对应页面内存映像比特位置1.
"sall $12,%%ecx\n\t" // 页面数*4K = 相对页面起始地址。
"addl %2,%%ecx\n\t" // 再加上低端内存地址,即获得页面实际物理起始地址。
"movl %%ecx,%%edx\n\t" // 将页面实际起始地址->edx 寄存器。
"movl $1024,%%ecx\n\t" // 寄存器ecx 置计数值1024。
"leal 4092(%%edx),%%edi\n\t" // 将4092+edx 的位置->edi(该页面的末端)。
"rep ; stosl\n\t" // 将edi 所指内存清零(反方向,也即将该页面清零)。
"movl %%edx,%%eax\n" // 将页面起始地址->eax(返回值)。
"1:"
:"=a" (__res)
:"0" (0), "i" (LOW_MEM), "c" (PAGING_PAGES), "D" (mem_map+PAGING_PAGES-1)
);
return __res; // 返回空闲页面地址(如果无空闲也则返回0)。
}
/*
* Free a page of memory at physical address 'addr'. Used by
* 'free_page_tables()'
*/
/*
* 释放物理地址'addr'开始的一页内存。用于函数'free_page_tables()'。
*/
//// 释放物理地址addr 开始的一页面内存。
// 物理地址 1MB 以下的内存空间用于内核程序和缓冲,不作为分配页面的内存空间。
// 因此参数 addr 需要大于 1MB
void free_page(unsigned long addr)
{
unsigned long page_num;
if (addr < LOW_MEM) return; // 如果物理地址addr 小于内存低端(1MB),则返回。
if (addr >= HIGH_MEMORY) // 如果物理地址addr>=内存最高端,则显示出错信息。
panic("trying to free nonexistent page");
page_num = MAP_NR(addr); // 从物理地址计算得到页面号。
if (mem_map[page_num] > 0) // 如果对应内存页面映射字节大于0,说明没有出现错误,可以返回。
{
mem_map[page_num]--; // 对应内存页面映射字节(页面号引用计数)减 1。
return;
}
else
{
mem_map[page_num]=0; // 否则置对应页面映射字节为0,并显示出错信息,死机。
panic("trying to free free page");
}
}
/*
* This function frees a continuos block of page tables, as needed
* by 'exit()'. As does copy_page_tables(), this handles only 4Mb blocks.
*/
/*
* 下面函数释放页表连续的内存块,'exit()'需要该函数。与copy_page_tables()
* 类似,该函数仅处理4Mb 的内存块。
*/
//// 根据指定的线性地址和限长(页表个数),释放对应内存页表所指定的内存块并置表项空闲。
// 页目录位于物理地址0 开始处,共1024 项,每项4字节,占4K 字节。每个目录项指定一个页表。
// 内核页表从物理地址0x1000 处开始(紧接着目录空间),共4个页表。每个页表有1024 项,每项占 4 字节。
// 也占4K 内存。每个页表项对应一页物理内存(4K)。因此一个页表最多可映射 4MB 物理内存。
// 参数:from - 起始基地址;size - 释放的长度。
int free_page_tables(unsigned long from,unsigned long size)
{
unsigned long *pg_table;
unsigned long * dir, nr;
// 首先检测参数 from 给出的线性基地址是否在 4MB的边界处。因为该函数只能处理这种情况。
if (from & 0x3fffff)
panic("free_page_tables called with wrong alignment");
// 若 from =0,则出错。说明试图释放内核和缓冲所占用的空间.
if (!from)
panic("Trying to free up swapper memory space");
size = (size + 0x3fffff) >> 22;
// 下面一句计算起始目录项。对应的目录项号=from>>22,因每项占4 字节,并且由于页目录是从
// 物理地址0 开始,因此实际的目录项指针=目录项号<<2,也即(from>>20)。与上0xffc 确保
// 目录项指针范围有效。
dir = (unsigned long *) ((from>>20) & 0xffc); /* _pg_dir = 0 */
for ( ; size-->0 ; dir++) {
// size 现在是需要被释放内存的目录项数。
if (!(1 & *dir)) // 如果该目录项无效(P 位=0),则继续。
continue; // 目录项的位0(P 位)表示对应页表是否存在。
pg_table = (unsigned long *) (0xfffff000 & *dir); // 取目录项中页表地址。
for (nr=0 ; nr<1024 ; nr++) {
// 每个页表有1024 个页项。
if (1 & *pg_table) // 若该页表项有效(P 位=1),则释放对应内存页。
free_page(0xfffff000 & *pg_table);
*pg_table = 0; // 该页表项内容清零。
pg_table++; // 指向页表中下一项。
}
free_page(0xfffff000 & *dir); // 释放该页表所占内存页面。但由于页表在
// 物理地址1M 以内,所以这句什么都不做。
*dir = 0; // 对相应页表的目录项清零。
}
invalidate(); // 刷新页变换高速缓冲。
return 0;
}
/*
* Well, here is one of the most complicated functions in mm. It
* copies a range of linerar addresses by copying only the pages.
* Let's hope this is bug-free, 'cause this one I don't want to debug :-)
*
* Note! We don't copy just any chunks of memory - addresses have to
* be divisible by 4Mb (one page-directory entry), as this makes the
* function easier. It's used only by fork anyway.
*
* NOTE 2!! When from==0 we are copying kernel space for the first
* fork(). Then we DONT want to copy a full page-directory entry, as
* that would lead to some serious memory waste - we just copy the
* first 160 pages - 640kB. Even that is more than we need, but it
* doesn't take any more memory - we don't copy-on-write in the low
* 1 Mb-range, so the pages can be shared with the kernel. Thus the
* special case for nr=xxxx.
*/
/*
* 好了,下面是内存管理mm 中最为复杂的程序之一。它通过只复制内存页面
* 来拷贝一定范围内线性地址中的内容。希望代码中没有错误,因为我不想
* 再调试这块代码了?。
*
* 注意!我们并不是仅复制任何内存块 - 内存块的地址需要是4Mb 的倍数(正好
* 一个页目录项对应的内存大小),因为这样处理可使函数很简单。不管怎样,
* 它仅被fork()使用(fork.c 第56 行)。
*
* 注意2!!当from==0 时,是在为第一次fork()调用复制内核空间。此时我们
* 不想复制整个页目录项对应的内存,因为这样做会导致内存严重的浪费 - 我们
* 只复制头160 个页面 - 对应640kB。即使是复制这些页面也已经超出我们的需求,
* 但这不会占用更多的内存 - 在低1Mb 内存范围内我们不执行写时复制操作,所以
* 这些页面可以与内核共享。因此这是nr=xxxx 的特殊情况(nr 在程序中指页面数)。
*/
//// 复制指定线性地址和长度(页表个数)内存对应的页目录项和页表,从而被复制的页目录和
//// 页表对应的原物理内存区被共享使用。
// 复制指定地址和长度的内存对应的页目录项和页表项。需申请页面来存放新页表,原内存区被共享;
// 此后两个进程将共享内存区,直到有一个进程执行写操作时,才分配新的内存页(写时复制机制)。
int copy_page_tables(unsigned long from,unsigned long to,long size)
{
unsigned long * from_page_table;
unsigned long * to_page_table;
unsigned long this_page;
unsigned long * from_dir, * to_dir;
unsigned long nr;
// 源地址和目的地址都需要是在4Mb 的内存边界地址上。否则出错,死机。
if ((from&0x3fffff) || (to&0x3fffff))
panic("copy_page_tables called with wrong alignment");
// 取得源地址和目的地址的目录项(from_dir 和to_dir)。
from_dir = (unsigned long *) ((from>>20) & 0xffc); /* _pg_dir = 0 */
to_dir = (unsigned long *) ((to>>20) & 0xffc);
// 计算要复制的内存块占用的页表数(也即目录项数)。
size = ((unsigned) (size+0x3fffff)) >> 22;
// 下面开始对每个占用的页表依次进行复制操作。
for( ; size-->0 ; from_dir++,to_dir++) {
// 如果目的目录项指定的页表已经存在(P=1),则出错,死机。
if (1 & *to_dir)
panic("copy_page_tables: already exist");
// 如果此源目录项未被使用,则不用复制对应页表,跳过。
if (!(1 & *from_dir))
continue;
// 取当前源目录项中页表的地址??from_page_table。
from_page_table = (unsigned long *) (0xfffff000 & *from_dir);
// 为目的页表取一页空闲内存,如果返回是0 则说明没有申请到空闲内存页面。返回值=-1,退出。
if (!(to_page_table = (unsigned long *) get_free_page()))
return -1; /* Out of memory, see freeing */
// 设置目的目录项信息。7 是标志信息,表示(Usr, R/W, Present)。
*to_dir = ((unsigned long) to_page_table) | 7;
// 针对当前处理的页表,设置需复制的页面数。如果是在内核空间,则仅需复制头160 页,否则需要
// 复制1 个页表中的所有1024 页面。
nr = (from==0)?0xA0:1024;
// 对于当前页表,开始复制指定数目nr 个内存页面。
for ( ; nr-- > 0 ; from_page_table++,to_page_table++) {
this_page = *from_page_table; // 取源页表项内容。
if (!(1 & this_page)) // 如果当前源页面没有使用,则不用复制。
continue;
// 复位页表项中R/W 标志(置0)。(如果U/S 位是0,则R/W 就没有作用。如果U/S 是1,而R/W 是0,
// 那么运行在用户层的代码就只能读页面。如果U/S 和R/W 都置位,则就有写的权限。)
this_page &= ~2;
*to_page_table = this_page; // 将该页表项复制到目的页表中。
// 如果该页表项所指页面的地址在1M 以上,则需要设置内存页面映射数组mem_map[],于是计算
// 页面号,并以它为索引在页面映射数组相应项中增加引用次数。
if (this_page > LOW_MEM) {
// 下面这句的含义是令源页表项所指内存页也为只读。因为现在开始有两个进程共用内存区了。
// 若其中一个内存需要进行写操作,则可以通过页异常的写保护处理,为执行写操作的进程分配
// 一页新的空闲页面,也即进行写时复制的操作。
*from_page_table = this_page; // 令源页表项也只读。
this_page -= LOW_MEM;
this_page >>= 12;
mem_map[this_page]++;
}
}
}
invalidate(); // 刷新页变换高速缓冲。
return 0;
}
/*
* This function puts a page in memory at the wanted address.
* It returns the physical address of the page gotten, 0 if
* out of memory (either when trying to access page-table or
* page.)
*/
/*
* 下面函数将一内存页面放置在指定地址处。它返回页面的物理地址,如果
* 内存不够(在访问页表或页面时),则返回0。
*/
//// 把一物理内存页面映射到指定的线性地址处。
// 主要工作是在页目录和页表中设置指定页面的信息。若成功则返回页面地址。
unsigned long put_page(unsigned long page,unsigned long address)
{
unsigned long tmp, *page_table;
/* NOTE !!! This uses the fact that _pg_dir=0 */
/* 注意!!!这里使用了页目录基址_pg_dir=0 的条件 */
// 如果申请的页面位置低于LOW_MEM(1Mb)或超出系统实际含有内存高端HIGH_MEMORY,则发出警告。
if (page < LOW_MEM || page >= HIGH_MEMORY)
printk("Trying to put page %p at %p\n",page,address);
// 如果申请的页面在内存页面映射字节图中没有置位,则显示警告信息。
if (mem_map[(page-LOW_MEM)>>12] != 1)
printk("mem_map disagrees with %p at %p\n",page,address);
// 计算指定地址在页目录表中对应的目录项指针。
page_table = (unsigned long *) ((address>>20) & 0xffc);
// 如果该目录项有效(P=1)(也即指定的页表在内存中),则从中取得指定页表的地址 page_table。
if ((*page_table)&1)
page_table = (unsigned long *) (0xfffff000 & *page_table);
else {
// 否则,申请空闲页面给页表使用,并在对应目录项中置相应标志7(User, U/S, R/W)。然后将
// 该页表的地址page_table。
if (!(tmp=get_free_page()))
return 0;
*page_table = tmp|7;
page_table = (unsigned long *) tmp;
}
// 在页表中设置指定地址的物理内存页面的页表项内容。每个页表共可有1024 项(0x3ff)。
page_table[(address>>12) & 0x3ff] = page | 7;
/* no need for invalidate */
/* 不需要刷新页变换高速缓冲 */
return page; // 返回页面地址。
}
//// 取消写保护页面函数。用于页异常中断过程中写保护异常的处理(写时复制)。
// 输入参数为页表项指针。
// [ un_wp_page 意思是取消页面的写保护:Un-Write Protected。]
void un_wp_page(unsigned long * table_entry)
{
unsigned long old_page,new_page;
old_page = 0xfffff000 & *table_entry; // 取原页面对应的目录项号。
// 如果原页面地址大于内存低端LOW_MEM(1Mb),并且其在页面映射字节图数组中值为1(表示仅
// 被引用1 次,页面没有被共享),则在该页面的页表项中置R/W 标志(可写),并刷新页变换
// 高速缓冲,然后返回。
if (old_page >= LOW_MEM && mem_map[MAP_NR(old_page)]==1) {
*table_entry |= 2;
invalidate();
return;
}
// 否则,在主内存区内申请一页空闲页面。
if (!(new_page=get_free_page()))
oom(); // Out of Memory。内存不够处理。
// 如果原页面大于内存低端(则意味着mem_map[]>1,页面是共享的),则将原页面的页面映射
// 数组值递减1。然后将指定页表项内容更新为新页面的地址,并置可读写等标志(U/S, R/W, P)。
// 刷新页变换高速缓冲。最后将原页面内容复制到新页面。
if (old_page >= LOW_MEM)
mem_map[MAP_NR(old_page)]--;
*table_entry = new_page | 7;
invalidate();
copy_page(old_page,new_page);
}
/*
* This routine handles present pages, when users try to write
* to a shared page. It is done by copying the page to a new address
* and decrementing the shared-page counter for the old page.
*
* If it's in code space we exit with a segment error.
*/
/*
* 当用户试图往一个共享页面上写时,该函数处理已存在的内存页面,(写时复制)
* 它是通过将页面复制到一个新地址上并递减原页面的共享页面计数值实现的。
*
* 如果它在代码空间,我们就以段错误信息退出。
*/
//// 页异常中断处理调用的C 函数。写共享页面处理函数。在page.s 程序中被调用。
// 参数error_code 是由CPU 自动产生,address 是页面线性地址。
// 写共享页面时,需复制页面(写时复制)。
void do_wp_page(unsigned long error_code,unsigned long address)
{
#if 0
/* we cannot do this yet: the estdio library writes to code space */
/* stupid, stupid. I really want the libc.a from GNU */
/* 我们现在还不能这样做:因为estdio 库会在代码空间执行写操作 */
/* 真是太愚蠢了。我真想从GNU 得到libc.a 库。*/
if (CODE_SPACE(address))
do_exit(SIGSEGV);
#endif
// 处理取消页面保护。参数指定页面在页表中的页表项指针,其计算方法是:
// ((address>>10) & 0xffc):计算指定地址的页面在页表中的偏移地址;
// (0xfffff000 &((address>>20) &0xffc)):取目录项中页表的地址值,
// 其中((address>>20) &0xffc)计算页面所在页表的目录项指针;
// 两者相加即得指定地址对应页面的页表项指针。这里对共享的页面进行复制。
un_wp_page((unsigned long *)
(((address>>10) & 0xffc) + (0xfffff000 &
*((unsigned long *) ((address>>20) &0xffc)))));
}
//// 写页面验证。
// 若页面不可写,则复制页面。在fork.c 中被调用.
void write_verify(unsigned long address)
{
unsigned long page;
// 判断指定地址所对应页目录项的页表是否存在(P),若不存在(P=0)则返回。
if (!( (page = *((unsigned long *) ((address>>20) & 0xffc)) )&1))
return;
// 取页表的地址,加上指定地址的页面在页表中的页表项偏移值,得对应物理页面的页表项指针。
page &= 0xfffff000;
page += ((address>>10) & 0xffc);
// 如果该页面不可写(标志R/W 没有置位),则执行共享检验和复制页面操作(写时复制)。
if ((3 & *(unsigned long *) page) == 1) /* non-writeable, present */
un_wp_page((unsigned long *) page);
return;
}
//// 取得一页空闲内存并映射到指定线性地址处。
// 与get_free_page()不同。get_free_page()仅是申请取得了主内存区的一页物理内存。而该函数
// 不仅是获取到一页物理内存页面,还进一步调用put_page(),将物理页面映射到指定的线性地址
// 处。
void get_empty_page(unsigned long address)
{
unsigned long tmp;
// 若不能取得一空闲页面,或者不能将页面放置到指定地址处,则显示内存不够的信息。
// 【标号1】处的英文注释的含义是:即使执行get_free_page()返回0 也无所谓,因为put_page()
// 中还会对此情况再次申请空闲物理页面的。
if (!(tmp=get_free_page()) || !put_page(tmp,address)) {
free_page(tmp); /* 0 is ok - ignored */ //【标号1】
oom();
}
}
/*
* try_to_share() checks the page at address "address" in the task "p",
* to see if it exists, and if it is clean. If so, share it with the current
* task.
*
* NOTE! This assumes we have checked that p != current, and that they
* share the same executable.
*/
/*
* try_to_share()在任务"p"中检查位于地址"address"处的页面,看页面是否存在,是否干净。
* 如果是干净的话,就与当前任务共享。
*
* 注意!这里我们已假定p !=当前任务,并且它们共享同一个执行程序。
*/
//// 尝试对进程指定地址处的页面进行共享操作。
// 同时还验证指定的地址处是否已经申请了页面,若是则出错,死机。
// 返回1-成功,0-失败。
static int try_to_share(unsigned long address, struct task_struct * p)
{
unsigned long from;
unsigned long to;
unsigned long from_page;
unsigned long to_page;
unsigned long phys_addr;
// 求指定内存地址的页目录项。
from_page = to_page = ((address>>20) & 0xffc);
// 计算进程p 的代码起始地址所对应的页目录项。
from_page += ((p->start_code>>20) & 0xffc);
// 计算当前进程中代码起始地址所对应的页目录项。
to_page += ((current->start_code>>20) & 0xffc);
/* is there a page-directory at from? */
/* 在from 处是否存在页目录?*/
// *** 对p 进程页面进行操作。
// 取页目录项内容。如果该目录项无效(P=0),则返回。否则取该目录项对应页表地址from。
from = *(unsigned long *) from_page;
if (!(from & 1))
return 0;
from &= 0xfffff000;
// 计算地址对应的页表项指针值,并取出该页表项内容phys_addr。
from_page = from + ((address>>10) & 0xffc);
phys_addr = *(unsigned long *) from_page;
/* is the page clean and present? */
/* 页面干净并且存在吗?*/
// 0x41 对应页表项中的Dirty 和Present 标志。如果页面不干净或无效则返回。
if ((phys_addr & 0x41) != 0x01)
return 0;
// 取页面的地址phys_addr。如果该页面地址不存在或小于内存低端(1M)也返回退出。
phys_addr &= 0xfffff000;
if (phys_addr >= HIGH_MEMORY || phys_addr < LOW_MEM)
return 0;
// *** 对当前进程页面进行操作。
// 取页目录项内容to。如果该目录项无效(P=0),则取空闲页面,并更新to_page 所指的目录项。
to = *(unsigned long *) to_page;
if (!(to & 1)) {
if ((to = get_free_page()))
*(unsigned long *) to_page = to | 7;
else
oom();
}
// 取对应页表地址to,页表项地址to_page。如果对应的页面已经存在,则出错,死机。
to &= 0xfffff000;
to_page = to + ((address>>10) & 0xffc);
if (1 & *(unsigned long *) to_page)
panic("try_to_share: to_page already exists");
/* share them: write-protect */
/* 对它们进行共享处理:写保护 */
// 对p 进程中页面置写保护标志(置R/W=0 只读)。并且当前进程中的对应页表项指向它。
*(unsigned long *) from_page &= ~2;
*(unsigned long *) to_page = *(unsigned long *) from_page;
// 刷新页变换高速缓冲。
invalidate();
// 计算所操作页面的页面号,并将对应页面映射数组项中的引用递增1。
phys_addr -= LOW_MEM;
phys_addr >>= 12;
mem_map[phys_addr]++;
return 1;
}
/*
* share_page() tries to find a process that could share a page with
* the current one. Address is the address of the wanted page relative
* to the current data space.
*
* We first check if it is at all feasible by checking executable->i_count.
* It should be >1 if there are other tasks sharing this inode.
*/
/*
* share_page()试图找到一个进程,它可以与当前进程共享页面。参数address 是
* 当前数据空间中期望共享的某页面地址。
*
* 首先我们通过检测executable->i_count 来查证是否可行。如果有其它任务已共享
* 该inode,则它应该大于1。
*/
//// 共享页面。在缺页处理时看看能否共享页面。
// 返回1 - 成功,0 - 失败。
static int share_page(unsigned long address)
{
struct task_struct ** p;
// 如果是不可执行的,则返回。excutable 是执行进程的内存i 节点结构。
if (!current->executable)
return 0;
// 如果只能单独执行(executable->i_count=1),也退出。
if (current->executable->i_count < 2)
return 0;
// 搜索任务数组中所有任务。寻找与当前进程可共享页面的进程,并尝试对指定地址的页面进行共享。
for (p = &LAST_TASK ; p > &FIRST_TASK ; --p) {
if (!*p) // 如果该任务项空闲,则继续寻找。
continue;
if (current == *p) // 如果就是当前任务,也继续寻找。
continue;
if ((*p)->executable != current->executable) // 如果executable 不等,也继续。
continue;
if (try_to_share(address,*p)) // 尝试共享页面。
return 1;
}
return 0;
}
//// 页异常中断处理调用的函数。处理缺页异常情况。在page.s 程序中被调用。
// 参数error_code 是由CPU 自动产生,address 是页面线性地址。
void do_no_page(unsigned long error_code,unsigned long address)
{
int nr[4];
unsigned long tmp;
unsigned long page;
int block,i;
address &= 0xfffff000; // 页面地址。
// 首先算出指定线性地址在进程空间中相对于进程基址的偏移长度值。
tmp = address - current->start_code;
// 若当前进程的executable 空,或者指定地址超出代码+数据长度,则申请一页物理内存,并映射
// 影射到指定的线性地址处。executable 是进程的i 节点结构。该值为0,表明进程刚开始设置,
// 需要内存;而指定的线性地址超出代码加数据长度,表明进程在申请新的内存空间,也需要给予。
// 因此就直接调用get_empty_page()函数,申请一页物理内存并映射到指定线性地址处即可。
// start_code 是进程代码段地址,end_data 是代码加数据长度。对于linux 内核,它的代码段和
// 数据段是起始基址是相同的。
if (!current->executable || tmp >= current->end_data) {
get_empty_page(address);
return;
}
// 如果尝试共享页面成功,则退出。
if (share_page(tmp))
return;
// 取空闲页面,如果内存不够了,则显示内存不够,终止进程。
if (!(page = get_free_page()))
oom();
/* remember that 1 block is used for header */
/* 记住,(程序)头要使用1 个数据块 */
// 首先计算缺页所在的数据块项。BLOCK_SIZE = 1024 字节,因此一页内存需要4 个数据块。
block = 1 + tmp/BLOCK_SIZE;
// 根据i 节点信息,取数据块在设备上的对应的逻辑块号。
for (i=0 ; i<4 ; block++,i++)
nr[i] = bmap(current->executable,block);
// 读设备上一个页面的数据(4 个逻辑块)到指定物理地址page 处。
bread_page(page,current->executable->i_dev,nr);
// 在增加了一页内存后,该页内存的部分可能会超过进程的end_data 位置。下面的循环即是对物理
// 页面超出的部分进行清零处理。
i = tmp + 4096 - current->end_data;
tmp = page + 4096;
while (i-- > 0) {
tmp--;
*(char *)tmp = 0;
}
// 如果把物理页面映射到指定线性地址的操作成功,就返回。否则就释放内存页,显示内存不够。
if (put_page(page,address))
return;
free_page(page);
oom();
}
//// 物理内存初始化。
// 参数:start_mem - 可用作分页处理的物理内存起始位置(已去除RAMDISK 所占内存空间等)。
// end_mem - 实际物理内存最大地址。
// 在该版的linux 内核中,最多能使用16Mb 的内存,大于16Mb 的内存将不于考虑,弃置不用。
// 0 - 1Mb 内存空间用于内核系统(其实是0-640Kb)。
void mem_init(long start_mem, long end_mem)
{
int i;
HIGH_MEMORY = end_mem; // 设置内存最高端。
for (i = 0; i < PAGING_PAGES; i++) // 首先置所有页面为已占用(USED=100)状态,
mem_map[i] = USED; // 即将页面映射数组全置成USED。
i = MAP_NR (start_mem); // 然后计算可使用起始内存的页面号。
end_mem -= start_mem; // 再计算可分页处理的内存块大小。
end_mem >>= 12; // 从而计算出可用于分页处理的页面数。
while (end_mem-- > 0) // 最后将这些可用页面对应的页面映射数组清零。
mem_map[i++] = 0;
}
// 计算内存空闲页面数并显示。
void calc_mem(void)
{
int i,j,k,free=0;
long * pg_tbl;
// 扫描内存页面映射数组mem_map[],获取空闲页面数并显示。
for(i=0 ; i<PAGING_PAGES ; i++)
if (!mem_map[i]) free++;
printk("%d pages free (of %d)\n\r",free,PAGING_PAGES);
// 扫描所有页目录项(除0,1 项),如果页目录项有效,则统计对应页表中有效页面数,并显示。
for(i=2 ; i<1024 ; i++) {
if (1&pg_dir[i]) {
pg_tbl=(long *) (0xfffff000 & pg_dir[i]);
for(j=k=0 ; j<1024 ; j++)
if (pg_tbl[j]&1)
k++;
printk("Pg-dir[%d] uses %d pages\n",i,k);
}
}
}
/*
* linux/mm/page.s
*
* (C) 1991 Linus Torvalds
*/
/*
* page.s contains the low-level page-exception code.
* the real work is done in mm.c
*/
/*
* page.s 程序包含底层页异常处理代码。实际的工作在memory.c 中完成。
*/
.globl _page_fault
_page_fault:
xchgl %eax,(%esp) # 取出错码到eax。
pushl %ecx
pushl %edx
push %ds
push %es
push %fs
movl $0x10,%edx # 置内核数据段选择符。
mov %dx,%ds
mov %dx,%es
mov %dx,%fs
movl %cr2,%edx # 取引起页面异常的线性地址
pushl %edx # 将该线性地址和出错码压入堆栈,作为调用函数的参数。
pushl %eax
testl $1,%eax # 测试标志P,如果不是缺页引起的异常则跳转。
jne 1f
call _do_no_page # 调用缺页处理函数(mm/memory.c)。
jmp 2f
1: call _do_wp_page # 调用写保护处理函数(mm/memory.c)。
2: addl $8,%esp # 丢弃压入栈的两个参数。
pop %fs
pop %es
pop %ds
popl %edx
popl %ecx
popl %eax
iret
您添加了 0 到此讨论。请谨慎行事。
请先完成此评论的编辑!
注册 或者 后发表评论