嵌入式系统Boot Loader启动全过程详解

上传人：ba****u6 文档编号：124972432 上传时间：2022-07-25 格式：DOCX 页数：14 大小：38.25KB

收藏版权申诉举报下载

第1页 / 共14页

第2页 / 共14页

第3页 / 共14页

下载文档到电脑，查找使用更方便

15 积分

下载资源

资源描述：

《嵌入式系统Boot Loader启动全过程详解》由会员分享，可在线阅读，更多相关《嵌入式系统Boot Loader启动全过程详解（14页珍藏版）》请在装配图网上搜索。

1、1.引言在专用的嵌入式板子运行GNU/Linux系统已经变得越来越流行。一个嵌入式Linux系统从软件的角度看通常可以分为四个层次：1. 引导加载程序。包括固化在固件（firmware）中的boot代码（可选），和Boot Loader两大部分。2. Linux内核。特定于嵌入式板子的定制内核以及内核的启动参数。3. 文件系统。包括根文件系统和建立于Flash内存设备之上文件系统。通常用ram disk来作为root fs。4. 用户应用程序。特定于用户的应用程序。有时在用户应用程序和内核层之间可能还会包括一个嵌入式图形用户界面。常用的嵌入式GUI有：MicroWindows和MiniGU

2、I懂。引导加载程序是系统加电后运行的第一段软件代码。回忆一下PC的体系结构我们可以知道，PC机中的引导加载程序由BIOS（其本质就是一段固件程序）和位于硬盘MBR中的OS Boot Loader（比如，LILO和 GRUB等）一起组成。BIOS在完成硬件检测和资源分配后，将硬盘MBR中的Boot Loader读到系统的RAM中，然后将控制权交给OS Boot Loader。Boot Loader的主要运行任务就是将内核映象从硬盘上读到RAM中，然后跳转到内核的入口点去运行，也即开始启动操作系统。而在嵌入式系统中，通常并没有像BIOS那样的固件程序（注，有的嵌入式CPU也会内嵌一段短小的启

3、动程序），因此整个系统的加载启动任务就完全由Boot Loader来完成。比如在一个基于ARM7TDMI core 的嵌入式系统中，系统在上电或复位时通常都从地址0x00000000处开始执行，而在这个地址处安排的通常就是系统的Boot Loader程序。本文将从Boot Loader的概念、Boot Loader的主要任务、Boot Loader的框架结构以及Boot Loader的安装等四个方面来讨论嵌入式系统的Boot Loader。2. Boot Loader 的概念简单地说，Boot Loader就是在操作系统内核运行之前运行的一段小程序。通过这段小程序，我们可以初始化硬件设

4、备、建立内存空间的映射图，从而将系统的软硬件环境带到一个合适的状态，以便为最终调用操作系统内核准备好正确的环境。通常，Boot Loader是严重地依赖于硬件而实现的，特别是在嵌入式世界。因此，在嵌入式世界里建立一个通用的Boot Loader几乎是不可能的。尽管如此，我们仍然可以对Boot Loader归纳出一些通用的概念来，以指导用户特定的Boot Loader设计与实现。1. Boot Loader所支持的CPU和嵌入式板每种不同的CPU体系结构都有不同的Boot Loader。有些Boot Loader也支持多种体系结构的CPU, 比如U-Boot就同时支持ARM体系结构和MI

5、PS体系结构。除了依赖于CPU的体系结构外，Boot Loader实际上也依赖于具体的嵌入式板级设备的配置。这也就是说，对于两块不同的嵌入式板而言，即使它们是基于同一种CPU而构建的，要想让运行在一块板子上的Boot Loader程序也能运行在另一块板子上，通常也都需要修改Boot Loader的源程序。2. Boot Loader 的安装媒介(Installation Medium)系统加电或复位后，所有的CPU通常都从某个由CPU制造商预先安排的地址上取指令。比如，基于 ARM7TDMI core的CPU在复位时通常都从地址0x00000000取它的第一条指令。而基于CPU构建的嵌入

6、式系统通常都有某种类型的固态存储设备(比如：ROM、EEPROM或FLASH等)被映射到这个预先安排的地址上。因此在系统加电后，CPU将首先执行Boot Loader程序。下图1就是一个同时装有Boot Loader、内核的启动参数、内核映像和根文件系统映像的固态存储设备的典型空间分配结构图。图1固态存储设备的典型空间分配结构Linuxdby.conn3. 用来控制Boot Loader的设备或机制主机和目标机之间一般通过串口建立连接，Boot Loader软件在执行时通常会通过串口来进行I/O,比如：输出打印信息到串口，从串口读取用户控制字符等。4. Boot Loader的启动过程是

7、单阶段(Single Stage)还是多阶段(Multi-Stage)通常多阶段的Boot Loader能提供更为复杂的功能，以及更好的可移植性。从固态存储设备上启动的Boot Loader大多都是2阶段的启动过程，也即启动过程可以分为stage 1和stage 2两部分。而至于在 stage 1和stage 2具体完成哪些任务将在下面讨论。5. Boot Loader 的操作模式(Operation Mode) 大多数Boot Loader都包含两种不同的操作模式：启动加载模式和下载模式，这种区别仅对于开发人员才有意义。但从最终用户的角度看，Boot Loader的作用就是用来加载操作系统

8、，而并不存在所谓的启动加载模式与下载工作模式的区别。启动加载(Boot loading)模式：这种模式也称为自主(Autonomous)模式。也即Boot Loader从目标机上的某个固态存储设备上将操作系统加载到RAM中运行，整个过程并没有用户的介入。这种模式是 Boot Loader的正常工作模式，因此在嵌入式产品发布的时侯，Boot Loader显然必须工作在这种模式下。下载(Downloading)模式：在这种模式下，目标机上的Boot Loader将通过串口连接或网络连接等通信手段从主机(Host )下载文件，比如：下载内核映像和根文件系统映像等。从主机下载的文件通常首先被B

9、oot Loader保存到目标机的RAM中，然后再被Boot Loader写到目标机上的FLASH类固态存储设备中。Boot Loader的这种模式通常在第一次安装内核与根文件系统时被使用；此外，以后的系统更新也会使用Boot Loader的这种工作模式。工作于这种模式下的Boot Loader通常都会向它的终端用户提供一个简单的命令行接口。像Blob或U-Boot等这样功能强大的Boot Loader通常同时支持这两种工作模式，而且允许用户在这两种工作模式之间进行切换。比如，Blob在启动时处于正常的启动加载模式，但是它会延时10秒等待终端用户按下任意键而将blob切换到下载模式。

10、如果在10秒内没有用户按键，则blob继续启动Linux内核。6. BootLoader与主机之间进行文件传输所用的通信设备及协议最常见的情况就是，目标机上的Boot Loader通过串口与主机之间进行文件传输，传输协议通常是 xmodem / ymodem / zmodem协议中的一种。但是，串口传输的速度是有限的，因此通过以太网连接并借助TFTP协议来下载文件是个更好的选择。此外，在论及这个话题时，主机方所用的软件也要考虑。比如，在通过以太网连接和TFTP协议来下载文件时，主机方必须有一个软件用来的提供TFTP服务。在讨论了 BootLoader的上述概念后，下面我们来具体看看Boo

11、tLoader的应该完成哪些任务。3. Boot Loader的主要任务与典型结构框架在继续本节的讨论之前，首先我们做一个假定，那就是：假定内核映像与根文件系统映像都被加载到RAM 中运行。之所以提出这样一个假设前提是因为，在嵌入式系统中内核映像与根文件系统映像也可以直接在 ROM或Flash这样的固态存储设备中直接运行。但这种做法无疑是以运行速度的牺牲为代价的。从操作系统的角度看，Boot Loader的总目标就是正确地调用内核来执行。另外，由于Boot Loader的实现依赖于CPU的体系结构，因此大多数Boot Loader都分为stagel和stage2两大部分。依赖于CPU体系结构的

12、代码，比如设备初始化代码等，通常都放在stagel中，而且通常都用汇编语言来实现，以达到短小精悍的目的。而stage2则通常用C语言来实现，这样可以实现给复杂的功能，而且代码会具有更好的可读性和可移植性。Boot Loader的stagel通常包括以下步骤（以执行的先后顺序）：硬件设备初始化。为加载Boot Loader的stage2准备RAM空间。拷贝Boot Loader的stage2至卩RAM空间中。设置好堆栈。跳转到stage2的C入口点。Boot Loader的stage2通常包括以下步骤（以执行的先后顺序）：初始化本阶段要使用到的硬件设备。检测系统内存映射（mem

13、ory map）。将kernel映像和根文件系统映像从flash上读到RAM空间中。为内核设置启动参数。调用内核。3.1 Boot Loader 的 stage13.1.1基本的硬件初始化这是Boot Loader 一开始就执行的操作，其目的是为stage2的执行以及随后的kernel的执行准备好一些基本的硬件环境。它通常包括以下步骤（以执行的先后顺序）：1. 屏蔽所有的中断。为中断提供服务通常是OS设备驱动程序的责任，因此在Boot Loader的执行全过程中可以不必响应任何中断。中断屏蔽可以通过写CPU的中断屏蔽寄存器或状态寄存器（比如ARM 的CPSR寄存器）来完成。2. 设置

14、CPU的速度和时钟频率。3. RAM初始化。包括正确地设置系统的内存控制器的功能寄存器以及各内存库控制寄存器等。4. 初始化LED。典型地，通过GPIO来驱动LED，其目的是表明系统的状态是OK还是Error。女廿果板子上没有LED，那么也可以通过初始化UART向串口打印Boot Loader的Logo字符信息来完成这一点。5. 关闭CPU内部指令/数据cache。3.1.2为加载stage2准备RAM空间为了获得更快的执行速度，通常把stage2加载到RAM空间中来执行，因此必须为加载Boot Loader的 stage2准备好一段可用的RAM空间范围。由于stage2通常是C语言执行代

15、码，因此在考虑空间大小时，除了 stage2可执行映象的大小外，还必须把堆栈空间也考虑进来。此外，空间大小最好是memory page大小（通常是4KB）的倍数。一般而言， 1M的RAM空间已经足够了。具体的地址范围可以任意安排，比如blob就将它的stage2可执行映像安排到从系统RAM起始地址0xc0200000开始的1M空间内执行。但是，将stage2安排到整个RAM 空间的最顶1MB（也即（RamEnd-1MB） - RamEnd）是一种值得推荐的方法。为了后面的叙述方便，这里把所安排的RAM空间范围的大小记为：stage2_size（字节），把起始地址和终止地址分别记为：sta

16、ge2_start和stage2_end（这两个地址均以4字节边界对齐）。因此：st age2 end = s tage2 s tart + st age2 size另外，还必须确保所安排的地址范围的的确确是可读写的RAM空间，因此，必须对你所安排的地址范围进行测试。具体的测试方法可以采用类似于blob的方法，也即：以memory page为被测试单位，测试每个memory page开始的两个字是否是可读写的。为了后面叙述的方便，我们记这个检测算法为： test_mempage，其具体步骤如下：1 先保存memory page 一开始两个字的内容。2. 向这两个字中写入任意的数字。比如：向

17、第一个字写入0x55,第2个字写入Oxaa。3. 然后，立即将这两个字的内容读回。显然，我们读到的内容应该分别是0x55和0xaa。如果不是，则说明这个memory page所占据的地址范围不是一段有效的RAM空间。4. 再向这两个字中写入任意的数字。比如：向第一个字写入0xaa,第2个字中写入0x55。5. 然后，立即将这两个字的内容立即读回。显然，我们读到的内容应该分别是0xaa和0x55。如果不是，则说明这个memory page所占据的地址范围不是一段有效的RAM空间。6. 恢复这两个字的原始内容。测试完毕。为了得到一段干净的RAM空间范围，我们也可以将所安排的RAM空间范围进行清

18、零操作。3.1.3 拷贝 stage2 到 RAM 中拷贝时要确定两点：（1） stage2的可执行映象在固态存储设备的存放起始地址和终止地址；（2） RAM空间的起始地址。3.1.4设置堆栈指针sp堆栈指针的设置是为了执行C语言代码作好准备。通常我们可以把sp的值设置为(stage2_end-4),也即在3.1.2节所安排的那个1MB的RAM空间的最顶端(堆栈向下生长)。此外，在设置堆栈指针sp之前，也可以关闭led灯，以提示用户我们准备跳转到stage2。经过上述这些执行步骤后，系统的物理内存布局应该如下图2所示。3.1.5跳转到stage2的C入口点在上述一切都就绪后，就可以跳转到B

19、oot Loader的stage2去执行了。比如，在ARM系统中，这可以通过修改PC寄存器为合适的地址来实现。图2 bootloader的stage2可执行映象刚被拷贝到RAM空间时的系统内存布局(blank)00001?0000(64KB)OsOOO0,O4O0(lKB)BooHoadjer 的 staged协：64KBBootloadjer的stagel可执行映義Ab= 1KB00000,0000 Linuxdyrann3.2 Boot Loader 的 stage2正如前面所说，stage2的代码通常用C语言来实现，以便于实现更复杂的功能和取得更好的代码可读性和可移植性。但是与普通C

20、语言应用程序不同的是，在编译和链接boot loader这样的程序时，我们不能使用glibc库中的任何支持函数。其原因是显而易见的。这就给我们带来一个问题，那就是从那里跳转进main()函数呢？直接把main()函数的起始地址作为整个stage2执行映像的入口点或许是最直接的想法。但是这样做有两个缺点：1)无法通过main()函数传递函数参数；2)无法处理main()函数返回的情况。一种更为巧妙的方法是利用trampoline(弹簧床)的概念。也即，用汇编语言写一段trampoline小程序，并将这段trampoline小程序来作为stage2可执行映象的执行入口点。然后我们可以在t

21、rampoline汇编小程序中用CPU跳转指令跳入main()函数中去执行；而当main()函数返回时，CPU执行路径显然再次回到我们的trampoline程序。简而言之，这种方法的思想就是：用这段trampoline小程序来作为main() 函数的外部包裹(external wrapper)。下面给出一个简单的trampoline程序示例(来自blob)：.text.globl _trampoline_trampoline:bl main/* if main ever returns we just call it again */b trampolinebl main的含义是：执行ma

22、in函数，并链接后面的第一条指令地址，即b _trampoline；如果函数有返回值，则继续执行后面第一条指令，即b _trampoline。b _trampoline的含义是：立即跳转至Ltrampoline并执行它。可以看出，当main()函数返回后，我们又用一条跳转指令重新执行trampoline程序当然也就重新执行main()函数，这也就是trampoline(弹簧床)一词的意思所在。3.2.1初始化本阶段要使用到的硬件设备这通常包括：(1)初始化至少一个串口，以便和终端用户进行I/O输出信息；(2)初始化计时器等。在初始化这些设备之前，也可以重新把LED灯点亮，以表明我们已经进

23、入main()函数执行。设备初始化完成后，可以输出一些打印信息，程序名字字符串、版本号等。3.2.2检测系统的内存映射(memory map)所谓内存映射就是指在整个4GB物理地址空间中有哪些地址范围被分配用来寻址系统的RAM单元。比如，在SA-1100 CPU中，从0xC000,0000开始的512M地址空间被用作系统的RAM地址空间，而在Samsung S3C44B0X CPU中，从0x0c00,0000至0x1000,0000之间的64M地址空间被用作系统的RAM地址空间。虽然CPU通常预留出一大段足够的地址空间给系统RAM，但是在搭建具体的嵌入式系统时却不一定会实现CPU预留的

24、全部RAM地址空间。也就是说，具体的嵌入式系统往往只把CPU 预留的全部RAM地址空间中的一部分映射到RAM单元上，而让剩下的那部分预留RAM地址空间处于未使用状态。由于上述这个事实，因此Boot Loader的stage2必须在它想干点什么(比如，将存储在flash上的内核映像读到RAM空间中)之前检测整个系统的内存映射情况，也即它必须知道CPU 预留的全部RAM地址空间中的哪些被真正映射到RAM地址单元，哪些是处于unused”状态的。(1) 内存映射的描述可以用如下数据结构来描述RAM地址空间中的一段连续(continuous)的地址范围：typedef struet memory_

25、area_struet u32 start; /* the base address of the memory region */u32 size; /* the byte number of the memory region */ int used; memory area t;这段RAM地址空间中的连续地址范围可以处于两种状态之一：(1)used=1，则说明这段连续的地址范围已被实现，也即真正地被映射到RAM单元上。(2)used=0，则说明这段连续的地址范围并未被系统所实现，而是处于未使用状态。基于上述memory_area_t数据结构，整个CPU预留的RAM地址空间可以用一个m

26、emory_area_t类型的数组来表示，如下所示：memory_area_t memory_mapNUM_MEM_AREAS = 0 . (NUM_MEM_AREAS - 1) = .start 二 0,.size = 0,.used = 0,；(2) 内存映射的检测下面我们给出一个可用来检测整个RAM地址空间内存映射情况的简单而有效的算法:/*数组初始化*/ for(i = 0; i NUM_MEM_AREAS; i+)memory_mapi.used = 0;/* first write a 0 to all memory loeations */ for(addr = MEM_STA

27、RT; addr MEM_END; addr += PAGE_SIZE)* (u32 *)addr = 0;for(i = 0, addr = MEM_START; addr hdr .tag = ATAG_C0RE;params-hdr.size = tag_size(tag_core);params-u.core.flags = 0;paramsu.core.pagesize = 0;paramsu.core.ro ot dev = 0;params = tag next(params);其中，BOOT_PARAMS表示内核启动参数在内存中的起始基地址，指针params是一个struct

28、tag类型的指针。宏tag_next()将以指向当前标记的指针为参数，计算紧临当前标记的下一个标记的起始地址。注意，内核的根文件系统所在的设备ID就是在这里设置的。下面是设置内存映射情况的示例代码: for(i = 0; i hdr .tag = ATAG_MEM;params-hdr.size = tag_size(tag_mem32);params-u.mem.s tart 二 memory_mapi.s tart;params-u.mem.size = memory_mapi.size;params = tag_next(params);可以看出，在memory_map 数组中，每一

29、个有效的内存段都对应一个ATAG_MEM参数标记。Linux内核在启动时可以以命令行参数的形式来接收信息，利用这一点我们可以向内核提供那些内核不能自己检测的硬件参数信息，或者重载(override)内核自己检测到的信息。比如，我们用这样一个命令行参数字符串console=ttyS0,115200n8来通知内核以ttySO作为控制台，且串口采用115200bps、无奇偶校验、8位数据位这样的设置。下面是一段设置调用内核命令行参数字符串的示例代码：char *p;/* eat leading white space */for(p = commandline; *p = ; p+)J/* s

30、kip non-existent command lines so the kernel will still* use its default command line.*/if( *p = 0)return;params-hdr .tag = ATAG_CMDLINE;params-hdr.size = (sizeof(struet tag_header) + strlen(p) + 1 + 4) 2;st rcpy(params-u.cmdline.cmdline, p);params = tag next(params);请注意在上述代码中，设置tag_header的大小时，必须包括字

31、符串的终止符0,此外还要将字节数向上圆整4个字节，因为tag_header结构中的size成员表示的是字数。下面是设置ATAGNITRD的示例代码，它告诉内核在RAM中的什么地方可以找到initrd映象（压缩格式）以及它的大小：params-hdr. tag = ATAG_INITRD2; params-hdr.size = tag_size(tag_initrd);params-u .initrd.start 二 RAMDISK_RAM_BASE;params-u .initrd.size = INITRD_LEN;params = tag next(params);下面是设置ATAG_

32、RAMDISK的示例代码，它告诉内核解压后的Ramdisk有多大(单位是KB):params-hdr. tag = ATAG_RAMDISK; params-hdr.size = tag_size(tag_ramdisk);paramsu.ramdisk.s tart 二 0;params-u.ramdisk.size = RAMDISK_SIZE; /* 请注意，单位是 KB */ paramsu.ramdisk.flags = 1; /* automatically load ramdisk */params = tag next(params);最后，设置ATAG_NONE标记，结束整个

33、启动参数列表：static void setup_end_tag（void）paramshdr .tag = ATAG_NONE; paramshdr.size = 0;3.2.5调用内核Boot Loader调用Linux内核的方法是直接跳转到内核的第一条指令处，也即直接跳转到MEM_START + 0x8000地址处。在跳转时，下列条件要满足：1. CPU寄存器的设置：R0 = 0；R1 =机器类型 ID；关于 Machine Type Number，可以参见 linux/arch/arm/tools/mach-types。R2 =启动参数标记列表在RAM中起始基地址；2. CPU模式：必

34、须禁止中断（IRQs和FIQs）；CPU必须SVC模式；3. Cache和MMU的设置：MMU必须关闭；指令Cache可以打开也可以关闭；数据Cache必须关闭；如果用C语言，可以像下列示例代码这样来调用内核:void (*theKernel)(int zero, int arch, u32 params_addr) = (void (*)(int, int, u32)KERNEL_RAM_BASE;theKernel(O, ARCH NUMBER, (u32) kernel params start);注意，theKernel()函数调用应该永远不返回的。如果这个调用返回，则说明出错。4.关

35、于串口终端在boot loader程序的设计与实现中，没有什么能够比从串口终端正确地收到打印信息能更令人激动了。此外，向串口终端打印信息也是一个非常重要而又有效的调试手段。但是，我们经常会碰到串口终端显示乱码或根本没有显示的问题。造成这个问题主要有两种原因：(1) boot loader对串口的初始化设置不正确。(2)运行在host端的终端仿真程序对串口的设置不正确，这包括：波特率、奇偶校验、数据位和停止位等方面的设置。此外，有时也会碰到这样的问题，那就是：在boot loader的运行过程中我们可以正确地向串口终端输出信息，但当boot loader启动内核后却无法看到内核的启动输出

36、信息。对这一问题的原因可以从以下几个方面来考虑：(1) 首先请确认你的内核在编译时配置了对串口终端的支持，并配置了正确的串口驱动程序。(2) 你的boot loader对串口的初始化设置可能会和内核对串口的初始化设置不一致。此外，对于诸如 s3c44b0x这样的CPU,CPU时钟频率的设置也会影响串口，因此如果boot loader和内核对其CPU时钟频率的设置不一致，也会使串口终端无法正确显示信息。(3) 最后，还要确认boot loader所用的内核基地址必须和内核映像在编译时所用的运行基地址一致，尤其是对于uClinux而言。假设你的内核映像在编译时用的基地址是0xc0008000，但你的boot loader却将它加载到0xc0010000处去执行，那么内核映像当然不能正确地执行了。5.结束语Boot Loader的设计与实现是一个非常复杂的过程。如果不能从串口收到那激动人心的uncompressinglinuxdone,booting the kernel内核启动信息，恐怕谁也不能说：嗨,我的boot loader已经成功地转起来了！ ”。

展开阅读全文

温馨提示:
1: 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

备案号:蜀ICP备2024067431号-1 川公网安备51140202000466号

本站为文档C2C交易模式，即用户上传的文档直接被用户下载，本站只是中间服务平台，本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私，请立即通知装配图网，我们立即给予删除！

嵌入式系统Boot Loader启动全过程详解

最新文档

相关资源

相关搜索