Nios II c程序在运行之前需要做一些初始化工作。如果程序直接从falsh中运行则Crt0.s是最先执行的代码,如果程序不是直接从flash中运行则Crt0.s是执行完bootloader后最开始执行的代码。
#include "nios2.h"
#include "system.h"
/*
* 宏ALT_LOAD_SECTIONS用于"run from flash"模式。它用于确定
* 是否有section(.RODATA段,.RWDATA段或.EXCEPTIONS段)
* 需要从flash装到RAM中。如果有的话就调用函数alt_load()加以装载。
*/
#define __ALT_LOAD_SECTIONS(res, text, rodata, exc) \
((res##_BASE != rodata##_BASE) ||\ // 如果复位地址和.RODATA段,.RWDATA段
(res##_BASE != rwdata##_BASE) ||\ // 或.EXCEPTIONS段所在存贮器基地址不同,
(res##_BASE != exc##_BASE))// 则表明需要装载。符号“##”用于拼接两个名字。
#define _ALT_LOAD_SECTIONS(res, text, rodata, exc) \
__ALT_LOAD_SECTIONS(res, text, rodata, exc)
#define ALT_LOAD_SECTIONS _ALT_LOAD_SECTIONS(ALT_RESET_DEVICE,\
ALT_RODATA_DEVICE, \
ALT_RWDATA_DEVICE, \
ALT_EXCEPTIONS_DEVICE)
/*
* 这是Nios II的入口地址
*
* 复位的时候只有包含有复位向量的cache line是初始化的,
* 所以第一个cache line 的代码要初始化其它的指令cache。
* 一个指令cache line大小是32个字节,所以代码长度不能超过8个指令。
* 注意:自动生成的linker script要求.init section小于0x20个字节
*/
.section .entry, "xa"// .entry段可执行可分配的
.align 5// 和2^5=32字节边界对齐
/*
* 用户C代码要么在hosted mode 的mainn中,要么在standalone mode的alt_main中
*/
.globl main
.globl alt_main
/*
* 生成一个软件multiply/divide中断处理引用
* 这样一旦有下面的宏定义,它们就会被连入可执行文件中。
*/
#ifndef ALT_NO_INSTRUCTION_EMULATION
.globl alt_exception_muldiv
#endif
#ifdef ALT_TRAP_HANDLER
.globl alt_exception_trap
#endif
/*
* 有些工具需要知道reset vector在哪里
*/
.globl __reset
/*
* 连接器定义的符号,用于初始化.bss
*/
.globl __bss_start// .bss段的开始地址
.globl __bss_end// .bss段的结束地址
/*
* 明确声明可以使用r1 (汇编临时寄存器at)。
* 这个寄存器正常是保留个编译器使用的。
*/
.set noat
.type __reset, @function// 把__reset作为函数符号
__reset:
#ifdef ALT_RUN_FROM_FLASH
/*
* 如果我们在"run from flash"模式,那我们必须把代码放在
* reset 地址,初始化指令cache后跳转到入口(注意:
* 一旦.text段和reset 地址一样的话,"run from flash"就会
* 被设置).如果我们没有在"run from flash"模式,那
* boot loader就会初始化指令cache就不需要这段代码了。
*/
/*
*如果定义了ALT_SIM_OPTIMIZE 那这段代码不会在硬件上运行
*这个定义移去了初始化的指令cache和数据cache。它假设这些在
*仿真模型中已经做了
*/
#ifndef ALT_SIM_OPTIMIZE
/* 初始化指令cache的所有cache line */
#if NIOS2_ICACHE_SIZE > 0
/*
* 假设指令cache大小是2的幂
*/
#if NIOS2_ICACHE_SIZE > 0x8000
movhi r2, %hi(NIOS2_ICACHE_SIZE)// 2的幂最高位为1,其它都是0,所以只要
#else// 给高位字节赋值,低位字节清0就可以了。
movui r2, NIOS2_ICACHE_SIZE// 小于32k时位长不超过16位,直接赋值就可以。
#endif
0:
initi r2// Nios II的cache是直接映射型,
addi r2, r2, -NIOS2_ICACHE_LINE_SIZE// 只要对一段和cache大小一样的内存对应的cache,
bgt r2, zero, 0b// 初始化即可以达到初始化整个cache的目的。
1:
/*
* 下面的调试信息块告诉仿真器不用运行上面的循环,
* 而使用内部的快速代码
*/
.pushsection .debug_alt_sim_info
.int 1, 1, 0b, 1b
.popsection
#endif /* NIOS2_ICACHE_SIZE > 0 */
/*
* 初始化cache后调用.text段的入口
*/
#endif /* ALT_SIM_OPTIMIZE */
movhi r1, %hiadj(_start)// 装入_start的高16位
addi r1, r1, %lo(_start)// 装入_start的低16位
jmp r1// 跳转到.text段入口
.size __reset, . - __reset// 给函数符号__reset设置大小=当前位置-__reset开始的位置
#endif
/*
* .text段的开始,当程序用loader装载运行的时候同时也是代码的入口
*/
.section .text
.align 2// 4字节对齐
.globl _start
.type _start, @function// 把_start作为函数符号
_start:
/*
*如果定义了 ALT_SIM_OPTIMIZE那这段代码不会在硬件上运行。
*这个宏定义移去了指令和数据cache的初始化部分,我们假设仿真
*模型已经做了这些工作。
*/
#ifndef ALT_SIM_OPTIMIZE
/*
* 在初始化指令cache后我们必须初始化数据cache
*/
#if NIOS2_DCACHE_SIZE > 0
/*
* 假设数据cache大小是2的幂
*/
#if NIOS2_DCACHE_SIZE > 0x8000
movhi r2, %hi(NIOS2_DCACHE_SIZE)// 2的幂只有最高位是1,其它位都是0
#else// 所以大于32k的数,只要存高位字节就可以
movui r2, NIOS2_DCACHE_SIZE// 其它位置为0,小于32k的数,则可以直接
#endif// 赋值。
0:
initd 0(r2)// Nios II的cache是直接映射型的,所以只要
addi r2, r2, -NIOS2_DCACHE_LINE_SIZE// 初始化任何一块和cache一样大小的内存相关
bgt r2, zero, 0b// cache就可以初始化整个cache。
1:
/*
* 下面的调试信息块告诉仿真器不用执行上面的循环,
* 而是执行内部的快速代码。
*/
.pushsection .debug_alt_sim_info
.int 2, 1, 0b, 1b
.popsection
#endif /* NIOS2_DCACHE_SIZE > 0 */
#endif /* ALT_SIM_OPTIMIZE */
/*
* 现在caches已经被初始化,设置栈指针。
* 我们假设由连接器提供的值已经4字节对齐了。
*/
movhi sp, %hiadj(__alt_stack_pointer)// __alt_stack_pointer由连接器脚本定义。
addi sp, sp, %lo(__alt_stack_pointer)
/* 设置global pointer. */
movhi gp, %hiadj(_gp)// _gp由连接器脚本定义。
addi gp, gp, %lo(_gp)
#ifdef ALT_STACK_CHECK
/*
* 如果需要的化就设置栈顶变量。连接器已经在存贮器中设置了该变量的拷贝
*/
ldwet, %gprel(alt_stack_limit_value)(gp)
#endif
#ifndef ALT_SIM_OPTIMIZE
/*
* 给.bss段清0。
*
* 这里使用了符号:__bss_start and __bss_end,,这些在连接器脚本
* 中定义的变量。它们标志了.bss的开始和结束,连接器脚本保证
* 这些值都是32位对齐的。
*/
movhi r2, %hiadj(__bss_start)
addi r2, r2, %lo(__bss_start)
movhi r3, %hiadj(__bss_end)
addi r3, r3, %lo(__bss_end)
beq r2, r3, 1f
0:// 给.bss段清0。
stw zero, (r2)
addi r2, r2, 4
bltu r2, r3, 0b
1:
/*
* 下面的调试信息块告诉仿真器不用执行上面的循环,
* 而执行内部的快速代码。
*/
.pushsection .debug_alt_sim_info
.int 3, 1, 0b, 1b
.popsection
#endif /* ALT_SIM_OPTIMIZE */
/*
* 如果是从flash中运行的就把其它段装入RAM中。
*/
#ifdef ALT_RUN_FROM_FLASH// 如果没有bootloader即从flash直接执行,
#if ALT_LOAD_SECTIONS// 判断是否有段需要从flash中装到RAM中,
call alt_load// 有的话就调用alt_load函数装载。
#endif /* ALT_LOAD_SECTIONS */
#endif /* ALT_RUN_FROM_FLASH */
/* 调用C入口 */
call alt_main
/* alt_main永远都不会返回,所以我们在这里不需要再做任何事情。
*/
.size _start, . - _start// 给函数符号_start赋值大小=当前位置-_start开始的地址
#ifdef ALT_STACK_CHECK
/*
* 如果我们想检查堆栈溢出那我们需要知道堆栈的基地址
*/
.globlalt_stack_limit_value
.section .sdata,"aws",@progbits
.align2
.typealt_stack_limit_value, @object
.sizealt_stack_limit_value, 4
alt_stack_limit_value:
.long__alt_stack_limit
#endif