arm-linux-ld命令
-T選項是ld命令中比較重要的一個選項,可以用它直接指明代碼的代碼段、數據段、博士生、
www.2cto.com
段,對於復雜的連接,可以專門寫一個腳本來告訴編譯器如何連接。
-Ttext addr
-Tdata addr
-Tbss addr
arm-elf-ld -Ttext 0x00000000 -g led_On.o -o led_on_elf ,運行地址為0x00000000,由於沒有data和bss,他們會默認的依次放在後面。相同的代碼 不同的Ttext,你可以對比一下他們之間會變的差異,ld會自動調整跳轉的地址。
*簡單的Linker script
(1) SECTIONS命令:
The SECTIONS command tells the linker how to map input sections into output sections, and how to place the output sections in memory.
命令格式如下:
SECTIONS
{
sections-command
sections-command
......
}
其中sections-command可以是ENTRY命令,符號賦值,輸出段描述,也可以是overlay描述。
(2) 地址計數器‘.’(location counter):
該符號只能用於SECTIONS命令內部,初始值為‘0’,可以對該符號進行賦值,也可以使用該符號進行計算或賦值給其他符號。它會自動根據SECTIONS命令內部所描述的輸出段的大小來計算當前的地址。
(3) 輸出段描述(output section description):
前面提到在SECTIONS命令中可以作輸出段描述,描述的格式如下:
section [address] [(type)] : [AT(lma)]
{
output-section-command
output-section-command
...
} [>region] [AT>lma_region] [:phdr :phdr ...] [=fillexp]
很多附加選項是用不到的。其中的output-section-command又可以是符號賦值,輸入段描述,要直接包含的數據值,或者某一特定的輸出段關鍵字。
*linker script 實例
==============================
OUTPUT_ARCH(arm)
ENTRY(_start)
SECTIONS {
. = 0xa3f00000;
__boot_start = .;
.start ALIGN(4) : {
*(.text.start)
}
.setup ALIGN(4) : {
setup_block = .;
*(.setup)
setup_block_end = .;
}
.text ALIGN(4) : {
*(.text)
}
.rodata ALIGN(4) : {
*(.rodata)
}
.data ALIGN(4) : {
*(.data)
}
.got ALIGN(4) : {
*(.got)
}
__boot_end = .;
.bss ALIGN(16) : {
bss_start = .;
*(.bss)
*(COMMON)
bss_end = .;
}
.comment ALIGN(16) : {
*(.comment)
}
stack_point = __boot_start + 0x00100000;
loader_size = __boot_end - __boot_start;
setup_size = setup_block_end - setup_block;
}
=============================
在SECTIONS命令中的類似於下面的描述結構就是輸出段描述:
.start ALIGN(4) : {
*(.text.start)
}
.start 為output section name,ALIGN(4)返回一個基於location counter(.)的4字節對齊的地址值。*(.text.start)是輸入段描述,*為通配符,意思是把所有被鏈接的object文件中的.text.start段都鏈接進這個名為.start的輸出段。
源文件中所標識的section及其屬性實際上就是對輸入段的描述,例如.text.start輸入段在源文件start.S中的代碼如下:
.section .text.start
.global _start
_start :
b start
arm-elf-ld -Ttimer.lds -o timer_elf header .o
這裡就必須存在一個timer.lds的文件。
對於.lds文件,它定義了整個程序編譯之後的連接過程,決定了一個可執行程序的各個段的存儲位置。雖然現在我還沒怎麼用它,但感覺還是挺重要的,有必要了解一下。
先看一下GNU官方網站上對.lds文件形式的完整描述:
SECTIONS {
...
secname start BLOCK(align) (NOLOAD) : AT ( ldadr )
{ contents } >region :phdr =fill
...
}
secname和contents是必須的,其他的都是可選的。下面挑幾個常用的看看:
1、secname:段名
2、contents:決定哪些內容放在本段,可以是整個目標文件,也可以是目標文件中的某段(代碼段、數據段等)
3、start:本段連接(運行)的地址,如果沒有使用AT(ldadr),本段存儲的地址也是start。GNU網站上說start可以用任意一種描述地址的符號來描述。
4、AT(ldadr):定義本段存儲(加載)的地址。
/* nand.lds */
SECTIONS {
firtst 0x00000000 : { head.o init.o }
second 0x30000000 : AT(4096) { main.o }
}
以上,head.o放在0x00000000地址開始處,init.o放在head.o後面,他們的運行地址也是0x00000000,即連接和存儲地址相同(沒有AT指定);main.o放在4096(0x1000,是AT指定的,存儲地址)開始處,但是它的運行地址在0x30000000,運行之前需要從0x1000(加載處)復制到0x30000000(運行處),此過程也就用到了讀取Nand flash。
這就是存儲地址和連接(運行)地址的不同,稱為加載時域和運行時域,可以在.lds連接腳本文件中分別指定。
編寫好的.lds文件,在用arm-linux-ld連接命令時帶-Tfilename來調用執行,如
arm-linux-ld ?Tnand.lds x.o y.o ?o xy.o。也用-Ttext參數直接指定連接地址,如
arm-linux-ld ?Ttext 0x30000000 x.o y.o ?o xy.o。
既然程序有了兩種地址,就涉及到一些跳轉指令的區別,這裡正好寫下來,以後萬一忘記了也可查看,以前不少東西沒記下來現在忘得差不多了。
ARM匯編中,常有兩種跳轉方法:b跳轉指令、ldr指令向PC賦值。
我自己經過歸納如下:
b step1 :b跳轉指令是相對跳轉,依賴當前PC的值,偏移量是通過該指令本身的bit[23:0]算出來的,這使得使用b指令的程序不依賴於要跳到的代碼的位置,只看指令本身。
ldr pc, =step1 :該指令是從內存中的某個位置(step1)讀出數據並賦給PC,同樣依賴當前PC的值,但是偏移量是那個位置(step1)的連接地址(運行時的地址),所以可以用它實現從Flash到RAM的程序跳轉。
此外,有必要回味一下adr偽指令,U-boot中那段relocate代碼就是通過adr實現當前程序是在RAM中還是flash中。仍然用我當時的注釋
adr r0, _start /* r0是代碼的當前位置 */
/* adr偽指令,匯編器自動通過當前PC的值算出 如果執行到_start時PC的值,放到r0中:
當此段在flash中執行時r0 = _start = 0;當此段在RAM中執行時_start = _TEXT_BASE(在board/smdk2410/config.mk中指定的值為0x33F80000,即u-boot在把代碼拷貝到RAM中去執行的代碼段的開始) */
ldr r1,UGG BOOTS, _TEXT_BASE /* 測試判斷是從Flash啟動,還是RAM */
/* 此句執行的結果r1始終是0x33FF80000,因為此值是又編譯器指定的(ads中設置,或-D設置編譯器參數) */
cmp r0, r1 /* 比較r0和r1,調試的時候不要執行重定位 */
下面,結合u-boot.lds看看一個正式的連接腳本文件。這個文件的基本功能還能看明白,雖然上面分析了好多,但其中那些GNU風格的符號還是著實讓我感到迷惑。
OUTPUT_FORMAT("elf32littlearm", "elf32littlearm", "elf32littlearm")
;指定輸出可執行文件是elf格式,32位ARM指令,小端
OUTPUT_ARCH(arm)
;指定輸出可執行文件的平台為ARM
ENTRY(_start)
;指定輸出可執行文件的起始代碼段為_start.
SECTIONS
{
. = 0x00000000 ; 從0x0位置開始
. = ALIGN(4) ; 代碼以4字節對齊
.text : ;指定代碼段
{
cpu/arm920t/start.o (.text) ; 代碼的第一個代碼部分
*(.text) ;其它代碼部分
}
. = ALIGN(4)
.rodata : { *(.rodata) } ;指定只讀數據段
. = ALIGN(4);
.data : { *(.data) } ;指定讀/寫數據段
. = ALIGN(4);
.got : { *(.got) } ;指定got段, got段式是uboot自定義的一個段, 非標准段
__u_boot_cmd_start = . ;把__u_boot_cmd_start賦值為當前位置, 即起始位置
.u_boot_cmd : { *(.u_boot_cmd) } ;指定u_boot_cmd段, uboot把所有的uboot命令放在該段.
__u_boot_cmd_end = .;把__u_boot_cmd_end賦值為當前位置,即結束位置
. = ALIGN(4);
__bss_start = .; 把__bss_start賦值為當前位置,即bss段的開始位置
.bss : { *(.bss) }; 指定bss段
_end = .; 把_end賦值為當前位置,即bss段的結束位置
}
請問這個從load address 到running address的加載過程是誰來完成呢,是不是bootloader(stage 1)根據相應的地址來完成這個加載過程呢?
Blog作者的回復:
是的
你好:讀了你的文章,很受啟發。但是有個地方不大明白,就是如果程序中只有main.o 那麼我是不是可以使用AT命令指定加載段為4096,那麼是什麼程序將main.o存放在存儲器的4096的位置而不是放在存儲器的0位置?是用燒寫程序嗎?
Blog作者的回復:
在bin文件按照這個lds腳本連接時,main.o就會被放到bin中從頭開始的4096偏移位置處(假定bin就按這個lds連接),之後把整個bin燒到flash中。
S3C2410基礎實驗--實驗四:arm-linux-ld2009-04-29 20:55在開始後續實驗之前,我們得了解一下arm-linux-ld連接命令的使用。在上述實驗中,我們一直使用類似如下的命令進行連接:
arm-linux-ld -Ttext 0x00000000 crt0.o led_on_c.o -o led_on_c_tmp.o
我們看看它是什麼意思:-o選項設置輸出文件的名字為led_on_c_tmp.o;“--Ttext 0x00000000”設置代碼段的起始地址為0x00000000;這條指令的作用就是將crt0.o和led_on_c.o連接成led_on_c_mp.o可執行文件,此可執行文件的代碼段起始地址為0x00000000。
我們感興趣的就是“―Ttext”選項!進入LINK目錄,link.s代碼如下:
1 .text
2 .global _start
3 _start:
4 b step1
5 step1:
6 ldr pc, =step2
7 step2:
8 b step2
Makefile如下:
1 link:link.s
2 arm-linux-gcc -c -o link.o link.s
3 arm-linux-ld -Ttext 0x00000000 link.o -o link_tmp.o
4 # arm-linux-ld -Ttext 0x30000000 link.o -o link_tmp.o
5 arm-linux-objcopy -O binary -S link_tmp.o link
6 arm-linux-objdump -D -b binary -m arm link >ttt.s
7 # arm-linux-objdump -D -b binary -m arm link >ttt2.s
8 clean:
9 rm -f link
10 rm -f link.o
11 rm -f link_tmp.o
實驗步驟:
1.進入目錄LINK,運行make生成arm-linux-ld選項為“-Ttext 0x00000000”的反匯編碼ttt.s
2.make clean
3.修改Makefile:將第4、7行的“#”去掉,在第3、6行前加上“#”
4.運行make生成arm-linux-ld選項為“-Ttext 0x30000000”的反匯編碼ttt2.s
link.s程序中用到兩種跳轉方法:b跳轉指令、直接向pc寄存器賦值。我們先把在不同“―Ttext”選項下,生成的可執行文件的反匯編碼列出來,再詳細分析這兩種不同指令帶來的差異。
ttt.s: ttt2.s
0: eaffffff b 0x4 0: eaffffff b 0x4
4: e59ff000 ldr pc, [pc, #0] ; 0xc 4: e59ff000 ldr pc, [pc, #0] ; 0xc
8: eafffffe b 0x8 8: eafffffe b 0x8
c: 00000008 andeq r0, r0, r8 c: 30000008 tsteq r0, #8 ; 0x8
先看看b跳轉指令:它是個相對跳轉指令,其機器碼格式如下:
Cond 1 0 1 L Offset
[31:28]位是條件碼;[27:24]位為“1010”時,表示B跳轉指令,為“1011”時,表示BL跳轉指令;[23:0]表示偏移地址。使用B或BL跳轉時,下一條指令的地址是這樣計算的:將指令中24位帶符號的補碼立即數擴展為32(擴展其符號位);將此32位數左移兩位;將得到的值加到pc寄存器中,即得到跳轉的目標地址。我們看看第一條指令“b step1”的機器碼eaffffff:
1. 24位帶符號的補碼為0xffffff,將它擴展為32得到:0xffffffff
2.將此32位數左移兩位得到:0xfffffffc,其值就是-4
3.pc的值是當前指令的下兩條指令的地址,加上步驟2得到的-4,這恰好是第二條指令step1的地址
各位不要被被反匯編代碼中的“b 0x4”給迷惑了,它可不是說跳到絕對地址0x4處執行,絕對地址得像上述3個步驟那樣計算。您可以看到b跳轉指令是依賴於當前pc寄存器的值的,這個特性使得使用b指令的程序不依賴於代碼存儲的位置――即不管我們連接命令中“--Ttext”為何,都可正確運行。
再看看第二條指令ldr pc, =step2:從反匯編碼“ldr pc, [pc, #0]”可以看出,這條指令從內存中某個位置讀出數據,並賦給pc寄存器。這個位置的地址是當前pc寄存器的值加上偏移值0,其中存放的值依賴於連接命令中的“--Ttext”選項。執行這條指令後,對於ttt.s,pc=0x00000008;對於ttt2.s, pc=0x30000008。於是執行第三條指令“b step2”時,它的絕對地址就不同了:對於ttt.s,絕對地址為0x00000008;對於ttt2.s,絕對地址為0x30000008。
ttt2.s上電後存放的位置也是0,但是它連接的地址是0x30000000。我們以後會經常用到“存儲地址和連接地址不同”(術語上稱為加載時域和運行時域)的特性:大多機器上電時是從地址0開始運行的,但是從地址0運行程序在性能方面總有很多限制,所以一般在開始的時候,使用與位置無關的指令將程序本身復制到它的連接地址處,然後使用向pc寄存器賦值的方法跳到連接地址開始的內存上去執行剩下的代碼。在實驗5、6中,我們將會作進一步介紹。
arm-linux-ld命令中選項“-Ttext”也可以使用選項“-Tfilexxx”來代替,在文件filexxx中,我們可以寫出更復雜的參數來使用arm-linux-ld命令――在實驗6中,我們就是使用這種方法來指定連接參數的。