打算為入門ARM指令集寫點初級文章,沒什麼遠大理想,純當娛樂算了。
首先編輯一個最簡單的函數,包含變量分配及初始化:test1.c
#include <stdio.h> void main() { int d = 4; }
然後編譯:arm-linux-gnueabihf-gcc test.c -o test1
然後看看匯編代碼:arm-linux-gnueabihf-objdump -D test1;每一句的含義我已經給出詳細注釋。
首先對輸出的文件格式說明,對於如下的輸出,左邊是程序地址(各種函數地址等等),第二列是指令碼的十六進制表示也俗稱機器碼,剩下的就是給人類看的指令助記符號,舉例舉例:
835c: b480 push {r7}
這裡,835c是main函數的地址,b480是機器碼表示的指令,push {r7}就是給我們人類看的了。下面看test1的輸出:
0000835c <main>:
程序用到了r7寄存器,所以需要保護以免破壞之前的數據
1 835c: b480 push {r7}
堆棧向下增長棧用的不多,只需要12個字節就夠用了: int d需要4個,多出來的8個沒有使用
2 835e: b083 sub sp, #12
因為r0-r7是通用寄存器,可以使勁用,堆棧寄存器sp只有沒辦法的時候才使用。只好用r7 = sp + 0這種笨辦法
3 8360: af00 add r7, sp, #0
參與int d = 4這條語句的是r3,這是通用寄存器,spec定義大家都可以用,不需要保護
4 8362: f04f 0304 mov.w r3, #4
把4存儲到sp+4所指定的棧裡,c語言描述:*(sp + 4) = 4;留給大家思考:為何不頂著sp放置--即*(sp+0)=4?
5 8366: 607b str r3, [r7, #4]
還記得第二條:sub sp, #12嗎?此句和下一句是為從堆棧裡恢復原來的r7--pop {r7},做准備;
6 8368: f107 070c add.w r7, r7, #12
r7已經是原來的sp了
7 836c: 46bd mov sp, r7
彈出sp指向的內存數據給r7,c語言:r7 = *sp;
8 836e: bc80 pop {r7}
沒有調用子函數,即沒有使用lr寄存器,所以不需要push lr。跳轉到lr地址--進入main函數的下一條地址
9 8370: 4770 bx lr
10 8372: bf00 nop
我們再編輯一個稍微增加一個變量:test2.c
#include <stdio.h> void main() { int d = 4; char b = 2; }
0000835c <main>:
1 835c: b480 push {r7}
2 835e: b083 sub sp, #12
3 8360: af00 add r7, sp, #0
4 8362: f04f 0304 mov.w r3, #4
把4存儲到sp+0所指定的棧裡,c語言描述:*(sp + 0) = 4,注意與上一個例子的區別,這裡是頂著stack存放,為什麼?
5 8366: 603b str r3, [r7, #0]
6 8368: f04f 0302 mov.w r3, #2
為何要這麼任性的存放變量b?
7 836c: 71fb strb r3, [r7, #7]
8 836e: f107 070c add.w r7, r7, #12
9 8372: 46bd mov sp, r7
10 8374: bc80 pop {r7}
11 8376: 4770 bx lr
棧裡的數據是這樣的,b和d中間隔著好幾條街呢:)
下一篇我們分析分析賦值運算。
更多詳情見請繼續閱讀下一頁的精彩內容: http://www.linuxidc.com/Linux/2016-05/131835p2.htm