本文包含原理圖、PCB、源代碼、封裝庫、中英文PDF等資源
您需要 登錄 才可以下載或查看,沒有賬號?注冊會員
×
全文請見附件
C語言字節對齊.pdf
(262.59 KB, 下載次數: 14)
2015-6-22 16:14 上傳
點擊文件名下載附件
下載積分: M幣 -5
在word里寫好了,在論壇里不好排版,請下載附件觀看全文
全文章節:
- 字節對齊的由來
- 字節對齊規則
- 非字節對齊訪問
- 非字節對齊的方法
- 非字節對齊類型的字節對齊規則
- 非字節對齊的影響
字節對齊的由來
程序在運行時會將數據臨時存放在內存中,芯片內核需要對這些數據進行計算,不斷的
讀取內存以獲得數據,并將計算結果寫入內存。計算機體系經過若干年的發展,最終確定了
以8bits 作為其基本的存儲單元——byte(字節),這是每個地址所對應的最小訪問單元,
在C 語言中對應一個char 型的變量。
下圖為芯片內核訪問內存的示意圖。芯片內核通過控制總線控制內存的動作,通過地址
總線告知內存地址,數據總線上出現交互的數據。
圖1 訪問內存示意圖
假設上圖是8 位機的示意圖,那么數據總線的寬度是8bits,由8 根數據線組成,這樣
芯片內核與內存之間一次就可以同時交換8 個bits 的數據,正好是一個字節。圖中右側的
每個小格子代表一個存儲地址,對應一個字節。
下面通過一段C 語言代碼來具體看看芯片內核與內存之間的數據交互過程。
char data[2];
data[0] = 2;
data[1] = data[0] + 1;
第一行代碼定義了2 個字節的數組data。假設data 數組被編譯到地址0x100,那么
data[0]這個字節就被存儲在地址為0x100 的內存空間,data[1]這個字節就被存儲在地址為
0x101 的內存空間。
第二行對應的硬件動作是將數據2 存入到data[0]中,也就是將數據2 存入到內存中的
0x100 地址,執行這條語句時,芯片內核對控制總線、地址總線和數據總線進行操作,控制
總線上出現寫信號,地址總線上出現數據0x100,數據總線上出現數據0x02。此時內存就
知道需要將數據2 寫入到地址0x100 中,完成一次寫操作。
第三行先讀出data[0]中的數據,芯片內核將控制總線置為讀信號,將地址總線置為
0x100,此時,內存就會從其內部取出0x100 地址中的數據,也就是數據2,2 將出現在數
據總線上,此時芯片內核就會通過數據總線讀取到data[0]中的數據了。接下來芯片內核計
算2+1=3,需要將數字3 寫入到data[1]中,芯片內核將控制總線置為寫信號,將地址總線
置為0x101,將數據總線置為3,內存接收到這些信號后,就會將數據3 存入到其內部0x101
地址中,完成本次操作。
內存內部細節
數據總線
地址總線
芯片內核 內存 0x100 2 3
控制總線
從上述介紹的過程可以看出,芯片內核與存儲芯片之間每次操作可以傳遞1 個字節的
數據,如果要傳遞多個字節的數據就需要重復這個過程,這受限于數據總線的寬度。
計算機技術在不斷的發展,在8bits 數據總線之后又相繼出現了16bits、32bits 乃至
64bits 數據總線,它們分別對應于我們所謂的8 位機、16 位機、32 位機以及64 位機。對
于16 位機一次可以交互2 個字節的數據,32 位機一次可以交互4 個字節的數據,64 位機
一次可以交互8 個字節的數據,可以看出總線的帶寬增加了,速度成倍提高。
以32 位機為例,我們在訪問0 地址時,可以一次訪問4 個字節的數據,這4 個字節的
數據占用了4 個內存地址,也就是說訪問0 地址時同時可以訪問0、1、2、3 這4 個地址,
訪問4 地址時可以同時訪問4、5、6、7 這4 個地址。我們不難得出這樣的結論:在地址總
線上只要出一個地址,就可以連同訪問這個地址及其后面的3 個地址中的數據,這4 個地
址正好可以組成一個32bits 的數據,通過訪問數據總線一次即可獲得,而對這個地址的要
求就是:需要4 字節對齊(對于64 位機則需要8 字節對齊)。在芯片設計時遵循了這個要
求,地址總線上只需要出現0、4、8……這樣4 的整數倍的地址就可以同時訪問連續4 個字
節的內存空間,這就是字節對齊的根源——是由硬件決定的!為了配合硬件的4 字節對齊
訪問,軟件的編譯器鏈接器也對軟件做了限制,需要4 字節對齊訪問。
有關計算機的設計五花八門,上述有關控制總線、地址總線、數據總線的介紹只是原理性的介紹,不同芯片在具體實現時
會有所不同。
字節對齊規則
我們在寫代碼時一般并不會指定變量存放在內存中的地址,這是由編譯器鏈接器決定
的,而編譯器鏈接器則遵循了4 字節對齊的原則,以32 位機為例,其規則是1 字節長度的
變量可以被編譯鏈接到任何地址,2 字節長度類型的變量被編譯鏈接到2 的整數倍的地址,
4 字節長度類型的變量被編譯鏈接到4 的整數倍的地址。因此,取signed/unsigned char
類型變量的地址,它可以是任意地址。取signed/unsigned short int 類型變量的地址,它一
定是2 的整數倍。取signed/unsigned int,signed/unsigned long 類型變量的地址,它一定
是4 的整數倍。
C 語言的結構體類型由多種基本類型組成,比較利于討論字節對齊的問題,下面我們將
以結構體為例講解字節對齊規則。以下例子除特殊說明外,均是在X86 32 位CPU,VC2010
環境下測試。
例1:
typedef struct example1
{
char a;
}EXAMPLE1;
結構體EXAMPLE1 比較簡單,它其實就是一個char 型,它的長度sizeof(EXAMPLE1)
為1。
例2:
typedef struct example2
{
char a;
short b;
}EXAMPLE2;
結構體EXAMPLE2 中包含了2 個變量,其中char 型a 的長度為1,short 型b 的長度
為2,但結構體EXAMPLE2 的整體長度sizeof(EXAMPLE2)卻為4,而不是1+2=3,這種
現象就是字節對齊造成的。
為了方便觀察結構體中變量相對結構體頭的偏移地址,我們定義如下的宏:
#define OFFSET(s, e) ((unsigned int)(&((s*)0)->e))
其中s 為結構體類型,e 為結構體中的變量,OFFSET 返回的就是結構體中的變量e
相對于結構體s 的偏移地址。通過該結構就可以看出結構體在內存中的分布。
求得結構體EXAMPLE2 的數據如下:
sizeof(EXAMPLE2) 4
OFFSET(EXAMPLE2, a) 0
OFFSET(EXAMPLE2, b) 2
畫出結構體EXAMPLE2 在內存中分布如下:
ab
b
其中每個格子代表一個字節,a 和b 之間灰色背景的格子是編譯器為了字節對齊而保留
的一個字節空間。為什么會保留一個字節的空間呢,這是因為結構體的對齊長度必須是其內
部變量類型中最長的對齊長度,也就是說存放結構體的起始地址必須是其內部變量類型中最
長的對齊長度的整數倍。結構體EXAMPLE2 中變量a 的對齊長度是1,變量b 的對齊長度
是2,因此EXAMPLE2 存放的地址必須是2 的整數倍。變量a 可以存放在任何地址,因此
存放在EXAMPLE2 開始的第一個字節,這個字節所在的地址是2 的整數倍,接下來的字節
(灰色)所在的地址不是2 的整數倍,而變量b 又只能存放在2 的整數倍地址,因此a 和b
之間只好空出1 個字節,這就使結構體EXAMPLE2 的長度變為4 了。
例3:
typedef struct example3
{
char a;
short b;
int c;
}EXAMPLE3;
在結構體EXAMPLE2 的基礎上再增加一個int 變量c 構造成結構體EXAMPLE3,按照
例2 中介紹的方法分析一下結構體EXAMPLE3 的長度。
EXAMPLE3 中最長對齊長度的變量是c,4 個字節,因此EXAMPLE3 開始的地址必須
是4 的整數倍。變量a 是1 個字節,存放在EXAMPLE3 開始的第一個字節。變量b 是2
個字節,需要在a 之后空出1 個字節,才能存放在2 字節對齊的地址。變量c 是4 個字節,
需要存放在4 字節對齊的地址,前面的變量a、保留字節和變量b 之后已經是4 字節對齊的
地址了,因此變量c 可以直接存放在變量b 之后。
按照上面的分析,我們可以畫出EXAMPLE3 在內存中的分布示意圖:
a b b
c c c c
可以看到EXAMPLE3 占有8 個字節。我們再使用sizeof 和OFFSET 計算EXAMPLE3
的數據進行驗證,如下:
sizeof(EXAMPLE3) 8
OFFSET(EXAMPLE3, a) 0
OFFSET(EXAMPLE3, b) 2
OFFSET(EXAMPLE3, c) 4
例4:
typedef struct example4
{
char a;
char b;
short c;
int d;
}EXAMPLE4;
在結構體EXAMPLE3 的基礎上再增加一個char 的變量構造成結構體EXAMPLE4,
EXAMPLE4 比EXAMPLE3 多了一個char 型變量,那么EXAMPLE4 是否會比EXAMPLE3
長1 個字節?
EXAMPLE4 中最長的對齊長度的變量是d,4 個字節,因此EXAMPLE4 開始的地址必
須是4 的整數倍。變量a 是1 個字節,存放在EXAMPLE4 開始的第一個字節。變量b 是1
個字節,對字節對齊沒有要求,直接存放在a 后面。變量c 是2 個字節,在a、b 之后已經
是2 字節對齊的地址了,因此c 可以直接存放在b 之后,對齊到2 個字節。變量d 是4 個
字節,在a、b、c 之后已經是4 字節對齊的地址了,因此d 可以直接存放在c 之后,對齊
到4 個字節。
按照上面的分析,我們可以畫出EXAMPLE4 在內存中的分布示意圖:
a b c c
d d d d
可以看到EXAMPLE4 雖然比EXAMPLE3 多了一個變量,但與EXAMPLE3 一樣同樣
占有8 個字節。我們再使用sizeof 和OFFSET 計算EXAMPLE3 的數據進行驗證,如下:
sizeof(EXAMPLE4) 8
OFFSET(EXAMPLE4, a) 0
OFFSET(EXAMPLE4, b) 1
OFFSET(EXAMPLE4, c) 2
OFFSET(EXAMPLE4, d) 4
例5:
typedef struct example5
{
short a;
char b;
}EXAMPLE5;
再來看EXAMPLE5,按照上面介紹的規則你是否會認為它的長度是3?
EXAMPLE5 在內存中分布示意圖如下:
a a
b
結構體不但要保證其存放的地址需要對齊到其內部變量類型中最長對齊長度的長度的
整數倍,其長度也要保證是其內部變量類型中最長的對齊長度的整數倍。EXAMPLE5 中最
長的對齊長度變量是a,2 個字節,因此它也必須是2 字節的整數倍,所以在b 之后需要填
充1 個字節。因此sizeof(EXAMPLE5)為4。
例6:
typedef struct example6
{
char a;
int b;
short c;
}EXAMPLE6;
按照前面介紹的方法可以得知EXAMPLE6 的長度是12,在內存中分布示意圖如下:
ab
b b b
c c
EXAMPLE6 的數據如下:
sizeof(EXAMPLE6) 12
OFFSET(EXAMPLE6, a) 0
OFFSET(EXAMPLE6, b) 4
OFFSET(EXAMPLE6, c) 8
例7:
typedef struct example7_1
{
char a;
int b;
char c;
}EXAMPLE7_1;
typedef struct example7_2
{
short a;
EXAMPLE7_1 b;
char c;
}EXAMPLE7_2;
當一個結構體被包含在另外一個結構體中時,我們仍可以使用上面的方法進行分析。
先來看被包含的結構體EXAMPLE7_1,它按照4 字節對齊,長度是12,它的內存分
布示意圖如下:
ab
b b b
c
對于結構體EXAMPLE7_2,short 型為2 字節對齊,EXAMPLE7_1 型被看做一個整體,
為4 字節對齊,char 型為1 字節對齊,因此結構體EXAMPLE7_2 也需要4 字節對齊,可
以得出EXAMPLE7_2 的內存分布示意圖如下:
a a
b.a
b.b b.b b.b b.b
b.c
c
由于EXAMPLE7_1 作為一個整體存在,其內部的char 型變量b.a 并不會直接接在變
量a 后面,char 型變量c 也不會直接接在EXAMPLE7_2 內部的b.c 之后。由于EXAMPLE7_2
是4 字節對齊的,因此變量c 之后需要保留3 個字節對齊到4 字節。
例8:
typedef struct example8_1
{
char a;
short b;
}EXAMPLE8_1;
typedef struct example8_2
{
char a;
EXAMPLE8_1 b;
char c;
}EXAMPLE8_2;
再來看一下例8 這個例子,EXAMPLE8_1 按照2 字節對齊,長度是4,它的內存分布
示意圖如下:
ab
b
對于結構體EXAMPLE8_2,char 型為1 字節對齊,EXAMPLE8_1 型為2 字節對齊,
因此結構體EXAMPLE8_2 也需要2 字節對齊。在EXAMPLE8_2 中將EXAMPLE8_1 看做
一個整體,可以得出EXAMPLE8_2 的內存分布示意圖如下:
a
b.a
b.b b.b
c
由于EXAMPLE8_1 作為一個整體存在,其內部的char 型變量b.a 并不會直接接在變
量a 后面。由于EXAMPLE8_2 是2 字節對齊的,因此變量c 之后需要保留1 個字節對齊
到2 字節。
上面我們了解了字節對齊的規則,是以32 位機為例的。8 位機中硬件一次所能操作的
最大長度是1 個字節,多個字節的操作也是由單個字節組成的,因此8 位機沒有字節對齊
的概念。例如過去所廣泛使用的8 位單片機,它的int 型是2 個字節,long 型是4 個字節,
但受硬件限制在硬件操作時都是按字節操作的。
理解了這一點,下面的結構體在8 位機上的結果也就不意外了:
|