本人工作10年總結(jié)文檔——《C語言字節(jié)對齊》

ifreecoding · 發(fā)表于 2015-6-22 16:21:17

本文包含原理圖、PCB、源代碼、封裝庫、中英文PDF等資源

您需要登錄才可以下載或查看，沒有賬號？注冊會員

×

全文請見附件

C語言字節(jié)對齊.pdf (262.59 KB, 下載次數(shù): 14)
在word里寫好了，在論壇里不好排版，請下載附件觀看全文

全文章節(jié)：

字節(jié)對齊的由來
字節(jié)對齊規(guī)則
非字節(jié)對齊訪問
非字節(jié)對齊的方法
非字節(jié)對齊類型的字節(jié)對齊規(guī)則
非字節(jié)對齊的影響

字節(jié)對齊的由來
程序在運行時會將數(shù)據(jù)臨時存放在內(nèi)存中，芯片內(nèi)核需要對這些數(shù)據(jù)進行計算，不斷的
讀取內(nèi)存以獲得數(shù)據(jù)，并將計算結(jié)果寫入內(nèi)存。計算機體系經(jīng)過若干年的發(fā)展，最終確定了
以8bits 作為其基本的存儲單元——byte（字節(jié)），這是每個地址所對應(yīng)的最小訪問單元，
在C 語言中對應(yīng)一個char 型的變量。
下圖為芯片內(nèi)核訪問內(nèi)存的示意圖。芯片內(nèi)核通過控制總線控制內(nèi)存的動作，通過地址
總線告知內(nèi)存地址，數(shù)據(jù)總線上出現(xiàn)交互的數(shù)據(jù)。
圖1 訪問內(nèi)存示意圖
假設(shè)上圖是8 位機的示意圖，那么數(shù)據(jù)總線的寬度是8bits，由8 根數(shù)據(jù)線組成，這樣
芯片內(nèi)核與內(nèi)存之間一次就可以同時交換8 個bits 的數(shù)據(jù)，正好是一個字節(jié)。圖中右側(cè)的
每個小格子代表一個存儲地址，對應(yīng)一個字節(jié)。
下面通過一段C 語言代碼來具體看看芯片內(nèi)核與內(nèi)存之間的數(shù)據(jù)交互過程。
char data[2];
data[0] = 2;
data[1] = data[0] + 1;
第一行代碼定義了2 個字節(jié)的數(shù)組data。假設(shè)data 數(shù)組被編譯到地址0x100，那么
data[0]這個字節(jié)就被存儲在地址為0x100 的內(nèi)存空間，data[1]這個字節(jié)就被存儲在地址為
0x101 的內(nèi)存空間。
第二行對應(yīng)的硬件動作是將數(shù)據(jù)2 存入到data[0]中，也就是將數(shù)據(jù)2 存入到內(nèi)存中的
0x100 地址，執(zhí)行這條語句時，芯片內(nèi)核對控制總線、地址總線和數(shù)據(jù)總線進行操作，控制
總線上出現(xiàn)寫信號，地址總線上出現(xiàn)數(shù)據(jù)0x100，數(shù)據(jù)總線上出現(xiàn)數(shù)據(jù)0x02。此時內(nèi)存就
知道需要將數(shù)據(jù)2 寫入到地址0x100 中，完成一次寫操作。
第三行先讀出data[0]中的數(shù)據(jù)，芯片內(nèi)核將控制總線置為讀信號，將地址總線置為
0x100，此時，內(nèi)存就會從其內(nèi)部取出0x100 地址中的數(shù)據(jù)，也就是數(shù)據(jù)2，2 將出現(xiàn)在數(shù)
據(jù)總線上，此時芯片內(nèi)核就會通過數(shù)據(jù)總線讀取到data[0]中的數(shù)據(jù)了。接下來芯片內(nèi)核計
算2+1=3，需要將數(shù)字3 寫入到data[1]中，芯片內(nèi)核將控制總線置為寫信號，將地址總線
置為0x101，將數(shù)據(jù)總線置為3，內(nèi)存接收到這些信號后，就會將數(shù)據(jù)3 存入到其內(nèi)部0x101
地址中，完成本次操作。
內(nèi)存內(nèi)部細節(jié)
數(shù)據(jù)總線
地址總線
芯片內(nèi)核內(nèi)存 0x100 2 3
控制總線
從上述介紹的過程可以看出，芯片內(nèi)核與存儲芯片之間每次操作可以傳遞1 個字節(jié)的
數(shù)據(jù)，如果要傳遞多個字節(jié)的數(shù)據(jù)就需要重復(fù)這個過程，這受限于數(shù)據(jù)總線的寬度。
計算機技術(shù)在不斷的發(fā)展，在8bits 數(shù)據(jù)總線之后又相繼出現(xiàn)了16bits、32bits 乃至
64bits 數(shù)據(jù)總線，它們分別對應(yīng)于我們所謂的8 位機、16 位機、32 位機以及64 位機。對
于16 位機一次可以交互2 個字節(jié)的數(shù)據(jù)，32 位機一次可以交互4 個字節(jié)的數(shù)據(jù)，64 位機
一次可以交互8 個字節(jié)的數(shù)據(jù)，可以看出總線的帶寬增加了，速度成倍提高。
以32 位機為例，我們在訪問0 地址時，可以一次訪問4 個字節(jié)的數(shù)據(jù)，這4 個字節(jié)的
數(shù)據(jù)占用了4 個內(nèi)存地址，也就是說訪問0 地址時同時可以訪問0、1、2、3 這4 個地址，
訪問4 地址時可以同時訪問4、5、6、7 這4 個地址。我們不難得出這樣的結(jié)論：在地址總
線上只要出一個地址，就可以連同訪問這個地址及其后面的3 個地址中的數(shù)據(jù)，這4 個地
址正好可以組成一個32bits 的數(shù)據(jù)，通過訪問數(shù)據(jù)總線一次即可獲得，而對這個地址的要
求就是：需要4 字節(jié)對齊（對于64 位機則需要8 字節(jié)對齊）。在芯片設(shè)計時遵循了這個要
求，地址總線上只需要出現(xiàn)0、4、8……這樣4 的整數(shù)倍的地址就可以同時訪問連續(xù)4 個字
節(jié)的內(nèi)存空間，這就是字節(jié)對齊的根源——是由硬件決定的！為了配合硬件的4 字節(jié)對齊
訪問，軟件的編譯器鏈接器也對軟件做了限制，需要4 字節(jié)對齊訪問。
有關(guān)計算機的設(shè)計五花八門，上述有關(guān)控制總線、地址總線、數(shù)據(jù)總線的介紹只是原理性的介紹，不同芯片在具體實現(xiàn)時
會有所不同。
字節(jié)對齊規(guī)則
我們在寫代碼時一般并不會指定變量存放在內(nèi)存中的地址，這是由編譯器鏈接器決定
的，而編譯器鏈接器則遵循了4 字節(jié)對齊的原則，以32 位機為例，其規(guī)則是1 字節(jié)長度的
變量可以被編譯鏈接到任何地址，2 字節(jié)長度類型的變量被編譯鏈接到2 的整數(shù)倍的地址，
4 字節(jié)長度類型的變量被編譯鏈接到4 的整數(shù)倍的地址。因此，取signed/unsigned char
類型變量的地址，它可以是任意地址。取signed/unsigned short int 類型變量的地址，它一
定是2 的整數(shù)倍。取signed/unsigned int，signed/unsigned long 類型變量的地址，它一定
是4 的整數(shù)倍。
C 語言的結(jié)構(gòu)體類型由多種基本類型組成，比較利于討論字節(jié)對齊的問題，下面我們將
以結(jié)構(gòu)體為例講解字節(jié)對齊規(guī)則。以下例子除特殊說明外，均是在X86 32 位CPU，VC2010
環(huán)境下測試。
例1：
typedef struct example1
{
char a;
}EXAMPLE1;
結(jié)構(gòu)體EXAMPLE1 比較簡單，它其實就是一個char 型，它的長度sizeof(EXAMPLE1)
為1。
例2：
typedef struct example2
{
char a;
short b;
}EXAMPLE2;
結(jié)構(gòu)體EXAMPLE2 中包含了2 個變量，其中char 型a 的長度為1，short 型b 的長度
為2，但結(jié)構(gòu)體EXAMPLE2 的整體長度sizeof(EXAMPLE2)卻為4，而不是1+2=3，這種
現(xiàn)象就是字節(jié)對齊造成的。
為了方便觀察結(jié)構(gòu)體中變量相對結(jié)構(gòu)體頭的偏移地址，我們定義如下的宏：
#define OFFSET(s, e) ((unsigned int)(&((s*)0)->e))
其中s 為結(jié)構(gòu)體類型，e 為結(jié)構(gòu)體中的變量，OFFSET 返回的就是結(jié)構(gòu)體中的變量e
相對于結(jié)構(gòu)體s 的偏移地址。通過該結(jié)構(gòu)就可以看出結(jié)構(gòu)體在內(nèi)存中的分布。
求得結(jié)構(gòu)體EXAMPLE2 的數(shù)據(jù)如下：
sizeof(EXAMPLE2) 4
OFFSET(EXAMPLE2, a) 0
OFFSET(EXAMPLE2, b) 2
畫出結(jié)構(gòu)體EXAMPLE2 在內(nèi)存中分布如下：
ab
b
其中每個格子代表一個字節(jié)，a 和b 之間灰色背景的格子是編譯器為了字節(jié)對齊而保留
的一個字節(jié)空間。為什么會保留一個字節(jié)的空間呢，這是因為結(jié)構(gòu)體的對齊長度必須是其內(nèi)
部變量類型中最長的對齊長度，也就是說存放結(jié)構(gòu)體的起始地址必須是其內(nèi)部變量類型中最
長的對齊長度的整數(shù)倍。結(jié)構(gòu)體EXAMPLE2 中變量a 的對齊長度是1，變量b 的對齊長度
是2，因此EXAMPLE2 存放的地址必須是2 的整數(shù)倍。變量a 可以存放在任何地址，因此
存放在EXAMPLE2 開始的第一個字節(jié)，這個字節(jié)所在的地址是2 的整數(shù)倍，接下來的字節(jié)
（灰色）所在的地址不是2 的整數(shù)倍，而變量b 又只能存放在2 的整數(shù)倍地址，因此a 和b
之間只好空出1 個字節(jié)，這就使結(jié)構(gòu)體EXAMPLE2 的長度變?yōu)? 了。
例3：
typedef struct example3
{
char a;
short b;
int c;
}EXAMPLE3;
在結(jié)構(gòu)體EXAMPLE2 的基礎(chǔ)上再增加一個int 變量c 構(gòu)造成結(jié)構(gòu)體EXAMPLE3，按照
例2 中介紹的方法分析一下結(jié)構(gòu)體EXAMPLE3 的長度。
EXAMPLE3 中最長對齊長度的變量是c，4 個字節(jié)，因此EXAMPLE3 開始的地址必須
是4 的整數(shù)倍。變量a 是1 個字節(jié)，存放在EXAMPLE3 開始的第一個字節(jié)。變量b 是2
個字節(jié)，需要在a 之后空出1 個字節(jié)，才能存放在2 字節(jié)對齊的地址。變量c 是4 個字節(jié)，
需要存放在4 字節(jié)對齊的地址，前面的變量a、保留字節(jié)和變量b 之后已經(jīng)是4 字節(jié)對齊的
地址了，因此變量c 可以直接存放在變量b 之后。
按照上面的分析，我們可以畫出EXAMPLE3 在內(nèi)存中的分布示意圖：
a b b
c c c c
可以看到EXAMPLE3 占有8 個字節(jié)。我們再使用sizeof 和OFFSET 計算EXAMPLE3
的數(shù)據(jù)進行驗證，如下：
sizeof(EXAMPLE3) 8
OFFSET(EXAMPLE3, a) 0
OFFSET(EXAMPLE3, b) 2
OFFSET(EXAMPLE3, c) 4
例4：
typedef struct example4
{
char a;
char b;
short c;
int d;
}EXAMPLE4;
在結(jié)構(gòu)體EXAMPLE3 的基礎(chǔ)上再增加一個char 的變量構(gòu)造成結(jié)構(gòu)體EXAMPLE4，
EXAMPLE4 比EXAMPLE3 多了一個char 型變量，那么EXAMPLE4 是否會比EXAMPLE3
長1 個字節(jié)？
EXAMPLE4 中最長的對齊長度的變量是d，4 個字節(jié)，因此EXAMPLE4 開始的地址必
須是4 的整數(shù)倍。變量a 是1 個字節(jié)，存放在EXAMPLE4 開始的第一個字節(jié)。變量b 是1
個字節(jié)，對字節(jié)對齊沒有要求，直接存放在a 后面。變量c 是2 個字節(jié)，在a、b 之后已經(jīng)
是2 字節(jié)對齊的地址了，因此c 可以直接存放在b 之后，對齊到2 個字節(jié)。變量d 是4 個
字節(jié)，在a、b、c 之后已經(jīng)是4 字節(jié)對齊的地址了，因此d 可以直接存放在c 之后，對齊
到4 個字節(jié)。
按照上面的分析，我們可以畫出EXAMPLE4 在內(nèi)存中的分布示意圖：
a b c c
d d d d
可以看到EXAMPLE4 雖然比EXAMPLE3 多了一個變量，但與EXAMPLE3 一樣同樣
占有8 個字節(jié)。我們再使用sizeof 和OFFSET 計算EXAMPLE3 的數(shù)據(jù)進行驗證，如下：
sizeof(EXAMPLE4) 8
OFFSET(EXAMPLE4, a) 0
OFFSET(EXAMPLE4, b) 1
OFFSET(EXAMPLE4, c) 2
OFFSET(EXAMPLE4, d) 4
例5：
typedef struct example5
{
short a;
char b;
}EXAMPLE5;
再來看EXAMPLE5，按照上面介紹的規(guī)則你是否會認為它的長度是3？
EXAMPLE5 在內(nèi)存中分布示意圖如下：
a a
b
結(jié)構(gòu)體不但要保證其存放的地址需要對齊到其內(nèi)部變量類型中最長對齊長度的長度的
整數(shù)倍，其長度也要保證是其內(nèi)部變量類型中最長的對齊長度的整數(shù)倍。EXAMPLE5 中最
長的對齊長度變量是a，2 個字節(jié)，因此它也必須是2 字節(jié)的整數(shù)倍，所以在b 之后需要填
充1 個字節(jié)。因此sizeof(EXAMPLE5)為4。
例6：
typedef struct example6
{
char a;
int b;
short c;
}EXAMPLE6;
按照前面介紹的方法可以得知EXAMPLE6 的長度是12，在內(nèi)存中分布示意圖如下：
ab
b b b
c c
EXAMPLE6 的數(shù)據(jù)如下：
sizeof(EXAMPLE6) 12
OFFSET(EXAMPLE6, a) 0
OFFSET(EXAMPLE6, b) 4
OFFSET(EXAMPLE6, c) 8
例7：
typedef struct example7_1
{
char a;
int b;
char c;
}EXAMPLE7_1;
typedef struct example7_2
{
short a;
EXAMPLE7_1 b;
char c;
}EXAMPLE7_2;
當(dāng)一個結(jié)構(gòu)體被包含在另外一個結(jié)構(gòu)體中時，我們?nèi)钥梢允褂蒙厦娴姆椒ㄟM行分析。
先來看被包含的結(jié)構(gòu)體EXAMPLE7_1，它按照4 字節(jié)對齊，長度是12，它的內(nèi)存分
布示意圖如下：
ab
b b b
c
對于結(jié)構(gòu)體EXAMPLE7_2，short 型為2 字節(jié)對齊，EXAMPLE7_1 型被看做一個整體，
為4 字節(jié)對齊，char 型為1 字節(jié)對齊，因此結(jié)構(gòu)體EXAMPLE7_2 也需要4 字節(jié)對齊，可
以得出EXAMPLE7_2 的內(nèi)存分布示意圖如下：
a a
b.a
b.b b.b b.b b.b
b.c
c
由于EXAMPLE7_1 作為一個整體存在，其內(nèi)部的char 型變量b.a 并不會直接接在變
量a 后面，char 型變量c 也不會直接接在EXAMPLE7_2 內(nèi)部的b.c 之后。由于EXAMPLE7_2
是4 字節(jié)對齊的，因此變量c 之后需要保留3 個字節(jié)對齊到4 字節(jié)。
例8：
typedef struct example8_1
{
char a;
short b;
}EXAMPLE8_1;
typedef struct example8_2
{
char a;
EXAMPLE8_1 b;
char c;
}EXAMPLE8_2;
再來看一下例8 這個例子，EXAMPLE8_1 按照2 字節(jié)對齊，長度是4，它的內(nèi)存分布
示意圖如下：
ab
b
對于結(jié)構(gòu)體EXAMPLE8_2，char 型為1 字節(jié)對齊，EXAMPLE8_1 型為2 字節(jié)對齊，
因此結(jié)構(gòu)體EXAMPLE8_2 也需要2 字節(jié)對齊。在EXAMPLE8_2 中將EXAMPLE8_1 看做
一個整體，可以得出EXAMPLE8_2 的內(nèi)存分布示意圖如下：
a
b.a
b.b b.b
c
由于EXAMPLE8_1 作為一個整體存在，其內(nèi)部的char 型變量b.a 并不會直接接在變
量a 后面。由于EXAMPLE8_2 是2 字節(jié)對齊的，因此變量c 之后需要保留1 個字節(jié)對齊
到2 字節(jié)。
上面我們了解了字節(jié)對齊的規(guī)則，是以32 位機為例的。8 位機中硬件一次所能操作的
最大長度是1 個字節(jié)，多個字節(jié)的操作也是由單個字節(jié)組成的，因此8 位機沒有字節(jié)對齊
的概念。例如過去所廣泛使用的8 位單片機，它的int 型是2 個字節(jié)，long 型是4 個字節(jié)，
但受硬件限制在硬件操作時都是按字節(jié)操作的。
理解了這一點，下面的結(jié)構(gòu)體在8 位機上的結(jié)果也就不意外了：

cap65 · 發(fā)表于 2015-6-27 21:42:42

學(xué)習(xí)的好資料！！

lydy123 · 發(fā)表于 2016-6-6 15:57:30

非常感謝您的分享

wangh1234 · 發(fā)表于 2025-5-28 23:36:50

寫的不錯，感謝分享

賬號		自動登錄	找回密碼
密碼			注冊會員

久久99国产精品久久_亚洲2022国产成人精品无码区_精品日本一区二区三区在线观看_国产午夜无码精品免费看

本人工作10年總結(jié)文檔——《C語言字節(jié)對齊》

本文包含原理圖、PCB、源代碼、封裝庫、中英文PDF等資源

相關(guān)帖子