一:C語言程序的存儲區域
由C語言代碼(文本文件)形成可執行程序(二進制文件),需要經過編譯-彙編-連接三個階段。編譯過程把C語言文本文件生成彙編程序,彙編過程把彙編程序形成二進制機器代碼,連接過程則將各個源文件生成的二進制機器代碼文件組合成一個文件。
C語言編寫的程序經過編譯-連接後,將形成一個統一文件,它由幾個部分組成。在程序運行時又會產生其他幾個部分,各個部分代表了不同的存儲區域:
1.代碼段(Code或Text)
代碼段由程序中執行的機器代碼組成。在C語言中,程序語句進行編譯後,形成機器代碼。在執行程序的過程中,CPU的程序計數器指向代碼段的每一條機器代碼,並由處理器依次運行。
2.只讀數據段(RO data)
只讀數據段是程序使用的一些不會被更改的數據,使用這些數據的方式類似查表式的操作,由於這些變量不需要更改,因此只需要放置在只讀存儲器中即可。
3.已初始化讀寫數據段(RW data)
已初始化數據是在程序中聲明,並且具有初值的變量,這些變量需要佔用存儲器的空間,在程序執行時它們需要位於可讀寫的內存區域內,並具有初值,以供程序運行時讀寫。
4.未初始化數據段(BSS)
未初始化數據是在程序中聲明,但是沒有初始化的變量,這些變量在程序運行之前不需要佔用存儲器的空間。
5.堆(heap)
堆內存只在程序運行時出現,一般由程序員分配和釋放。在具有操作系統的情況下,如果程序沒有釋放,操作系統可能在程序(例如一個進程)結束後回收內存。
6.棧(stack)
棧內存只在程序運行時出現,在函數內部使用的變量、函數的參數以及返回值將使用棧空間,棧空間由編譯器自動分配和釋放。
C語言目標文件的內存佈局
看一個例子:
int a = 0; //全局初始化區,。data段
static int b=20; //全局初始化區,。data段
char *p1; //全局未初始化區 .bss段
const int A = 10; //.rodata段
void main(void)
{
int b; //棧
char s[] = "abc"; //棧
char *p2; //棧
static int c = 0; //全局(靜態)初始化區 .data段
char *p3 = "123456"; //123456\0在常量區,p3 在棧上。
p1 = (char*) malloc(10);//分配得來的10和20個字節的區域就在堆區
p2 = (char*) malloc(20);
strcpy(p1, "123456"); //123456\0 在常量區,編譯器可能會將它與p3所指向的"123456"優化成一個地方
}
代碼段、只讀數據段、讀寫數據段、未初始化數據段屬於靜態區域,而堆和棧屬於動態區域。代碼段、只讀數據段和讀寫數據段將在鏈接之後產生,未初始化數據段將在程序初始化的時候開闢,而堆和棧將在程序的運行中分配和釋放。C語言程序分為映像和運行時兩種狀態。在編譯-連接後形成的映像中,將只包含代碼段(Text)、只讀數據段(RO Data)和讀寫數據段(RW Data)。在程序運行之前,將動態生成未初始化數據段(BSS),在程序的運行時還將動態形成堆(Heap)區域和棧(Stack)區域。一般來説,在靜態的映像文件中,各個部分稱之為節(Section),而在運行時的各個部分稱之為段(Segment)。如果不詳細區分,可以統稱為段。
C語言在編譯和連接後,將生成代碼段(Text)、只讀數據段(RO Data)和讀寫數據段(RW Data)。在運行時,除了以上三個區域外,還包括未初始化數據段(BSS)區域和堆(Heap)區域和棧(Stack)區域。
二:C語言程序的段
1.代碼段(code或text)
代碼段由各個函數產生,函數的每一個語句將最終經過編繹和彙編生成二進制機器代碼(具體生生哪種體系結構的機器代碼由編譯器決定)。
2.只讀數據段(RO Data)
只讀數據段由程序中所使用的數據產生,該部分數據的特點是在運行中不需要改變,因此編譯器會將該數據段放入只讀的部分中。C語言中的只讀全局變量,只讀局部變量,程序中使用的常量等會在編譯時被放入到只讀數據區。
注意:定義全局變量const char a[100]={"ABCDEFG"};將生成大小為100個字節的只讀數據區,並使用“ABCDEFG”初始化。如果定義為:const char a[ ]={"ABCDEFG"};則根據字符串長度生成8個字節的只讀數據段(還有’\0’),所以在只讀數據段中,一般都需要做完全的初始化。
3.讀寫數據段(RW Data)
讀寫數據段表示了在目標文件中一部分可以讀也可以寫的數據區,在某些場合它們又被稱為已初始化數據段,這部分數據段和代碼段,與只讀數據段一樣都屬於程序中的靜態區域,但具有可寫性的特點。通常已初始化的全局變量和局部靜態變量被放在了讀寫數據段,如: 在函數中定義static char b[ 100]={“ABCDEFG”};讀寫數據區的特點是必須在程序經過初始化,如果只定義,沒初始值,則不會生成讀寫數據區,而會定位為未初始化數據區(BSS)。如果全局變量(函數外部定義的變量)加入static修飾,這表示只能在文件內使用,而不能被其他文件使用。
4. 未初始化數據段(BSS)
與讀寫數據段類似,它也屬於靜態數據區,但是該段中的數據沒有經過初始化。因此它只會在目標文件中被標識,而不會真正稱為目標文件中的一段,該段將會在運行時產生。未初始化數據段只在運行的初始化階段才會產生,因此它的大小不會影響目標文件的大小。
在C語言的程序中,對變量的使用還有以下幾點需要注意:
1.函數體中定義的變量通常是在棧上,不需要在程序中進行管理,由編繹器處理。
2.用malloc,calloc,realloc等分配內存的函數所分配的內存空間在堆上,程序必須保證在使用free釋放,否則會發生內存泄漏。
3.所有函數體外定義的是全局變量,加了static後的變量不管是在函數內部或外部都放在全局區。
4.使用const定義的變量將放於程序的只讀數據區。
三:程序中段的使用
下面用一個簡單的例子來説明C語言中變量和段的對應關係。C語言程序中的全局區(靜態區),實際對應着下述幾個段:RO Data; RW Data ; BSS Data.
一般來説,直接定義的全局變量在未初始化數據區,如果該變量有初始化則是在已初始化數據區(RW Data),加上const則將放在只讀數據區。
const char ro[ ] = {"this is read only data"}; //只讀數據區
static char rw_1[ ] ={"this is global read write data"}; //已初始化讀寫數據段
char BSS_1[ 100]; //未初始化數據段
const char *ptrconst ="constant data"; //字符串放在只讀取數據段
int main()
{
short b; //在棧上,佔用2個字節
char a[100]; //在棧上開闢100個字節, 它的值是其首地址
char s[ ]="abcdefg"; //s在棧上,佔用4個字節,"abcdefg"本身放置在只讀數據存儲區,佔8個字節
char *p1; //p1在棧上,佔用4個字節
char *p2="123456"; //p2 在棧上,p2指向的內容不能改,“123456”在只讀數據區
static char rw_2[ ]={"this is local read write data"};//局部已初始化讀寫數據段
static char BSS_2[100]; //局部未初始化數據段
static int c = 0; //全局(靜態)初始化區
p1=(char )malloc(10 sizeof(char ) ); //分配內存區域在堆區
strcpy(p1,"xxxx"); //“XXXX”放在只讀數據區,佔5個字節
free(p1); //使用free釋放p1所指向的內存
return 0;
}
讀寫數據段包含了憶初始化的全局變量 static char rw_1[ ]以及局部靜態變量static rw_2[ ].其差別在於編繹時,是在函數內部使用的還是可以在整個文件中使用。對於rw_1[] 無論有無static 修飾,其都將被放置在讀寫數據區,只是能否被其它文件引用與否。對於後者就不一樣了,它是局部靜態變量,放置在讀寫數據區,如果沒static修飾,其意義完全改變,它將會是開闢在棧空間的局部變量,而不是靜態變量,在這裏rw_1[],rw_2[]後沒具體數值,表示靜態區大小同後面字符串長度決定。
對於未初始化數據區BSS_1[100]與BSS_2[100],其區別在於前者是全局變量,在所有文件中都可以使用;後者是局部變量,只在函數內部使用。未初始化數據段不設置後面的初始化數值,因此必須使用數值指定區域的大小,編繹器將根據大小設置BSS中需要增加的長度。
棧空間主要用於以下3數據的存儲:
1.函數內部的動態變量
2.函數的參數
3.函數的返回值
棧空間是動態開闢與回收的。在函數調用過程中,如果函數調用的層次比較多,所需要的棧空間也逐漸加大,對於參數的傳遞和返回值,如果使用較大的結構體,在使用的棧空間也會比較大。