深入理解C語言

fmms 14年前發布 | 34K 次閱讀 C語言

Dennis Ritchie 過世了，他發明了C語言，一個影響深遠并徹底改變世界的計算機語言。一門經歷40多年的到今天還長盛不訓的語言，今天很多語言都受到C的影響，C++，Java，C#，Perl， PHP， Javascript，等等。但是，你對C了解嗎？相信你看過本站的《C語言的謎題》還有《誰說C語言很簡單？》，這里，我再寫一篇關于深入理解C語言的文章，一方面是緬懷 Dennis，另一方面是告訴大家應該如何學好一門語言。（順便注明一下，下面的一些例子來源于這個 slides）

首先，我們先來看下面這個經典的代碼：

    　　int main ()

    　　{

    　　int a = 42;

    　　printf(“%d\n”， a);

    　　}

從這段代碼里你看到了什么問題？我們都知道，這段程序里少了一個#include <stdio.h> 還少了一個 return 0;的返回語句。

不過，讓我們來深入的學習一下，

這段代碼在 C++ 下無法編譯，因為 C++ 需要明確聲明函數
這段代碼在C的編譯器下會編譯通過，因為在編譯期，編譯器會生成一個 printf 的函數定義，并生成.o 文件，鏈接時，會找到標準的鏈接庫，所以能編譯通過。
但是，你知道這段程序的退出碼嗎？在 ANSI-C下，退出碼是一些未定義的垃圾數。但在 C89 下，退出碼是3，因為其取了 printf 的返回值。為什么 printf 函數返回3呢？因為其輸出了’4′， ’2′，’\n’ 三個字符。而在 C99 下，其會返回0，也就是成功地運行了這段程序。你可以使用 gcc 的 -std=c89或是-std=c99來編譯上面的程序看結果。
另外，我們還要注意 main ()，在C標準下，如果一個函數不要參數，應該聲明成 main (void)，而 main ()其實相當于 main (…)，也就是說其可以有任意多的參數。

我們再來看一段代碼：

    　　#include <stdio.h>

    　　void f(void)

    　　{

    　　   static int a = 3;

    　　   static int b;

    　　   int c;

    　　   ++a; ++b; ++c;

    　　   printf("a=%d\n", a);

    　　   printf("b=%d\n", b);

    　　   printf("c=%d\n", c);

    　　}

    　　int main (void)

    　　{

    　　   f();

    　　   f();

    　　   f();

    　　}

這個程序會輸出什么？

我相信你對a的輸出相當有把握，就分別是4，5，6，因為那個靜態變量。
對于c呢，你應該也比較肯定，那是一堆亂數。
但是你可能不知道b的輸出會是什么？答案是1，2，3。為什么和c不一樣呢？因為，如果要初始化，每次調用函數里，編譯器都要初始化函數棧空間，這太費性能了。但是c的編譯器會初始化靜態變量為0，因為這只是在啟動程序時的動作。
全局變量同樣會被初始化。

說到全局變量，你知道靜態全局變量和一般全局變量的差別嗎？是的，對于 static 的全局變量，其對鏈接器不可以見，也就是說，這個變量只能在當前文件中使用。

我們再來看一個例子：

 　　#include <stdio.h>

　　void foo (void)

　　{

　　int a;

　　printf("%d\n", a);

　　}

　　void bar (void)

　　{

　　int a = 42;

　　}

　　int main (void)

　　{

　　bar ();

　　foo ();

　　}

你知道這段代碼會輸出什么嗎？A) 一個隨機值，B) 42。A 和 B 都對（在“在函數外存取局部變量的一個比喻”文中的最后給過這個例子），不過，你知道為什么嗎？

如果你使用一般的編譯，會輸出42，因為我們的編譯器優化了函數的調用棧（重用了之前的棧），為的是更快，這沒有什么副作用。反正你不初始化，他就是隨機值，既然是隨機值，什么都無所謂。
但是，如果你的編譯打開了代碼優化的開關，-O，這意味著，foo ()函數的代碼會被優化成 main ()里的一個 inline 函數，也就是說沒有函數調用，就像宏定義一樣。于是你會看到一個隨機的垃圾數。

下面，我們再來看一個示例：

    　　#include <stdio.h>

    　　int b(void) { printf(“3”); return 3; }

    　　int c(void) { printf(“4”); return 4; }

    　　int main (void)

    　　{

    　　   int a = b () + c ();

    　　   printf(“%d\n”， a);

    　　}

這段程序會輸出什么？，你會說是，3，4，7。但是我想告訴你，這也有可能輸出，4，3，7。為什么呢？這是因為，在C/C++中，表達的評估次序是沒有標準定義的。編譯器可以正著來，也可以反著來，所以，不同的編譯器會有不同的輸出。你知道這個特性以后，你就知道這樣的程序是沒有可移植性的。

我們再來看看下面的這堆代碼，他們分別輸出什么呢？

示例一

int a=41; a++; printf("%d\n", a);

示例二

int a=41; a++ & printf("%d\n", a);

示例三

int a=41; a++ && printf("%d\n", a);

示例四

int a=41; if (a++ < 42) printf("%d\n", a);

示例五

　　int a=41; a = a++; printf("%d\n", a);

只有示例一，示例三，示例四輸出42，而示例二和五的行為則是未定義的。關于這種未定義的東西又叫 Sequence Points，因為這會讓編譯器不知道在一個表達式順列上如何存取變量的值。比如a = a++，a + a++，不過，在C中，這樣的情況很少。

下面，再看一段代碼：（假設 int 為4字節，char 為1字節）

    　　struct X { int a; char b; int c; };

    　　printf("%d,", sizeof(struct X));

    　　struct Y { int a; char b; int c; char d};

    　　printf("%d\n", sizeof(struct Y));

這個代碼會輸出什么?

a) 9，10

b)12, 12

c)12, 16

答案是C，我想，你一定知道字節對齊，是向4的倍數對齊。

但是，你知道為什么要字節對齊嗎？還是因為性能。因為這些東西都在內存里，如果不對齊的話，我們的編譯器就要向內存一個字節一個字節的取，這樣一來，struct X，就需要取9次，太浪費性能了，而如果我一次取4個字節，那么我三次就搞定了。所以，這是為了性能的原因。
但是，為什么 struct Y 不向 12 對齊，卻要向16對齊，因為 char d; 被加在了最后，當編譯器計算一個結構體的尺寸時，是邊計算，邊對齊的。也就是說，編譯器先看到了 int，很好，4字節，然后是 char，一個字節，而后面的 int 又不能填上還剩的3個字節，不爽，把 char b 對齊成4，于是計算到d時，就是 13 個字節，于是就是16啦。但是如果換一下d和c的聲明位置，就是12了。

另外，再提一下，上述程序的 printf 中的%d并不好，因為，在64位下，sizeof 的 size_t是 unsigned long，而32位下是 unsigned int，所以，C99引入了一個專門給 size_t用的%zu。這點需要注意。在64位平臺下，C/C++ 的編譯需要注意很多事。你可以參看《64位平臺C/C++開發注意事項》。

下面，我們再說說編譯器的 Warning，請看代碼：

    　　#include <stdio.h>

    　　int main (void)

    　　{

    　　int a;

    　　printf("%d\n", a);

    　　}

考慮下面兩種編譯代碼的方式：

cc -Wall a.c
cc -Wall -O a.c

前一種是不會編譯出a未初化的警告信息的，而只有在-O的情況下，再會有未初始化的警告信息。這點就是為什么我們在 makefile 里的 CFLAGS 上總是需要-Wall 和 -O。

最后，我們再來看一個指針問題，你看下面的代碼：

 　　#include <stdio.h>

　　int main (void)

　　{

　　int a[5];

　　printf("%x\n", a);

　　printf("%x\n", a+1);

　　printf("%x\n", &a);

　　printf("%x\n", &a+1);

　　}

假如我們的a的地址是：0Xbfe2e100, 而且是32位機，那么這個程序會輸出什么？

第一條 printf 語句應該沒有問題，就是 bfe2e100
第二條 printf 語句你可能會以為是 bfe2e101。那就錯了，a+1，編譯器會編譯成 a+ 1*sizeof (int)，int 在32位下是4字節，所以是加4，也就是 bfe2e104
第三條 printf 語句可能是你最頭疼的，我們怎么知道a的地址？我不知道嗎？可不就是 bfe2e100。那豈不成了a==&a啦？這怎么可能？自己存自己的？也許很多人會覺得指針和數組是一回事，那么你就錯了。如果是 int *a，那么沒有問題，a == &a。但是這是數組啊a[]，所以&a其實是被編譯成了 &a[0]。
第四條 printf 語句就很自然了，就是 bfe2e104。

看過這么多，你可能會覺得C語言設計得真拉淡啊。不過我要告訴下面幾點 Dennis 當初設計C語言的初衷：

1）相信程序員，不阻止程序員做他們想做的事。

2）保持語言的簡潔，以及概念上的簡單。

3）保證性能，就算犧牲移植性。

今天很多語言進化得很高級了，語法也越來越復雜和強大，但是C語言依然光芒四射，Dennis 離世了，但是C語言的這些設計思路將永遠不朽。

來自: coolshell.cn

本文由用戶 fmms 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！

本文地址：http://www.baiduhome.net/news/view/1828462

C語言

深入理解C語言

相關資訊

相關經驗

相關文檔