C言語のコンパイルとリンクの仕組み

C言語の実装には、必ず二つの独立した環境が存在する。

Cプログラムは、複数の .c ファイルから構成されることが一般的である。これらのファイルはそれぞれ独立して処理され、最終的に一つの実行可能ファイルに結合される。

コンパイルプロセスはさらに三段階に分解できる：

この段階では、ソースファイルとそのインクルードするヘッダファイルが処理され、拡張子 .i の中間ファイルが生成される。

gcc -E source.c -o source.i

主な処理内容：

この段階が終了すると、ソースファイルにはマクロやインクルード指令は一切存在せず、単一の拡張されたコードの塊となる。エラーの原因がマクロ展開やヘッダの包含ミスである場合、この .i ファイルを確認することで問題を特定できる。

プリプロセス済みの .i ファイルを、アセンブリ言語（.s ファイル）に変換する。

gcc -S source.i -o source.s

この段階では、以下の処理が連続して行われる：

字句解析：文字列をキーワード、識別子、リテラル、演算子などの「トークン」に分割
構文解析：トークン列を構文木（AST）に変換。式や文の構造を階層的に表現
意味解析：型の整合性、変数の宣言・使用の妥当性、型変換の可能性などを静的に検査。型ミスマッチや未定義変数の使用など、構文的には正しいが意味的に誤ったコードを検出

この段階で発生するエラーは「コンパイルエラー」と呼ばれ、実行前に必ず修正が必要である。

アセンブリ言語の命令を、対応する機械語命令に直接変換する。1行のアセンブリ命令はほぼ1対1で機械語命令にマッピングされる。

gcc -c source.s -o source.o

この段階では最適化は行われず、純粋なバイナリコードへの変換のみが目的である。生成される .o ファイルは、CPUが直接実行できないが、リンク可能な形式の機械語である。

複数のオブジェクトファイルとライブラリを統合し、一つの実行可能ファイルを生成する。

主な処理：

たとえば、a.c で定義された関数 calculate() を b.c から呼び出している場合、リンク時にその関数の実際のアドレスが b.c の呼び出し箇所に埋め込まれる。

生成された実行ファイルが動作する環境では、以下のステップが順に実行される：

7月1日 23:35 投稿

異端開発室