人類怎么和計算機進行溝通的?
人類怎么和計算機進行溝通的?為什么幾行代碼就可以指揮計算機去解決各種問題?這里就涉及到計算機組成原理、編譯原理以及數據結構和算法了。程序要運行起來,必須要經過四個步驟:預處理、編譯、匯編和鏈接。
1 預處理
預處理之后的文件仍然是一個C++文件,預處理過程進行的操作如下:將所有的“#define”刪除,并且展開所有的宏定義處理所有的條件編譯指令,比如“#if”、“#ifdef”、“#elif”、“#else”、“#endif”處理“#include”指令,將被包含的頭文件插入到該指令的位置。(這個過程是遞歸進行的,因為被包含的文件可能還包含了其他文件)刪除所有的注釋“//”和“/* */”。添加行號。2 編譯
編譯過程主要包括詞法分析、語法分析、語義分析等操作。編譯完成后生成一個 .s 文件,即匯編文件。
詞法分析詞法分析是使用一種叫做lex的程序實現詞法掃描,它會按照用戶之前描述好的詞法規則將輸入的字符串分割成一個個記號。產生的記號一般分為:關鍵字、標識符、字面量(包含數字、字符串等)和特殊符號(運算符、等號等),然后他們放到對應的表中。
語法分析語法分析器根據用戶給定的語法規則,將詞法分析產生的記號序列進行解析,然后將它們構成一棵語法樹。對于不同的語言,只是其語法規則不一樣。
語義分析語法分析完成了對表達式語法層面的分析,但是它不了解這個語句是否真正有意義。有的語句在語法上是合法的,但是卻是沒有實際的意義,比如說兩個指針的做乘法運算,這個時候就需要進行語義分析,但是編譯器能分析的語義也只有靜態語義。
靜態語義:在編譯期就可以確定的語義。通常包括聲明與類型的匹配、類型的轉換。比如當一個浮點型的表達式賦值給一個整型的表達式時,其中隱含一個從浮點型到整型的轉換,而語義分析就需要完成這個轉換,再比如,將一個浮點型的表達式賦值給一個指針,這肯定是不行的,語義分析的時候就會發現兩者類型不匹配,編譯器就會報錯。動態語義:只有在運行期才能確定的語義。比如說兩個整數做除法,語法上沒問題,類型也匹配,聽著好像沒毛病,但是,如果除數是0的話,這就有問題了,而這個問題事先是不知道的,只有在運行的時候才能發現他是有問題的,這就是動態語義。3 匯編
匯編對應生成的文件是目標文件,目標文件由機器碼寫成。
4 鏈接
目標文件經過鏈接可以形成一個可執行文件。鏈接過程主要包括了符號決議和重定位。
符號決議有時候也被叫做符號綁定、名稱綁定、名稱決議、或者地址綁定,其實就是指用符號來去標識一個地址。比如說 int a = 6,這樣一句代碼,用a來標識一個塊4個字節大小的空間,空間里邊存放的內容就是6。
重定位重新計算各個目標的地址過程叫做重定位,重定位分為以下兩步:合并相同類型的節,然后鏈接器將運行時的內存地址賦給新的聚合節。這一步完成,程序中的每條指令和全局變量都有唯一的運行時內存地址了。鏈接器修改代碼節和數據節中對于每個符號的引用,使得他們指向正確的運行時地址。
對這些如果感興趣,可以在評論區留言,在這里就不展開詳細描述了。