【深入淺出教你寫編譯器(Compiler)】一、簡介 by Dukeland
相信每個 programmer 都跟西傑一樣想過設計一種自己的編程語言,最近西傑就有機會要寫一個編譯器了。雖然在大學時已經讀過如何編寫一個編譯器,但要認真寫起上來還真的不容易,而且網上教寫編譯器的教材不多(尤其中文的),所以就把這次經驗記下來,疏理一下自己在開發過程中所學到的東西,也同時為互聯網增加一些有關編譯器這方面的中文資源吧。
在這個教程中,西傑將會使用 Javascript 來開發,原因有二。第一,JS 是我最喜愛的編程語言之一,語法簡潔易明,亦較多人認識。第二,可以讓大家在瀏覽器直接運行 Demo,大家不用浪費時間下載本文所舉的例子再執行。
整個教程將會分為七個主要單元,除了這篇簡介外,還包括以下六個單元。
二、詞法分析(Lexical analysis):把字元合併成為詞語
三、語法分析(Syntactic analysis):把詞語組合成一句有意思的句子
四、語意分析(Semantic analysis):把句子組成有上文下理的段落,成為有意思的故事。西傑認為這個單元和第三個單元最難,大家要有心理準備
五、虛擬機(Virtual Machine):用來運行編譯好的程式
六、生成代碼(Code Generation):把你閱讀完的故事寫出來給虛擬機看
七、優化器(Optimizer):可以把故事說得簡單一點
好了,那麼我們開始吧,先來看看我們即將開發的語言﹣Wescript (音類似 Westkit,不過要翹舌)的特徵
兩種變數類型(variable type):bool, int
兩種控制結構(Control structure):if/else, while
註釋(Comment)://單行,/*多行*/
運算符(Operator):+, -, *, /, %, (, ), &&, ||, !, ==, !=, =, +=, ++, -=, –
Static scoping, bool 不能與 int 比較,忽略空白符號
例子:
/*
Wescript
*/
var a:int = 1;
var b:int = 2;
var c:bool = true;
if (c){
print a;
}else{
print b;
}
var i:int = 0;
while (i < 10){
print i;
i++;
}
//WoW
就是這樣了,下一章就會開始做 Scanner。
後續還有七篇文章,由於本站備份已遺失,請見 jaceju 的備份。