Menu

【深入淺出教你寫編譯器(Compiler)】一、簡介 by Dukeland

相信每個 programmer 都跟西傑一樣想過設計一種自己的編程語言,最近西傑就有機會要寫一個編譯器了。雖然在大學時已經讀過如何編寫一個編譯器,但要認真寫起上來還真的不容易,而且網上教寫編譯器的教材不多(尤其中文的),所以就把這次經驗記下來,疏理一下自己在開發過程中所學到的東西,也同時為互聯網增加一些有關編譯器這方面的中文資源吧。

西傑在開發過程中經常參考 Actionscript 編譯器的 source code(用Java 寫的),大家有興趣可以看看這裡(在 /trunk/modules/asc 裡), 是 open source 的

在這個教程中,西傑將會使用 Javascript 來開發,原因有二。第一,JS 是我最喜愛的編程語言之一,語法簡潔易明,亦較多人認識。第二,可以讓大家在瀏覽器直接運行 Demo,大家不用浪費時間下載本文所舉的例子再執行。

整個教程將會分為七個主要單元,除了這篇簡介外,還包括以下六個單元。

二、詞法分析(Lexical analysis):把字元合併成為詞語

三、語法分析(Syntactic analysis):把詞語組合成一句有意思的句子

四、語意分析(Semantic analysis):把句子組成有上文下理的段落,成為有意思的故事。西傑認為這個單元和第三個單元最難,大家要有心理準備

五、虛擬機(Virtual Machine):用來運行編譯好的程式

六、生成代碼(Code Generation):把你閱讀完的故事寫出來給虛擬機看

七、優化器(Optimizer):可以把故事說得簡單一點

 

好了,那麼我們開始吧,先來看看我們即將開發的語言﹣Wescript (音類似 Westkit,不過要翹舌)的特徵

兩種變數類型(variable type):bool, int

兩種控制結構(Control structure):if/else, while

註釋(Comment)://單行,/*多行*/

運算符(Operator):+, -, *, /, %, (, ), &&, ||, !, ==, !=, =, +=, ++, -=, –

Static scoping, bool 不能與 int 比較,忽略空白符號

例子:

/*
Wescript
*/
var a:int = 1;
var b:int = 2;
var c:bool = true;
if (c){
print a;
}else{
print b;
}
var i:int = 0;
while (i < 10){
print i;
i++;
}
//WoW

就是這樣了,下一章就會開始做 Scanner。

 

後續還有七篇文章,由於本站備份已遺失,請見 jaceju 的備份