根據(jù)應(yīng)用目的的不同,漢字編碼分為外碼、交換碼、機(jī)內(nèi)碼和字形碼。
1.外碼(輸入碼)
外碼也叫輸入碼,是用來將漢字輸入到計算機(jī)中的一組鍵盤符號。目前常用的輸入碼有拼音碼、五筆字型碼、自然碼、表形碼、認(rèn)知碼、區(qū)位碼和電報碼等,一種好的編碼應(yīng)有編碼規(guī)則簡單、易學(xué)好記、操作方便、重碼率低、輸入速度快等優(yōu)點(diǎn),每個人可根據(jù)自己的需要進(jìn)行選擇。在后面的章節(jié)中,重點(diǎn)介紹智能全拼輸入法和五筆字型輸入法。
2.交換碼(國標(biāo)碼)
計算機(jī)內(nèi)部處理的信息,都是用二進(jìn)制代碼表示的,漢字也不例外。而二進(jìn)制代碼使用起來是不方便的,于是需要采用信息交換碼。中國標(biāo)準(zhǔn)總局1981年制定了中華人民共和國國家標(biāo)準(zhǔn)GB2312--80《信息交換用漢字編碼字符集--基本集》,即國標(biāo)碼。
區(qū)位碼是國標(biāo)碼的另一種表現(xiàn)形式,把國標(biāo)GB2312--80中的漢字、圖形符號組成一個94×94的方陣,分為94個“區(qū)”,每區(qū)包含94個“位”,其中“區(qū)”的序號由01至94,“位”的序號也是從01至94。94個區(qū)中位置總數(shù)=94×94=8836個,其中7445個漢字和圖形字符中的每一個占一個位置后,還剩下1391個空位,這1391個位置空下來保留備用。
3.機(jī)內(nèi)碼
根據(jù)國標(biāo)碼的規(guī)定,每一個漢字都有了確定的二進(jìn)制代碼,在微機(jī)內(nèi)部漢字代碼都用機(jī)內(nèi)碼,在磁盤上記錄漢字代碼也使用機(jī)內(nèi)碼。
4.漢字的字形碼
字形碼是漢字的輸出碼,輸出漢字時都采用圖形方式,無論漢字的筆畫多少,每個漢字都可以寫在同樣大小的方塊中。通常用16×16點(diǎn)陣來顯示漢字。