什么是標記語言?
標記語言,是一種將文本以及文本相關的其他信息結合起來,展現出關于文檔結構和數據處理細節的電腦文字編碼。與文本相關的其他信息(包括文本的結構和表示信息等)與原來的文本結合在一起,但是使用標記進行標識。
標記語言不僅僅是一種語言。就像許多語言一樣,它需要一個運行時環境,使其有用。提供運行時環境的元素稱為用戶代理。
標記語言通常可以分為三類:標識性的、過程性的以及描述性的。
標識性置標語言
1:“標識性置標語言” (外語:Presentational markup)是在編碼過程中,標記文檔的結構信息。例如,在文本文件中, 文件的標題可能需要用特定的格式表示(居中,放大等),這樣我們就需要標記文件的標題。字處理以及桌面出版產品有時候能夠自動推斷出這類的結構信息,但是絕大多數的,像Wiki這樣的純文本編輯器還不能解決這個問題。
過程性標識
2:“過程性置標語言”(外語:Procedural markup) 一般都專門于文字的表達,但通常對于文本編輯者可見,并且能夠被軟件依其出現順序依次解讀 。 為了格式化一個標題,在標題文本之前,會緊接著插入一系列的格式標識符,以指示計算機轉換到居中的顯示模式,同時加大及加粗字體。在標題文本之后,會緊接綴上格式中止標識; 對于更高級的系統宏命令或者堆棧模式會讓這一過程的實現方式更加豐富 。大多數情況下, 過程性置標能力包含有一個Turing-complete編程語言。 過程性置標語言的范例有:nroff, troff, TeX, Lout 以及 PostScript. 過程性置標語言被廣泛應用在專業出版領域, 專業的出版商會根據要求使用不同的置標語言已達到出版要求.
3:描述性標記
“描述性的標記”——有時被稱為邏輯標記或概念上的標記,鼓勵作者編寫的方式描述概念上,而非視覺上。
歷史
“置標”這個詞來源自傳統出版業的“標記”一個手稿,也就是在原稿的邊緣加注一些符號來指示打印上的要求。 長久以來,這個工作都是由專門的“標記人”(外語:markup men )或“復制標記”(外語全稱:copy markers[3] )以及校對人來進行,對原稿標志出使用什么樣的字體,字型以及字號,然后再將原稿交給其他人進行手工的排版工作。
TeX
TeX是一個由美國電腦教授高德納(Donald E. Knuth)編寫的功能強大的排版軟件。它在學術界十分流行,特別是數學、物理學和計算機科學界。TeX被普遍認為是一個很好的排版工具,特別是在處理復雜的數學公式時。利用諸如是LaTeX等終端軟件,TeX就能夠排版出精美的文本。
標準通用標記語言
標準通用標記語言是一種專門的置標語言,被用作編寫《牛津英語詞典》的電子版本。由于它的復雜,導致難以普及。
超文本標記語言
超文本標記語言(標準通用標記語言下的一個應用、外語縮寫:HTML)是為網頁創建和其它可在網頁瀏覽器中看到的信息設計的一種標記語言。
可擴展標記語言
可擴展標記語言(標準通用標記語言下的一個子集、外語縮寫:XML),又稱可擴展置標語言,是一種標記語言。置標指電腦所能理解的信息符號,通過此種標記,電腦之間可以處理包含各種信息的文章等。
XHTML
可延伸超文件標記語言(外語全稱:Extensible HyperText Markup Language、外語縮寫:XHTML),是一種標記語言,表現方式與超文本標記語言類似,不過語法上更加嚴格。
其他基于可擴展標記語言的應用
還有其他一些基于可擴展標記語言的應用,比如RDF、XForms、DocBook、SOAP以及“網絡本體語言”(外語縮寫:OWL)。
其他應用
XAML(外語:Extensible Application Markup Language),基于XML語言,在微軟WPF(Windows Presentation Foundation)中使用。