Java是一種跨平臺的編程語言,支持不同字符集的編碼方式,其中最常用的是UTF-8和GBK編碼。
UTF-8是一種可變長的Unicode編碼,支持0至4個字節的編碼方式,覆蓋了世界上幾乎所有的字符,而且兼容ASCII編碼。在Java中,采用UTF-8編碼可以保證對不同語言的支持,且能夠避免出現亂碼的情況。
String str = "你好世界!"; byte[] utf8Bytes = str.getBytes("UTF-8"); String utf8Str = new String(utf8Bytes, "UTF-8"); System.out.println(utf8Str); //輸出:你好世界!
而GBK是一種針對漢字的編碼方式,它將每個漢字使用兩個字節來表示,它支持簡體中文和繁體中文,但是支持的字符種類有限,它不能像UTF-8一樣支持更多的字符編碼。
String str = "你好世界!"; byte[] gbkBytes = str.getBytes("GBK"); String gbkStr = new String(gbkBytes, "GBK"); System.out.println(gbkStr); //輸出:你好世界!
在Java開發過程中,選擇正確的字符編碼方式很重要。如果沒有正確指定字符編碼方式,就會出現亂碼的情況,而且在不同的操作系統和瀏覽器上顯示的效果也可能不同。