編碼有哪些

常用的編碼有以下方式:

編碼有哪些

1、ASCII碼。

ASCII碼,總共有128個,用一個位元組的低7位表示,0到31是控制字元如換行回車刪除等。32到126是列印字元,可以通過鍵盤輸入並且能夠顯示出來。

2、ISO-8859-1。

128個字元顯然是不夠用的,於是ISO組織在ASCII碼基礎上又制定了一些列標準用來擴充套件ASCII編碼,它們是ISO-8859-1到ISO-8859-15,其中ISO-8859-1涵蓋了大多數西歐語言字元,所有應用的最廣泛。ISO-8859-1仍然是單位元組編碼,它總共能表示256個字元。

3、GB2312。

它的全稱是《資訊交換用漢字編碼字符集基本集》,它是雙位元組編碼,總的編碼範圍是A1到F7,其中從A到A9是符號區,總共包含682個符號,從B0到F7是漢字區,包含6763個漢字。

4、GBK。

全稱叫《漢字內碼擴充套件規範》,是國家技術監督局為windows95所制定的新的漢字內碼規範,它的出現是為了擴充套件GB2312,加入更多的漢字,它的編碼範圍是8140到FEFE(去掉XX7F)總共有23940個碼位,它能表示21003個漢字,它的編碼是和GB2312相容的,也就是說用GB2312編碼的漢字可以用GBK來解碼,並且不會有亂碼。

5、GB18030。

全稱是《資訊交換用漢字編碼字符集》,是我國的強制標準,它可能是單位元組、雙位元組或者四位元組編碼,它的編碼與GB2312編碼相容,這個雖然是國家標準,但是實際應用系統中使用的並不廣泛。

6、UTF-16。

UTF-16具體定義了Unicode字元在計算機中存取方法。UTF-16用兩個位元組來表示Unicode轉化格式,這個是定長的表示方法,不論什麼字元都可以用兩個位元組表示,兩個位元組是16個bit,所以叫UTF-16。UTF-16表示字元非常方便,每兩個位元組表示一個字元,這個在字串操作時就大大簡化了操作,這也是Java以UTF-16作為記憶體的字元儲存格式的一個很重要的原因。

7、UTF-8。

UTF-16統一採用兩個位元組表示一個字元,雖然在表示上非常簡單方便,但是也有其缺點,有很大一部分字元用一個位元組就可以表示的現在要兩個位元組表示,儲存空間放大了一倍,在現在的網路頻寬還非常有限的今天,這樣會增大網路傳輸的流量,而且也沒必要。而UTF-8採用了一種變長技術,每個編碼區域有不同的字碼長度。不同型別的字元可以是由1~6個位元組組成。