呢篇文講嘅唔係亂馬

亂碼係指電腦系統顯示唔到正確嘅字符,而顯示一啲無意義嘅字符或空白,例如一堆代碼;呢啲所顯示出來嘅文字就係稱為亂碼。

網頁因為缺字(喺爾度係冇漢字字型)而出現嘅亂碼現象
頁面:日文維基百科文章《書体
對應於粵文維基百科文章《字體
網頁因為用錯內碼而出現嘅亂碼現象

亂碼本來係指電腦檔案或者程式用嘅內碼唔係用家用緊嘅內碼,所以顯示出錯,後來引伸指所有睇落亂來lyun2 lei4嘅嘢或者亂咗嘅文字。同用錯內碼無關嘅亂碼可以係因為字款缺字、程式出、又或者個檔案根本唔係文字等等。

由用錯內導致嘅亂碼喺2020年代基本上已經唔係問題,因為大部分系統已經轉咗用統一碼;喺網上仍然遇到嘅亂碼問題好多時係多次編碼錯誤,屬於無法修復嘅情況。

可能產生嘅原因 編輯

用錯內碼 編輯

  • 來源編碼錯誤。
  • 軟件解碼錯誤。

例如瀏覽器將GBK碼當成係Big5碼顯示,或電子郵件程序將對方傳來嘅郵件錯誤解碼。如果喺發送時編碼錯誤。如果解碼錯誤之後再編碼錯誤,結果可能會無法修復[1],需要寄件者嘅電郵程序重新編碼再寄等等。

其他原因 編輯

  • 字體檔案缺字。
  • 文件受到破壞。

可能解決嘅方法 編輯

  • 轉換編碼。如果係漢字內容一般可以試Big5GBKUTF-8統一碼嘅一種形式)、EUC-JPShift-JIS日文)、EUC-KR韓文)。喺2020年代基本上已經唔係問題,有啲瀏覽器亦唔再有轉換編碼嘅功能。
  • 字體。如果解碼正確而出現錯誤文字,可能係有可能係字款缺字,即係字體檔案冇相對應嘅字符,可嘗試換字體。呢種情況喺用 Word 處理英文比㝔常見。
  • 如果啲字變咗數字,例如最欣賞相中拉(最欣賞相中拉)等Unicode代碼,可以將呢部分抄低,獨立儲存成html檔案,再用瀏覽器打開解碼。或者可以直接用JavaScript作解讀︰
    alert("最欣賞相中拉");
    
  • 有時輸入漢字嘅時候都會出現亂碼,不過呢種情況好少出現。最大嘅原因係輸入法所用嘅編碼,同經編輯器輸出嘅字體編碼不符所致。解決方法係將輸入法設定成編輯器預期嘅編碼,或者將編輯器設定成用輸入法用嘅編碼。

有時解碼嘅方法係要視乎軟件同實際環境,同埋努力嘅嘗試嚟解碼,特別係當你唔知原本用邊個編碼系統。

參考 編輯

  1. Lunde, Ken. "Encoding Methods". CJKV Information Processing (第2版). O’Reilly. p. 294.

睇埋 編輯

出面網頁 編輯