|
N900上TXT文本的編碼格式為UTF-8。此格式不用說(shuō),是目前兼容性相當(dāng)好的一種編碼。但是比如PC上(特指中文系統(tǒng)的XP、win7等)建立的TXT文本默認(rèn)是ANSI
所以當(dāng)存儲(chǔ)有中文的ANSI編碼的TXT文本在N900上中文顯示成亂碼,更有可能無(wú)法打開(kāi)(大量特殊符號(hào))。提示系統(tǒng)內(nèi)部錯(cuò)誤,這是因?yàn)榫幋a不兼容所致。
當(dāng)然如果是全E文就不會(huì)發(fā)上以上問(wèn)題。
結(jié)論是,PC端生成的TXT文本最好另存為UTF-8編碼。然后在N900上使用。(N900生成的TXT文本直接是UTF-8編碼)
大量特殊符號(hào):ANSI所包含的符號(hào)遠(yuǎn)比UTF-8少,例如全角的·在ANSI編碼文本里會(huì)無(wú)法顯示,成為?號(hào).
知識(shí)角
unicode和ansi都是字符代碼的一種表示形式。
為使計(jì)算機(jī)支持更多語(yǔ)言,通常使用 0x80~0xFF 范圍的 2 個(gè)字節(jié)來(lái)表示 1 個(gè)字符。比如:漢字'中'在中文操作系統(tǒng)中,使用 [0xD6,0xD0] 這兩個(gè)字節(jié)存儲(chǔ)。
不同的國(guó)家和地區(qū)制定了不同的標(biāo)準(zhǔn),由此產(chǎn)生了 GB2312, BIG5, JIS 等各自的編碼標(biāo)準(zhǔn)。這些使用 2 個(gè)字節(jié)來(lái)代表一個(gè)字符的各種漢字延伸編碼方式,稱為 ANSI 編碼。在簡(jiǎn)體中文系統(tǒng)下,ANSI 編碼代表 GB2312 編碼,在日文操作系統(tǒng)下,ANSI 編碼代表 JIS 編碼。
不同 ANSI 編碼之間互不兼容,當(dāng)信息在國(guó)際間交流時(shí),無(wú)法將屬于兩種語(yǔ)言的文字,存儲(chǔ)在同一段 ANSI 編碼的文本中。
it知識(shí)庫(kù):關(guān)于N900的TXT文本的編碼注意事項(xiàng),轉(zhuǎn)載需保留來(lái)源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。