|
date.csv:
"ID" "NAME" "EMAIL"
"1" "小明" "xm@163.com"
"2" "小東" "xd@sina.com"
"3" "小少" "shaozi@hotmai.com"
讀取這個(gè)csv文件
復(fù)制代碼 代碼如下:
<?php
$handle=fopen('date.csv','r');
while($data=fgetcsv($handle,10000,"/t"))
{
echo "$data[0]"."$data[1]"."$data[2]";
}
?>
讀取后在頁(yè)面上顯示時(shí),成了這樣:
"ID" NAME EMAIL
1 小明 xm@163.com
2 小東 xd@sina.com
3 小少 shaozi@hotmai.com
fgetcsv函數(shù)的字段環(huán)繞符默認(rèn)是雙引號(hào),
為什么我讀取出來(lái)時(shí),其它字段都好好的,可是ID還有雙引號(hào)包著?
上網(wǎng)查了下,原來(lái)是utf8編碼的bom在php下無(wú)法識(shí)別.
下面是查來(lái)的資料:
Unicode規(guī)范中有一個(gè)BOM的概念。BOM――Byte Order Mark,就是字節(jié)序標(biāo)記。在
這里
找到一段關(guān)于BOM的說(shuō)明:
在UCS 編碼中有一個(gè)叫做"ZERO WIDTH NO-BREAK SPACE"的字符,它的編碼是FEFF。而FFFE在UCS中是不存在的字符,所以不應(yīng)該出現(xiàn)在實(shí)際傳輸中。UCS規(guī)范建議我們?cè)趥鬏斪止?jié)流前,先傳輸字符"ZERO WIDTH NO-BREAK SPACE"。這樣如果接收者收到FEFF,就表明這個(gè)字節(jié)流是Big-Endian的;如果收到FFFE,就表明這個(gè)字節(jié)流是Little-Endian的。因此字符"ZERO WIDTH NO-BREAK SPACE"又被稱(chēng)作BOM。
UTF-8不需要BOM來(lái)表明字節(jié)順序,但可以用BOM來(lái)表明編碼方式。字符"ZERO WIDTH NO-BREAK SPACE"的UTF-8編碼是EF BB BF。所以如果接收者收到以EF BB BF開(kāi)頭的字節(jié)流,就知道這是UTF-8編碼了。
Windows就是使用BOM來(lái)標(biāo)記文本文件的編碼方式的。
另外unicode網(wǎng)站的
FAQ-BOM
詳細(xì)介紹了BOM。官方的自然權(quán)威,不過(guò)是英文的,看起來(lái)比較費(fèi)勁。
UTF-8編碼的文件中,BOM占三個(gè)字節(jié)。如果用記事本把一個(gè)文本文件另存為UTF-8編碼方式的話(huà),用UE打開(kāi)這個(gè)文件,切換到十六進(jìn)制編輯狀態(tài)就可以看到開(kāi)頭的FFFE了。這是個(gè)標(biāo)識(shí)UTF-8編碼文件的好辦法,軟件通過(guò)BOM來(lái)識(shí)別這個(gè)文件是否是UTF-8編碼,很多軟件還要求讀入的文件必須帶BOM。可是,還是有很多軟件不能識(shí)別BOM。我在研究Firefox的時(shí)候就知道,在Firefox早期的版本里,擴(kuò)展是不能有BOM的,不過(guò)Firefox 1.5以后的版本已經(jīng)開(kāi)始支持BOM了。現(xiàn)在又發(fā)現(xiàn),php也不支持BOM。
php在設(shè)計(jì)時(shí)就沒(méi)有考慮BOM的問(wèn)題,也就是說(shuō)他不會(huì)忽略UTF-8編碼的文件開(kāi)頭BOM的那三個(gè)字符。由于必須在轉(zhuǎn)換->UTF-8轉(zhuǎn)ASCII,或者在另存為里選擇ASCII編碼。如果是DOS格式的行尾符,可以用記事本打開(kāi),點(diǎn)另存為,選ASCII編碼。如果包含中文字符的話(huà),可以用UE的另存為功能,選擇“UTF-8 無(wú) BOM”即可。請(qǐng)參考下面的圖片:
根據(jù)Bo-Blog的wiki的說(shuō)明:Editplus需要先另存為gb,再另存為UTF-8。不過(guò)這樣做要小心,所有GBK編碼中不包含的字符就會(huì)都丟了。如果有一些非中文的字符在文件里的話(huà)還是不要用這種辦法了。(從這一個(gè)小方面來(lái)看,UE――UltraEdite-32確實(shí)比Editplus好很多,Editplus太輕量級(jí)了)
另外我發(fā)現(xiàn)了一個(gè)辦法,就是利用Wordpress提供的文件編輯器。這個(gè)辦法不受限制,不需要去下載專(zhuān)門(mén)的編輯器,畢竟大家都在用Wordpress嘛。先在ftp里把要編輯的文件的寫(xiě)入權(quán)限打開(kāi),然后進(jìn)入Wordpress后臺(tái)->管理->文件編輯器,輸入要編輯文件的路徑,點(diǎn)編輯文件。在顯示出來(lái)的編輯界面中,你是看不到開(kāi)頭的那三個(gè)字符的,不過(guò)沒(méi)關(guān)系,把光標(biāo)定位在整個(gè)文件的第一個(gè)字符前,按一下Backspace鍵。OK了,點(diǎn)更新文件吧,在ftp里刷新一下,可以看到文件小了3字節(jié),大功告成。
最后說(shuō)一下,這是個(gè)大問(wèn)題,所有要自己寫(xiě)插件的,編輯別人的插件自己用的,需要修改模版的(這條估計(jì)每個(gè)人都需要吧),最好了解一下上面的知識(shí),免得出現(xiàn)問(wèn)題時(shí)不知所措。
php技術(shù):php讀取csv文件后,uft8 bom導(dǎo)致在頁(yè)面上顯示出現(xiàn)問(wèn)題的解決方法,轉(zhuǎn)載需保留來(lái)源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。