|
對(duì)于數(shù)百萬(wàn)條數(shù)據(jù)量的CSV文件,文件大小可能達(dá)到數(shù)百M(fèi),如果簡(jiǎn)單讀取的話(huà)很可能出現(xiàn)超時(shí)或者卡死的現(xiàn)象。
為了成功將CSV文件里的數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫(kù),分批處理是非常必要的。
下面這個(gè)函數(shù)是讀取CSV文件中指定的某幾行數(shù)據(jù):
復(fù)制代碼 代碼如下:
/**
* csv_get_lines 讀取CSV文件中的某幾行數(shù)據(jù)
* @param $csvfile csv文件路徑
* @param $lines 讀取行數(shù)
* @param $offset 起始行數(shù)
* @return array
* */
function csv_get_lines($csvfile, $lines, $offset = 0) {
if(!$fp = fopen($csvfile, 'r')) {
return false;
}
$i = $j = 0;
while (false !== ($line = fgets($fp))) {
if($i++ < $offset) {
continue;
}
break;
}
$data = array();
while(($j++ < $lines) && !feof($fp)) {
$data[] = fgetcsv($fp);
}
fclose($fp);
return $data;
}
調(diào)用方法:
復(fù)制代碼 代碼如下:
$data = csv_get_lines('path/bigfile.csv', 10, 2000000);
print_r($data);
函數(shù)主要采用行定位的思路,通過(guò)跳過(guò)起始行數(shù)來(lái)實(shí)現(xiàn)文件指針定位。
上述函數(shù)對(duì)500M以?xún)?nèi)的文件進(jìn)行過(guò)測(cè)試,運(yùn)行通暢,對(duì)于更大的文件未做測(cè)試,請(qǐng)斟酌使用或加以改進(jìn)。
php技術(shù):PHP按行讀取、處理較大CSV文件的代碼實(shí)例,轉(zhuǎn)載需保留來(lái)源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。