|
在使用phpQuery采集網(wǎng)頁時(shí),遇到一個(gè)問題:在處理大量網(wǎng)頁之后,phpQuery占用的內(nèi)存數(shù)量非常驚人(很快就超過了1G),
比如這段代碼:
復(fù)制代碼 代碼如下:
while (true) {
phpQuery::newDocumentFile($htmlFile);
// 處理網(wǎng)頁元素...
echo memory_get_usage() . "/n";
}
謹(jǐn)慎運(yùn)行上面這段代碼,它會很快用光你的內(nèi)存。
經(jīng)過查看phpQuery的源代碼終于發(fā)現(xiàn)了問題所在,phpQuery在每處理一個(gè)網(wǎng)頁就會產(chǎn)生一個(gè)DOMDocumentWrapper 對象,而每個(gè)DOMDocumentWrapper 對象會被保存在靜態(tài)成員$documents中(phpQuery::createDocumentWrapper中),這個(gè)變量是一個(gè)數(shù)組,每解析一個(gè)網(wǎng)頁數(shù)組元素就增加一個(gè)。
phpQuery::$documents[$wrapper->id] = $wrapper;
找到問題后,解決就很容易了,每次解析完一個(gè)網(wǎng)頁,把phpQuery::$documents置空即可。
復(fù)制代碼 代碼如下:
while (true) {
phpQuery::newDocumentFile($htmlFile);
// 處理網(wǎng)頁元素...
phpQuery::$documents = array();
echo memory_get_usage() . "/n";
}
內(nèi)存占用穩(wěn)定了。
php技術(shù):phpQuery占用內(nèi)存過多的處理方法,轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。