|
function binsearch(&$arr, $key, $value)
{
$low = 0;
$high = count($arr);
while ($low <= $high) {
$mid = floor($low + ($high - $low) / 2);
$item = $arr[$mid][$key];
if ($item == $value) {
return $mid;
} else if ($value > $item) {
$low = $mid + 1;
} else {
$high = $mid - 1;
}
}
return false;
}
在這里,$mid 采用了先減后加的方法計(jì)算,目的是為了防止整數(shù)的溢出。不是故意寫復(fù)雜了。
我用下面的代碼進(jìn)行測試:
復(fù)制代碼 代碼如下:
$data = array();
for ($i = 0; $i < 1000000; $i++)
{
$data[] = array("sq" => $i * 2);
}
var_dump(binsearch($data, "sq", 10000));
發(fā)現(xiàn),binsearch 的時(shí)候,總是要花個(gè) 0.2s左右。理論上來說,100萬的數(shù)據(jù),最多也就是循環(huán)20次。怎么會這樣慢呢。
后來監(jiān)控了一下內(nèi)存,data 數(shù)組 占用了 230M 的內(nèi)存。而 binsearch 的時(shí)候,占用了60K 的內(nèi)存。但是,理論上來說,binsearch
不應(yīng)該占用如此多的內(nèi)存。因?yàn)椋矣X得,我已經(jīng)用引用了,根本就沒有對data 的結(jié)構(gòu)進(jìn)行修改。
我也是百思不得其解,后來,我把引用參數(shù)去掉,居然 binsearch 只要 0.0002s ,看來是引用耗費(fèi)了大量的cpu 資源。
php 內(nèi)部遵循一個(gè)copy on write 的原則。實(shí)際上這個(gè)引用是多余的。
但是為什么,加了引用速度會變慢呢?今天重點(diǎn)就談?wù)勥@個(gè)問題。明白道理后,大家一定知道怎么用引用了。
如果在binsearch 調(diào)用前,直接 $a = &$data,這個(gè)引用的速度會非常的快。看來肯定不是引用本身產(chǎn)生的問題。
這個(gè)問題,實(shí)際上涉及了zend 引擎如何管理php變量。
先看下面的問題:
復(fù)制代碼 代碼如下:
<?php
function demo(&$a, &$b) { $a =& $b; }
$a = 1;
$b = 2;
demo($a, $b);
$b = 3;
print $a;
?>
$a 輸出是多少呢?不錯(cuò),是2. 不過,我一開始覺得是3。
那么怎么解釋上面這個(gè)問題呢?
實(shí)際上,函數(shù)的參數(shù)引用是這樣進(jìn)行的。
復(fù)制代碼 代碼如下:
$tmp = $a;
$a1 = &$tmp;
$a = $tmp;
unset($a1, $tmp);
這里,引用的實(shí)際上是一個(gè)臨時(shí)變量。這個(gè)時(shí)候,$tmp 是帶引用屬性的,而$a 變量不是帶引用屬性的。
根據(jù)zend引擎管理內(nèi)存的方法,在內(nèi)部,不能用一個(gè)zval 來表示,必須強(qiáng)制分離這個(gè)zval。
用這樣的理解方法,上面的問題就解決了。函數(shù)內(nèi)部,不會改變函數(shù)外部的引用特性。這也是php
不贊成用 calltime_by_ref 的原因,而選擇上面如此低效的拷貝方法。
下面的分析,也能證明,在傳遞參數(shù)時(shí),的確發(fā)生了拷貝。
在 binsearch 函數(shù)里面。
$data[0] = 1;
這樣,就會發(fā)生一次$data 所在zval 的拷貝。內(nèi)存使用量 就是 60K。和函數(shù)調(diào)用加引用一模一樣。
可能很多人會疑問,為什么不是多了230M呢,這其實(shí)就是php的高明之處,數(shù)組Key 對應(yīng)的是一個(gè)zval的指針。(內(nèi)部是一個(gè)哈希表)
所以,只要把這些指針復(fù)制一遍就就好了,數(shù)據(jù)不用復(fù)制。但是,100萬的php 哈希表實(shí)際上要占用 50M 內(nèi)存。為什么只有60K呢。
在 binsearch 函數(shù)的外面,運(yùn)行
復(fù)制代碼 代碼如下:
$t = $data;
$t[0] = 1;
unset($t);
果然,多了60K 的內(nèi)存。估計(jì)和php的內(nèi)存管理機(jī)制有關(guān)系。
現(xiàn)在一切都明白了吧!今天,想了好幾個(gè)小時(shí),才把這個(gè)問題想通,不敢獨(dú)享。
函數(shù)中的引用不是給你傳參數(shù)方便的,而是讓你實(shí)現(xiàn),一個(gè)函數(shù),可以有多個(gè)返回值的,所以,最好不要畫蛇添足。
實(shí)際上,用引用它會降低性能。
php技術(shù):PHP 引用是個(gè)壞習(xí)慣,轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。