|
比如:
復(fù)制代碼 代碼如下:
<?php
$arr['laruence'] = 'huixinchen';
$arr['yahoo'] = 2007;
$arr['baidu'] = 2008;
foreach ($arr as $key => $val) {
//結(jié)果是什么?
}
又比如:
復(fù)制代碼 代碼如下:
<?php
$arr[2] = 'huixinchen';
$arr[1] = 2007;
$arr[0] = 2008;
foreach ($arr as $key => $val) {
//現(xiàn)在結(jié)果又是什么?
}
要完全了解清楚這個(gè)問題, 我想首先應(yīng)該要大家了解php數(shù)組的內(nèi)部實(shí)現(xiàn)結(jié)構(gòu)………
php的數(shù)組
在php中, 數(shù)組是用一種HASH結(jié)構(gòu)(HashTable)來實(shí)現(xiàn)的, php使用了一些機(jī)制, 使得可以在O(1)的時(shí)間復(fù)雜度下實(shí)現(xiàn)數(shù)組的增刪, 并同時(shí)支持線性遍歷和隨機(jī)訪問.
之前的文章中也討論過, php的HASH算法, 基于此, 我們做進(jìn)一步的延伸.
認(rèn)識(shí)HashTable之前, 首先讓我們看看HashTable的結(jié)構(gòu)定義, 我加了注釋方便大家理解:
復(fù)制代碼 代碼如下:
typedef struct _hashtable {
uint nTableSize; /* 散列表大小, Hash值的區(qū)間 */
uint nTableMask; /* 等于nTableSize -1, 用于快速定位 */
uint nNumOfElements; /* HashTable中實(shí)際元素的個(gè)數(shù) */
ulong nNextFreeElement; /* 下個(gè)空閑可用位置的數(shù)字索引 */
Bucket *pInternalPointer; /* 內(nèi)部位置指針, 會(huì)被reset, current這些遍歷函數(shù)使用 */
Bucket *pListHead; /* 頭元素, 用于線性遍歷 */
Bucket *pListTail; /* 尾元素, 用于線性遍歷 */
Bucket **arBuckets; /* 實(shí)際的存儲(chǔ)容器 */
dtor_func_t pDestructor;/* 元素的析構(gòu)函數(shù)(指針) */
zend_bool persistent;
unsigned char nApplyCount; /* 循環(huán)遍歷保護(hù) */
zend_bool bApplyProtection;
#if ZEND_DEBUG
int inconsistent;
#endif
} HashTable;
關(guān)于nApplyCount的意義, 我們可以通過一個(gè)例子來了解:
復(fù)制代碼 代碼如下:
<?php
$arr = array(1,2,3,4,5,);
$arr[] = &$arr;
var_export($arr); //Fatal error: Nesting level too deep - recursive dependency?
這個(gè)字段就是為了防治循環(huán)引用導(dǎo)致的無(wú)限循環(huán)而設(shè)立的.
查看上面的結(jié)構(gòu), 可以看出, 對(duì)于HashTable, 關(guān)鍵元素就是arBuckets了, 這個(gè)是實(shí)際存儲(chǔ)的容器, 讓我們來看看它的結(jié)構(gòu)定義:
復(fù)制代碼 代碼如下:
typedef struct bucket {
ulong h; /* 數(shù)字索引/hash值 */
uint nKeyLength; /* 字符索引的長(zhǎng)度 */
void *pData; /* 數(shù)據(jù) */
void *pDataPtr; /* 數(shù)據(jù)指針 */
struct bucket *pListNext; /* 下一個(gè)元素, 用于線性遍歷 */
struct bucket *pListLast; /* 上一個(gè)元素, 用于線性遍歷 */
struct bucket *pNext; /* 處于同一個(gè)拉鏈中的下一個(gè)元素 */
struct bucket *pLast; /* 處于同一拉鏈中的上一個(gè)元素 */
char arKey[1]; /* 節(jié)省內(nèi)存,方便初始化的技巧 */
} Bucket;
我們注意到, 最后一個(gè)元素, 這個(gè)是flexible array技巧, 可以節(jié)省內(nèi)存,和方便初始化的一種做法, 有興趣的朋友可以google flexible array.
h是元素的Hash值,對(duì)于數(shù)字索引的元素,h為直接索引值(通過nKeyLength=0來表示是數(shù)字索引).而對(duì)于字符串索引來說, 索引值保存在arKey中, 索引的長(zhǎng)度保存在nKeyLength中.
在Bucket中,實(shí)際的數(shù)據(jù)是保存在pData指針指向的內(nèi)存塊中,通常這個(gè)內(nèi)存塊是系統(tǒng)另外分配的。但有一種情況例外,就是當(dāng)Bucket保存 的數(shù)據(jù)是一個(gè)指針時(shí),HashTable將不會(huì)另外請(qǐng)求系統(tǒng)分配空間來保存這個(gè)指針,而是直接將該指針保存到pDataPtr中,然后再將pData指向本結(jié)構(gòu)成員的地址。這樣可以提高效率,減少內(nèi)存碎片。由此我們可以看到php HashTable設(shè)計(jì)的精妙之處。如果Bucket中的數(shù)據(jù)不是一個(gè)指針,pDataPtr為NULL(本段來自Altair的”Zend HashTable詳解”)
結(jié)合上面的HashTable結(jié)構(gòu), 我們來說明下HashTable的總結(jié)構(gòu)圖:

HashTable的pListhHead指向線性列表形式下的第一個(gè)元素, 上圖中是元素1, pListTail指向的是最后一個(gè)元素0, 而對(duì)于每一個(gè)元素pListNext就是紅色線條畫出的線性結(jié)構(gòu)的下一個(gè)元素, 而pListLast是上一個(gè)元素.
pInternalPointer指向當(dāng)前的內(nèi)部指針的位置, 在對(duì)數(shù)組進(jìn)行順序遍歷的時(shí)候, 這個(gè)指針指明了當(dāng)前的元素.
當(dāng)在線性(順序)遍歷的時(shí)候, 就會(huì)從pListHead開始, 順著Bucket中的pListNext/pListLast, 根據(jù)移動(dòng)pInternalPointer, 來實(shí)現(xiàn)對(duì)所有元素的線性遍歷.
比如, 對(duì)于foreach, 如果我們查看它生成的opcode序列, 我們可以發(fā)現(xiàn), 在foreach之前, 會(huì)首先有個(gè)FE_RESET來重置數(shù)組的內(nèi)部指針, 也就是pInternalPointer(關(guān)于foreach可以參看深入理解php原理之foreach), 然后通過每次FE_FETCH來遞增pInternalPointer,從而實(shí)現(xiàn)順序遍歷.
類似的, 當(dāng)我們使用, each/next系列函數(shù)來遍歷的時(shí)候, 也是通過移動(dòng)數(shù)組的內(nèi)部指針而實(shí)現(xiàn)了順序遍歷, 這里有一個(gè)問題, 比如:
復(fù)制代碼 代碼如下:
<?php
$arr = array(1,2,3,4,5);
foreach ($arr as $v) {
//可以獲取
}
while (list($key, $v) = each($arr)) {
//獲取不到
}
?>
了解到我剛才介紹的知識(shí), 那么這個(gè)問題也就很明朗了, 因?yàn)閒oreach會(huì)自動(dòng)reset, 而while這塊不會(huì)reset, 所以在foreach結(jié)束以后, pInternalPointer指向數(shù)組最末端, while語(yǔ)句塊當(dāng)然訪問不到了, 解決的辦法就是在each之前, 先reset數(shù)組的內(nèi)部指針.
而在隨機(jī)訪問的時(shí)候, 就會(huì)通過hash值確定在hash數(shù)組中的頭指針位置, 然后通過pNext/pLast來找到特點(diǎn)元素.
增加元素的時(shí)候, 元素會(huì)插在相同Hash元素鏈的頭部和線性列表的尾部. 也就是說, 元素在線性遍歷的時(shí)候是根據(jù)插入的先后順序來遍歷的, 這個(gè)特殊的設(shè)計(jì)使得在php中,當(dāng)使用數(shù)字索引時(shí), 元素的先后順序是由添加的順序決定的,而不是索引順序.
也就是說, php中遍歷數(shù)組的順序, 是和元素的添加先后相關(guān)的, 那么, 現(xiàn)在我們就很清楚的知道, 文章開頭的問題的輸出是:
復(fù)制代碼 代碼如下:
huixinchen
2007
2008
所以, 如果你想在數(shù)字索引的數(shù)組中按照索引大小遍歷, 那么你就應(yīng)該使用for, 而不是foreach
復(fù)制代碼 代碼如下:
for($i=0,$l=count($arr); $i<$l; $i++) {
//這個(gè)時(shí)候,不能認(rèn)為是順序遍歷(線性遍歷)
}
原文:http://www.laruence.com/2009/08/23/1065.html
php技術(shù):深入理解PHP之?dāng)?shù)組(遍歷順序) Laruence原創(chuàng),轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。