|
一,ord()函數(shù)的應(yīng)用
ord()函數(shù)用于返回一個字符的ASCII值,最基本的用法如獲取a 的ASCII值ord('a')返回 97,但在實際開發(fā)中,應(yīng)用最多的還是用于字符截取函數(shù)中獲取中文字符高低位編碼的十進(jìn)制數(shù),如常見的中文字符截取函數(shù)具體可看看phpWind或 Discuz!論壇源代碼中substrs()函數(shù)或cutstr()函數(shù),其原理就是通過ord()函數(shù)獲取字符的ASCII碼值,如果返回值大于 127則表示為中文字符的一半,再獲取后一半組合成一個完整字符,同時結(jié)合字符編碼如GBK或UTF-8等。
以GBK編碼為例利用ord()函數(shù)判斷中文字符返回各中文字符的ASCII值,代碼如下
復(fù)制代碼 代碼如下:
$string = "不要迷戀哥";
$length = strlen($string);
var_dump($string);//原始中文
var_dump($length);//長度
$result = array();
for($i=0;$i<$length;$i++){
if(ord($string[$i])>127){
$result[] = $string[$i].' '.$string[++$i];
}
}
var_dump($result);
代碼說明
1,定義一個變量$string,其值為字符串
2,獲取變量的長度(字節(jié)數(shù))
3,打印變量和變量的長度
4,通過for循環(huán)獲取變量的各個字節(jié)值,把一個漢字的兩個字節(jié)中間用空格隔開顯示。
結(jié)果如下圖
圖解:“不要迷戀哥”為5個漢字,共10個字節(jié)(一個漢字2個字節(jié)),分別打印各個字節(jié)無法正常顯示如上圖
初始值不變修改for循環(huán)部分代碼顯示各個字節(jié)ASCII值
復(fù)制代碼 代碼如下:
$result = array();
for($i=0;$i<$length;$i++){
if(ord($string[$i])>127){
$result[] = ord($string[$i]).' '.ord($string[++$i]);
}
}
var_dump($result);
如上代碼使用ord()函數(shù)打印各個字符的ASCII值,結(jié)果如下
通過ord()函數(shù)轉(zhuǎn)換后就能正常查看各個字符的ASCII值。
二,chr()函數(shù)的應(yīng)用
chr()函數(shù)的作用與ord()函數(shù)相反,用于返回指定的字符,如chr(97)返回a。
結(jié)合上面實例,只要獲取到中文字符的ASCII值,就可以通過chr()函數(shù)組裝出中文字符,代碼如下
復(fù)制代碼 代碼如下:
$string = "不要迷戀哥";
$length = strlen($string);
var_dump($string);//原始中文
var_dump($length);//長度
$result = array();
for($i=0;$i<$length;$i++){
if(ord($string[$i])>127){
$result[] = ord($string[$i]).' '.ord($string[++$i]);
}
}
var_dump($result);
foreach($result as $v){
$decs = explode(" ",$v);
echo chr($decs[0]).chr($decs[1]);
}
結(jié)果如下圖
如上代碼并沒有直接輸出中文字符,但打印出正常的漢字,其原理是首先獲取各個字節(jié)的ASCII值,通過chr()函數(shù)轉(zhuǎn)化為字節(jié),再把兩個字節(jié)組合起來就形成了一個完整的中文漢字。
通過對ord()與chr()函數(shù)的討論已經(jīng)初步了解了中文字符的編碼原理,了解GBK編碼中一個漢字二個字節(jié),使用ord()與chr()函數(shù)實現(xiàn)各字節(jié)轉(zhuǎn)換方法,請關(guān)注下一期中文字符編碼研究系列之中文字符編碼轉(zhuǎn)換原理。
參考資料
phpWind與Discuz截取字符函數(shù)substrs與cutstr性能比較
php技術(shù):PHP函數(shù)篇之掌握ord()與chr()函數(shù)應(yīng)用,轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。