一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

GD輸出漢字的函數(shù)的分析

    很早以前找到一個(gè)把GB碼轉(zhuǎn)化為UTF-8的函數(shù),配合一個(gè)GB到UNICODE的對(duì)照表(gb2312.txt),用于在GD中輸出漢字。后來(lái)發(fā)現(xiàn)在欲輸出的內(nèi)容中含有西文字符時(shí),會(huì)出現(xiàn)混亂。后來(lái)找到了修改后的代碼,解決了問(wèn)題。現(xiàn)將兩個(gè)函數(shù)做一對(duì)比分析如下。

首先,這是一個(gè)UNICODE到UTF-8編碼轉(zhuǎn)換的函數(shù),這一部分修改前后沒(méi)有變化:
function u2utf8($c)
{
for($i=0;$i<count($c);$i++)
$str="";
if ($c < 0x80) {
$str.=$c;
}
else if ($c < 0x800) {
$str.=(0xC0 | $c>>6);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x10000) {
$str.=(0xE0 | $c>>12);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
else if ($c < 0x200000) {
$str.=(0xF0 | $c>>18);
$str.=(0x80 | $c>>12 & 0x3F);
$str.=(0x80 | $c>>6 & 0x3F);
$str.=(0x80 | $c & 0x3F);
}
return $str;
}

這里完全是按照UTF-8編碼的規(guī)則,通過(guò)判斷字符屬于不同的UNICODE編碼段范圍,進(jìn)行不同的移位和位與操作,以轉(zhuǎn)化為UTF-8編碼。關(guān)于該規(guī)則可參考http://www.utf8.org/上的說(shuō)明。

這是修改前的GB轉(zhuǎn)化為UTF-8編碼的函數(shù),其中調(diào)用了上面的u2utf8函數(shù)。
function gb2utf8($gb)     /* Program writen by sadly www.phpx.com  */
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
}
else
{
$gb=substr($gb,1,strlen($gb));
$utf8.=u2utf8(substr($gb,0,1));
}
}

$ret="";
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));

return $ret;
}
函數(shù)中while循環(huán)部分,把漢字逐個(gè)按照“對(duì)照表”轉(zhuǎn)化為UNICODE,再通過(guò)u2utf8函數(shù)轉(zhuǎn)化為UTF-8。但從中可以看出,while循環(huán)結(jié)束后,又用一個(gè)for循環(huán),把每三個(gè)字節(jié)合成了一個(gè)UTF-8字符(見(jiàn)http://www.utf8.org/上的規(guī)則說(shuō)明,每個(gè)漢字的UTF-8編碼為三字節(jié)),沒(méi)有考慮到其中的西文字符(西文字符的UTF-8編碼為一字節(jié))。所以,如果欲輸出的內(nèi)容中不論是開(kāi)始時(shí)出現(xiàn)西文字符,或是漢字當(dāng)中穿插西文字符,轉(zhuǎn)化為UTF-8后,都會(huì)被按照“每三個(gè)字節(jié)截取”的方式截開(kāi),導(dǎo)致亂碼。


以下是修改后的函數(shù):
function gb2utf8($gb)    /* Program writen by sadly   modified by agun */
{
if(!trim($gb))
return $gb;
$filename="gb2312.txt";
$tmp=file($filename);
$codetable=array();
while(list($key,$value)=each($tmp))
$codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

$ret="";
$utf8="";
while($gb)
{
if (ord(substr($gb,0,1))>127)
{
$this=substr($gb,0,2);
$gb=substr($gb,2,strlen($gb));
$utf8=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
for($i=0;$i<strlen($utf8);$i+=3)
$ret.=chr(substr($utf8,$i,3));
}
else
{
$ret.=substr($gb,0,1);
$gb=substr($gb,1,strlen($gb));
}
}
return $ret;
}

修改后的函數(shù)將 GB轉(zhuǎn)化為UNICODE、UNICODE轉(zhuǎn)化為UTF-8、幾個(gè)字節(jié)合成一個(gè)UTF-8字符,這三個(gè)步驟在一個(gè)循環(huán)里完成,尤其是幾個(gè)字節(jié)合成一個(gè)UTF-8字符這一步驟,放在判斷了字符屬于西文還是屬于漢字的條件分支里,據(jù)此決定截取一個(gè)字節(jié)還是三個(gè)字節(jié)。于是結(jié)果正確了!

php技術(shù)GD輸出漢字的函數(shù)的分析,轉(zhuǎn)載需保留來(lái)源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 久久精品视频99精品视频150 | 欧美日韩国产一区二区三区在线观看 | 涩涩涩爱 | 韩国三日本三级中文字幕 | 亚洲欧洲精品成人久久曰影片 | 在线视频一区二区三区在线播放 | 2022年国产精品久久久久 | 精品国产美女福利在线 | 国产成人mv在线观看入口视频 | 四虎国产精品免费视 | 香蕉成人国产精品免费看网站 | 91白丝制服被啪到喷水在线 | 国内精品福利 | 九九99re在线视频精品免费 | 国产精品久久久久久久久鸭 | 久久亚洲国产成人亚 | 久久久久综合中文字幕 | 手机在线亚洲 | 午夜小视频在线观看 | 色偷偷尼玛图亚洲综合 | 青青国产成人久久激情911 | 免费国产成人午夜在线观看 | 狠狠色做五月深爱婷婷 | 国产高清精品91在线 | 国产网红在线观看 | 亚洲人体视频 | 国产91av在线| 色婷婷久久合月综 | 五月天综合色 | 精品伊人久久大线蕉色首页 | 亚洲区激情区图片小说区 | 亚洲综合色一区二区三区另类 | 国产成人高清 | 亚洲国产色婷婷精品综合在线观看 | 免费视频一区二区 | 99久久精品免费看国产一区二区三区 | www.麻豆91| 手机看片www xiao2b cm | 国产在线精品美女观看 | 欧美日韩中文国产一区二区三区 | 国产精品久久久久久久久齐齐 |