|
復制代碼 代碼如下:
<?php
//編碼UTF-8
echo strlen('測試文字a測試文字');
echo '-';
echo mb_strlen('測試文字a測試文字','utf-8');
?>
輸出:25-9
GB2312的中文字符串是二個字節
復制代碼 代碼如下:
<?php
//編碼GB2312
echo strlen('測試文字a測試文字');
echo '-';
echo mb_strlen('測試文字a測試文字','Gb2312');
?>
輸出:17-9
在Mysql數據庫(5.1以后的版本)中,如果字段類型為varchar(10)則可插入10個字符(不是字節);
所以在判斷字符串的長度時需要根據文檔編碼來區分。
符一個簡單的UTF-8下字符串截取(按字符個數截取)
復制代碼 代碼如下:
<?
/*
* UTF-8字符串截取
* $str 要截取的字串
* $start 截取起始位置
* $length 截取長度
*/
function cutStr($str,$start,$length) {
$restr = '';
$j = 0;
$end = $length + $start - 1;
$plen = strlen($str);
for($i=0;$i<$plen;$i++) {
$restr .= ord($str[$i])>127 ? $str[$i].$str[++$i].$str[++$i] : $str[$i];
$j++;
if ($j < $start){$restr = '';}
if ($j >= $end){break;}
}
$restr .='';
return $restr;
}
$str = '中新網9月24日電 二十國集團(G20)領導人第三次金融峰會今日將在美國匹茲堡召開。';
echo $str;
echo '<br>';
echo utf8_substr($str,0,25);
echo '<br>';
?>
php技術:php 不同編碼下的字符串長度區分,轉載需保留來源!
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。