一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

PHP HTML代碼串 截取實現代碼

而且給的數據是HTML代碼串,比如這樣:

<div class=”aaa”><a href=”/aaa.php?id=1″>張三</a>  評論了 <a href=”/aaa.php?id=444″>李四</a> 分享的 <a href=”bbb.html”>一篇文章文章一長串的東西</a></div>

截取的時候是要截取 div 標簽內部的東西,而且要保留HTML標簽,只是對其中的文字做處理。比如我可能只是截取到“李四”的“李”字,但是如果就這樣放到前端的話,“李四”前面的 a 標簽是沒有閉合的,所以截取之后要保證HTML的語法正確。

這個問題確實不太好搞,讓我郁悶了兩天。請注意,這只是一個字符串,只不過內容是HTML代碼,是沒有什么DOM的。如果是在前端處理就好辦了,直接DOM獲取,然后對里面的節點進行處理,最后把innerHTML 之類的東西輸出就搞定了?,F在可不行了,得換個思路。同事的思路是這樣的:

遍歷字符串的每一個字符。設置一個標記,碰到標簽開始的標記< 就置為1,接下來的字符都不記數,然后碰到>之后再開始計數。對標簽內部的字符串處理的時候,還要先判斷當前字符的編碼是不是可能是中文,一般來說php中 UTF-8 編碼的中文字符的長度都是3,所以如果碰到是中文字符編碼,就要跳過兩個不記數……說到這里我自己頭已經開始大了。個人認為這種方法很不爽,首先這種精致的邏輯不太容易控制,而且 UFT-8 編碼下中文產生的長度有可能是3個或4個 所以代碼的嚴密性值得懷疑。

我個人的思路是,用 Tidy 來搞(具體用法請看php手冊吧)。昨天研究了一下那個 Tidy ,發現這個東西還是挺好用的。首先,把這個字符串轉換成 Tidy 對象,這樣:

$tidy = tidy_parse_string($str, array(), ‘utf8′);  // 最后一個是設置編碼的,注意,這里是utf8 ,不是utf-8,沒有中間那個連線。

然后獲取$tidy中的 body(因為轉換之后$tidy會自動加上<head><body>等標簽):

$body =  tidy_get_body($tidy);

這個時候你可以用 var_dump 看一些 $body 的結構,會發現它把每個標簽都變成了一個對應的對象,里面有相應的屬性。舉例來說,比如 <a href=”#”>sdf</a> ,這么一條語句對應的一些屬性有:

name=>”a”
value => “<a href=”#”>sdf</a>”
child=> array{[0]=>一個文本節點對象,value是 sdf}
attribute=array{”href”=>”#”}
…..其他屬性

可以看到,我們其實是可以單獨去處理 a 標簽對應節點下面的文字節點的值的,那樣就不會破壞任何HTML完整性。原來我以為改變 a 標簽中文字節點的值之后, a 標簽的value也會跟著改變,那樣我直接返回a標簽對應節點的value就OK了,沒想到不是那個樣子,哎,所以處理過其中的文字之后還是要自己拼出新的HTML。

知道了Tidy對象的結構之后,一切就好辦了,只要遍歷所有的節點,對于本需求來說,就是找到那個 div 標簽,然后開始處理里面的節點。代碼如下:

if(mb_strwidth($subchild->value, ‘utf-8′) >= $len)
{
$subchild->value = mb_strimwidth($subchild->value, 0, $len, ‘…', ‘utf-8′);
$trimed_str .= $subchild->value;
break;
}
else
{
$trimed_str .= $subchild->value;
$len = $len - mb_strwidth($subchild->value, ‘utf-8′);
}

里面的$subchild 就是一個子節點。注意,這里使用了 mb_strwidth 來獲取字符串長度。嚴重推薦一下這個 mb_strwidth,很好用,它會把中文當作兩個字符長度處理,正好符合這里的需求!而且截取字符串的時候用到了 mb_strimwidth,這個函數也會把中文當作兩個字符長度處理,mb_ 開頭的函數真是好用啊。

具體代碼我就不寫出來了,因為是針對一個需求寫的,沒做成通用的形式。哪天我有時間做成通用的再發布一下。

另外,可惜FireFox不支持 text-overflow 屬性,不然也不用后臺那么辛苦地去截斷了。如果大家有更好的方法,歡迎提出!不勝感激。

php技術PHP HTML代碼串 截取實現代碼,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 免费观看成人鲁鲁鲁鲁鲁视频 | 精品一区二区三区在线视频 | 91手机视频在线 | 男人进去女人爽免费视频国产 | 亚洲综合激情九月婷婷 | 毛片美女 | 免费国产成人手机在线观看 | 九九午夜 | 国产精品美女在线观看 | 五月开心六月伊人色婷婷 | 成人精品第一区二区三区 | 午夜精品一区二区三区在线观看 | 亚洲图片欧美激情 | 91资源在线| 婷婷色在线视频 | 国产美女毛片 | 九九视频这里只有精品 | 国产精品青草久久久久福利99 | 五月婷婷影视 | 四虎在线观看免费视频 | 四虎8848精品永久在线观看 | 久久国内精品自在自线400部o | 亚洲一区二区观看 | 中文字幕123 | 色欧美视频 | 四虎中文| 很黄的网站在线观看 | 精品三级网站 | 国产小视频你懂的 | 久久精品爱国产免费久久 | 亚洲图片小说网 | 成 人网站免费 | 色v在线| 国产女人一区二区 | 久热爱精品视频在线观看久爱 | 国产女同一区二区三区五区 | 欧美一区二区激情视频 | 亚洲综合三区 | 九九视频高清视频免费观看 | 韩国一大片a毛片 | 欧美特黄特色aaa大片免费看 |