荡女淫春未删减在线观看,黄色不良视频,五月天亭亭

事情的起源比較簡單，我需要把一個導(dǎo)航頁的數(shù)據(jù)整理好寫入數(shù)據(jù)庫。一個比較直觀的方法是對html文件進行分析，通用的方法是用php的正則表達式來匹配。但是這樣做開發(fā)和維護都很困難，代碼可讀性非常差。

導(dǎo)航頁的數(shù)據(jù)都是規(guī)則的排列在DOM樹當(dāng)中的，用JS可以用幾個循環(huán)輕松的對其進行操作，而且JS需要依賴瀏覽器，操作數(shù)據(jù)庫很困難。其實php就有現(xiàn)成的類庫對DOM樹種的節(jié)點進行增刪改查操作，在此做一些筆記。

這里涉及到2個類 DOMDocument 和 DOMXPath。

其實思路比較明確，就是通過DOMDocument將一個html file轉(zhuǎn)換成DOM樹的數(shù)據(jù)結(jié)構(gòu)，再用DOMXPath的實例去搜索這個DOM樹，拿到想要特定節(jié)點，接下來就可以對當(dāng)前節(jié)點的子樹進行遍歷，得到想要的結(jié)果。

在當(dāng)前目錄下有一個這樣一個導(dǎo)航的html文件 "./hao.html"

現(xiàn)在需要得到所有<a>標簽的中文內(nèi)容，php代碼如下：
復(fù)制代碼代碼如下:
<?php
//將html/xml文件轉(zhuǎn)換成DOM樹
$dom = new DOMDocument();
$dom->loadHTMLFile("hao.html");

//得到所有class為fix的dl標簽

// example 1: for everything with an id
//$elements = $xpath->query("http://*[@id]");

// example 2: for node data in a selected id
//$elements = $xpath->query("/html/body/div[@id='yourTagIdHere']");

// example 3: same as above with wildcard
//$elements = $xpath->query("*/div[@id='yourTagIdHere']");
$xpath = new DOMXPath($dom);
$dls = $xpath->query('//dl[@class="fix"]');

foreach ($dls as $dl) {
$spans = $dl->childNodes;
foreach ($spans as $span) {
echo trim($span->textContent)."/t";
}
echo "/n";
}
?>

輸出結(jié)果如下：

注意：值得注意的一點是DOMDocument的默認編碼方式是Latin，所以在處理utf編碼的中文的時候，需要在<head>后面緊跟著填入
復(fù)制代碼代碼如下:
<meta http-equiv="content-type" content="text/html; charset=utf-8">

在其他位置，或者是只寫上<meta content="charset=utf-8">都是不識別的哦

php技術(shù)：用PHP代替JS玩轉(zhuǎn)DOM的思路及示例代碼，轉(zhuǎn)載需保留來源！

鄭重聲明：本文版權(quán)歸原作者所有，轉(zhuǎn)載文章僅為傳播更多信息之目的，如作者信息標記有誤，請第一時間聯(lián)系我們修改或刪除，多謝。

一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

用PHP代替JS玩轉(zhuǎn)DOM的思路及示例代碼

相關(guān)文章閱讀