|
火車頭免費(fèi)版本不支持采集結(jié)果的外掛處理,比如采用php來(lái)輔助處理結(jié)果,而火車頭本身對(duì)于正則表達(dá)式的不完整支持,
導(dǎo)致對(duì)于采集一些有混淆文字的內(nèi)容效果不好,那么咱們?cè)趺醋龅竭^(guò)濾那些混淆字串呢?
其實(shí)很簡(jiǎn)單--采用服務(wù)器端過(guò)濾
比如采集發(fā)送到服務(wù)器端是:
$_POST = array("subject"=> "這里是標(biāo)題","content"=> "<div class='1fadfafasfasdf'>混淆文字</div>這里是內(nèi)容");
在服務(wù)器端我們稍加處理:
$_POST["content"] = preg_replace("正則表達(dá)式","",$_POST["content"]);
就可以使用熟悉的工具完成工作。
有朋友說(shuō)了,我服務(wù)器端代碼是加密的怎么辦?
其實(shí)很簡(jiǎn)單 比如 add.php 加密 ,那么將add.php 改名為 add_ori.php
然后建立新的 add.php
<?
//處理上傳來(lái)的數(shù)據(jù)
....
include dirname(__FILE__)."/add_ori.php";
?>
這樣就可以了
php技術(shù):火車采集器 免費(fèi)版使出收費(fèi)版本功能實(shí)現(xiàn)原理,轉(zhuǎn)載需保留來(lái)源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。