一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

基于PHP的簡單采集數據入庫程序

說到采集,無非就是遠程獲取信息->提取所需內容->分類存儲->讀取->展示

也算是簡單"小偷程序"的加強版吧

下面是對應核心代碼(別拿去做壞事哦^_^)

所要采集的內容是某游戲網站上的公告,如下圖:

可先利用file_get_contents和簡單正則獲取基本頁面信息

整理下基本信息,采集入庫:

<?php  include_once("conn.php");   if($_GET['id']<=8&&$_GET['id']){     $id=$_GET['id'];    $conn=file_get_contents("http://www.93moli.com/news_list_4_$id.html");//獲取頁面內容    $pattern="/<li><a title=/"(.*)/" target=/"_blank/" href=/"(.*)/">/iUs";//正則  preg_match_all($pattern, $conn, $arr);//匹配內容到arr數組  //print_r($arr);die;    foreach ($arr[1] as $key => $value) {//二維數組[2]對應id和[1]剛好一樣,利用起key    $url="http://www.93moli.com/".$arr[2][$key];    $sql="insert into list(title,url) value ('$value', '$url')";    mysql_query($sql);    //echo "<a href='content.php?url=http://www.93moli.com/$url'>$value</a>"."<br/>";    }   $id++;   echo "正在采集URL數據列表$id...請稍后...";   echo "<script>window.location='list.php?id=$id'</script>"; }else{   echo "采集數據結束。"; }?>

conn.php是數據庫連接文件

list.php是本頁面

由于要采集的數據是分頁顯示的,且頁面地址是規律遞增,所以我用了js跳轉代碼,利用id傳值控制采集的頁數,也避免了for循環數目過大。

輕輕松松數據入庫,下篇文章寫關于具體url采集信息的過程。

php技術基于PHP的簡單采集數據入庫程序,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 中文字幕在线视频在线看 | 天天躁日日躁成人字幕aⅴ 天天躁日日躁狠狠躁中文字幕老牛 | 久久成年片色大黄全免费网站 | 国产在线视频h | 四虎影视永久在线精品免费 | 婷婷亚洲视频 | 成年美女黄网站色大片视频 | 高清激情小视频在线观看 | 色综合久久综合欧美综合图片 | 久久国产亚洲 | 色网影院 | 国产a v高清一区二区三区 | 婷婷草 | 欧美黄色网页 | 色久悠悠色久在线观看 | 色优影院 | 色呦呦免费视频 | 久久久精品一区 | 国产精品第六页 | 精品一区二区三区波多野结衣 | 搞黄网站免费看 | 久久精品国产2020观看福利色 | 99午夜高清在线视频在观看 | 国产福利免费在线观看 | 国产精品欧美亚洲韩国日本不卡 | 精品久久久久久久久免费影院 | 99精品久久秒播无毒不卡 | 97青青草视频 | 看全黄大色黄大片老人做 | 米奇色网| 国产极品嫩模在线观看91精品 | 亚洲黄色在线播放 | 欧美黑人xxxxx性受 | 国产最新精品精品视频 | 国产 欧美 日产久久 | 一区二区视频在线播放 | 蜜月aⅴ免费一区二区三区 免播放器在线观看 | 99国产精品久久 | 香蕉成人999视频 | 婷婷久操| 精品久久久久久久一区二区伦理 |