一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

深入php數據采集的詳解

這里介紹兩個php采集能用到的好工具。一個是Snoopy,一個是simple_html_dom。采集還有很多方式(其實本質就2-3種,其他的都是衍生的),php自帶了幾個方法也能直接進行采集。但是,出于把懶惰進行到底的精神。我們還是可以通過這兩個工具,讓采集變得更簡單。

網上有不少介紹Snoopy的,下面是別人翻譯的Snoopy的SDK
//////////////////////////////////////////////////////////////
Snoopy是一個php類,用來模擬瀏覽器的功能,可以獲取網頁內容,發送表單。
Snoopy的一些特點:
1抓取網頁的內容 fetch
2抓取網頁的文本內容 (去除HTML標簽) fetchtext
3抓取網頁的鏈接,表單 fetchlinks fetchform
4支持代理主機
5支持基本的用戶名/密碼驗證
6支持設置 user_agent, referer(來路), cookies 和 header content(頭文件)
7支持瀏覽器重定向,并能控制重定向深度
8能把網頁中的鏈接擴展成高質量的url(默認)
9提交數據并且獲取返回值
10支持跟蹤HTML框架
11支持重定向的時候傳遞cookies
要求php4以上就可以了 由于本身是php一個類 無需擴支持 服務器不支持curl時候的最好選擇,
類方法:
fetch($URI)
――― 主站蜘蛛池模板: se97se成人亚洲网站 | 日韩一区精品 | 亚洲人欧洲日韩 | 色网站欧美 | 欧美日韩一区妖精视频yjsp | 国内精品91最新在线观看 | 色欧美与xxxxx | 一二三四视频社区5在线高清视频 | 国产精品伦理久久久久久 | 4hu44四虎在线观看 | 久久久国产一区二区三区丝袜 | 亚洲伦理一二三四 | 黄在线| 2021国产麻豆剧传媒精品网站 | 亚洲一道本 | 久久综合久久伊人 | 一二三四日本高清 | 91高清视频在线观看 | 热re66久久精品国产99re | 国产三级欧美 | 精品一区二区三区四区五区六区 | 久久香蕉国产精品一区二区三 | 亚洲全网成人资源在线观看 | 精品综合久久88色鬼首页 | 中国美女牲交一级毛片 | 久久中文字幕网 | 一区二区三区 亚洲区 | 国产乱码一区二区三区四川人 | 视频亚洲一区 | 成人开心激情 | 精品国产品国语在线不卡丶 | 久久中字 | 成人福利在线看 | 国产视频一区二区在线观看 | 91久久精品国产91久久性色tv | 玖玖免费| 东北普通话清晰对白 | 大杳蕉伊人狼人久久一本线 | 在线观看色视频 | 自偷自拍亚洲欧美清纯唯美 | 美女让男人插 |