一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

PHP統(tǒng)計nginx訪問日志中的搜索引擎抓取404鏈接頁面路徑

我在服務(wù)器上有每天切割nginx日志的習(xí)慣,所以針對每天各大搜索引擎來訪,總能記錄一些404頁面信息,傳統(tǒng)上我只是偶爾分析下日志,但是對于很多日志信息的朋友,人工來篩選可能不是一件容易的事情,這不我個人自己慢慢研究了一點點,針對谷歌、百度、搜搜、360搜索、宜搜、搜狗、必應(yīng)等搜索引擎的404訪問生成為一個txt文本文件,直接上代碼test.php

復(fù)制代碼 代碼如下:
<?php
//訪問test.php?s=google
$domain='http://www.jb51.NET';
$spiders=array('baidu'=>'Baiduspider','360'=>'360Spider',
'google'=>'Googlebot','soso'=>'Sosospider','sogou'=>
'Sogou web spider','easou'=>'EasouSpider','bing'=>'bingbot');
 
$path='/home/nginx/logs/'.date('Y/m/').(date('d')-1).'/access_www.txt';
 
$s=$_GET['s'];
 
if(!array_key_exists($s,$spiders)) die();
$spider=$spiders[$s];
 
$file=$s.'_'.date('ym').(date('d')-1).'.txt';
if(!file_exists($file)){
    $in=file_get_contents($path);
    $pattern='/GET (.*) HTTP//1.1" 404.*'.$spider.'/';
    preg_match_all ( $pattern , $in , $matches );
    $out='';
    foreach($matches[1] as $k=>$v){
        $out.=$domain.$v."/r/n";
    }
    file_put_contents($file,$out);
}
 
$url=$domain.'/silian/'.$file;
echo $url;

好就這樣了。沒有什么高深的技術(shù),只有動手寫的過程。

php技術(shù)PHP統(tǒng)計nginx訪問日志中的搜索引擎抓取404鏈接頁面路徑,轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 国产精品手机在线观看 | 国产网站视频 | 中国女人一级毛片 | 欧美激情片在线观看 | 国产成人精品日本亚洲网址 | 久久久网站亚洲第一 | 在线观看免费福利 | 亚洲a区视频 | 麻豆久久精品免费看国产 | 黄色免费观看网站 | 国产综合精品久久亚洲 | 精品国产品国语在线不卡丶 | 国产成人精品一区二区秒拍 | 九九99久久精品影视 | 97在线精品视频 | 久热99这里只有精品视频6 | 日本欧美久久久久免费播放网 | gogo全球高清人体成人 | 8090碰成年女人免费碰碰尤物 | 午夜视频www| 精品国产福利第一区二区三区 | 国产精品手机在线亚洲 | 91www在线观看 | 久久精品无码一区二区日韩av | 欧洲一卡2卡三卡4卡免费观看 | 小说区视频区 | 禁断の肉体乱爱中文字幕欧 | 久久久久久久免费 | www.女人的天堂.com | 97精品久久久久中文字幕 | 欧美亚洲另类色国产综合 | 最新亚洲情黄在线网站 | 亚洲激情另类 | 精品久久久久久婷婷 | 黄色视屏在线播放 | 五月婷婷综合网 | 热伊人99re久久精品最新地 | 久久婷婷激情综合色综合也去 | 久久婷五月综合 | 亚洲精品人成网在线播放影院 | 色啦啦 |