一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

PHP統計nginx訪問日志中的搜索引擎抓取404鏈接頁面路徑

我在服務器上有每天切割nginx日志的習慣,所以針對每天各大搜索引擎來訪,總能記錄一些404頁面信息,傳統上我只是偶爾分析下日志,但是對于很多日志信息的朋友,人工來篩選可能不是一件容易的事情,這不我個人自己慢慢研究了一點點,針對谷歌、百度、搜搜、360搜索、宜搜、搜狗、必應等搜索引擎的404訪問生成為一個txt文本文件,直接上代碼test.php

復制代碼 代碼如下:
<?php
//訪問test.php?s=google
$domain='http://www.jb51.NET';
$spiders=array('baidu'=>'Baiduspider','360'=>'360Spider',
'google'=>'Googlebot','soso'=>'Sosospider','sogou'=>
'Sogou web spider','easou'=>'EasouSpider','bing'=>'bingbot');
 
$path='/home/nginx/logs/'.date('Y/m/').(date('d')-1).'/access_www.txt';
 
$s=$_GET['s'];
 
if(!array_key_exists($s,$spiders)) die();
$spider=$spiders[$s];
 
$file=$s.'_'.date('ym').(date('d')-1).'.txt';
if(!file_exists($file)){
    $in=file_get_contents($path);
    $pattern='/GET (.*) HTTP//1.1" 404.*'.$spider.'/';
    preg_match_all ( $pattern , $in , $matches );
    $out='';
    foreach($matches[1] as $k=>$v){
        $out.=$domain.$v."/r/n";
    }
    file_put_contents($file,$out);
}
 
$url=$domain.'/silian/'.$file;
echo $url;

好就這樣了。沒有什么高深的技術,只有動手寫的過程。

php技術PHP統計nginx訪問日志中的搜索引擎抓取404鏈接頁面路徑,轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 香蕉视频网页 | 国产乱码精品一区二区三区中 | 国产呦精品一区二区三区网站 | 久久久久久久免费 | 国产精品免费观看视频播放 | 99视频精品在线 | 日韩精品视频在线 | 2020年国产精品午夜福利在线观看 | 欧美亚洲国产另类 | 亚洲精品成人 | 亚洲成人77777| 一区二区三区高清不卡 | 国产成人盗摄精品 | 色天天综合色天天害人害己 | 亚洲精品福利在线观看 | 国产乱码一区二区三区四川人 | 精品久久久久久久久久久久久久久 | 国产免费精彩视频 | 日韩精品第一页 | 男人精品一线视频在线观看 | 99久久国产综合精品国 | 亚洲伊人久久综合 | 四虎永久在线精品免费观看地址 | 国产青草视频在线观看 | 久久精品亚瑟全部免费观看 | 欧美激情在线免费 | 一区二区三区免费视频 www | 夭天色综合 | 一个人免费播放在线视频看片 | 国产亚洲第一页 | 五月婷婷深爱五月 | 真实国产乱子伦视频 | 成人午夜免费福利视频 | 亚洲图片激情小说 | 久久精品视频一区 | 97色婷婷 | 成人免费在线观看视频 | 欧美成人三级大全 | 高清视频 一区二区三区四区 | 婷婷成人基地 | 亚洲第一黄色网址 |