一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

php 短鏈接算法收集與分析

短鏈接就不說了,大家已經(jīng)都清楚了,如下所示就是短鏈接:
新浪微博 http://t.cn/SVpONM
騰訊微博 http://url.cn/302yor
Yun.io http://d.yun.io/PNri2v
短鏈接的好處:1、內(nèi)容需要;2、用戶友好;3、便于管理。
如何實(shí)現(xiàn)呢,大概有三個(gè)步驟:
1、定義一個(gè)URL映射算法,可以將長的URL映射成短字符串;
2、使用一個(gè)存儲(chǔ)(數(shù)據(jù)庫?NoSQL?)來存儲(chǔ)完成的映射;
3、實(shí)現(xiàn)自己的URL映射算法;
一般來說,第三步是我們比較頭疼的,如何將一個(gè)長的URL字符串,映射成一個(gè)較短的字符串呢。我總結(jié)了三種辦法:
普通實(shí)現(xiàn)
我想以前大家學(xué)習(xí)過十進(jìn)制和二進(jìn)制的互相轉(zhuǎn)換,或者十進(jìn)制和十六進(jìn)制的互相轉(zhuǎn)換,那么為了更短,我們可以使用62進(jìn)制,對于一個(gè)數(shù)字ID進(jìn)行轉(zhuǎn)碼,轉(zhuǎn)換成一個(gè)短字符串。
這種做法的缺點(diǎn)是沒有辦法保證所有鏈接都是固定的位數(shù)的長度,而且在高并發(fā)的情況下,如何保證能夠快速分發(fā)是個(gè)問題。
具體實(shí)現(xiàn)方法:
復(fù)制代碼 代碼如下:
/**
* 利用62進(jìn)制對數(shù)字ID進(jìn)行短鏈接編碼,缺點(diǎn)不能保證每個(gè)短鏈接是固定長度
*
* @author wanshiqiang<wangshiqiang@360.cn>
* @param integer $integer
* @param string $base
*/
private function getShortenedURLFromID ($integer, $base = ALLOWED_CHARS)
{
$length = strlen($base);
while($integer > $length - 1)
{
$out = $base[fmod($integer, $length)] . $out;
$integer = floor( $integer / $length );
}
return $base[$integer] . $out;
}
/**
* 對62進(jìn)制編碼的短鏈接進(jìn)行解碼
*
* @author wangshiqiang<wangshiqiang@360.cn>
* @param string $string
* @param string $base
*/
private function getIDFromShortenedURL ($string, $base = ALLOWED_CHARS)
{
$length = strlen($base);
$size = strlen($string) - 1;
$string = str_split($string);
$out = strpos($base, array_pop($string));
foreach($string as $i => $char)
{
$out += strpos($base, $char) * pow($length, $size - $i);
}
return $out;
}

文藝實(shí)現(xiàn)
算法描述:使用6個(gè)字符來表示短鏈接,我們使用ASCII字符中的'a'-'z','0'-'5',共計(jì)32個(gè)字符做為集合。每個(gè)字符有32種狀態(tài),六個(gè)字符就可以表示32^6(1073741824),那么如何得到這六個(gè)字符,描述如下:
對傳入的長URL進(jìn)行Md5,得到一個(gè)32位的字符串,這個(gè)字符串變化很多,是16的32次方,基本上可以保證唯一性。將這32位分成四份,每一份8個(gè)字符,這時(shí)機(jī)率變成了16的8次方,是4294967296,這個(gè)數(shù)字碰撞的機(jī)率也比較小啦,關(guān)鍵是后面的一次處理。我們將這個(gè)8位的字符認(rèn)為是16進(jìn)制整數(shù),也就是1*('0x'.$val),然后取0-30位,每5個(gè)一組,算出他的整數(shù)值,然后映射到我們準(zhǔn)備的32個(gè)字符中,最后就能夠得到一個(gè)6位的短鏈接地址。
php實(shí)現(xiàn)如下:
復(fù)制代碼 代碼如下:
function shorten( $long_url )
{
$base32 = "abcdefghijklmnopqrstuvwxyz012345";
$hex = md5( $long_url );
$hexLen = strlen( $hex );
$subHexLen = $hexLen / 8;
$output = array();
for( $i = 0; $i < $subHexLen; $i++ )
{
$subHex = substr( $hex, $i * 8, 8 );
$subHex = 0x3FFFFFFF & ( 1 * ('0x' . $subHex ) );
    $out = '';
for( $j = 0; $j < 6; $j++ )
{
$val = 0x0000001F & $int;
$out .= $base32[$val];
$int = $int >> 5;
}
$output[] = $out;
}
return $output;
}

二逼實(shí)現(xiàn)
下面這個(gè)函數(shù)使用了純隨機(jī)的方式來生成一個(gè)短鏈接,雖然我們可以通過查詢操作來確保不重復(fù)使用短鏈接,可是... 這樣真的靠譜嗎~~
復(fù)制代碼 代碼如下:
function random($length, $pool = '') {
$random = '';
if (empty($pool)) { $pool = 'abcdefghkmnpqrstuvwxyz'; $pool .=
'23456789'; }
srand ((double)microtime()*1000000);
for($i = 0; $i < $length; $i++) { $random .=
substr($pool,(rand()%(strlen ($pool))), 1); }
return $random;
}

Technorati 標(biāo)簽: 短鏈接,Short Url,映射,哈希

參考資料:

1、微博短地址原理解析

2、微博短域名原理及作用

3、Yours.org

4、Free php URL Shorten script that kicks ass

5、php Short Url Algorithm Implementation

6、Implement your own short URL

7、短網(wǎng)址算法初步匯總

8、Short Url 實(shí)現(xiàn)方式

php技術(shù)php 短鏈接算法收集與分析,轉(zhuǎn)載需保留來源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 成人精品久久 | 精品久久久久久久免费加勒比 | 六月丁香久久 | 久久亚洲精品国产精品婷婷 | 黄色免费视屏 | 日韩欧美国产三级 | 午夜福利毛片 | 97色婷婷成人综合在线观看 | 思思玖玖玖在线精品视频 | 美女胸免费视频网站 | 久久久久久久久久免观看 | 国产亚洲精品国产福利在线观看 | 亚洲视频一区二区 | 国内精品免费一区二区观看 | 亚洲综合久久久 | 欧美黄一级 | 97麻豆精品国产自产在线观看 | 亚洲卡5卡6卡7国色天香 | 国产线视频精品免费观看视频 | 国产激情一级毛片久久久 | 国产成人精视频在线观看免费 | 一区二区美女视频 | 久久国产99 | 亚洲六月丁香婷婷综合 | 免费国产叼嘿视频在线观看 | 加勒比高清在线 | 91老师国产黑色丝袜在线 | 国产免费午夜 | 四虎永久在线精品视频免费观看 | 久久伊人热精品老鸭窝 | 一二三四视频社区5在线高清视频 | 亚洲欧美婷婷 | 国产精品久久久久久吹潮 | 午夜激情视频在线 | 日韩天堂视频 | 99视频精品全部在线播放 | 韩日美女 | 国产午夜精品久久久久小说 | 亚洲福利秒拍一区二区 | 中文字幕在线观看一区 | 久青草国产手机在线视频 |