一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

第4章 數據處理-php正則表達式-鄭阿奇(續)

1.正則表達式基礎知識
含義:由普通字符和(a-z)和一些特殊字符組成的字符串模式
功能:有效性驗證。
替換文本。
從一個字符串提取一個子字符串。
分類:POSIX和Perl
POSIX風格更容易掌握,但不能用于二進制模式,而perl相對比較復雜。
2.POSIX風格的正則表達式
1.編寫正則表達式
表4.3 POSIX正則表達式語法格式列表

字 符

描 述

/

轉義字符,用于轉義特殊字符。例如,'.'匹配單個字符,'/.'匹配一個點號。'/-'匹配連字符'-','//'匹配符號'/'

^

匹配輸入字符串的開始位置。例如'^he'表示以'he'開頭的字符串

$

匹配輸入字符串的結束位置。例如,'ok$'表示以'ok'結尾的字符串

*

匹配前面的子表達式零次或多次。例如,'zo*'能匹配"z"以及"zoo"。*等價于{0,}

+

匹配前面的子表達式一次或多次。例如,'zo+'能匹配"zo"以及"zoo",但不能匹配"z"。+等價于{1,}

?

匹配前面的子表達式零次或一次。例如,'do(es)?'可以匹配"do"或"does"中的"do"。'?'等價于{0,1}

{n}

n是一個非負整數。匹配確定的n次。例如,'o{2}'不能匹配"Bob"中的'o',但是能匹配"food" 中的兩個'o'

{n,}

n是一個非負整數。至少匹配n次。例如,'o{2,}'不能匹配"Bob"中的'o',但能匹配"foooood" 中的所有'o'。'o{1,}'等價于'o+'。'o{0,}'則等價于'o*'

{n,m}

mn均為非負整數,其中nm。最少匹配n次且最多匹配m次。例如,"o{1,3}"將匹配"fooooood"中的前三個'o'。'o{0,1}'等價于'o?'。請注意在逗號和兩個數之間不能有空格

?

當該字符緊跟在任何一個其他限制符(*, +, ?, {n}, {n,}, {n,m})后面時,匹配模式是非貪婪的。非貪婪模式盡可能少地匹配所搜索的字符串,而默認的貪婪模式則盡可能多地匹配所搜索的字符串。例如,對于字符串"oooo",'o+?'將匹配單個"o",而'o+' 將匹配所有'o'

.

匹配除"/n"之外的任何單個字符,要匹配包括'/n' 在內的任何字符,可以使用'[./n]'的模式

(pattern)

匹配pattern并獲取這一匹配。所獲取的匹配保存到相應的數組中。要匹配圓括號字符,請使用 '/(' 或 '/)'

(?:pattern)

匹配pattern但不獲取匹配結果,也就是說這是一個非獲取匹配,不進行存儲。這在使用"或"|"來組合一個模式的各個部分時很有用。例如,'industr(?:y|ies).就是一個比'industry|industries'更簡略的表達式

(?=pattern)

正向預查,在任何匹配pattern的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以后使用。例如,'Windows(?=95|98|NT|2000)'能匹配"Windows 2000"中的"Windows",但不能匹配"Windows 3.1"中的"Windows"。預查不消耗字符,也就是說,在一個匹配發生后,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預查的字符之后開始

(?!pattern)

負向預查,在任何不匹配pattern的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要獲取供以后使用。例如'Windows(?!95|98|NT|2000)'能匹配"'Windows 3.1"中的"Windows",但不能匹配"Windows 2000"中的"Windows"。預查不消耗字符,也就是說,在一個匹配發生后,在最后一次匹配之后立即開始下一次匹配的搜索,而不是從包含預查的字符之后開始

x|y

匹配x或y。例如,'z|food' 能匹配"z"或"food",'(z|f)ood'則匹配"zood"或"food"

[xyz]

字符集合。匹配所包含的任意一個字符。例如,'[abc]'可以匹配"plain"中的'a'

[^xyz]

負值字符集合。匹配未包含的任意字符。例如,'[^abc]'可以匹配"plain"中的'p'

[a-z]

字符范圍。匹配指定范圍內的任意字符。例如,'[a-z]'可以匹配'a'到'z' 范圍內的任意小寫字母字符

[^a-z]

負值字符范圍。匹配不在指定范圍內的任意字符。例如,'[^a-z]'可以匹配不在'a' 到'z'范圍內的任意字符

以下是幾個簡單的正則表達式的例子:
●'[A-Za-z0-9] ':表示所有的大寫字母、小寫字母及0到9的數字。
●'^hello':表示以hello開始的字符串。
●'world$':表示以world結尾的字符串。
●'.at':表示以除"/n"外的任意單個字符開頭并以"at"結尾的字符串,如"cat"、"nat"等。
●'^[a-zA-Z]':表示一個以字母開頭的字符串。
●'hi{2}':表示字母h后跟著兩個i即hii。
●'(go)+':表示至少含有一個'go'字符串的字符串,如'gogo'
身份證號碼一般由18位數字或17位數字后面加一個X或Y字母組成,要匹配身份證號碼,可以寫作:
^[0-9]{17}([0-9]|X|Y)$
Email地址的正則表達式可以寫作:
^[a-zA-Z0-9/-]+@[a-zA-Z0-9/-]+/.[a-zA-Z0-9/-/.]+$
2.字符串的匹配
ereg()和eregi()函數
使用ereg()函數可以查找字符串與子字符串匹配的情況,并返回匹配字符串的長度,還可以借助參數返回匹配字符的數組。語法格式如下:
int ereg(string ($pattern) , string $string [, array $regs ])
復制代碼 代碼如下:
<?php
/*本例檢查字符串是否是ISO格式的日期(YYYY-MM-DD) */
$date="1988-08-09";
$len=ereg ('([0-9]{4})-([0-9]{1,2})-([0-9]{1,2})', $date, $regs);//日期格式為YYYY-MM-DD
if ($len)
{
echo "$regs[3].$regs[2].$regs[1]". "<br>"; //輸出"09.08.1988"
echo $regs[0] ."<br>"; //輸出"1988-08-09"
echo $len; //輸出10
}
else
{
echo "錯誤的日期格式: $date";
}
?>

3.字符串的替換
ereg_replace()函數語法格式如下:
string ereg_replace(string $pattern , string $replacement , string $string)
說明:函數使用字符串$replacement替換字符串$string中與$pattern匹配的部分,并返回替換后的字符串。若未找到匹配項,則原樣返回
復制代碼 代碼如下:
<?php
$str="hello world";
echo ereg_replace('[aeo]', 'x',$str). "<br>"; //輸出'hxllx wxrld'
$res='<a href=/"hello.php/">hello</a>';
echo ereg_replace('hello', $res,$str); //使用超鏈接替換'hello'
?>

4.分割數組

使用split()函數可以完成與explode()函數一樣的功能,而且可以根據給出的正則表達式來分割字符串,并返回一個數組。語法格式如下:

array split(string $pattern , string $string [, int $limit ])

5.產生正則表達式

3.Perl兼容的正則表達式

1.編寫正則表達式

表4.4 Perl兼容正則表達式擴充的語法格式

字 符

描 述

/b

匹配一個單詞邊界,也就是指單詞和空格間的位置。例如,'er/b'可以匹配"never"中的 'er',但不能匹配"verb"中的'er'

/B

匹配非單詞邊界。'er/B'能匹配"verb"中的'er',但不能匹配"never"中的'er'

/cx

匹配由x指明的控制字符。例如,'/cM'匹配一個Control-M或回車符。x的值必須為A~Z或a~z之一。否則,將'c'視為一個原義的'c'字符

/d

匹配一個數字字符。等價于'[0-9]'

/D

匹配一個非數字字符。等價于'[^0-9]'

/f

匹配一個換頁符。等價于'/x0c'和'/cL'

/n

匹配一個換行符。等價于'/x0a'和'/cJ'

/r

匹配一個回車符。等價于'/x0d'和'/cM'

/s

匹配任何空白字符,包括空格、制表符、換頁符等。等價于' [ /f/n/r/t/v] '

/S

匹配任何非空白字符。等價于' [^ /f/n/r/t/v] '

/t

匹配一個制表符。等價于'/x09'和'/cI'

/v

匹配一個垂直制表符。等價于'/x0b'和'/cK'

/w

匹配包括下劃線的任何單詞字符。等價于'[A-Za-z0-9_]'

/W

匹配任何非單詞字符,等價于'[^A-Za-z0-9_]'

/xn

匹配n,其中n為十六進制轉義值。十六進制轉義值必須為確定的兩個數字長。例如,'/x41' 匹配"A"。'/x041'則等價于'/x04' & "1"。正則表達式中可以使用ASCII編碼

/num

匹配num,其中num是一個正整數。對所獲取的匹配的引用。例如,'(.)/1'匹配兩個連續的相同字符

/n

標志一個八進制轉義值或一個后向引用。如果/n之前至少有n個獲取得子表達式,則n為后向引用。否則,如果n為八進制數字(0~7),則n為一個八進制轉義值

/nm

標志一個八進制轉義值或一個后向引用。如果/nm之前至少有nm個獲取得子表達式,則 nm為后向引用。如果/nm之前至少有n個獲取,則n為一個后跟文字m的后向引用。如果前面的條件都不滿足,若 n和m均為八進制數字(0~7),則/nm將匹配八進制轉義值nm

/nml

如果n為八進制數字(0~3),且m和l均為八進制數字(0~7),則匹配八進制轉義值nml

/un

匹配n,其中n是用4個十六進制數字表示的Unicode字符。例如,'/u00A9'匹配版權符號(©)

2.字符串匹配
preg_match()函數進行字符串的查找,語法格式如下:
int preg_match(string $pattern , string $subject [, array $matches [, int $flags ]])
說明:該函數的結構與ereg()函數類似,在$subject字符串中搜索與$pattern給出的正則表達式相匹配的內容。
preg_match()函數返回$pattern所匹配的次數。不是0次(沒有匹配)就是1次,因為preg_match()函數在第一次匹配之后將停止搜索
還有一個是preg_match_all(),從第一個匹配的末尾開始繼續搜索,直到搜索完整個字符串。
preg_match_all()函數參數$flags的值可以取以下三種:
●PREG_PATTERN_ORDER。默認項,表示$matches[0]為全部模式匹配的數組,
$matches[1]為第一個括號中的子模式所匹配的字符串組成的數組,以此類推。
●PREG_SET_ORDER。如果設定此標記,則$matches[0]為第一組匹配項的數組,$matches[1]為第二組匹配項的數組,以此類推。
●PREG_OFFSET_CAPTURE。PREG_OFFSET_CAPTURE可以和其他兩個標記組合使用,
如果設定本標記,對每個出現的匹配結果也同時返回其附屬的字符串偏移量。
3.字符串的替換
使用preg_replace()函數能夠完成與函數ereg_replace()相同的功能,在字符串中查找匹配的子字符串,并用指定字符串替換子字符串。
語法格式如下:
mixed preg_replace(mixed $pattern , mixed $replacement , mixed $subject [, int $limit ])
4.字符串的分割
preg_split()函數可以使用正則表達式作為邊界分割一個字符串,并將子字符串存入一個數組返回,作用與split()函數類似。
語法格式如下:
array preg_split(string $pattern , string $subject [, int $limit [, int $flags ]])
說明:本函數區分大小寫,返回一個數組,數組包含$subject中沿著與$pattern匹配的邊界所分割的子串。
$limit是可選參數,如果指定則最多返回$limit個字串,如果省略或為-1,則沒有限制。
$flags的值可以是以下三種:
●PREG_SPLIT_NO_EMPTY。如果設定本標記,則函數只返回非空的字符串。
●PREG_SPLIT_DELIM_CAPTURE。如果設定本標記,定界符模式中的括號表達式的匹配項也會被捕獲并返回。
PREG_SPLIT_OFFSET_CAPTURE。如果設定本標記,對每個出現的匹配結果也同時返回其附屬的字符串偏移量。
4.3實例-驗證表單內容
【例4.4】 使用正則表達式驗證用戶輸入的表單內容是否滿足格式要求。
新建EX4_4_Hpage.php文件,輸入以下代碼。
復制代碼 代碼如下:
<?php
include 'EX4_4_Hpage.php'; //包含文件EX4_4Hpage.php
$id=$_POST['ID'];
$pwd=$_POST['PWD'];
$phone=$_POST['PHONE'];
$Email=$_POST['EMAIL'];
$checkid=preg_match('/^/w{1,10}$/',$id); //檢查字符串是否在10個字符以內
$checkpwd=preg_match('/^/d{4,14}$/',$pwd); //檢查是否在4~14個數字之間
$checkphone=preg_match('/^1/d{10}$/',$phone); //檢查是否是以1開頭的11位數字
//檢查Email地址的合法性
$checkEmail=preg_match('/^[a-zA-Z0-9_/-]+@[a-zA-Z0-9/-]+/.[a-zA-Z0-9/-/.]+$/',$Email);
if($checkid&&$checkpwd&&$checkphone&&$checkEmail) //如果都為1,則注冊成功
echo "注冊成功!";
else
echo "注冊失敗,格式不對";
?>

新建EX4_4_Ppage.php文件,輸入以下代碼:
2.字符串匹配
preg_match()函數進行字符串的查找,語法格式如下:
int preg_match(string $pattern , string $subject [, array $matches [, int $flags ]])
說明:該函數的結構與ereg()函數類似,在$subject字符串中搜索與$pattern給出的正則表達式相匹配的內容。
preg_match()函數返回$pattern所匹配的次數。不是0次(沒有匹配)就是1次,因為preg_match()函數在第一次匹配之后將停止搜索
還有一個是preg_match_all(),從第一個匹配的末尾開始繼續搜索,直到搜索完整個字符串。
preg_match_all()函數參數$flags的值可以取以下三種:
●PREG_PATTERN_ORDER。默認項,表示$matches[0]為全部模式匹配的數組,
$matches[1]為第一個括號中的子模式所匹配的字符串組成的數組,以此類推。
●PREG_SET_ORDER。如果設定此標記,則$matches[0]為第一組匹配項的數組,$matches[1]為第二組匹配項的數組,以此類推。
●PREG_OFFSET_CAPTURE。PREG_OFFSET_CAPTURE可以和其他兩個標記組合使用,
如果設定本標記,對每個出現的匹配結果也同時返回其附屬的字符串偏移量。
3.字符串的替換
使用preg_replace()函數能夠完成與函數ereg_replace()相同的功能,在字符串中查找匹配的子字符串,并用指定字符串替換子字符串。
語法格式如下:
mixed preg_replace(mixed $pattern , mixed $replacement , mixed $subject [, int $limit ])
4.字符串的分割
preg_split()函數可以使用正則表達式作為邊界分割一個字符串,并將子字符串存入一個數組返回,作用與split()函數類似。
語法格式如下:
array preg_split(string $pattern , string $subject [, int $limit [, int $flags ]])
說明:本函數區分大小寫,返回一個數組,數組包含$subject中沿著與$pattern匹配的邊界所分割的子串。
$limit是可選參數,如果指定則最多返回$limit個字串,如果省略或為-1,則沒有限制。
$flags的值可以是以下三種:
●PREG_SPLIT_NO_EMPTY。如果設定本標記,則函數只返回非空的字符串。
●PREG_SPLIT_DELIM_CAPTURE。如果設定本標記,定界符模式中的括號表達式的匹配項也會被捕獲并返回。
PREG_SPLIT_OFFSET_CAPTURE。如果設定本標記,對每個出現的匹配結果也同時返回其附屬的字符串偏移量。
4.3實例-驗證表單內容
【例4.4】 使用正則表達式驗證用戶輸入的表單內容是否滿足格式要求。
新建EX4_4_Hpage.php文件,輸入以下代碼。
復制代碼 代碼如下:
<?php
include 'EX4_4_Hpage.php'; //包含文件EX4_4Hpage.php
$id=$_POST['ID'];
$pwd=$_POST['PWD'];
$phone=$_POST['PHONE'];
$Email=$_POST['EMAIL'];
$checkid=preg_match('/^/w{1,10}$/',$id); //檢查字符串是否在10個字符以內
$checkpwd=preg_match('/^/d{4,14}$/',$pwd); //檢查是否在4~14個數字之間
$checkphone=preg_match('/^1/d{10}$/',$phone); //檢查是否是以1開頭的11位數字
//檢查Email地址的合法性
$checkEmail=preg_match('/^[a-zA-Z0-9_/-]+@[a-zA-Z0-9/-]+/.[a-zA-Z0-9/-/.]+$/',$Email);
if($checkid&&$checkpwd&&$checkphone&&$checkEmail) //如果都為1,則注冊成功
echo "注冊成功!";
else
echo "注冊失敗,格式不對";
?>

新建EX4_4_Ppage.php文件,輸入以下代碼:
復制代碼 代碼如下:
<?php
include 'EX4_4_Hpage.php'; //包含文件EX4_4Hpage.php
$id=$_POST['ID'];
$pwd=$_POST['PWD'];
$phone=$_POST['PHONE'];
$Email=$_POST['EMAIL'];
$checkid=preg_match('/^/w{1,10}$/',$id); //檢查字符串是否在10個字符以內
$checkpwd=preg_match('/^/d{4,14}$/',$pwd); //檢查是否在4-14個字符之間
$checkphone=preg_match('/^1/d{10}$/',$phone); //檢查是否是以1開頭的11位數子
//檢查Email地址的合法性
$checkEmail=preg_match('/^[a-zA-Z0-9_/-]+@[a-zA-Z0-9/-]+/.[a-zA-Z0-9/-/.]+$/',$Email);
if($checkid&&$checkpwd&&$checkphone&&$checkEmail) //如果都為1,則注冊成功
echo "注冊成功!";
else
echo "注冊失敗,格式不對";
?>

php技術第4章 數據處理-php正則表達式-鄭阿奇(續),轉載需保留來源!

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

主站蜘蛛池模板: 91精品国产综合久久精品 | 国产成人啪精品午夜在线播放 | 91视频播放| 亚洲国产激情一区二区三区 | 久久亚洲网站 | 色哟网 | 激情小说图片视频 | 污片网站在线看 | 国产精品免费入口视频 | 日韩亚洲欧洲在线rrrr片 | 亚洲福利在线播放 | 91免费视 | 激情综合五月 | 中文字幕日本不卡一二三区 | 玖玖国产精品 | 国内精品1区1区3区4区 | 日日噜噜夜夜狠狠tv视频免费 | 国产中文在线视频 | 九九热播| 91网站免费观看 | 欧美视频在线观看网站 | 国产91区 | 午夜黄色网 | 在线国产资源 | 日本精品久久久久护士 | 国产激情视频趣趣在线观看的 | 欧美一级日韩一级亚洲一级 | 国产免费午夜高清 | 看全色黄大色黄大片女图片 | 在线播放国产一区 | 激情六月在线视频观看 | 四虎成人4hutv影院 | 国产九九视频在线观看 | 国产特黄一级毛片特黄 | 亚洲综合国产 | 伊人色综合网一区二区三区 | 99精品国产兔费观看66 | 久久www免费人成精品 | 日本高清无卡码一区二区久久 | 香蕉视频国产精品 | 色婷婷亚洲综合五月 |