|
【問題描述】
我們可能會在數(shù)據(jù)庫的錯誤日志里,發(fā)現(xiàn)這么一條信息:
A time-out occurred while waiting for buffer latch -- type 4, bp 000000097BFDEDC0, page 1:19239, stat 0xc00009, database id: 5, allocation unit Id: 72057615247867904, task 0x0000000005E594C8 : 0, waittime 300, flags 0x1018, owning task 0x0000000000169DC8. Not continuing to wait.
我們的問題是,這個錯誤到底是什么含義,在什么情況下會報上面的錯誤,以及如何解決?
【背景介紹】
Latch是SQL Server內(nèi)部用來同步資源訪問的一個數(shù)據(jù)結(jié)構(gòu)。和操作系統(tǒng)的Critical Section或ReaderWriterLock類似。Latch保護了那些想保護的資源,使得訪問同步有序。比方說,當(dāng)某個線程獲得某個資源的Latch的獨占使用權(quán)時候,別的線程如果也需要訪問這個Latch,則它必須等待。
從大的方面來講,有兩種Latch,一種叫Buffer Latch,另外一種叫I/O Latch。
我們先來簡短介紹一下I/O Latch。當(dāng)SQL Server從硬盤上讀取一個頁時,會先在內(nèi)存預(yù)留該頁的空間。并且在該預(yù)留空間的某一個位BUF_IO設(shè)為1。如果數(shù)據(jù)從硬盤讀寫完成,則該位設(shè)為0。從硬盤讀取頁的期間,其他也需要訪問該頁的線程當(dāng)然要等待,等待類型為PAGEIOLATCH_SH,直到讀寫完成,BUF_IO被設(shè)為0為止。因此,如果我們看到大量PAGEIOLATCH_SH等待,則基本可以斷定問題是出在磁盤性能上面。
另外一種Latch則稱為Buffer Latch,用來保護內(nèi)存里的數(shù)據(jù)結(jié)構(gòu),如Index, Data Pages, B樹中的Non-Leaf頁。當(dāng)進程需要讀取一個內(nèi)存里的數(shù)據(jù)頁時,該進程要先獲取該數(shù)據(jù)頁上的Buffer Latch。有各種類型的Latch,包括獨占Latch(PAGELATCH_EX)和共享Latch(PAGELATCH_SH)。
下面來演示,為什么我們需要Latch。如下圖所示,我們在頁面100上,已經(jīng)存放了兩條記錄。
如果沒有Latch鎖的話,某進程在頁面100上,插入如下數(shù)據(jù):INSERT VALUES(3, 300),其結(jié)果如下:
這時,另外一個進程要在頁面100上,插入如下數(shù)據(jù): INSERT VALUES(4, 400), 因為沒有Latch鎖,所以會覆蓋之前的數(shù)據(jù)。導(dǎo)致數(shù)據(jù)插入出問題。
正確的做法是,我們要在第一個線程進行操作時,加獨占Latch鎖。第二個線程必須要等待,直到第一個線程操作完成。如下圖所示:
開始第一條記錄插入,隨后修改m_freedata(值為141)以及Row的指針(值為126),在此期間,第二條插入語句處于等待Latch狀態(tài)。第一條記錄插入完成后,釋放獨占Latch鎖。
第二條記錄開始插入,插入期間也會加獨占Latch鎖,以防止其他進程修改或讀取頁。完成后,也隨即釋放Latch鎖。最后結(jié)果如圖所示。由于有Latch鎖,所以數(shù)據(jù)的插入可以有序的進行。
【LATCH申請模式】
Latch在申請的時候有以下幾種模式,
- KP – Keep Latch 保證引用的結(jié)構(gòu)不能被破壞
- SH – Shared Latch 讀數(shù)據(jù)頁的時候需要
- UP – Update Latch 更改數(shù)據(jù)頁的時候需要
- EX – Exclusive Latch 獨占模式,主要用于寫數(shù)據(jù)頁的時候需要
- DT – Destroy Latch 在破壞引用的數(shù)據(jù)結(jié)構(gòu)時所需要
下表顯示各種Latch申請的兼容模式:
Y表明是兼容的,如果兩個線程都去讀某頁,則他們都會去申請SH鎖,因為SH鎖是兼容的,則兩個線程都不會互相妨礙。而N表明是不兼容的,必須要等待。直到前面一個Latch被釋放為止。
【LATCH等待類型】
Latch的等待主要有三種。
- Buffer (BUF) Latch 用來保護索引或數(shù)據(jù)頁,也包括PFS, GAM, SGAM和IAM數(shù)據(jù)頁,等待類型是PAGELATCH_*模式。
- Non-buffer (Non-BUF) Latch 除了上述數(shù)據(jù)結(jié)構(gòu)以外的其他內(nèi)存結(jié)構(gòu),等待類型是LATCH_*模式。
- IO Latch 保護數(shù)據(jù)從磁盤到頁面的讀寫過程,等待類型是PAGEIOLATCH_*模式。
我們可以查詢下面的語句了解一下具體的等待種類:
SELECT * FROM sys.dm_os_wait_stats WHERE wait_type like '%Latch%'
it知識庫:Buffer Latch Timeout的解析,轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。