天啪天干在线视频,国产第一福利精品导航,国产大片黄在线看免费

　　Myspace和Facebook都是很優秀的社交類網站，它們擁有的用戶和fans之多，大家都很清楚。
　　Myspace是一個基于.NET平臺的，而Facebook更多是基于LAMP的。
　　我們來看看MySpace配合.NET+Windows Server 2003+Sql Server 2000/2005+IIS怎么創造傳奇的

　　文章正文如下：

　　在每個里程碑，站點負擔都會超過底層系統部分組件的最大載荷，特別是數據庫和存儲系統。接著，功能出現問題，用戶失聲尖叫。最后，技術團隊必須為此修訂系統策略。
雖然自2005年早期，站點賬戶數超過7百萬后，系統架構到目前為止保持了相對穩定，但MySpace仍然在為SQL Server支持的同時連接數等方面繼續攻堅，Benedetto說，"我們已經盡可能把事情做到最好"。

　　里程碑一：50萬賬戶

　　按Benedetto 的說法，MySpace最初的系統很小，只有兩臺Web 服務器和一個數據庫服務器。那時使用的是Dell雙CPU、4G內存的系統。

　　單個數據庫就意味著所有數據都存儲在一個地方，再由兩臺Web 服務器分擔處理用戶請求的工作量。但就像MySpace后來的幾次底層系統修訂時的情況一樣，三服務器架構很快不堪重負。此后一個時期內，MySpace基本是通過添置更多Web 服務器來對付用戶暴增問題的。

　　但到在2004年早期，MySpace用戶數增長到50萬后，數據庫服務器也已開始汗流浹背。

　　但和Web 服務器不同，增加數據庫可沒那么簡單。如果一個站點由多個數據庫支持，設計者必須考慮的是，如何在保證數據一致性的前提下，讓多個數據庫分擔壓力。

　　在第二代架構中，MySpace運行在3個SQL Server數據庫服務器上——一個為主，所有的新數據都向它提交，然后由它復制到其他兩個；另兩個全力向用戶供給數據，用以在博客和個人資料欄顯示。這種方式在一段時間內效果很好——只要增加數據庫服務器，加大硬盤，就可以應對用戶數和訪問量的增加。

　　里程碑二：1-2百萬賬戶

　　MySpace注冊數到達1百萬至2百萬區間后，數據庫服務器開始受制于I/O容量——即它們存取數據的速度。而當時才是2004年中，距離上次數據庫系統調整不過數月。用戶的提交請求被阻塞，就像千人樂迷要擠進只能容納幾百人的夜總會，站點開始遭遇"主要矛盾"，Benedetto說，這意味著MySpace永遠都會輕度落后于用戶需求。

　　"有人花5分鐘都無法完成留言，因此用戶總是抱怨說網站已經完蛋了。"他補充道。

　　這一次的數據庫架構按照垂直分割模式設計，不同的數據庫服務于站點的不同功能，如登錄、用戶資料和博客。于是，站點的擴展性問題看似又可以告一段落了，可以歇一陣子。

　　垂直分割策略利于多個數據庫分擔訪問壓力，當用戶要求增加新功能時，MySpace將投入新的數據庫予以支持它。賬戶到達2百萬后，MySpace還從存儲設備與數據庫服務器直接交互的方式切換到SAN（Storage Area NETwork，存儲區域網絡）——用高帶寬、專門設計的網絡將大量磁盤存儲設備連接在一起，而數據庫連接到SAN。這項措施極大提升了系統性能、正常運行時間和可靠性，Benedetto說。

　　里程碑三：3百萬賬戶

　　當用戶繼續增加到3百萬后，垂直分割策略也開始難以為繼。盡管站點的各個應用被設計得高度獨立，但有些信息必須共享。在這個架構里，每個數據庫必須有各自的用戶表副本——MySpace授權用戶的電子花名冊。這就意味著一個用戶注冊時，該條賬戶記錄必須在9個不同數據庫上分別創建。但在個別情況下，如果其中某臺數據庫服務器臨時不可到達，對應事務就會失敗，從而造成賬戶非完全創建，最終導致此用戶的該項服務無效。

　　另外一個問題是，個別應用如博客增長太快，那么專門為它服務的數據庫就有巨大壓力。

　　2004年中，MySpace面臨Web開發者稱之為"向上擴展"對"向外擴展"（譯者注：Scale Up和Scale Out，也稱硬件擴展和軟件擴展）的抉擇——要么擴展到更大更強、也更昂貴的服務器上，要么部署大量相對便宜的服務器來分擔數據庫壓力。一般來說，大型站點傾向于向外擴展，因為這將讓它們得以保留通過增加服務器以提升系統能力的后路。

　　但成功地向外擴展架構必須解決復雜的分布式計算問題，大型站點如Google、Yahoo和Amazon.com，都必須自行研發大量相關技術。以Google為例，它構建了自己的分布式文件系統。

　　另外，向外擴展策略還需要大量重寫原來軟件，以保證系統能在分布式服務器上運行。"搞不好，開發人員的所有工作都將白費"，Benedetto說。

　　因此，MySpace首先將重點放在了向上擴展上，花費了大約1個半月時間研究升級到32CPU 服務器以管理更大數據庫的問題。Benedetto說，"那時候，這個方案看似可能解決一切問題。"如穩定性，更棒的是對現有軟件幾乎沒有改動要求。

　　糟糕的是，高端服務器極其昂貴，是購置同樣處理能力和內存速度的多臺服務器總和的很多倍。而且，站點架構師預測，從長期來看，即便是巨型數據庫，最后也會不堪重負，Benedetto說，"換句話講，只要增長趨勢存在，我們最后無論如何都要走上向外擴展的道路。"

　　因此，MySpace最終將目光移到分布式計算架構——它在物理上分布的眾多服務器，整體必須邏輯上等同于單臺機器。拿數據庫來說，就不能再像過去那樣將應用拆分，再以不同數據庫分別支持，而必須將整個站點看作一個應用。現在，數據庫模型里只有一個用戶表，支持博客、個人資料和其他核心功能的數據都存儲在相同數據庫。

　　既然所有的核心數據邏輯上都組織到一個數據庫，那么MySpace必須找到新的辦法以分擔負荷——顯然，運行在普通硬件上的單個數據庫服務器是無能為力的。這次，不再按站點功能和應用分割數據庫，MySpace開始將它的用戶按每百萬一組分割，然后將各組的全部數據分別存入獨立的SQL Server實例。目前，MySpace的每臺數據庫服務器實際運行兩個SQL Server實例，也就是說每臺服務器服務大約2百萬用戶。Benedetto指出，以后還可以按照這種模式以更小粒度劃分架構，從而優化負荷分擔。

　　當然，還是有一個特殊數據庫保存了所有賬戶的名稱和密碼。用戶登錄后，保存了他們其他數據的數據庫再接管服務。特殊數據庫的用戶表雖然龐大，但它只負責用戶登錄，功能單一，所以負荷還是比較容易控制的。

　　里程碑四：9百萬到1千7百萬賬戶

　　2005年早期，賬戶達到9百萬后，MySpace開始用Microsoft的C#編寫ASP.NET程序。C#是C語言的最新派生語言，吸收了C++和Java的優點，依托于Microsoft .NET框架（Microsoft為軟件組件化和分布式計算而設計的模型架構）。ASP.NET則由編寫Web站點腳本的ASP技術演化而來，是Microsoft目前主推的Web站點編程環境。

　　可以說是立竿見影， MySpace馬上就發現ASP.NET程序運行更有效率，與ColdFusion相比，完成同樣任務需消耗的處理器能力更小。據技術總監Whitcomb說，新代碼需要150臺服務器完成的工作，如果用ColdFusion則需要246臺。Benedetto還指出，性能上升的另一個原因可能是在變換軟件平臺，并用新語言重寫代碼的過程中，程序員復審并優化了一些功能流程。

　　最終，MySpace開始大規模遷移到ASP.NET。即便剩余的少部分ColdFusion代碼，也從Cold-Fusion 服務器搬到了ASP.NET，因為他們得到了BlueDragon.NET（喬治亞州阿爾法利塔New Atlanta Communications公司的產品，它能將ColdFusion代碼自動重新編譯到Microsoft平臺）的幫助。

　　賬戶達到1千萬時，MySpace再次遭遇存儲瓶頸問題。SAN的引入解決了早期一些性能問題，但站點目前的要求已經開始周期性超越SAN的I/O容量——即它從磁盤存儲系統讀寫數據的極限速度。

　　原因之一是每數據庫1百萬賬戶的分割策略，通常情況下的確可以將壓力均分到各臺服務器，但現實并非一成不變。比如第七臺賬戶數據庫上線后，僅僅7天就被塞滿了，主要原因是佛羅里達一個樂隊的歌迷瘋狂注冊。

　　某個數據庫可能因為任何原因，在任何時候遭遇主要負荷，這時，SAN中綁定到該數據庫的磁盤存儲設備簇就可能過載。"SAN讓磁盤I/O能力大幅提升了，但將它們綁定到特定數據庫的做法是錯誤的。"Benedetto說。

　　最初，MySpace通過定期重新分配SAN中數據，以讓其更為均衡的方法基本解決了這個問題，但這是一個人工過程，"大概需要兩個人全職工作。"Benedetto說。

　　長期解決方案是遷移到虛擬存儲體系上，這樣，整個SAN被當作一個巨型存儲池，不再要求每個磁盤為特定應用服務。MySpace目前采用了一種新型SAN設備——來自加利福尼亞州弗里蒙特的3PARdata。

　　在3PAR的系統里，仍能在邏輯上按容量劃分數據存儲，但它不再被綁定到特定磁盤或磁盤簇，而是散布于大量磁盤。這就使均分數據訪問負荷成為可能。當數據庫需要寫入一組數據時，任何空閑磁盤都可以馬上完成這項工作，而不再像以前那樣阻塞在可能已經過載的磁盤陣列處。而且，因為多個磁盤都有數據副本，讀取數據時，也不會使SAN的任何組件過載。

　　當2005年春天賬戶數達到1千7百萬時，MySpace又啟用了新的策略以減輕存儲系統壓力，即增加數據緩存層——位于Web 服務器和數據庫服務器之間，其唯一職能是在內存中建立被頻繁請求數據對象的副本，如此一來，不訪問數據庫也可以向Web應用供給數據。換句話說，100個用戶請求同一份資料，以前需要查詢數據庫100次，而現在只需1次，其余都可從緩存數據中獲得。當然如果頁面變化，緩存的數據必須從內存擦除，然后重新從數據庫獲取——但在此之前，數據庫的壓力已經大大減輕，整個站點的性能得到提升。

　　緩存區還為那些不需要記入數據庫的數據提供了驛站，比如為跟蹤用戶會話而創建的臨時文件——Benedetto坦言他需要在這方面補課，"我是數據庫存儲狂熱分子，因此我總是想著將萬事萬物都存到數據庫。"但將像會話跟蹤這類的數據也存到數據庫，站點將陷入泥沼。

　　增加緩存服務器是"一開始就應該做的事情，但我們成長太快，以致于沒有時間坐下來好好研究這件事情。"Benedetto補充道。

　　里程碑五：2千6百萬賬戶

　　2005年中期，服務賬戶數達到2千6百萬時，MySpace切換到了還處于beta測試的SQL Server 2005。轉換何太急？主流看法是2005版支持64位處理器。但Benedetto說，"這不是主要原因，盡管這也很重要；主要還是因為我們對內存的渴求。"支持64位的數據庫可以管理更多內存。

　　更多內存就意味著更高的性能和更大的容量。原來運行32位版本的SQL Server 服務器，能同時使用的內存最多只有4G。切換到64位，就好像加粗了輸水管的直徑。升級到SQL Server 2005和64位Windows Server 2003后，MySpace每臺服務器配備了32G內存，后于2006年再次將配置標準提升到64G。

　　意外錯誤

　　如果沒有對系統架構的歷次修改與升級，MySpace根本不可能走到今天。但是，為什么系統還經常吃撐著了？很多用戶抱怨的"意外錯誤"是怎么引起的呢？

　　原因之一是MySpace對Microsoft的Web技術的應用已經進入連Microsoft自己也才剛剛開始探索的領域。比如11月，超出SQL Server最大同時連接數，MySpace系統崩潰。Benedetto說，這類可能引發系統崩潰的情況大概三天才會出現一次，但仍然過于頻繁了，以致惹人惱怒。一旦數據庫罷工，"無論這種情況什么時候發生，未緩存的數據都不能從SQL Server獲得，那么你就必然看到一個'意外錯誤'提示。"他解釋說。

　　去年夏天，MySpace的Windows 2003多次自動停止服務。后來發現是操作系統一個內置功能惹的禍——預防分布式拒絕服務攻擊（黑客使用很多客戶機向服務器發起大量連接請求，以致服務器癱瘓）。MySpace和其他很多頂級大站點一樣，肯定會經常遭受攻擊，但它應該從網絡級而不是依靠Windows本身的功能來解決問題——否則，大量MySpace合法用戶連接時也會引起服務器反擊。

　　"我們花了大約一個月時間尋找Windows 2003 服務器自動停止的原因。"Benedetto說。最后，通過Microsoft的幫助，他們才知道該怎么通知服務器："別開槍，是友軍。"

　　緊接著是在去年7月某個周日晚上，MySpace總部所在地洛杉磯停電，造成整個系統停運12小時。大型Web站點通常要在地理上分布配置多個數據中心以預防單點故障。本來，MySpace還有其他兩個數據中心以應對突發事件，但Web 服務器都依賴于部署在洛杉磯的SAN。沒有洛杉磯的SAN，Web 服務器除了懇求你耐心等待，不能提供任何服務。

　　Benedetto說，主數據中心的可靠性通過下列措施保證：可接入兩張不同電網，另有后備電源和一臺儲備有30天燃料的發電機。但在這次事故中，不僅兩張電網失效，而且在切換到備份電源的過程中，操作員燒掉了主動力線路。

　　2007年中，MySpace在另兩個后備站點上也建設了SAN。這對分擔負荷大有幫助——正常情況下，每個SAN都能負擔三分之一的數據訪問量。而在緊急情況下，任何一個站點都可以獨立支撐整個服務，Benedetto說。

　　MySpace仍然在為提高穩定性奮斗，雖然很多用戶表示了足夠信任且能原諒偶現的錯誤頁面。

　　"作為開發人員，我憎惡Bug，它太氣人了。"Dan Tanner這個31歲的德克薩斯軟件工程師說，他通過MySpace重新聯系到了高中和大學同學。"不過，MySpace對我們的用處很大，因此我們可以原諒偶發的故障和錯誤。" Tanner說，如果站點某天出現故障甚至崩潰，恢復以后他還是會繼續使用。

　　這就是為什么Drew在論壇里咆哮時，大部分用戶都告訴他應該保持平靜，如果等幾分鐘，問題就會解決的原因。Drew無法平靜，他寫道，"我已經兩次給MySpace發郵件，而它說一小時前還是正常的，現在出了點問題……完全是一堆廢話。"另一個用戶回復說，"畢竟它是免費的。"Benedetto坦承100%的可靠性不是他的目標。"它不是銀行，而是一個免費的服務。"他說。

　　換句話說，MySpace的偶發故障可能造成某人最后更新的個人資料丟失，但并不意味著網站弄丟了用戶的錢財。"關鍵是要認識到，與保證站點性能相比，丟失少許數據的故障是可接受的。"Benedetto說。所以，MySpace甘冒丟失2分鐘到2小時內任意點數據的危險，在SQL Server配置里延長了"checkpoint"操作——它將待更新數據永久記錄到磁盤——的間隔時間，因為這樣做可以加快數據庫的運行。

　　Benedetto說，同樣，開發人員還經常在幾個小時內就完成構思、編碼、測試和發布全過程。這有引入Bug的風險，但這樣做可以更快實現新功能。而且，因為進行大規模真實測試不具可行性，他們的測試通常是在僅以部分活躍用戶為對象，且用戶對軟件新功能和改進不知就里的情況下進行的。因為事實上不可能做真實的加載測試，他們做的測試通常都是針對站點。

　　"我們犯過大量錯誤，"Benedetto說，"但到頭來，我認為我們做對的還是比做錯的多。"

　　MySpace Tech Roster
　　January 16, 2007
　　By David F. Carr
------------------------------------------------

　　個人的幾個觀點：
　　1，.NET平臺很牛，很強大。
　　2，對于技術而言，局限性往往存在于程序員自身。
　　3，網站的分布式更多是為了提高性能，否則不要開始分布式。
　　４，網站的分布式更多體現在數據庫方面，和目前.NET平臺主流的分布式技術有點不同。
　　５，.NET平臺企業級開發的分布式解決方案有很多，選擇適合企業自身特點的才是最理想的。

NET技術：從MySpace基于.NET平臺的六次重構經歷，來感受分布式，轉載需保留來源！

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播更多信息之目的，如作者信息標記有誤，請第一時間聯系我們修改或刪除，多謝。

一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

從MySpace基于.NET平臺的六次重構經歷，來感受分布式

相關文章閱讀

去评论

去顶部