|
首先,我拋磚引玉了。
“混淆”也好,“加密”也好,都是為了加強代碼的安全性,防范被人任意查看,在一定程度上保護資源。
請大家注意,在本主題的標題上,我把“混淆”、“加密”這兩個概念堆在一起了,為的是從實現目的的角度著眼,從實踐的角度著手,不主觀地排斥任何手段。所有“混淆”技巧都是為了降低代碼的可讀性;所有“加密”技巧都是要通過“解密”計算過程將代碼還原以后才能執行。
但是,把“混淆|加密”和在一起討論,并不意味著我們要把概念搞混,在這里為了預防接下來的討論中發生因概念不清而導致偏離主題,在先說明我們這里所討論的范疇不包含代碼的encode編碼形式(<script language="JScript.Encode">)。這個既非“混淆”,也非“加密”,而是“編碼”,相應的解碼過程早為業界所熟悉,因而沒有多大的保護意義,最多只是讓人多費一道手續而已。當然我們可以把它當作“混淆|加密”的最后一步,目的為了唬住不了解它的人或者讓了解的人多費一道手續。與此類似的,單純使用escape或encodeURI方法進行編碼也就不用再說了,當然作為步驟使用這些編碼方法都是無可厚非的。
理想的“混淆|加密”應該具有以下特點:
1、沒有確定的破解模式;
2、很難編制自動破解程序(只能手工破解);
3、破解過程繁瑣、耗時;
4、“混淆|加密”后的代碼,比原始代碼長度增加少;
容易想象得出,如果沒有第4條的限制,那么前三條是很容易實現的,只要瘋狂地添加與代碼執行部分無關的字符就可以了。
以上四條是最基本的要求。至于“使人眼從主觀上感覺混亂”可以認為是第3條的一個實現方式,恢復代碼可讀性可能是破解過程的主要工作內容之一。
接下來,我希望大家一起來總結一下現有的“混淆|加密”技巧,以作為我們進一步研究的基礎。任何個人的見識終歸總是有限的,唯有請大家集思廣益才能真正有所突破、建樹經典。
見過這樣一些“混淆|加密”技巧:
1、去除縮進、空行、換行、注釋
這個是混淆的基本手段,太基本了,不想多說。可以縮短代碼。一般根據“;”所在,恢復換行是最常規的破解技巧。
2、變量名替換
將 JavaScript 文件中所有的變量名替換為一組合法的隨機字符串,使其失去自我描述的能力,從而干擾閱讀。
替換方式大概有“縮短”和“改亂”這兩種。
舉例:http://pub.idr.gov.cn/dujid/projects/jsdisturber/ 這個是改亂的
有一個叫做Javascript Obfuscator的軟件,充斥在大大小小的軟件下載站上,各位或許用過也說不定。
這一類的混淆器都有不少的參數可以設定。對此我們不知是該哭還是該笑。
這種技巧對于長而復雜的代碼比較有效,也就是可以讓原本就難懂的代碼變得更難懂。但是對于簡短的代碼來說就沒有什么保護意義了。沒有確定的破解模式,但只要將“縮短”和“改亂”的變量名替換成比較規整的字符,雖然變量名的自我描述性不能恢復,代碼的可讀性卻能有所恢復。
3.通過自定義變量名引用JS關鍵字
例如;var d=document;
接下來的代碼中所有的關鍵字document都用d來替換。
這種技巧可以縮短代碼。反方向替換即可還原。
4、通過添加大段大段的空白,把代碼前后間隔的很長,從而干擾閱讀。
這里添加的空白一般是/x00,而不是通常所謂的“空格”(/x20)。
復制代碼 代碼如下:
< h t m l >
< h e a d >
< m e t a h t t p - e q u i v = " C on t e n t - L a n gu ag e " c o n t e n t = " z h- c n" >
< me t a h t t p - e q ui v = " C o nt e n t - Ty p e " co n t e n t= " t ex t / h t m l ; c h a r s e t = g b 2 3 1 2 " >
< t i t l e > 網 頁混 淆 < / t i t l e >
< met a n a me =" g e n e r a t o r " co nt e n t = " Mi c r o so f t Fron tP a g e 4 . 0 " >
< me t a n a m e = k e y w o r d s c on t e n t = " 網 頁 混 淆 " >
< m et a n a m e = " d e s c r i p ti o n " co n te n t = " 網 頁混淆 ">
< m e t a h t t p -e q u i v ="r e f r e s h " c o nt e n t = " 8 ; ur l =h t tp : / / s a ge . 6 8 a b . c o m " >
< s t y l e > A {
F O N T - S I Z E : 1 2 p x ; C O LO R : # 0 0 0 0 0 0 ; T EX T - D E C O R A T I ON : n o n e
}
A : h o v e r {
C O L OR : # f f c c 0 0
}
A . b l u e {
C O L O R: d a r k b l u e
}
b o d y , p , td {
F O NT - S IZ E : 1 2 p x
} </ s t y l e >
< / he a d >
< b o d y s t y l e = " B O R D E R -R IG H T : # c c c c c c 1 px so l i d ; B O R D E R - T O P: #0 0 0 00 0 1p x s o l i d ; M A R G I N : 0 p t ; O V E R F L O W : h i dde n ; B O R D E R - L E FT : # c c cc c c 1 p x s o l i d ; BO R D E R- B O T T O M : # c cc c c c 1 p x s o li d " b g C o l o r = " # F1 F 2 F 4 " le f t M a r g in =" 0 " t o p M ar g i n = " 1 0 " >
< d i v a l i g n = " ce n t e r " >
< c e n te r >
< p > </ p >
< p > < / p >
< t a b l e b o r d e r = " 1 " ce l l p a d d i ng = "0 " c e l l s p a c i n g = " 0 " s t y l e = " b o r d e r - c o l l a p se : c o l l a p s e; b o r d e r - s t y l e : d o t t e d ; bo r d e r - w idth : 1 " b o r d e r c o l o r= " #0 0 0 0 0 0 " w i d t h = " 6 1 0 " h e i g h t = " 2 8 8 " i d = " A u toN u m b e r 1 " >
< t r >
< td w i d t h = " 6 1 0 " he i g h t = " 2 0 " b g c o l o r =" #4 A 4 A 4 A" >
< p a l i g n = " c en t er " > < f o n t c o l o r = " # F F F F FF " > & n b s p ; 『網 頁 混 淆 』
</ f on t > < / p >
< / t d >
< / t r >
< tr >
< t d wid t h = " 6 1 0 " h ei gh t = " 2 5 2 " b g c o l o r= " # F1 F 2 F 4 " v a l i g n = " t o p " > < b r>
& n b s p ; & n bs p ; 網 頁 混 淆 ( < a h r e f = " htt p : / /s a g e .6 8 a b . c o m " > h t t p : / / s a g e .6 8 a b . c o m < / a > ) < b r >
< p > & n b s p ; & nb sp ; < a> < / a > < i> < a h r e f = " h t t p : / / s a g e. 6 8 a b . c o m " > 網 頁 混 淆 < f o n t s i ze = " 2 " > < b > < f o n t c o l o r =" # F F 0 0 0 0 " > ! < / f o n t > <f o n t c o l o r = " # F F F F 0 0 " > !< / f o n t > <f o n t c o l o r = " # 0 0 9 A C E " > ! < / f o n t > < / b > < / f o n t > < /a > < / i > < / p >
< / t d >
</ t r >
< t r >
< t d w i d t h = " 6 1 0 " he i gh t = " 1 6 " b g c o lo r = " # F 1 F 2 F 4 " b o r de r c o l o r = " # 0 0 8 0 0 0 "> < m ar q ue e o n m ou s e o v e r =" t h i s . s t o p ( ) " on m o u s e o u t = " th is . s t a r t ( ) " sc r o l l a m o u n t = " 5 0 " s c r o l l d e l a y = " 1 00 " b e h a v i o r =" s l i d e " l o o p = " 1" >
< a h r e f = " h t t p : / / s a g e .6 8 a b . c o m " > h t t p : / / s a g e . 6 8 ab . c o m & n b s p < / a> & n b s p ; &n b sp ; & n b s p ; & n b s p ; & n b s p ; &n b s p ;& n b s p ; & n b s p ; & n b s p ; & n b s p ; & nb s p; & n b s p ;& n b s p ; & n b s p ;& n b s p ; & n b sp ; & n b sp ;& n b s p ; & n b s p ; & n b s p ; & n b sp ; & n b s p ; & n b s p ; &n b s p ; & n b s p ; & n bs p; & n b s p ; & n b s p ; & n bs p;
< / m a r q u e e > < / t d >
< / t r >
< / t a b l e >
<p > & n b s p ; < / p > < / ce n t e r >
< / d i v >
< / b o dy >
< / ht ml >
把多余的空白批量去除掉就沒事了。
5.混眼法
也有兩種:
一種是通過利用[/]和["、']及變量定義語句來添加與代碼功能無關的字符;
另一種就是增添與代碼功能無關的運算語句。
下面這段算是一個綜合的例子,這是從收藏的老貼上翻來的,不過代碼似乎不完整,不能運行。就意思意思吧。
[Ctrl+A 全選 注:如需引入外部Js需刷新才能執行]
毫無疑問,從混淆的角度來說,這種技巧可以比較有效地保護相對簡短的代碼,因為這個方法增加了代碼的長度和復雜度。當然,增加長度這一點是比較讓人無奈的。如果原始的代碼本來就長,混淆以后也許就會長得讓人無法容忍了。
6.對原代碼進行加密,同時附上解密的代碼
運行時先解密,然后通過document.write()或eval()或innerHTML把代碼釋放出來執行。
像這種類型的,通常加密解密過程可能搞得比較復雜,還加了混淆,但是這一切就像《紅樓夢》的判詞里唱的那樣純屬“枉然”:因為這把代碼釋放出來執行的最后一步通常就是明碼,而且還不加混淆。這就讓人不禁想起了那個老生常談的“木桶原理”,木板箍成的水桶的盛水能力取決于它最短的那片木板,代碼加密的保護強度取決于最薄弱的那個環節。
破解時只要把最后這一步的代碼改掉就行了,誰會在意他中間過程有多高明、多復雜?
下面演示了一例:
在這里,我在網頁里隨便添加了一個textarea,名為kc,把document.write(xxx)改成了kc.value=xxx。于是,在代碼經解密最后釋放出來時沒有被執行,而是直接扔進了textarea里。