|
參數編碼規范
一.摘要
我們經常要在頁面傳遞中文數據,但是往往被文字編碼所困惑.有時不了解到底是瀏覽器編碼問題還是服務器編碼問題.本文分析了互聯網傳遞數據的編碼原理, 并且提出了完善易用的解決方案.
二.原則
避免在get或者post參數時直接傳遞中文字符.中文參數需要經過編碼后再傳遞.服務器端要使用相同的編碼格式進行解碼
三.錯誤觀點
1.很多程序員認為url中可以傳遞中文.
url中并不能攜帶中文參數.如果我們在瀏覽器中輸入"http://localhost/?a=中文",感覺上我們在url中帶了中文,實際上當按下回車鍵后,瀏覽器自動將其中的"中文"漢字進行編碼后傳遞給服務器.
2.當獲取中文參數產生了亂碼時, 往往首先檢查服務器端程序的編碼格式.
很多人認為url可以傳遞中文,不知道瀏覽器有自動編碼的行為, 所以單純的認為問題出在服務器端.其實即使在服務器端找到了正確的編碼格式,我們也不應該輕易地改變服務器的默認編碼格式.
3.傳遞參數前編碼,使用Request對象獲取參數時解碼
很多的程序員認為認為,傳遞參數時我們使用UrlEncode等方式編碼, 在接收時應該使用UrlDecode解碼.這是常見的錯誤請大家一定要注意,使用默認的Request.QueryString和Request.Form時已經自動執行了一次解碼,使用的解碼格式是服務器端設置的默認編碼格式.
四.原因
傳遞中文字符時,自動的編碼解碼格式和瀏覽器與服務器的設置有關.
測試Firefox3和IE6的Get方式發送中文參數, Firefox默認使用UTF-8格式編碼中文參數, 而IE6即使在高級設置中設置了"總是以 UTF-8 發送URL", 仍然自動使用GB2312編碼中文參數.
對于服務器端我們可以自由的控制解碼的格式.但是往往是通過更改服務器配置進行全局的統一設置.比如對于ASP.NET程序.可以在Web.Config中設置服務器段的編碼和解碼格式:
<globalization culture="zh-CN" uiCulture="zh-CN" requestEncoding="UTF-8" responseEncoding="gb2312" />
但是我們沒法控制瀏覽器端行為.用戶可能使用不同的瀏覽器.
五.解決方案
1.統一默認的編碼格式
(1)設置服務器端的編碼格式為UTF-8
(2)傳遞參數全部進行編碼,.服務器端(C#)使用Server.UrlEncode方法,客戶端(Javascript)使用encodeURIComponent方法.
說明:
客戶端的Javascript函數encodeURIComponent只能使用UTF-8編碼格式. 所以需要設置服務器端request和response都為UTF-8.
缺陷是如果某些合作伙伴必須傳遞其他的編碼格式的參數, 則服務器端或獲取到亂碼.此方案實現簡單,適合大部分場景.
2.通過編碼參數指定編碼格式
為了解決可能存在的無法統一編碼格式的問題, 我們使用一個參數"encoding"來顯示的指定編碼格式.encoding參數需要在所有的請求中傳遞,無論是get還是post.
(1)對于Javascript客戶端編碼而言, 仍然使用encodeURIComponent方法編碼, 此時指定encoding參數的值為"UTF-8".
(2)對于傳入給服務器端的其他編碼格式, 比如GB2312, 我們不能使用默認的Request.Form或者QueryString方法進行編碼.因為服務器端的編碼格式可能設置為了UTF-8.此時使用Request.Form或者QueryString會自動使用服務器端指定的編碼格式進行解碼. 所以需要使用下面的方法自己處理請求,獲取參數:
/// <summary>
/// 根據指定的編碼格式返回請求的參數集合 ziqiu.zhang 2009.1.19
/// </summary>
/// <param name="request">當前請求的request對象</param>
/// <param name="encode">編碼格式字符串</param>
/// <returns>鍵為參數名,值為參數值的NameValue集合</returns>
public static NameValueCollection GetRequestParameters(HttpRequest request, string encode)
{
NameValueCollection result = null;
Encoding destEncode = null;
//獲取指定編碼格式的Encoding對象
if (!String.IsNullOrEmpty(encode))
{
try
{
//獲取指定的編碼格式
destEncode = Encoding.GetEncoding(encode);
}
catch
{
//如果獲取指定編碼格式失敗,則設置為null
destEncode = null;
}
}
//根據不同的HttpMethod方式,獲取請求的參數.如果沒有Encoding對象則使用服務器端默認的編碼.
if (request.HttpMethod == "POST")
{
if (null != destEncode)
{
Stream resStream = request.InputStream;
byte[] filecontent = new byte[resStream.Length];
resStream.Read(filecontent, 0, filecontent.Length);
string postquery = destEncode.GetString(filecontent);
result = HttpUtility.ParseQueryString(postquery, destEncode);
}
else
{
result = request.Form;
}
}
else
{
if (null != destEncode)
{
result = System.Web.HttpUtility.ParseQueryString(request.Url.Query, destEncode);
}
else
{
result = request.QueryString;
}
}
//返回結果
return result;
}
NET技術:參數編碼 完全解決方案,轉載需保留來源!
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。