一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

基于HBase Thrift接口的一些使用問(wèn)題及相關(guān)注意事項(xiàng)的詳解

HBase對(duì)于非Java語(yǔ)言提供了Thrift接口支持,這里結(jié)合對(duì)HBase Thrift接口(HBase版本為0.92.1)的使用經(jīng)驗(yàn),總結(jié)其中遇到的一些問(wèn)題及其相關(guān)注意事項(xiàng)。
1. 字節(jié)的存放順序
HBase中,由于row(row key和column family、column qualifier、time stamp)是按照字典序進(jìn)行排序的,因此,對(duì)于short、int、long等類型的數(shù)據(jù),通過(guò)Bytes.toBytes(…)轉(zhuǎn)換成byte數(shù)組后,必須按照大端模式(高字節(jié)在低地址,低字節(jié)在高地址)存放。對(duì)于value,也是同樣的道理。因此,在使用Thrift API(C++、phpPython等)方式時(shí),最好對(duì)于row和value都統(tǒng)一按照大端進(jìn)行pack和unpack處理。
舉個(gè)例子,C++中,對(duì)于int型變量,經(jīng)過(guò)以下方式轉(zhuǎn)換為字典序:
復(fù)制代碼 代碼如下:
string key;
  int32_t timestamp = 1352563200;
  const char* pTs =(const char*) ×tamp;
  size_t n = sizeof(int32_t);
  key.append(pTs, n);

通過(guò)以下方式將字典序轉(zhuǎn)換為int:
復(fù)制代碼 代碼如下:
const char * ts = key.c_str();
int32_t timestamp = *((int32_t*)(ts));

php中則提供了pack和unpack方法進(jìn)行轉(zhuǎn)換:
復(fù)制代碼 代碼如下:
  $key = pack("N", $num);
  $num = unpack("N", $key);

2. TScan的使用陷阱
HBase的php Thrift接口中,TScan可以直接通過(guò)設(shè)置startRow、stopRow、columns、filter等屬性,默認(rèn)這些屬性均為null,設(shè)置后變?yōu)榉莕ull(通過(guò)TScan的構(gòu)造函數(shù)或直接對(duì)TScan的成員變量進(jìn)行賦值)。通過(guò)write()方法和Thrift Server進(jìn)行RPC操作時(shí),直接判斷的依據(jù)是這些屬性不為null,則通過(guò)Thrift協(xié)議傳輸?shù)絋hrift Server端。
但是在C++的Thrift接口中,TScan中有一個(gè)_TScan__isset __isset類型的變量,其內(nèi)部結(jié)構(gòu)如下:
復(fù)制代碼 代碼如下:
typedef struct _TScan__isset {
  _TScan__isset() : startRow(false), stopRow(false), timestamp(false), columns(false), caching(false), filterString(false) {}
  bool startRow;
  bool stopRow;
  bool timestamp;
  bool columns;
  bool caching;
  bool filterString;
} _TScan__isset;

TScan的write()方法則是通過(guò)判斷_TScan__isset下的各個(gè)bool變量標(biāo)記是否設(shè)置了startRow、stopRow、columns、filter等屬性,決定是否將這些屬性通過(guò)Thrift協(xié)議傳輸?shù)絋hrift Server端,而這些屬性必須通過(guò)__set_xxx()方法進(jìn)行設(shè)置才能生效!在TScan的默認(rèn)構(gòu)造函數(shù)中,并不會(huì)對(duì)這些屬性對(duì)應(yīng)的__isset標(biāo)記設(shè)置為true!
因此,如果直接通過(guò)TScan的構(gòu)造函數(shù)初始化startRow、stopRow、columns、filter等屬性會(huì)導(dǎo)致從頭遍歷該表,只有調(diào)用了__set_xxx()方法才會(huì)將對(duì)應(yīng)的bool標(biāo)識(shí)設(shè)置為true,這樣服務(wù)端才會(huì)從Thrift Server獲取startRow、stopRow、columns、filter等屬性進(jìn)行掃描。
3. 并發(fā)訪問(wèn)線程數(shù)
首先,為了盡可能減少由于網(wǎng)絡(luò)傳輸帶來(lái)的時(shí)間開(kāi)銷,HBase的Thrift Server最好和應(yīng)用客戶端部署在同一臺(tái)機(jī)器上。Thrift Server啟動(dòng)時(shí)可以通過(guò)參數(shù)配置并發(fā)線程數(shù),否則很容易導(dǎo)致Thrift Server線程滿了不響應(yīng)客戶端的讀寫(xiě)請(qǐng)求,具體命令:bin/hbase-daemon.sh start thrift --threadpool -m 200 -w 500(更多參數(shù)參考這里:bin/hbase-daemon.sh start thrift -h)。
4. 最大堆內(nèi)存配置
如果客戶端與Thrift Server進(jìn)行scan操作順序讀取數(shù)據(jù),而且設(shè)置了一定的cache記錄條數(shù)(通過(guò)TScan的int32_t caching變量設(shè)置),那么這些被caching的記錄數(shù)可能會(huì)占用Thrift Server相當(dāng)部分的堆內(nèi)存,尤其在多客戶端并發(fā)訪問(wèn)時(shí)更明顯。
因此,在Thrift Server啟動(dòng)前,可以調(diào)大最大堆內(nèi)存,否則可能由于Java.lang.OutOfMemoryError異常而導(dǎo)致進(jìn)程被殺掉,尤其是當(dāng)Scan時(shí)設(shè)置了較大的caching記錄條數(shù)的情況(默認(rèn)為export HBASE_HEAPSIZE=1000MB,可以在conf/hbase-env.sh中設(shè)置)。

php技術(shù)基于HBase Thrift接口的一些使用問(wèn)題及相關(guān)注意事項(xiàng)的詳解,轉(zhuǎn)載需保留來(lái)源!

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。

主站蜘蛛池模板: 精品视频一区二区 | 男人扒开女人腿做爽爽视频网站 | 国产成人自拍视频在线观看 | 巨臀中文字幕一区二区翘臀 | 69视频免费观看l | 怡红院免费全部视频在线视频 | 九九视频精品在线 | 国产嫩草在线观看 | 国产欧美一区二区三区观看 | 久久99国产一区二区三区 | 欧美另类人交videos新 | 五月婷婷在线免费观看 | 国产小视频在线观看免费 | 久久亚洲一级毛片 | 中文字幕加勒比 | 国产大片免费观看中文字幕 | 成人黄色免费网址 | 综合涩 | 色综合中文 | 在线观看www日本免费网站 | 三区在线观看 | 国产成人综合亚洲欧洲色就色 | 成人福利在线看 | 啪一啪在线视频 | 麻豆国产91 | 国产一二三区视频 | 色婷婷精品大全在线视频 | 白嫩美女一级毛片免费看 | www.日本视频 | 亚洲14p | 欧美1314www伊人久久香网 | 特黄未满14周岁毛片 | 四虎影视国产884a精品亚洲 | 黄黄的网站在线观看 | 草草线在成人免费视频 | 国产一级做a爰片久久毛片99 | 在线成人爽a毛片免费软件 在线成人小视频 | 天天色天天爱 | 韩国毛片 | 精品一区二区三区免费 | 久久青青草原精品无线观看 |