[Hadoop in China 2011] HBase在淘宝平台上的应用和改进经验
http://tech.it168.com/a2011/1202/1283/000001283152.shtml
在今天下午進行的NoSQL系統(tǒng)及應用分論壇中,來自淘寶的軟件工程師張毅發(fā)表主題演講“淘寶HBase應用和改善”,介紹了HBase在淘寶平臺上使用,以及對HBase的調(diào)試和改進的經(jīng)驗分享。
▲淘寶軟件工程師張毅
隨著淘寶的數(shù)據(jù)的快速增長,數(shù)據(jù)量每年都會翻一翻,這樣的增長速度是淘寶選擇HBase的重要原因。據(jù)張毅介紹,淘寶自今年年初開始對HBase進行預 演,包括線上應用和調(diào)優(yōu),以及bug的修改。這一過程包括三個階段,第一階段是對HBase的屬性和配置等性能方面的熟悉過程;第二階段將HBase應用 到線上;第三階段是修改其內(nèi)部代碼,并投入到HBase的社區(qū)中,使其得到進一步的發(fā)展。
▲淘寶選擇HBase的原因
HBase是分布式NoSQL存儲系統(tǒng),其底層數(shù)據(jù)存儲基于HDFS,具有高可用和高性能的特點,可以處理百億行*百萬列*上萬個版本的列式存儲。談到 淘寶為什么會選擇HBase,張毅表示,淘寶選擇HBase就像當年選擇Hadoop一樣,因其具有海量數(shù)據(jù)處理的能力。淘寶每天的數(shù)據(jù)量都能達到PB 級,需要HBase應對海量數(shù)據(jù)帶來的挑戰(zhàn)。另外,HBase還具有易于橫向擴展、隨機讀寫的高性能、高可靠性和穩(wěn)定性、單行寫入的強一致性的特點。
▲HBase在淘寶的規(guī)模
張毅認為數(shù)據(jù)瞬間寫入量很大,數(shù)據(jù)庫不好支撐或者需要很高成本支撐的場景可以考慮使用HBase,或者數(shù)據(jù)需要長久保存,且量會持續(xù)增長到比較大的場景 可以選擇HBase。但是HBase畢竟不是關系型數(shù)據(jù)庫,因此不適用于有Join、多級索引、表關系復雜的數(shù)據(jù)模型。
▲NoSQL專場爆滿 向坐在地上的同學們致敬
轉(zhuǎn)載于:https://www.cnblogs.com/licheng/archive/2011/12/05/2276414.html
總結(jié)
以上是生活随笔為你收集整理的[Hadoop in China 2011] HBase在淘宝平台上的应用和改进经验的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 修改 gcc 和 g++ 的默认版本
- 下一篇: 小猿圈之java文件重命名