Lucene4.3和Lucene3.5性能对比(一)
今天做了對lucene最新版(Lucene4.3)的性能測試,主要與3.5進(jìn)行對比。
我的工作環(huán)境:windows xp 32位, 內(nèi)存4G,可用3G,eclipse indingo。
測試數(shù)據(jù)為json數(shù)據(jù),比較小,索引時均為字符串形式。
json數(shù)據(jù),一個元數(shù)據(jù),格式如下:
{ TURNOVER_INC=526289,PRICE=13.49, NAME=鵬博士, PRICE_PRE=13.49, PERCENT=0.02197, SYMBOL=600804, VOLUME_INC=39000, DATE=2013-07-12 14:15:37, TRADE_TYPE=-1, RN=1, CODE=0600804 }
說明:
a、10萬條,即是對此數(shù)據(jù)重復(fù)進(jìn)行了十萬次索引。
b、索引做了最簡單的處理,全部保存為字符串,并且沒有分詞。
c、略去了讀取磁盤文件時間,for循環(huán),內(nèi)存操作。
結(jié)果如下:
1、索引的數(shù)據(jù)量遞增,lucene建立索引耗時也越多,但是看曲線,明顯lucene3.5更高效一些。
2、對建立好的索引持久化到硬盤時間進(jìn)行了統(tǒng)計(jì),lucene3.5的效率更高一些。
3、對索引數(shù)據(jù)進(jìn)行全量查詢,占用內(nèi)存4.3明顯要高,說明其內(nèi)部肯定有更復(fù)雜的結(jié)構(gòu),占用了一定的內(nèi)存。
4、全量查詢,3.5的查詢速度竟然至少是4.3的8倍,這個有點(diǎn)意料之外了。
5、設(shè)置總數(shù)據(jù)量為100萬,分別對不同數(shù)據(jù)位置的100條數(shù)據(jù)進(jìn)行了查詢操作,結(jié)果如下圖所示,lucene3.5在查詢中段數(shù)據(jù)時耗時最長,而lucene4.3始終維持在一個較低水平,呈線性增長趨勢。
6、對多條件查詢(我這里設(shè)置了兩個條件,都是與)隨時間變化曲線,在多條件查詢時3.5的效率也是明顯優(yōu)于4.3。
?
現(xiàn)在只對lucene最基本的功能做了性能測試,但是還未測試其新功能,還需要進(jìn)一步測試。
?
?
?
轉(zhuǎn)載于:https://www.cnblogs.com/seanvon/p/3173734.html
總結(jié)
以上是生活随笔為你收集整理的Lucene4.3和Lucene3.5性能对比(一)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: adb shell root
- 下一篇: PPT资料下载 - 问题驱动的软件测试设