日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

一日三项令人兴奋的Lucene功能

發布時間:2023/12/3 编程问答 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 一日三项令人兴奋的Lucene功能 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

昨天是富有成效的一天:突然,Lucene有了三個令人興奮的新功能。

表達式模塊

昨天提交的第一個功能是新的expressions模塊 。 這使您可以使用任意String表達式定義用于排序的動態字段。 內置了對JavaScript解析的支持,但是如果您想創建自己的語法,則解析器是可插入的。

例如,您可以使用表達式定義排序字段

sqrt(_score) + ln(popularity)

如果您想主要通過相關性來提供混合排序,并通過受歡迎度字段來提高混合排序。

該代碼非常易于使用。 在TestDemoExpressions.java單元測試用例中,有一些很好的示例,這將在Lucene的下一個穩定版本(4.6)中提供。

可更新的數字文檔值字段

第二個功能也是昨天提交的,它是可更新的數字文檔值字段 ,可讓您使用IndexWriter上的新updateNumericDocValue方法更改以前索引的數字值。 它可以與近實時閱讀器配合使用,因此您可以更新一些文檔的數值,然后重新打開新的近實時閱讀器以查看更改。

該功能目前僅是主干,因為我們可以解決一些涉及特別有爭議的布爾值的剩余問題。 當前它也不適用于稀疏字段,即,僅當該文檔已首先對該字段建立索引時,您才能更新該文檔的值。

結合使用這兩種功能后,您可以使用功能強大的用例,在這些用例中,您可以根據隨時間變化的混合字段進行排序。 例如,也許您測量了用戶單擊搜索結果中每個文檔的頻率,然后使用它來更新popularity字段,然后將該popularity字段用于混合排序。 這樣,當您向用戶學習哪些文檔很受歡迎而哪些文檔不受歡迎時,搜索結果的排名就會隨著時間而變化。

當然,使用自定義外部代碼以前總是可以使用這種功能,但是現在有了表達式和可更新的文檔值,實現起來就變得微不足道了!

免費文字建議

最后,第三個功能是一個新的建議程序實現,即FreeTextSuggester 。 它是與現有建議完全不同的建議者:它不是使用有限的預建建議范圍中的建議,而是使用簡單的ngram語言模型基于1個或2個先前標記來預測可能建議的“長尾巴”。

在ShingleFilter ,它使用ShingleFilter創建ngram,并使用FST存儲和查找生成的ngram模型。 盡管將多個ngram模型緊湊地存儲在單個FST中,但FST仍然會變得很大; 建立在AOL查詢日志上的3克,2克和1克模型為19.4 MB(查詢本身為25.4 MB)。 這是受到Google方法的啟發。

可能不會單獨使用此建議者,而是當您的主要建議者未能找到任何建議時作為備用。 您可以通過Google查看這種行為。 嘗試搜索“ the fast and”,您將看到建議仍然是完整的查詢。 但是,如果您鍵入的下一個單詞是“ burning”,那么google(到目前為止!)突然沒有完整的建議,并退回到其自由文本方法。

參考:我們的JCG合作伙伴 Michael Mc Candless在一天內通過Changeing Bits博客提供了三項令人興奮的Lucene功能 。

翻譯自: https://www.javacodegeeks.com/2013/09/three-exciting-lucene-features-in-one-day.html

總結

以上是生活随笔為你收集整理的一日三项令人兴奋的Lucene功能的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。