微软开放必应搜索引擎核心算法
https://www.toutiao.com/a6691434638826537486/
?
5月15日;微軟宣布了開源了部分必應搜索引擎的核心算法,能快速的將搜索結果反饋給用戶。通過開放這項技術;微軟希望開發人員能夠利用這項技術為其他用戶搜索大量數據的用戶提供類似的體驗。
?
普通的用戶可能不清楚;其實我們在使用百度和其他搜索引擎,本質上是利用百度提供api接口去檢索我們想要的數據,要知道在海量的數據中篩選出我們想要的數據是非常困難的,尤其是能做到毫秒級的響應。其背后的核心算法,是由一群數據科學家團隊維護的。
今天開源的軟件是微軟開發的一個庫,它可以更好地利用它收集的所有數據,為Bing 引擎構建的 AI 訓練模型。該算法稱為空間分區樹和圖(SPTAG),使用開源的 Python 庫為核心;允許用戶利用深度學習模型的智能來搜索數十億條信息,可以實現毫秒級的“矢量”搜索;用于更快地向用戶提供更相關的結果。
?
“矢量搜索”可以更好低理解用戶意向,而不是根據關鍵字匹配。例如,如果用戶輸入“巴黎的塔樓有多高?” Bing可以返回一個自然語言結果,告訴用戶 埃菲爾鐵塔是 1,063 英尺,即使搜索查詢中沒有出現“埃菲爾”這個詞,結果中也沒有出現“高”這個詞。
矢量化工作已經擴展到搜索引擎索引的超過1500億條數據,從而改進了傳統的關鍵字匹配。這些匹配包括單個單詞,字符,網頁代碼段,和其他媒體圖片。一旦用戶搜索后,可以快速準確的提供搜索結果。
?
總結
以上是生活随笔為你收集整理的微软开放必应搜索引擎核心算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 我的父亲母亲
- 下一篇: 手把手教你玩转QQ的原创表情