【搜索引擎基础知识1】搜索引擎基本架构
生活随笔
收集整理的這篇文章主要介紹了
【搜索引擎基础知识1】搜索引擎基本架构
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
(一)搜索引擎的開發一般可分為以下三大部分
1、數據采集層:一般使用爬蟲獲取互聯網的數據,重要的開源項目有Heritrxi
2、數據分析處理層:將從互聯網上獲取到的數據進行提取歸類、分詞、語義分析得出索引得內容,等待用戶查詢使用,重要的開源項目有Lucene
3、視圖層:也用戶的交互界面,如一個網站的首頁
其基本架構可參考下圖:
總結
以上是生活随笔為你收集整理的【搜索引擎基础知识1】搜索引擎基本架构的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 【搜索引擎基础知识2】网络爬虫
- 下一篇: 关于serialVersionUID的说