SEO新手入门笔记
2019獨角獸企業重金招聘Python工程師標準>>>
上個月公司讓我給產品網站做SEO,第一次做這種事情,從中學到一些新東西,在這里做一個總結。什么是SEO
SEO是“搜索引擎優化”的簡稱,目的是提升網站在搜索引擎結果中的排名,讓用戶更容易找到我們的網站,從而帶來更多的網站訪問量。
網絡爬蟲
爬蟲(“crawler”)或蜘蛛(“spider”)是對web機器人一個很形象的概括。它們會遞歸地對網站進行遍歷,順著一個頁面上的鏈接爬到其他頁面上并且獲取頁面的內容然后存儲在自己的服務器上。
SEO的常用方法
可以分為站內優化和站外優化。
站內優化:
因為搜索引擎讀取這個頁面時首先就會查看頁面的title,所以title要根據這個頁面的內容來定,還要包含網站的關鍵字。比如:開源中國有一個FAQ頁面,那么它的title就叫“開源中國-FAQ”,而不要僅僅是FAQ。
每個頁面有一個且最多一個h1標簽,h1標簽的內容也是搜索引擎查看的重點,它應該包含頁面的內容概括和網站關鍵字;h2標簽用來概括這個頁面每個重點的內容,還是以FAQ舉例,有個問題是“如何在開源中國注冊用戶”,這個問題就可以寫在h2當中。
咋一看這個名字讓人摸不著頭腦。我們先來看看為什么有這個東西。因為有些網站不同的url可以指向同一個頁面。比如:
http://www.example.com/index.html
http://www.example.com/
http://example.com
http://www.example.com:80/INDEX.HTML
以上這些都是指向同一個頁面,可是機器人不知道它們指向同一個資源,就會反復的去爬,但獲取到的是一樣的內容,這對于搜索引擎是無用甚至有害的,因為可能會造成環路。所以我們要給每個頁面指定一個規范化的url,蟲子就會采用這個我們推薦的url作為這個頁面的固定url,如此當它通過其他url再爬過來的時候,一對比就能知道這個頁面是不是已經爬過了。
在head中添加如下代碼即可:
<link rel="canonical" href="http://www.example.com/index.html" />
在head標簽中,記得添加頁面的關鍵字和描述,爬蟲會收錄這些內容,所以挑選關鍵字也很重要,能概括這個頁面的內容,還得體現自己網站的特色。描述就是概括這個頁面的一句話,在搜索結果的網頁快照下面會顯示出來,不信可以用google搜索“開源中國”試試。
<meta name="keywords" content="faq,問題,解答,開源中國"> <meta name="description" content="開源中國常見問題集合">
alt屬性本意是在圖片無法在頁面上正確顯示出來時用文本替代顯示圖片內容的,所以搜索引擎會讀取圖片的alt屬性來查看圖片內容。
可以在head標簽中使用index和follow,明確告訴爬蟲整個頁面的內容希望被加到搜索引擎索引中,鏈接也會被追蹤;反之,可以使用noindex,nofollow告訴它這個頁面的所有內容都不被索引,所有鏈接都不要追蹤。
<meta name="robots" content="index, follow">
robots.txt是一個放在網站根目錄下的文件,我們可以在這里看到開源中國的robots.txt文件。它不是一個強制協議,而是搜索引擎自愿遵守的一套約束規范,我們可以用它來告訴爬蟲網站哪些部分可以被訪問,哪些部分拒絕訪問。詳細用法參見百度百科。
很有趣的是淘寶,顯然它不愿意百度訪問任何內容。
同時,robots文件中可以引入網站地圖sitemap,把網站上所有頁面的鏈接列出來,爬蟲會根據列出來的鏈接去讀取頁面,可以減少爬蟲的工作量。
以上都是一些技術手段,而好的內容才會有人來看有人轉載,所以定期更新內容,最好有原創的文章,這樣別人轉載的次數才會多,搜索引擎也會以此判斷這是一個優秀的內容,應該被排在前面。
站外優化:
以上是本人對seo的一些淺見。
轉載于:https://my.oschina.net/zombiecat/blog/93964
總結
- 上一篇: cesss
- 下一篇: 童继龙:论ERP顾问的创新分享与专业精神