Feed43自定义 RSS 订阅源
Google Reader 的關閉后,到處充斥著 RSS 將死的論調。如今看來并沒有想象中的那么慘,許多人依舊喜歡沿用 RSS 作為自己獲取信息的方式。?前段時間,少數派 Matrix 進行了一次關于 RSS 的討論,其中不乏有許多好的觀點迸發出來。如果你沒有參加,可以閱讀?這篇回顧文章?了解。
我喜歡 RSS,但又苦于許多網站不支持,這時候,就要借助可以將任意網站變成 RSS 訂閱源的工具,我在用的是 Feed43。
你可能會好奇,它是怎樣做到的呢?通俗來說,網站通過后臺發布的消息在你的瀏覽器上顯示時,有許多代碼段落是重復的。拿少數派來講,每一篇在首頁顯示的文章,使用了同一種樣式,變化的只是內容。Feed43 通過建立特定的篩選器來過濾復雜的樣式,簡化成 RSS 訂閱源。
所以,利用 Feed43 制作自己的 RSS 訂閱源時,你可能需要對網頁使用的 HTML 語言有一些基本的了解。不過,你完全不必擔心這一點,通過下面的例子,你很容易看明白。
手把手教你制作?RSS 源
我在少數派撰稿,但是并不知道自己的文章會在什么時候被責編發布,于是我就利用我在少數派的個人主頁,制作了一個「少數派發表了我的文章」的 RSS 源。一旦我的文章被發布,就會收到提醒。下面,我就以此為實例,來手把手教你制作一個 RSS 源。
1. 打開需要制作 RSS 內容的頁面,并在 Feed43 上新建一個 RSS 源。
在這里,我打開的是我的個人主頁。因為一旦我的文章被發布,就會在此頁面有內容更新。然后?打開 Feed43,點擊「Create your own feed」開始創建 RSS 源。
2. 在 Feed43 中加載內容頁面,并獲取源碼。
接下來,將個人中心網址復制下來,并粘貼到 Feed43 的對應選框中。后面的 Encoding 代表網頁編碼方式,正常情況下留空就行,Feed43 會自動選擇。
點擊 Reload,你就會在下面的選框中看到當前網頁的源代碼了。其實這些源代碼你也可以通過右鍵點擊相應網頁的空白區域,選擇「查看網頁源代碼」來獲取。不過,這里我們嚴格按照 Feed43 的流程來獲取。
3. 找到內容所在 HTML 字段規律。
這一步就會接觸到 HTML 了,完全不明白 HTML 的朋友也不必擔心,你就當作是找規律小游戲。
滾動鼠標找到內容對應的區域,你會發現不同文章對應著相似源碼。Feed43 有一點做的比較好,它會自動捕捉一些標記標題的源碼,并標識成粉紅色。
4. 復制其中的一段源碼,留做下一步備用。
這一步就是將相似的源代碼復制一段。需要考慮到 3 個小問題:
- 實例中的源碼會包含多篇文章,但只需要復制其中一篇文章對應的那一段源碼就行。
- 復制的部分需要通過你所制作的 RSS 來考慮。例如我這次制作的 RSS 可能會包括文章標題、鏈接、發布時間、摘要等。
- 需要考慮 HTML 語言的格式。HTML 語言在使用時,標記符號是相互對應的。例如標記標題三是:<h3>標題三</h3>。所以復制時不要丟掉后面的標記符號。下面展示了正確和錯誤的示例。錯誤的示例中,丟掉了?</div>。
正確示例
錯誤示例
?最終我復制了一個包含標題、鏈接、摘要和時間的字段,分別如下所示:
<h3 class="post-title"><a href="https://sspai.com/34188">讓輸入更高效有趣,Google 出品的 iOS 鍵盤:Gboard</a></h3> <a href="https://sspai.com/34188">鑒于 Google 輸入法在 Android 上的良好口碑,從 iOS 支持第三方輸入法開始,不少人就一直期盼著它什么時候也能登陸 iOS 平臺。 終于在昨晚,Google 在 A...</a> <span class="publish-time">04月26日</span>5. 將特定的源碼字段變成通用源碼字段。
這一步將上面復制的源碼粘貼到「Item (repeatable) Search Pattern」選框中,「Global Search Pattern」留空即可。
接下來就是精簡源碼。將標題、鏈接,時間等變化的字段刪去用?{%}代替。將固定且多余的字段刪去用?{*}代替。注意,源碼中有換行的地方均需要添加{*}。
如上圖所示,源碼已經被精簡了。點擊 Extract,如果左下方顯示?? OK (N items found),則代表成功了??匆豢醋ト〉降膬热菔欠裼懈袷藉e誤的地方。如果沒有抓取到內容,或者有格式錯誤,則需要繼續仔細調整。這一步需要多嘗試幾次,就能找到經驗了。
如上圖所示,每一篇文章的標題、鏈接、摘要、時間都已經成功抓取了。
6. 完善 RSS 源格式。
接下來,就是完善 RSS 訂閱源格式。如下圖所示,上半部分主要是填寫 RSS 信息,包括名稱和描述,相信大家很好理解。我重點介紹下半部分的填寫。
回到上一步,你會看到變化的字段用?{%+數字}的形式標示出來,而這個?{%+數字}是通用標識符。例如?{%2}代表了所有文章的標題,{%1}或?{%3}代表了所有文章的鏈接。所以,下面填寫時,標題的位置只需要填寫?{%2},當然我在后面加了一個發布時間?{%5}。你只需要把這幾個通用標識符填寫到對于的區域就行,不同的?{%+數字}之間可以填寫隨意的文字、符號過渡。
7. 預覽并使用。
到了這里,基本上宣布大功告成了。點擊 Preview 預覽一下,如下方左圖所示,預覽沒有問題。如右圖所示,你可以通過頁面下方的選項將系統默認的隨機地址改成有意義的地址,方便使用。
我的經驗和感受
使用 Feed43 最大的好處就是,將那些不支持 RSS 的頁面變成 RSS 方便訂閱。而一旦有了 RSS 地址你就有了許多適合自己的玩法,比如我將它同 IFTTT 或者?Superfeedr?結合起來,一旦少數派發表了我的文章,我就會立即收到提醒。又比如,學校的教務處網站會以低頻率更新一些十分重要的信息,然后你又不可能每天打開關注,制作一個 RSS,更新即提醒??傊?#xff0c;你可以運用 Feed43 關注那些自己關心的內容。
你可以免費使用 Feed43 做 RSS 源,但免費版中包含的每條內容都會包含 Feed43 推廣鏈接,而抓取頻率也受到了嚴格的限制。當然,你也可以在官網上通過 Paypal 購買付費版,體驗會好許多。
你可以在?Feed43 官網?了解詳情。
? 本文著作權歸作者所有,并授權少數派獨家使用,未經少數派許可,不得轉載使用。
104
與50位技術專家面對面20年技術見證,附贈技術全景圖
總結
以上是生活随笔為你收集整理的Feed43自定义 RSS 订阅源的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《能源专业的展望及其未来择业方向的分析》
- 下一篇: 为MFC应用程序添加全屏幕显示功能