通过聚合数据API获取微信精选文章
生活随笔
收集整理的這篇文章主要介紹了
通过聚合数据API获取微信精选文章
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
思路
- 在聚合數據申請賬號(https://www.juhe.cn/)
- 通過聚合數據api獲取微信精選文章api
- 通過
newspaper庫提取相應的文本內容,關于newspaper庫的使用方法可以參考這里
代碼
# -*- coding: utf-8 -*-# !/usr/bin/env python# Time: 2019/5/9 18:57# Author: sty# File: get_data.pyimport json, urllib
from urllib.parse import urlencode
import requests
import json
import re
from newspaper import Articledef remove_punctuation(strs):"""去除標點符號:param strs::return:"""return re.sub("[\s+\.\!\/<>“”,$%^*(+\"\']+|[+——!,。?、~@#¥%……&*()]+", "", strs.strip())def remove_unusual_upunctuation(strs):"""去除標點符號:param strs::return:"""return re.sub("[\s+\.\!\/<>“”,$%^*(+\"\']+|[+——、~@#¥%……&*()]+", "", strs.strip())# 獲取當天的詳細信息
def request():url = "http://v.juhe.cn/weixin/query"payload = {"pno": 1,"ps":50,"dtype":"json","key":"_______" # 這里填寫自己在聚合數據申請api時,產生的key}f = requests.get(url,params=payload)res = json.loads(f.text)for detail in res["result"]["list"]:url = detail["url"]article = Article(url, language='zh') # Chinesearticle.download()article.parse()text_res = article.text[:].strip()print("Title is :", detail["title"])text_res = text_res.replace("\n\n", "")print(remove_unusual_upunctuation(text_res))if __name__ == '__main__':request()
總結
以上是生活随笔為你收集整理的通过聚合数据API获取微信精选文章的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: FastAI 2019课程学习笔记 le
- 下一篇: HTTP服务器端常用推送技术