Python数据分析之获取数据
生活随笔
收集整理的這篇文章主要介紹了
Python数据分析之获取数据
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
一、獲取數據采用數據倉庫,將所有業務數據經匯總處理,構成數據倉庫(DW)。數據倉庫包括全部事實的記錄、部分維度與數據的整理(數據集市-DM)數據庫與倉庫的對比1.數據庫面向業務存儲,倉庫面向主題存儲。注:主題是較高層次上對分析對象數據的一個完整并且一致的描述2.數據庫針對應用(OLTP),倉庫針對分析(OLAP)3.數據庫組織規范,倉庫可能冗余,相對變化大,數據量大 二、獲取數據采用監測與抓取1.直接解析網頁、接口、文件的信息2.python通常采用urllib、urllib2、requests、scrapy抓取數據或網站,采用PhantomJS、beautifualSoup、Xpath(lxml)解析路徑三、獲取數據--填寫、埋點、日志用戶填寫信息;App或網頁埋點(特定流程的信息記錄點);操作日志四、獲取數據---計算通過已有數據計算生成衍生數據
總結
以上是生活随笔為你收集整理的Python数据分析之获取数据的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 接口测试平台代码实现134: 全局变量-
- 下一篇: python压缩_Python札记 --