python数据科学实践指南_《Python数据科学实践指南》——导读-阿里云开发者社区...
前 言
為什么要寫這本書
我接觸大數據技術的時間算是比較早的,四五年前當大數據這個詞火遍互聯網的時候,我就已經在實驗室里學習編程及算法的知識。那個時候我一心想要做學術,每天閱讀大量的英文文獻,主要興趣更多的是在機器人和人工智能上。研究生畢業時我本來想實現早先的愿望,繼續攻讀博士學位,不過思來想去覺得不應該錯過大數據這個機會,所以毅然決定投入大數據行業中。
在工作之初,市面上已經存在一些介紹大數據相關技術的權威著作,其中很多還是很底層的或特定領域的專著。但即使是我這種自詡為“學院派”的人看這些書,頭腦也會經常開小差。而大數據相關的技術又特別龐雜,包括計算框架、網絡爬蟲、機器學習算法、編程語言、數據庫、文本分析、數據流水線的架構,甚至還包括前端可視化等眾多方面,只有對它們都有涉獵,才能更好地勝任相關的工作。所以我讀過很多的相關圖書,這確實為我以后的工作打下了堅實的基礎,不過隨著工作內容的增加,以及新同事的到來,更多的問題相繼涌現。首當其沖的就是,并不是每個人都有足夠的基礎來閱讀這些專業著作,而且每個人的情況各不相同,有的是編程基礎差,有的是數學基礎差,有的是英語基礎差,這也導致我的這套學習方法難以推廣開來。所以我想寫一本關于大數據技術的手冊,其目的并不是為讀者講明白所有技術背后的原理,而是告訴讀者某項技術可以用于哪些工作中,哪些工作需要哪些工具。
讀完這本手冊,可以幫助讀者建立一個相對完整的大數據生態的概念,其中所講的每一個工具都值得讀者進行更深入的研究(你也可以像我一樣,對其中的兩三項進行非常深入的研究),也許在研究過程中,你會成為該領域的專家。如果現在正在看這本書的你是一位技術決策者,那么我希望本書的介紹能幫助你下定決心使用其中的某項技術,比如寫作全書的Python語言就是一門非常好的數據處理語言,它能快速編碼,且具有強大的字符串處理能力,擁有大量成熟的大數據類庫,這些都使Python成為數據科學領域無可爭議的No. 1語言;或許你的團隊可以僅用Python編寫大規模分布式爬蟲程序(雖然本書介紹的是單機的簡化版)就能大幅度地提升工作的效率。Scrapy可能是爬蟲領域最有名的框架了,你也可以像我一樣實現屬于你自己的版本。當然這本書也是一本Python入門書,所以讀者無須擔心閱讀門檻,你可以從零基礎開始學習,并體驗整個學習過程所帶來的愉悅。
目 錄
[第0章 發現、出發
0.1 何謂數據科學 ](https://yq.aliyun.com/articles/119372/)
0.1.1 海量的數據與科學的方法
0.1.2 數據科學并不是新概念
0.1.3 數據科學是一個系統工程
0.2 如何成為數據科學家
0.3 為什么是Python
0.4 一個簡單的例子
[第1章 Python介紹
1.1 Python的版本之爭 ](https://yq.aliyun.com/articles/119389/)
1.2 Python解釋器
1.2.1 Mac OS X系統
1.2.2 Linux系統
1.2.3 Windows系統
1.3 第一段Python程序
1.4 使用Python shell調試程序
[第2章 Python基礎知識
2.1 應當掌握的基礎知識 ](https://yq.aliyun.com/articles/119418/)
2.1.1 基礎數據類型
2.1.2 變量和賦值
2.1.3 操作符及表達式
2.1.4 文本編輯器
2.2 字符串
2.3 獲取鍵盤輸入
2.4 流程控制
2.4.1 條件判斷
2.4.2 循環
2.4.3 縮進、空白和注釋
總結
以上是生活随笔為你收集整理的python数据科学实践指南_《Python数据科学实践指南》——导读-阿里云开发者社区...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 乱序图片 极验_极验验证吴渊:传统图片验
- 下一篇: websocket python爬虫_p