「Sqlserver」数据分析师有理由爱Sqlserver之三-最值得使有低投入高产出的Sqlserver功能...
數據分析師群體,有別于一般的傳統開發群體和數據庫運維群體,對Sqlserver的功能需求上也各不相同,本篇以筆者的親身經歷,用一種有別于一般性教程的角度來講解Sqlserver值得我們學習,投入產出比高的一些功能模塊。
當然,知道地越多,能夠產生的價值也越大,在平衡投入產出比的前提下,越往深入學習,在特定時候會產生成倍的回報。
相關閱讀
數據分析師有理由愛Sqlserver之一-好用的插件工具推薦
數據分析師有理由愛Sqlserver之二-像使用Excel一般地使用SqlServer
數據分析師的定義
雖然真正意義上的數據分析師是很高級的分析水平,也有超強的學習能力,大不必來閱讀筆者所寫的這些不太有營養的入門讀物。
但就像市面上大家都對一個小軟件叫系統,一個簡單進銷存叫ERP一樣,大家對數據分析師的稱號也是很大的寬容,類似筆者這樣一個三流分析水平,經常各種方向到處尋覓的各種知識領域的人,也能叫上個數據分析師的頭銜。
本篇的定義的數據分析師也同樣是寬泛的,可能只是一個普通數據文員,統計員的角色,但誰都是從普通工作做起,普通數據統計慢慢爬升起來的,筆者也相信這些分享也可以幫助許多的沒有明確方向指引的、在數據領域摸爬滾打的人群帶來一些幫助的。
數據分析師的剛需
普通的數據分析師,在數據量不大的情形下,使用Excel是一個很不錯的選擇,但數據量一大,Excel的性能也開始出現瓶頸,就算是現在自助式BI技術的普及,對于定位為單機版的Excel、ACCESS、PowerBIDesktop等工具來說,仍然容易存在性能的瓶頸。
所以,筆者對數據分析師的剛需理解為:數據存儲和數據查詢與處理方面的相關功能。對應于Sqlserver的使用場景是,能夠幫我們把數據順利地把手頭上的數據放到數據庫中集中式存放,當要使用時,可以將其重新導出,并且可以適當地作一些加工處理如多個表關聯查詢,數據顆粒度的匯總聚合等。最終可以有很好的載體來承接這些數據如導出至Excel表格或導入到PowerBI模型或其他SPSS、python等更專業的分析軟件或工具中。
總結為Sqlserver上的功能掌握為:數據導入導出、會使用SQL查詢數據,知道怎樣使用其他軟件工具訪問Sqlserver數據。
數據分析師的進階需求
有了前面的一些簡單掌握后,基本可滿足自身的數據分析需求,但如果需要更加自動化、更靈活安全地數據分發、對數據運算性能的更多地優化,也是需要繼續學習Sqlserver的其他一些企業級的功能知識點的。
企業級IT主導和個人部門級業務主導很大的差異點在于企業級的解決方案可滿足到:數據權限控制,流程自動化處理,流程穩定性保障,性能并發性滿足等等,這些都是單機版文件型的解決方案所難于滿足到的。
所以進階性的需求對應于Sqlserver的知識點為:登錄名、用戶名的運維,各數據表、視圖、存儲過程等數據庫對象的權限授予分發,查詢性能的優化如索引的添加維護、復雜SQL查詢的創建,特別是專為數據分析師準備的數據分析窗口函數非常有必要完全掌握,還有一些自動化調度作業系統的使用滿足流程的自動化。
數據分析師較少需要關注到的方面
因數據分析的場景不像生產數據環節的業務系統那般高要求,例如不能隨便出錯,沒有機會讓你隨便死機后重啟系統,應對大量用戶的高并發查詢請求和數據增刪改查任務,所以往往一些教材上談及的高級的功能,對數據分析的群體來說,都是非常少的應用面和非常不實用的知識。
例如:數據庫鎖機制、觸發器、事務、游標、高性能查詢優化、日志的維護等等。這些知識點如果在學習過程中遇到,筆者認為只需略略地帶過,了解一下即可。
更合理的方案是數據分析使用的數據庫,與業務系統的數據庫分離,一般專業一點的叫法是組建一個數據中心或數據倉庫,專門用于數據分析的查詢性需求(這個一般專業做法是使用BI系統中的數據ETL工具,將數據從生產性環境同步一份到分析服務器上)。
有了專門不受生產環境影響的數據倉庫,再怎么出錯,也最多重啟一下,數據不會因這短暫的停止而影響業務進展,同時一般分析性的數據倉庫,并發性訪問也不高,也無需苦苦地為了優化一個查詢從100秒的等待時間優化為1秒這種需要大量的知識儲備和專業知識才能完成的高難度任務。
結語
經過以上的簡單梳理,再結合上兩篇提及的Sqlserver的使用方式(盡可能地使用界面化操作完成降低難度和大量使用外部工具插件提升SQL書寫的便捷性),自己再入門一些簡單的教程和示例(微軟MSDN和微軟Learn等資源已經非常豐富,易學),相信對于一名數據庫新手來說,要往數據分析師方向發展,往前邁出一步學習下Sqlserver也不會是太難的事情。
當然筆者也會在日后有限的時間內,盡量分享一些簡單易行、功能強大的個人的知識輸出和觀點分享,相信是除了系統學習外一個很好的補充,祝讀者朋友們在學習上一路順利,有問題多回來交流。如果覺得受用,也請多多幫忙傳播分享給有需要的人。
筆者未來聚焦在數據領域的分享,不限于Excel,會分享更多Sqlserver、dotNET、Azure、PowerBI等話題,升級數據分析的能力,歡迎繼續關注。
關于Excel催化劑
Excel催化劑先是一微信公眾號的名稱,后來順其名稱,正式推出了Excel插件,插件將持續性地更新,更新的周期視本人的時間而定爭取一周能夠上線一個大功能模塊。Excel催化劑插件承諾個人用戶永久性免費使用!
Excel催化劑插件使用最新的布署技術,實現一次安裝,日后所有更新自動更新完成,無需重復關注更新動態,手動下載安裝包重新安裝,只需一次安裝即可隨時保持最新版本!
Excel催化劑插件下載鏈接:https://pan.baidu.com/s/1Iz2_NZJ8v7C9eqhNjdnP3Q
聯系作者公眾號取名催化劑,因Excel本身的強大,并非所有人能夠立馬享受到,大部分人還是在被Excel軟件所虐的階段,就是頭腦里很清晰想達到的效果,而且高手們也已經實現出來,就是自己怎么弄都弄不出來,或者更糟的是還不知道Excel能夠做什么而停留在不斷地重復、機械、手工地在做著數據,耗費著無數的青春年華歲月。所以催生了是否可以作為一種媒介,讓廣大的Excel用戶們可以瞬間點燃Excel的爆點,無需苦苦地掙扎地沒日沒夜的技巧學習、高級復雜函數的燒腦,最終走向了從入門到放棄的道路。
最后Excel功能強大,其實還需樹立一個觀點,不是所有事情都要交給Excel去完成,也不是所有事情Excel都是十分勝任的,外面的世界仍然是一個廣闊的世界,Excel只是其中一枚耀眼的明星,還有其他更多同樣精彩強大的技術、工具等。*Excel催化劑也將借力這些其他技術,讓Excel能夠發揮更強大的爆發!
關于Excel催化劑作者
姓名:李偉堅,從事數據分析工作多年(BI方向),一名同樣在路上的學習者。
服務過行業:零售特別是鞋服類的零售行業,電商(淘寶、天貓、京東、唯品會)
技術路線從一名普通用戶,通過Excel軟件的學習,從此走向數據世界,非科班IT專業人士。
歷經重重難關,終于在數據的道路上達到技術平原期,學習眾多的知識不再太吃力,同時也形成了自己的一套數據解決方案(數據采集、數據加工清洗、數據多維建模、數據報表展示等)。
擅長技術領域:Excel等Office家族軟件、VBA&VSTO的二次開發、Sqlserver數據庫技術、Sqlserver的商業智能BI技術、Powerbi技術、云服務器布署技術等等。
2018年開始職業生涯作了重大調整,從原來的正職工作,轉為自由職業者,暫無固定收入,暫對前面道路不太明朗,苦重新回到正職工作,對Excel催化劑的運營和開發必定受到很大的影響(正職工作時間內不可能維護也不可能隨便把工作時間內的成果公布于外,工作外的時間也十分有限,因已而立之年,家庭責任重大)。
和廣大擁護者一同期盼:Excel催化劑一直能運行下去,我所惠及的群體們能夠給予支持(多留言鼓勵下、轉發下朋友圈推薦、小額打賞下和最重點的可以和所在公司及同行推薦推薦,讓我的技術可以在貴司發揮價值,實現雙贏(初步設想可以數據顧問的方式或一些小型項目開發的方式合作)。
總結
以上是生活随笔為你收集整理的「Sqlserver」数据分析师有理由爱Sqlserver之三-最值得使有低投入高产出的Sqlserver功能...的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: .NET Core 3.0 发布小尺寸
- 下一篇: .netcore项目docker化,以及