當前位置:首頁 » 網路資訊 » 怎樣堅持自學數據分析
擴展閱讀
半歲寶寶可以吃什麼水果 2024-11-28 00:22:31
工行可以網上注銷嗎 2024-11-28 00:21:48

怎樣堅持自學數據分析

發布時間: 2024-10-15 15:49:22

1. 如何在業余時學數據分析

數據分析師中國統計網——一位資深數據分析師的分享
一、掌握基礎、更新知識。
基本技術怎麼強調都不過分。這里的術更多是(計算機、統計知識), 多年做數據分析、數據挖掘的經歷來看、以及業界朋友的交流來看,這點大家深有感觸的。
資料庫查詢—SQL
數據分析師在計算機的層面的技能要求較低,主要是會SQL,因為這里解決一個數據提取的問題。有機會可以去逛逛一些專業的數據論壇,學習一些SQL技巧、新的函數,對你工作效率的提高是很有幫助的。
統計知識與數據挖掘
你要掌握基礎的、成熟的數據建模方法、數據挖掘方法。例如:多元統計:回歸分析、因子分析、離散等,數據挖掘中的:決策樹、聚類、關聯規則、神經網路等。但是還是應該關注一些博客、論壇中大家對於最新方法的介紹,或者是對老方法的新運用,不斷更新自己知識,才能跟上時代,也許你工作中根本不會用到,但是未來呢?
行業知識
如果數據不結合具體的行業、業務知識,數據就是一堆數字,不代表任何東西。是冷冰冰,是不會產生任何價值的,數據驅動營銷、提高科學決策一切都是空的。
一名數據分析師,一定要對所在行業知識、業務知識有深入的了解。例如:看到某個數據,你首先必須要知道,這個數據的統計口徑是什麼?是如何取出來的?這個數據在這個行業, 在相應的業務是在哪個環節是產生的?數值的代表業務發生了什麼(背景是什麼)?對於A部門來說,本月新會員有10萬,10萬好還是不好呢?先問問上面的這個問題:
對於A部門,
1、新會員的統計口徑是什麼。第一次在使用A部門的產品的會員?還是在站在公司角度上說,第一次在公司發展業務接觸的會員?
2、是如何統計出來的。A:時間;是通過創建時間,還是業務完成時間。B:業務場景。是只要與業務發接觸,例如下了單,還是要業務完成後,到成功支付。
3、這個數據是在哪個環節統計出來。在注冊環節,在下單環節,在成功支付環節。
4、這個數據代表著什麼。10萬高嗎?與歷史相同比較?是否做了營銷活動?這個行業處理行業生命同期哪個階段?
在前面二點,更多要求你能按業務邏輯,來進行數據的提取(更多是寫SQL代碼從資料庫取出數據)。後面二點,更重要是對業務了解,更行業知識了解,你才能進行相應的數據解讀,才能讓數據產生真正的價值,不是嗎?
對於新進入數據行業或者剛進入數據行業的朋友來說:
行業知識都重要,也許你看到很多的數據行業的同仁,在微博或者寫文章說,數據分析思想、行業知識、業務知識很重要。我非常同意。因為作為數據分析師,在發表任何觀點的時候,都不要忘記你居於的背景是什麼?
但大家一定不要忘記了一些基本的技術,不要把基礎去忘記了,如果一名數據分析師不會寫SQL,那麻煩就大了。哈哈。。你只有把數據先取對了,才能正確的分析,否則一切都是錯誤了,甚至會導致致命的結論。新同學,還是好好花時間把基礎技能學好。因為基礎技能你可以在短期內快速提高,但是在行業、業務知識的是一點一滴的積累起來的,有時候是急不來的,這更需要花時間慢慢去沉澱下來。
不要過於追求很高級、高深的統計方法,我提倡有空還是要多去學習基本的統計學知識,從而提高工作效率,達到事半功倍。以我經驗來說,我負責任告訴新進的同學,永遠不要忘記基本知識、基本技能的學習。
二、要有三心。
1、細心。
2、耐心。
3、靜心。
數據分析師其實是一個細活,特別是在前文提到的例子中的前面二點。而且在數據分析過程中,是一個不斷循環迭代的過程,所以一定在耐心,不怕麻煩,能靜下心來不斷去修改自己的分析思路。
三、形成自己結構化的思維。
數據分析師一定要嚴謹。而嚴謹一定要很強的結構化思維,如何提高結構化思維,也許只需要工作隊中不斷的實踐。但是我推薦你用mindmanagement,首先把你的整個思路整理出來,然後根據分析不斷深入、得到的信息不斷增加的情況下去完善你的結構,慢慢你會形成一套自己的思想。當然有空的時候去看看《麥肯錫思維》、結構化邏輯思維訓練的書也不錯。在我以為多看看你身邊更資深同事的報告,多問問他們是怎麼去考慮這個問題的,別人的思想是怎麼樣的?他是怎麼構建整個分析體系的。
四、業務、行業、商業知識。
當你掌握好前面的基本知識和一些技巧性東西的時候,你應該在業務、行業、商業知識的學習與積累上了。
這個放在最後,不是不重要,而且非常重要,如果前面三點是決定你能否進入這個行業,那麼這則是你進入這個行業後,能否成功的最根本的因素。 數據與具體行業知識的關系,比作池塘中魚與水的關系一點都不過分,數據(魚)離開了行業、業務背景(水)是死的,是不可能是「活」。而沒有「魚」的水,更像是「死」水,你去根本不知道看什麼(方向在哪)。
如何提高業務知識,特別是沒有相關背景的同學。很簡單,我總結了幾點:
1、多向業務部門的同事請教,多溝通。多向他們請教,數據分析師與業務部門沒有利益沖突,而更向是共生體,所以如果你態度好,相信業務部門的同事也很願意把他們知道的告訴你。
2、永遠不要忘記了google大神,定製一些行業的關鍵字,每天都先看看定製的郵件。
3、每天有空去瀏覽行業相關的網站。看看行業都發生了什麼,主要競爭對手或者相關行業都發展什麼大事,把這些大事與你公司的業務,數據結合起來。
4、有機會走向一線,多向一線的客戶溝通,這才是最根本的。
標題寫著告誡,其實談不上,更多我自己的一些心得的總結。希望對新進的朋友有幫助,數據分析行業絕對是一個朝陽行業,特別是互聯網的不斷發展,一個不談數據的公司根本不叫互聯網公司,數據分析師已經成為一個互聯網公司必備的職位了。
-

2. 如何自學數據分析

很多人都覺得,自己是文科類出身,或者對數理專業不熟悉,會很難上手數據分析。其實不是這樣子的,學習數據分析,不同於程序員,它不會專門要求我們一定要掌握編程,只是理解熟悉就可以。個人的邏輯思維能力、個人興趣所在,以及自身的決心毅力,這些才是構成一個人學成與否的關鍵和最重要因素。
小編覺得最重要的一點就是,我們得清楚企業對數據分析師的基礎技能需求是什麼。這樣我們才能有的放矢。我大抵總結如下:

(1)SQL資料庫的基本操作,會基本的數據管理
(2)會用Excel/SQL做基本的數據分析和展示
(3)會用腳本語言進行數據分析,Python or R
(4)有獲取外部數據的能力,如爬蟲
(5)會基本的數據可視化技能,能撰寫數據報告
(6)熟悉常用的數據挖掘演算法:回歸分析、決策樹、隨機森林、支持向量機等
之後,怎麼安排自己的業余時間就看個人了。總體來說,先學基礎,再學理論,最後是工具。基本上,每一門語言的學習都是要按照這個順序來的。
1、學習數據分析基礎知識,包括概率論、數理統計。基礎這種東西還是要掌握好的啊,基礎都還沒扎實,知識大廈是很容易倒的哈。
2、你的目標行業的相關理論知識。比如金融類的,要學習證券、銀行、財務等各種知識,不然到了公司就一臉懵逼啦。
3、學習數據分析工具,軟體結合案列的實際應用,關於數據分析主流軟體有(從上手度從易到難):Excel,SPSS,stata,R,Python,SAS等。
4、學會怎樣操作這些軟體,然後是利用軟體從數據的清洗開始一步步進行處理,分析,最後輸出結果,檢驗及解讀數據。