- 大數據分析實訓心得體會 推薦度:
- 相關推薦
數據分析心得體會
在平日里,心中難免會有一些新的想法,寫心得體會是一個不錯的選擇,這樣能夠讓人頭腦更加清醒,目標更加明確。那么要如何寫呢?下面是小編收集整理的數據分析心得體會,歡迎閱讀與收藏。
在數據分析這門課程當中主要學習了numpy和pandas和數據挖掘的知識,學習過程很充實,也不是很難。
首先學習了Numpy, NumPy(Numerical Python)是Python語言的一個擴展程序庫,主要學習了
1、矩陣生成,
2、矩陣切片,
3、軸對換、相乘,
4、條件填入(where),
5、數據處理。NumPy是一個運行速度非常快的數學庫,主要用于數組計算。
在pandas中有兩類非常重要的數據結構,即序列Series和數據DataFrame。Series類似于numpy中的一維數組,除了通吃一維數組可用的函數或方法,而且其可通過索引標簽的方式獲取數據,還具有索引的自動對齊功能;DataFrame類似于numpy中的二維數組,同樣可以通用numpy數組的函數和方法,而且還具有其他靈活應用。之后學習了數據索引index,包括了通過索引值或索引標簽獲取數據以及自動化對齊;此外,pandas模塊為我們提供了非常多的描述性統計分析的指標函數,如總和、均值、最小值、最大值等,我們來具體看看這些函數;在SQL中常見的操作主要是增、刪、改、查幾個動作,那么pandas能否實現對數據的這幾項操作呢?答案是Of Course!我們發現,不論是刪除行還是刪除列,都可以通過drop方法實現,只需要設定好刪除的軸即可,即調整drop方法中的
axis參數。默認該參數為0,表示刪除行觀測,如果需要刪除列變量,則需設置為1。在Excel中有一個非常強大
的功能就是數據透視表,通過托拉拽的方式可以迅速的查看數據的聚合情況,這里的聚合可以是計數、求和、均值、標準差等。pandas為我們提供了非常強大的函數
pivot_table(),該函數就是實現數據透視表功能的。
數據挖掘的技術與方法相關知識包括:數據挖掘的方法分為描述性與預測性兩種。其中描述性數據挖掘指的是分析具有多個屬性的數據集,找出潛在的模式和規律,沒有因變量。要采用的算法:聚類、關聯分析、因子分析、主成分分析等。預測性數據挖掘指的是用一個或多個自變量預測因變量的值。主要算法:決策樹、線性回歸Logistic回歸、支持向量機、神經網絡、判別分析。
通過這幾天的學習我了解到數據分析的復雜性和難度,想要學好的它,還需要我花費很長時間。
【數據分析心得體會】相關文章:
數據分析說課稿11-20
數據分析總結09-30
數據分析報告07-28
數據分析報告09-23
數據分析報告02-02
數據分析工作職責08-07
數據分析簡歷模板08-22
市場數據分析報告11-09
數據分析報告范文01-02