干貨 | 數據分析師進階必備6大數學利器



【摘要】要想成為資深數據分析師,必須具備一定的數學知識,熟練應用數學技巧,才能更好地使用程序自帶的算法。比如說,理解了算法背后的數學知識,能更好地理解用戶推薦系統的機制。下面為大家總結了數據分析師進階必備6大數學利器,希望對大家有所幫助。

三、線性代數

學什么

Facebook上的朋友推薦、Spotify上的歌曲推薦,通過深度學習把自拍照片轉換為薩爾瓦多·達利風格的人像畫,試問這些操作的共同點是什么?其實就是它們都離不開矩陣和矩陣代數的知識。

線性代數這一重要的數學分支,研究的是機器學習算法如何從數據流中獲取有價值信息。下列是必學的線性代數知識:

矩陣和向量的基本性質:標量乘法、線性變換、轉置、共軛、秩與行列式

內積與外積、矩陣乘法規則及其算法、逆矩陣

特殊矩陣:方陣、單位矩陣、三角矩陣、稀疏矩陣、密集矩陣、單位向量、對稱矩陣、厄米矩陣(又稱自共軛矩陣)、斜厄米矩陣和酉矩陣

矩陣分解概念:LU分解、高斯消元法、求解 Ax = b 線性方程組

向量空間、基向量、擴張空間、正交性、線性最小二乘法

特征值、特征向量、對角化與奇異值分解(SVD)

怎么用

使用降維技術實現主成分分析時,要用奇異值分解來縮減維度,讓數據集參數變得更少。所有神經網絡算法都使用線性代數處理網絡結構和學習操作。

在哪兒學

線性代數:從基礎到精通 — edX,UT Austin

機器學習中的數學知識:線性代數 — Coursera,帝國理工學院,倫敦[

四、微積分

學什么

在上大學的時候,微積分是最讓人頭疼的課程,不過,在數據科學和機器學習領域里,微積分可是無處不在,最簡單的普通最小二乘法問題的分析解決方案離不開微積分,神經網絡中用于學習新模式的反向傳播里也少不了微積分??梢哉f,微積分是你的技能庫里最有價(zhi)值(qian)的技能。下列是要掌握的微積分知識點:

單變量函數、極限與連續、可微性

均值定理、不定式和洛必達法則

最大值與最小值

乘積和鏈式法則

泰勒級數、無限級數求和與積分

積分中值定理與基本公式,定積分與不定積分方程式

Beta 和 Gamma 函數

多變量函數、極限與連續、偏導數

常微分方程與偏微分方程的基礎知識(不必了解過于高級的內容)

怎么用

理解邏輯回歸算法需要微積分的知識,比如怎樣通過“梯度下降”找到最小損失函數。 要了解梯度下降的機制,就會用到微積分的概念 - 梯度、導數、極限和鏈式法則。

在哪兒學

大學預備課 - 微積分 — edX, TU Delft

可汗學院 - 微積分

機器學習中的數學知識:多變量微積分 — Coursera,帝國理工學院,倫敦




上一篇:世界欠他一個圖靈獎,LSTM之父的深度學習“奇跡之年”
下一篇:香港食安中心跟進日本非法進口冷藏蛋白液
贵州快3开奖结果