Interview:機器學習演算法工程師求職九大必備技能之【數學基礎、工程能力、特徵工程、模型評估、優化演算法、機器學習基本概念、經典機器學習模型、深度學習模型、業務與應用】(建議收藏,持續更新)

語言: CN / TW / HK

Interview:機器學習演算法工程師求職九大必備技能之【數學基礎、工程能力、特徵工程、模型評估、優化演算法、機器學習基本概念、經典機器學習模型、深度學習模型、業務與應用】(建議收藏,持續更新)

目錄

一、數學基礎

1.1、概率論

1.2、線性代數

1.3、微積分

1.4、凸優化

1.5、資訊理論

二、工程能力

2.1、資料結構與演算法

(1)、樹與相關演算法

(2)、圖與相關演算法

(3)、雜湊表

(4)、矩陣運算與優化

2.2、大資料處理

(1)、MapReduce

(2)、Spark

(3)、HiveQL

(4)、Storm

2.3、機器學習平臺

(1)、TensorFlow

(2)、Torch

(3)、Theano

2.4、平行計算

2.5、資料庫和資料倉庫

2.6、系統服務架構

三、特徵工程

3.1、特徵離散化與歸一化

3.2、特徵組合

3.3、特徵選擇

3.4、詞嵌入表示

四、模型評估

4.1、評價指標

4.2、A/B測試

4.3、過擬合與欠擬合

4.4、超引數選擇

五、優化演算法

5.1、損失函式

5.2、正則化

5.3、EM演算法

5.4、梯度下降/隨機梯度下降

5.5、反向傳播

5.6、梯度驗證

5.7、Momentum

5.8、AdaGrad

5.9、Adam

六、機器學習基本概念和分類

6.1、基本概念

(1)、假設空間

(2)、訓練/測試資料

(3)、標註

(4)、損失函式

6.2、按資料分類

(1)、分類

(2)、迴歸

(3)、序列標註

6.3、按監督分類

(1)、監督學習

(2)、非監督學習

(3)、強化學習

6.4、按模型分類

(1)、生成式模型

(2)、判別式模型

七、經典機器學習模型

7.1、監督學習

(1)、經典演算法

(2)、概率圖模型

7.2、非監督學習

(1)、層次聚類

(2)、k均值聚類

(3)、高斯混合模型

(4)、主題模型

7.3、整合學習

(1)、Bagging

(2)、Boosting

(3)、GBDT

(4)、隨機森林

7.4、降維演算法

7.5、取樣

7.6、強化學習

八、深度學習模型

8.1、前向神經網路

(1)、多層感知機

(2)、卷積神經網路

(3)、深度殘差網路

(4)、自組織對映神經網路

(5)、受限玻爾茲曼機

8.2、迴圈神經網路

(1)、迴圈神經網路

(2)、長短期記憶模型

(3)、注意力機制

(4)、Seq2Seq

8.3、深度學習優化技巧

(1)、批量歸一化

(2)、Dropout

(3)、啟用函式

8.4、強化學習

8.5、生成式對抗網路

九、業務與應用

9.1、計算機視覺

9.2、自然語言處理

9.3、推薦系統

9.4、計算廣告

9.5、智慧遊戲


相關文章\ AI:幾張圖理清人工智慧與機器學習、知識發現、資料探勘、統計學、模式識別、神經計算學、資料庫之間的曖昧關係

一、數學基礎

相關文章\ ML與math:機器學習與高等數學基礎概念、程式碼實現、案例應用之詳細攻略——基礎篇\ ML與math:機器學習與高等數學基礎概念、程式碼實現、案例應用之詳細攻略——進階篇\ DL之simpleNet:利用自定義的simpleNet(設好權重)對新樣本進行預測、評估、輸出梯度值

1.1、概率論

  • 常用概率分佈
  • 大數定理和中心極限定理
  • 假設檢驗
  • 貝葉斯理論

1.2、線性代數

1.3、微積分

1.4、凸優化

1.5、資訊理論

二、工程能力

2.1、資料結構與演算法

相關文章\ Algorithm:【Algorithm演算法進階之路】之資料結構二十多種演算法演示\ Algorithm:【Algorithm演算法進階之路】之十大經典排序演算法\ Algorithm:【Algorithm演算法進階之路】之資料結構基礎知識\ Algorithm:【Algorithm演算法進階之路】之資料結構相關習題(陣列、字串、連結串列、棧、佇列、樹、圖、雜湊)\ Algorithm:【Algorithm演算法進階之路】之演算法中的數學程式設計(時間速度、進位制轉換、排列組合、條件概率、斐波那契數列)相關習題\ Algorithm:【Algorithm演算法進階之路】之演算法(查詢、排序、遞迴、複雜度、高階演算法)相關習題\ Algorithm:【Algorithm演算法進階之路】之機器學習相關習題\ Algorithm:【Algorithm演算法進階之路】之Python語言相關習題

(1)、樹與相關演算法

(2)、圖與相關演算法

(3)、雜湊表

(4)、矩陣運算與優化

2.2、大資料處理

相關文章\ BigData:大資料開發的簡介、核心知識(linux基礎+Java/Python程式語言+Hadoop{HDFS、HBase、Hive}+Docker)、經典場景應用之詳細攻略\ Job:人工智慧&大資料的相關職位——【資料分析師】的簡介、技能、待遇、進階的詳細攻略

(1)、MapReduce

(2)、Spark

(3)、HiveQL

(4)、Storm

2.3、機器學習平臺

相關文章\ DL框架:主流深度學習框架(TensorFlow/Pytorch/Caffe/Keras/CNTK/MXNet/Theano/PaddlePaddle)簡介、多個方向比較、案例應用之詳細攻略\ DL框架之MXNet :深度學習框架之MXNet 的簡介、安裝、使用方法、應用案例之詳細攻略\ DL框架之Caffe:深度學習框架之Caffe的簡介、安裝、使用方法詳細攻略\ DL之paddlepaddle:百度深度學習框架paddlepaddle飛槳的簡介、安裝、使用方法之詳細攻略\ DL:深度學習框架Pytorch、 Tensorflow各種角度對比\ DL框架之Tensorflow:深度學習框架Tensorflow的簡介、安裝、使用方法之詳細攻略\ DL框架之TensorFlow:深度學習框架TensorFlow Core(低級別TensorFlow API)的簡介、安裝、使用方法之詳細攻略\ DL框架之PyTorch:深度學習框架PyTorch的簡介、安裝、使用方法之詳細攻略\ DL框架之darknet:深度學習框架darknet的簡介、安裝、使用方法的詳細攻略\ DL框架之AutoKeras框架:深度學習框架AutoKeras框架的簡介、特點、安裝、使用方法詳細攻略\ DL框架之Keras:深度學習框架Keras框架的簡介、安裝(Python庫)、相關概念、Keras模型使用、使用方法之詳細攻略

(1)、TensorFlow

(2)、Torch

(3)、Theano

2.4、平行計算

2.5、資料庫和資料倉庫

Database之SQLSever:SQLSever資料庫管理學習並深入理解SQL命令語句進階綜合篇《初級→中級→高階》(持續更新,建議收藏)

2.6、系統服務架構

三、特徵工程

相關文章\ ML之DataScience:基於機器學習處理資料科學(DataScience)任務(資料分析、特徵工程、科學預測等)的簡介、流程、案例應用執行詳細攻略\ ML之FE:資料處理—特徵工程之稀疏特徵的簡介、如何處理、案例應用之詳細攻略\ ML之FE:資料處理—特徵工程的簡介、使用方法、案例應用之詳細攻略

\  

3.1、特徵離散化與歸一化

3.2、特徵組合

3.3、特徵選擇

3.4、詞嵌入表示

四、模型評估

相關文章\ ML之模型評價指標(損失函式):基於不同機器學習框架(sklearn/TF)下演算法的模型評估函式(Scoring/metrics)集合(僅程式碼實現)

4.1、評價指標

4.2、A/B測試

4.3、過擬合與欠擬合

DL之DNN優化技術:DNN中抑制過擬合/欠擬合、提高泛化能力技術的簡介、使用方法、案例應用詳細攻略

4.4、超引數選擇

DL之模型調參:深度學習演算法模型優化引數之對深度學習模型的超引數採用網格搜尋進行模型調優(建議收藏)

五、優化演算法

5.1、損失函式

ML之LF:機器學習中常見損失函式(LiR損失、L1損失、L2損失、Logistic損失)求梯度/求導、案例應用之詳細攻略\ ML之LF:機器學習中常見的損失函式(連續型/離散型)的簡介、損失函式/代價函式/目標函式之間區別、案例應用之詳細攻略

5.2、正則化

AI:神經網路調參(資料、層數、batch大小,學習率+啟用函式+正則化+分類/迴歸)並進行結果視覺化

5.3、EM演算法

5.4、梯度下降/隨機梯度下降

5.5、反向傳播

5.6、梯度驗證

5.7、Momentum

DL之DNN優化技術:GD、SGD、Momentum、NAG、Ada系列、RMSProp各種程式碼實現之詳細攻略

5.8、AdaGrad

5.9、Adam

六、機器學習基本概念和分類

6.1、基本概念

(1)、假設空間

(2)、訓練/測試資料

(3)、標註

(4)、損失函式

6.2、按資料分類

(1)、分類

(2)、迴歸

(3)、序列標註

6.3、按監督分類

相關文章\ ML之SL:監督學習(Supervised Learning)的簡介、應用、經典案例之詳細攻略\ ML之UL:無監督學習Unsupervised Learning的概念、應用、經典案例之詳細攻略\ ML之SSL:Semi-Supervised Learning半監督學習的簡介、應用、經典案例之詳細攻略

(1)、監督學習

(2)、非監督學習

(3)、強化學習

6.4、按模型分類

(1)、生成式模型

(2)、判別式模型

七、經典機器學習模型

7.1、監督學習

(1)、經典演算法

支援向量機

邏輯迴歸

決策樹

(2)、概率圖模型

樸素貝葉斯

最大熵模型

隱馬爾可夫模型

條件隨機場

7.2、非監督學習

相關文章\ ML之Clustering之普聚類演算法:普聚類演算法的相關論文、主要思路、關鍵步驟、程式碼實現等相關配圖之詳細攻略

(1)、層次聚類

(2)、k均值聚類

(3)、高斯混合模型

(4)、主題模型

7.3、整合學習

相關文章\ EL:整合學習(Ensemble Learning)的概念講解、問題應用、演算法分類、關鍵步驟、程式碼實現等相關配圖詳細攻略

(1)、Bagging

(2)、Boosting

(3)、GBDT

(4)、隨機森林

7.4、降維演算法

FE之DR之線性降維:PCA/白化、LDA演算法的數學知識(協方差矩陣)、相關論文、演算法驟、程式碼實現、案例應用等相關配圖之詳細攻略

7.5、取樣

DataScience:對嚴重不均衡資料集進行多種取樣策略(隨機過抽樣、SMOTE過取樣、SMOTETomek綜合取樣、改變樣本權重等)簡介、經驗總結之詳細攻略

7.6、強化學習

ML之RL:強化學習Reinforcement Learning的簡介、應用、經典案例、學習資源之詳細攻略

八、深度學習模型

8.1、前向神經網路

(1)、多層感知機

DL之Perceptron:Perceptron感知器(感知機/多層感知機/人工神經元)的簡介、原理、案例應用(相關配圖)之詳細攻略

(2)、卷積神經網路

DL之CNN:計算機視覺之卷積神經網路演算法的簡介(經典架構/論文)、CNN優化技術、調參學習實踐、CNN經典結構及其演化、案例應用之詳細攻略

(3)、深度殘差網路

DL之ResNet:ResNet演算法的簡介(論文介紹)、架構詳解、案例應用等配圖集合之詳細攻略

(4)、自組織對映神經網路

(5)、受限玻爾茲曼機

8.2、迴圈神經網路

(1)、迴圈神經網路

DL之RNN:迴圈神經網路RNN的簡介、應用、經典案例之詳細攻略

(2)、長短期記憶模型

DL之LSTM:LSTM演算法論文簡介(原理、關鍵步驟、RNN/LSTM/GRU比較、單層和多層的LSTM)、案例應用之詳細攻略

(3)、注意力機制

DL之Attention:Attention注意力機制的簡介、應用領域之詳細攻略

(4)、Seq2Seq

8.3、深度學習優化技巧

(1)、批量歸一化

DataScience:深入探討與分析機器學習中的資料處理之線性變換—標準化standardization、歸一化Normalization/比例化Scaling的區別與聯絡

(2)、Dropout

DL之DNN優化技術:利用Dropout(簡介、使用、應用)優化方法提高DNN模型的效能

(3)、啟用函式

  • Sigmoid
  • Softmax
  • Tanh
  • ReLU

ML/DL之啟用函式/求導函式:ML中常用的AF啟用函式(step_function、sigmoid、softmax、ReLU等)&求導函式等程式碼實現之詳細攻略

8.4、強化學習

ML之RL:強化學習Reinforcement Learning的簡介、應用、經典案例、學習資源之詳細攻略

8.5、生成式對抗網路

DL之GAN:生成對抗網路GAN的簡介、應用、經典案例之詳細攻略

九、業務與應用

9.1、計算機視覺

CV:人工智慧之計算機視覺方向的簡介(CV發展史+常用資料集+CV職位)、傳統方法對比CNN類演算法、計算機視覺八大應用(知識導圖+經典案例)之詳細攻略

9.2、自然語言處理

NLP:自然語言處理技術的簡介、發展歷史、案例應用之詳細攻略

9.3、推薦系統

ML之RS:基於使用者的CF+LFM實現的推薦系統(基於相關度較高的使用者實現電影推薦)

9.4、計算廣告

ML之FE:資料處理—特徵工程之高維組合特徵的處理案例(矩陣分解)——基於LoR演算法的廣告點選預估問題

9.5、智慧遊戲

RL之PG:基於TF利用策略梯度演算法玩Cartpole遊戲實現智慧得

「其他文章」