干貨來襲,谷歌最新機器學習術語表(上)



原標題:干貨來襲,谷歌最新機器學習術語表(上)

雷鋒網 AI 研習社按,日前,谷歌發布機器學習術語表,AI 研習社獲其授權轉載。以下術語表中列出了一般的機器學習術語和 TensorFlow 專用術語的定義。本文為 A-L (術語首字母)部分,M-W 部分參見干貨來襲,谷歌最新機器學習術語表(下)。

A

A/B 測試 (A/B testing)

一種統計方法,用于將兩種或多種技術進行比較,通常是將當前采用的技術與新技術進行比較。A/B 測試不僅旨在確定哪種技術的效果更好,而且還有助于了解相應差異是否具有顯著的統計意義。A/B 測試通常是采用一種衡量方式對兩種技術進行比較,但也適用于任意有限數量的技術和衡量方式。

準確率 (accuracy)

分類模型的正確預測所占的比例。在多類別分類中,準確率的定義如下:

在二元分類中,準確率的定義如下:

請參閱真正例和真負例。

激活函數 (activation function)

一種函數(例如 ReLU 或 S 型函數),用于對上一層的所有輸入求加權和,然后生成一個輸出值(通常為非線性值),并將其傳遞給下一層。

AdaGrad

一種先進的梯度下降法,用于重新調整每個參數的梯度,以便有效地為每個參數指定獨立的學習速率。如需查看完整的解釋,請參閱這篇論文。

ROC 曲線下面積 (AUC, Area under the ROC Curve)

一種會考慮所有可能分類閾值的評估指標。

ROC 曲線下面積是,對于隨機選擇的正類別樣本確實為正類別,以及隨機選擇的負類別樣本為正類別,分類器更確信前者的概率。

B

反向傳播算法 (backpropagation)

在神經網絡上執行梯度下降法的主要算法。該算法會先按前向傳播方式計算(并緩存)每個節點的輸出值,然后再按反向傳播遍歷圖的方式計算損失函數值相對于每個參數的偏導數。

基準 (baseline)

一種簡單的模型或啟發法,用作比較模型效果時的參考點?;鶞视兄谀P烷_發者針對特定問題量化最低預期效果。

批次 (batch)

模型訓練的一次迭代(即一次梯度更新)中使用的樣本集。

另請參閱批次規模。

批次規模 (batch size)

一個批次中的樣本數。例如,SGD 的批次規模為 1,而小批次的規模通常介于 10 到 1000 之間。批次規模在訓練和推斷期間通常是固定的;不過,TensorFlow 允許使用動態批次規模。

偏差 (bias)

距離原點的截距或偏移。偏差(也稱為偏差項)在機器學習模型中以 b 或 w0 表示。例如,在下面的公式中,偏差為 b:

請勿與混淆。

二元分類 (binary classification)

一種分類任務,可輸出兩種互斥類別之一。例如,對電子郵件進行評估并輸出“垃圾郵件”或“非垃圾郵件”的機器學習模型就是一個二元分類器。

分箱 (binning)

請參閱分桶。

分桶 (bucketing)

將一個特征(通常是連續特征)轉換成多個二元特征(稱為桶或箱),通常是根據值區間進行轉換。例如,您可以將溫度區間分割為離散分箱,而不是將溫度表示成單個連續的浮點特征。假設溫度數據可精確到小數點后一位,則可以將介于 0.0 到 15.0 度之間的所有溫度都歸入一個分箱,將介于 15.1 到 30.0 度之間的所有溫度歸入第二個分箱,并將介于 30.1 到 50.0 度之間的所有溫度歸入第三個分箱。

C

校準層 (calibration layer)

一種預測后調整,通常是為了降低預測偏差。調整后的預測和概率應與觀察到的標簽集的分布一致。

候選采樣 (candidate sampling)

一種訓練時進行的優化,會使用某種函數(例如 softmax)針對所有正類別標簽計算概率,但對于負類別標簽,則僅針對其隨機樣本計算概率。例如,如果某個樣本的標簽為“小獵犬”和“狗”,則候選采樣將針對“小獵犬”和“狗”類別輸出以及其他類別(貓、棒棒糖、柵欄)的隨機子集計算預測概率和相應的損失項。這種采樣基于的想法是,只要正類別始終得到適當的正增強,負類別就可以從頻率較低的負增強中進行學習,這確實是在實際中觀察到的情況。候選采樣的目的是,通過不針對所有負類別計算預測結果來提高計算效率。

分類數據 (categorical data)

一種特征,擁有一組離散的可能值。以某個名為 house style 的分類特征為例,該特征擁有一組離散的可能值(共三個),即 Tudor, ranch, colonial。通過將 house style 表示成分類數據,相應模型可以學習 Tudor、ranch 和 colonial 分別對房價的影響。




上一篇:昆明中原2016年房地產市場分析 今年房價或將持續上漲
下一篇:民航局:對放行率不達標的機場實施梯度處罰
贵州快3开奖结果