前言
隨機森林的出現,是為了解決決策樹對訓練數據過擬合的問題而出現的。決策樹在訓練的工程中,可以讓每一個葉子節點的不確定性降為0(即熵或者基尼指數為0),這樣做可能把訓練數據中的偶然性、異常值或噪聲也當成了“規 律”去學習了
對於複雜高維的數據,隨機森林的算法可以更好的泛化能力
開始探索
scikit-learn
老規矩,先上代碼,看看隨機森林的用法
from sklearn.ensemble i
前言
彩筆運維勇闖機器學習:KNN算法,它也是分類中的一種
開始探索
scikit-learn
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler