kmeans 與 GMMs有什麼共同點

1樓：想回從前的時

高斯混合模型就是用高斯概率密度函式（正態分佈曲線）精確地量化事物，它是乙個將事物分解為若干的基於高斯概率密度函式（正態分佈曲線）形成的模型。高斯模型就是用高斯概率密度函式（正態分佈曲線）精確地量化事物

2樓：可能回憶掉進

一，K-Means聚類演算法原理 k-means 演算法接受引數 k ；然後將事先輸入的n個資料物件劃分為 k個聚類以便使得所獲得的聚類滿足：同一聚類中的物件相似度較高；而不同聚類中的物件相似度較校聚類相似度是利用各聚類中物件的均值所獲得乙個「中心物件」。

3樓：Ada

Kmeans和GMM都屬於機器學習裡面的聚類演算法，聚類演算法的目的就是把資料進行分堆，而Kmeans和GMM只是兩種資料分堆的手段，只是實現方式有所不同而已

Kmeans需要預先設定分堆的數量K，設定好之後隨機選取K個資料點放到各個堆裡面，然後計算剩下的點和這K個資料點之間的距離，根據距離把這些點分配到不同的堆裡面，分配好之後又會重新計算各個堆的中點，重新計算各個點到各個堆中點的距離，根據新計算出來的距離重新分配這些點，之後一直持續這個過程，直到各個點到所屬堆的中點的距離是最小距離。在Kmeans裡面，乙個資料點要麼是屬於這個堆，要麼不屬於，是一種比較hard的分類方式，也相對簡單。

而GMM則是假設整個資料是由若干個不同分布的資料堆組成的，這裡的分布通常指的就是正態分佈。用GMM做資料分堆，也是要預先假定分堆的數量K，假定好分堆數量之後給每乙個堆隨機生成分布引數，然後計算每乙個點屬於每乙個堆的概率，根據計算好的概率來重新計算每個堆的分布引數，然後一直持續這個過程，直到各個堆的分布引數不再變化為止。在GMM，乙個資料點到底屬於哪個堆是用概率來表示的，比如說這個點有20%的可能是屬於第乙個堆的，30%的可能是屬於第二個堆的，因此是一種比較soft的分類方式，計算相對來說比較複雜。

從上面2種演算法的分類過程就可以看出，雖然它們基於不同的計算方式進行資料分類，其基本過程都是一樣的，都要預先假設分堆的數量（當然之後來可以尋找最優分堆數），然後做隨機初始化，根據不同指標初步將資料進行分堆，然後再迭代優化分堆。

kmeans 與 GMMs有什麼共同點

為什麼有共情能力的人普遍看不起沒有共情能力的人？

有書共讀是個什麼鬼？

諸如SPI I2C USART等協議有什麼共同點和區別啊？什麼時候該用什麼？

其他用戶還看了：