(2 ,4,10,12,15,3,21)K Means聚類 設定聚類數為2個 相似度按照歐式距離計算?

時間 2021-05-30 18:20:01

1樓:張豪

歐式距離是向量的2-範數:║x║2=(│x1│2+│x2│2+…+│xn│2)^1/2;

KMeans是每次迭代時,劃分向量到最近的中心,

顯然,你的資料向量的維度為1,對應於一維座標,

歐式距離就是直線上兩點的距離,一維座標上兩點的距離即是數值直接相減的絕對值

比如你隨機選擇的初始聚類中心是 5、12,各個點(2,4,10,12,15,3,21)到5的距離是(5-2,5-4,10-5,12-5,15-5,5-3,21-5),到12的距離是(12-2,12-4,12-10,12-12,15-12,12-3,21-12)

那麼第一次劃分情況是:2->5、4->5、10->12、12->12、15->12、3->5、21->12,

其等價於:把一維資料按照數值大小排列 2,3,4,10,12,15,21,選取乙個劃分數值,大於該數值的被劃分到一類,小於該數值的劃分到另一類,且保證目標函式區域性最優。

資料探勘 K means聚類

Blacard 陰曆中每月的天數,是根據月亮運動週期來確立的,實際上每月的平均天數是29.5306日,如果乘以12,一年只有354.3672天 而地球繞著太陽公轉乙個週期 回歸年 陽曆年 是365.2422天,這樣陰曆年1年的實際天數比陽曆年少了10.875天,差不多是11天,19年就少了209天。...

K means聚類演算法的優化?

奔跑中的小新 k means改進的乙個路線就是盡可能加快收斂速度,這個方向有幾個思路 1.質心初始化 選擇初始質心之間有一些策略比如盡量遠離,有助於反應資料的分布,加快收斂。2.改進k means的迭代過程,有幾個方向,乙個改進複雜度,比如資料的訪問用KD樹來索引,乙個是改進目標函式 原始目標函式就...

K means聚類演算法中的K如何確定?

桔了個仔 常用的方法是elbow method 手肘法則 1 選不同的k值,例如從1 9,然後畫出每乙個k值的 距離之和 和k的關係圖。左軸可以是distortion 或者Inertia distortion和inertia挺接近,都是衡量每個資料和最近中心點的距離之和,只是計算距離的方式不一樣而已...