聚類和協同過濾是什麼關係？

1樓：

嚴格來說，協同過濾不是一種演算法，而是一種演算法的應用。協同過濾會用到以下基礎的ML演算法：（各種版本的）KNN、聚類（最簡單的k均值聚類，中等複雜的高斯混合聚類，比較複雜的LDA等）、矩陣分解、因子分解等。

理論上支援向量機也可以，實際應用未知。大公司資料量比較大，深度學習用得相對多一點。總體來說協同過濾這塊還是非dl的傳統機器學習用得更多。

2樓：劉洪照

協同過濾中的Model-based裡有用聚類技術，將相似人群聚類，然後把投票高的內容推薦給不同的使用者群。

同時在對物品進行特徵提取的時候也有應用聚類技術，將物品聚類在乙個topic下。

3樓：Kenneth

自邀自答，不用謝。

這是兩種完全不同的演算法思想。

以二維空間為例，聚類是各個樣本往若干個共同中心聚合的過程，計算的是樣本點到聚類中心的二維空間距離；而協同過濾是盡量在樣本中構造平行相似性，以彌合缺失的樣本資訊維度。

聚類和協同過濾是可以而且應當在解決實際問題中混合使用的。但應該是在解決問題的不同階段。比如微博使用者興趣推薦，首先使用聚類方法對人群進行若干大類的劃分，然後在一類人群中進行協同過濾推薦。

這樣比全域性進行協同過濾效果會好，因為這個思路首先承認了不同的人群的興趣愛好是迥異而有模式的。

4樓：郭寬

回答一下一年前自己的提的問題

聚類：關注Item本身的特徵，根據相似度把特徵相似的聚集在一起，表示他們屬於同一類別。

協同過濾：並不關於Item本身的特徵，而主要關注User和Item之間的關係，基於相似的使用者對相似的Item會有相似的評分的原則進行推薦，找到相似的Item或相似的User。

5樓：肖龍飛

從原理上看：

1. 聚類就是分組，對user或item分組。所以用直接聚類來做推薦的話，是從聚類得到的分組中（隨機）挑一些item推薦給使用者。

2. 協同過濾演算法得到的是對一件item的評分。協同過濾將評分最高的item推薦給user。

從效果上看：

1. 協同過濾得到的推薦是有排序的，評分越高，推薦的程度就越高。

2. 聚類得到的推薦是沒有重要性差別的，在乙個分組中，不知道哪一件item比另一件更值得推薦。

從應用上看：

1. 協同過濾和聚類可以組合起來使用。

如果資料規模非常大，協同過濾中計算KNN（在全域性user或item中找K個最近的鄰居）是非常耗時的。但如果先對user （或item）做乙個聚類，然後在目標user（或item）所屬聚類簇中找KNN，可以極大地節省計算開銷。

6樓：王鐳

如果說區分，個人覺得

1、用聚類做推薦，一般需要對user進行特徵表述，對使用者進行聚簇後，用簇內的item推給簇內的user，或者對item進行聚簇，推給相應user

2、cf更多強調利用user和item的這種聯合關係，把偏好相似的user推薦不同的item

感覺推薦中聚類和cf比較類似的原因是，對user的表達僅僅使用item向量，但是實際使用中往往對user的表達使用了別的維度特徵，來克服資料稀疏問題。

7樓：Spirit_Dongdong

總的來說很相像，硬要說區別的話，我傾向於認為：

1.協同過濾針對於使用者的行為或偏好，更加側重於長尾。比如使用者對某首歌評分，推薦某個東西給好友等等。

從產生時間上來說，可以認為現代的協同過濾（用於電子商務，推薦系統等領域）是web2.0的產物

2.聚類更傾向於使用者本身的屬性，如收入，職業等。作為傳統的非監督方法，目的更多在於去挖掘一類個體中的共同規律。在長尾方面效果可能沒那麼好。

協同過濾是不是個性化推薦？

已重置有很多共同行為，完全有可能有且僅有這些共同行為是說相同人群的人行為一致，導致推薦結果一致？我們來看看這個經典的協同過濾圖示，我們把上圖稍作更改，使用基於使用者的協同過濾，我們可以認為A,B,C是比較相似的使用者，但是使用者評分還是不完全一致，這是由於1 每個人的個體偏好還是有差別，2 而且...

做協同過濾的時候矩陣太大伺服器吃不消怎麼辦？

周晟 10G資料應該不算大，處理方式挺多。我的理解中，協同過濾主要分協同矩陣包括歸一化評分矩陣和矩陣相乘三步。首先如果挑選Item based還是User based協同過濾，電影等推薦系統一般前者，News一般後者，如果這個挑選不合適，協同矩陣和評分矩陣的資料大小就會不同，效果也會不同。然後最後...

聚類和協同過濾是什麼關係？

協同過濾是不是個性化推薦？

做協同過濾的時候矩陣太大伺服器吃不消怎麼辦？

其他用戶還看了：