聚類和協同過濾是什麼關係?

時間 2021-05-05 19:18:30

1樓:

嚴格來說,協同過濾不是一種演算法,而是一種演算法的應用。協同過濾會用到以下基礎的ML演算法:(各種版本的)KNN、聚類(最簡單的k均值聚類,中等複雜的高斯混合聚類,比較複雜的LDA等)、矩陣分解、因子分解等。

理論上支援向量機也可以,實際應用未知。大公司資料量比較大,深度學習用得相對多一點。總體來說協同過濾這塊還是非dl的傳統機器學習用得更多。

2樓:劉洪照

協同過濾中的Model-based裡有用聚類技術,將相似人群聚類,然後把投票高的內容推薦給不同的使用者群。

同時在對物品進行特徵提取的時候也有應用聚類技術,將物品聚類在乙個topic下。

3樓:Kenneth

自邀自答,不用謝。

這是兩種完全不同的演算法思想。

以二維空間為例,聚類是各個樣本往若干個共同中心聚合的過程,計算的是樣本點到聚類中心的二維空間距離;而協同過濾是盡量在樣本中構造平行相似性,以彌合缺失的樣本資訊維度。

聚類和協同過濾是可以而且應當在解決實際問題中混合使用的。但應該是在解決問題的不同階段。比如微博使用者興趣推薦,首先使用聚類方法對人群進行若干大類的劃分,然後在一類人群中進行協同過濾推薦。

這樣比全域性進行協同過濾效果會好,因為這個思路首先承認了不同的人群的興趣愛好是迥異而有模式的。

4樓:郭寬

回答一下一年前自己的提的問題

聚類:關注Item本身的特徵,根據相似度把特徵相似的聚集在一起,表示他們屬於同一類別。

協同過濾:並不關於Item本身的特徵,而主要關注User和Item之間的關係,基於相似的使用者對相似的Item會有相似的評分的原則進行推薦,找到相似的Item或相似的User。

5樓:肖龍飛

從原理上看:

1. 聚類就是分組,對user或item分組。所以用直接聚類來做推薦的話,是從聚類得到的分組中(隨機)挑一些item推薦給使用者。

2. 協同過濾演算法得到的是對一件item的評分。協同過濾將評分最高的item推薦給user。

從效果上看:

1. 協同過濾得到的推薦是有排序的,評分越高,推薦的程度就越高。

2. 聚類得到的推薦是沒有重要性差別的,在乙個分組中,不知道哪一件item比另一件更值得推薦。

從應用上看:

1. 協同過濾和聚類可以組合起來使用。

如果資料規模非常大,協同過濾中計算KNN(在全域性user或item中找K個最近的鄰居)是非常耗時的。但如果先對user (或item)做乙個聚類,然後在目標user(或item)所屬聚類簇中找KNN,可以極大地節省計算開銷。

6樓:王鐳

如果說區分,個人覺得

1、用聚類做推薦,一般需要對user進行特徵表述,對使用者進行聚簇後,用簇內的item推給簇內的user,或者對item進行聚簇,推給相應user

2、cf更多強調利用user和item的這種聯合關係,把偏好相似的user推薦不同的item

感覺推薦中聚類和cf比較類似的原因是,對user的表達僅僅使用item向量,但是實際使用中往往對user的表達使用了別的維度特徵,來克服資料稀疏問題。

7樓:Spirit_Dongdong

總的來說很相像,硬要說區別的話,我傾向於認為:

1.協同過濾針對於使用者的行為或偏好,更加側重於長尾。比如使用者對某首歌評分,推薦某個東西給好友等等。

從產生時間上來說,可以認為現代的協同過濾(用於電子商務,推薦系統等領域)是web2.0的產物

2.聚類更傾向於使用者本身的屬性,如收入,職業等。作為傳統的非監督方法,目的更多在於去挖掘一類個體中的共同規律。在長尾方面效果可能沒那麼好。

協同過濾是不是個性化推薦?

已重置 有很多共同行為,完全有可能有且僅有這些共同行為 是說相同人群的人行為一致,導致推薦結果一致?我們來看看這個經典的協同過濾圖示,我們把上圖稍作更改,使用基於使用者的協同過濾,我們可以認為A,B,C是比較相似的使用者,但是使用者評分還是不完全一致,這是由於1 每個人的個體偏好還是有差別,2 而且...

做協同過濾的時候矩陣太大伺服器吃不消怎麼辦?

周晟 10G資料應該不算大,處理方式挺多。我的理解中,協同過濾主要分協同矩陣包括歸一化 評分矩陣和矩陣相乘三步。首先如果挑選Item based還是User based協同過濾,電影等推薦系統一般前者,News一般後者,如果這個挑選不合適,協同矩陣和評分矩陣的資料大小就會不同,效果也會不同。然後最後...