詞向量，LDA，word2vec三者的關係是什麼

1樓：萌萌

1. Word2vec是乙個用於計算詞向量的開源工具，是較常見的word embeddings，即「詞向量」；它可以將自然語言中的字詞word轉化稠密向量，在這個基礎上就可以進行數學計算了。我們常說的word2vec演算法或模型其實指的是用於計算word vector的CBOW模型和Skip-gram模型，它是乙個簡單的神經網路。

2. LDA是一種主題模型，它可以將文件集中每篇文件的主題以概率分布的形式給出，從而通過分析一些文件抽取出它們的主題（分布）出來後，便可以根據主題（分布）進行主題聚類或文字分類。

區別：（1）Word2vec用來生成各個詞語的詞向量，而LDA是生成文章的主題及其概率分布。其實兩者沒什麼關係。

（2）詞向量所體現的是semantic和syntactic這些 low-level的資訊，而LDA的主題詞體現的是文章topic這一high-level層的資訊。

2樓：劉搖鵬

瀉藥lda和其他兩個沒關係，說白了就是把文件、詞、主題聯絡起來，訓練完給你篇文章他說這陀詞放一塊很有可能是說某個主題

word2vec的訓練結果是Distributed Representation的詞向量，主要拿來判斷詞之間相似度的

3樓：理查德帕克

這麼說吧，word2vec屬於神經網路語言模型，根據詞與其周邊詞彙的關係訓練詞向量，然後將詞向量用來做nlp的任務，而lda屬於主題模型，應該是概率圖模型的一種，主要是貝葉斯方法，通過假設先驗分布計算後驗概率並採用模擬和取樣的方式估計模型引數

4樓：

word2vec就是乙個工具，給它一堆已分詞文字進行訓練，就能得到每個詞的詞向量。詞向量是什麼？就是乙個詞的向量表示，意思越接近的兩個詞它們詞向量夾角就越小，比如」高興」和」開心」。

LDA是主題模型，可以對一篇文章進行分析，計算它屬於哪個主題的概率，比如一篇文章，裡面好多詞：蘋果、三星、華為、魅族……等等，那麼這篇文章很有可能是手機這個主題。

5樓：li Eta

Latent Dirichlet Allocation(LDA)和word2vec從模型上看幾乎沒有顯著聯絡。詞向量則是所有對詞進行表示的方法的統稱。

關於聯絡你可以這樣看：LDA的作用之一是通過對doc-word矩陣進行建模抽出doc-topic和topic-word兩個分布。而word2vec其實是分解了word-context矩陣。

其實都是對乙個"A"-"B"矩陣進行建模。那麼LDA自然也可以用於對word-context矩陣進行建模，而word2vec也可以對doc-word矩陣做分解。

以上算是LDA和word2vec之間的的一點聯絡吧。不過他們之間的區別也是非常顯著的。

詞向量，LDA，word2vec三者的關係是什麼

資訊資料知識三者的關係是什麼？求解答

三維雷射掃瞄，lidar ，雷射雷達三者的關係是什麼？

反極權反烏托邦賽博朋克這三者之間的關係是怎樣的？

其他用戶還看了：

詞向量，LDA，word2vec三者的關係是什麼

資訊 資料 知識三者的關係是什麼？求解答

三維雷射掃瞄，lidar ，雷射雷達三者的關係是什麼？

反極權 反烏托邦 賽博朋克這三者之間的關係是怎樣的？

其他用戶還看了：

資訊資料知識三者的關係是什麼？求解答

反極權反烏托邦賽博朋克這三者之間的關係是怎樣的？