通俗的解釋主流的主題模型及其擴充套件所適合解決的問題,包括PLSA, LDA, supervised LDA, labeled LDA

時間 2021-06-09 09:07:31

1樓:「已登出」

@禾惠 講得很好了,我來補充乙個sLDA和Labeled LDA的比較吧,它們雖然都是supervised LDA, 但sLDA是downstream model, Labeled LDA是upstream model. 區別在於標籤是什麼時候生成的。如果你仔細觀察樓上的圖,Λ是Labeled LDA的標籤, 它的作用是影響主題的prior distribution, 而Yd是sLDA的標籤,它是在已經有了主題之後生成的。

因此,一般來說像sLDA這種downstream model, 是更適合prediction的任務的,而upstream model, 則偏重於理解topic的生成過程,更注重interpretability.

References:

Benton, Adrian, et al. "Collective supervision of topic models for predicting surveys with social media."Thirtieth AAAI Conference on Artificial Intelligence.

2016.

Yang, Yi, Doug Downey, and Jordan Boyd-Graber. "Efficient methods for incorporating knowledge into topic models."Proceedings of the 2015 conference on empirical methods in natural language processing.

2015.

文件主題模型的幾個問題?

以下回答基本基於LDA。主題一般都是自動生成的,你可以認為是詞項聚類,不過這個聚類是軟聚類,你得到的是乙個分布。原則上你可以通過先驗來指導生成的主題,但是收斂結果是否符合你的預期那就是另一回事了。多項式模型建模?你說的是Multinomial?因為詞是有限的,於是很自然地採用乙個離散的Multino...

誰能通俗的解釋下如何理財?

理財,就是對財務 資產和負債 進行管理,最終實現對財產的保值 增值的財務目標。理財可以從粗線條上分為 公司理財,和個人理財。而機構則可以劃為公司理財裡的一部分,家庭理財也可以看作是個人理財的乙個延申。整個人類的生存 生活以及其它一切的活動,都離不開物質基礎,所以理財和每個人都又非常密切的關係。理財通...

如何通俗的解釋什麼是應力?

最最最念雨 可以把應力理解為乙個物體的面反抗外界變化的力。當我用力地捏乙個長方體橡皮,橡皮的乙個面上發生了變形。這時候橡皮的這個面會產生乙個力來反抗我,這個力就是應力了。垂直於面的應力叫正應力,平行於面的力就是剪應力。而橡皮作為乙個立方體是無數個面組成的,那麼每個面上受到的應力集合起來就是這個橡皮在...