在自然語言處理中有哪些可以利用先驗知識的演算法？

1樓：Milo Sun

上面也有人說了，廣義來看，自然語言演算法或多或少都有些先驗知識，確切的說，AI絕大部分演算法都有先驗知識，所謂的人工智慧，人工是真的，智慧型是假的，知識都是研究人員直接或者間接加入的。比如我要做句法分析，句法的模型就是一種先驗知識，這個語言句子往哪邊分支，詞類有什麼特點。針對某一種語言，什麼樣的模型更加合適。

由於自然語言特徵提取十分困難，經常會手動寫入特徵，這也是需要大量先驗知識。比如做named entity recognition，大寫開頭的詞很有可能是人名地名，所以可以把開頭字母大寫作為特徵寫入演算法。無向圖模型很適合寫入特徵。

至於使用大量先驗知識的演算法，最著名的要數一些詞彙層面的演算法，Jurafsky和Martin的自然語言處理和計算語言學教材裡有涉及。比如自動找出詞彙之間的關係，歧義消解(word sense disambiguation)。先驗知識主要以詞彙關係庫或詞典的形式出現，叫基於詞典的方法(dictionary-based / thesaurus-based methods) 。

比如搜尋近義詞可以通過計算在語義網/樹中的距離。歧義消解，可以看詞典中某個詞幾個詞義的定義，觀察使用語境與詞典描述重合度有多高。

2樓：張大帥

什麼演算法都可以利用先驗知識，比如中文做word2vec，切詞結果就算一種先驗，你加專有名詞進去，就先驗了。加個停用詞表，也是先驗。

所以關鍵要結合具體實際，到底加什麼先驗，再研究形式。

在自然語言處理中有哪些可以利用先驗知識的演算法？

自然語言處理在開放搜尋中的應用

自然語言處理為什麼要分詞？

搞自然語言處理是否需要懂Hadoop，Spark和Hive

其他用戶還看了：