大部分開源程式的乙個普遍的問題是「中文搜尋」功能幾乎沒有,是不是只有中文以及周邊的國家如日語是需要進行語義分詞的?

時間 2021-05-11 14:06:42

1樓:obaby

如果資料量不大要做個簡單的分詞也可以,基於jieba分詞相對來說都比較容易實現,並且效果也還可以。

讓WordPress支援分詞搜尋

2樓:閆濤

中文、日文、韓文是我們熟知面要分詞的語言,因為這些語言以字為單位,單詞之間沒有明顯的分隔符,因此需要進地分詞。而對於英語等語言,單詞之間採用空格分隔,因此不需要進行分詞,但是英語需要處理片語及組合詞,可以視為分詞的反過程。

目前全文檢索中,主要是兩個開源實現Lucene和Sphinx,對於Lucene有自帶的CKJ、SmartChinese兩種中文分詞方案,其中SmartChinese中文分詞效果較好,Lucene也可以整合開源中文分詞引擎MMSeg4j,效果有很好。Sphinx可以通過編譯加入MMSeg做為中文分詞引擎,分詞效果較好。

3樓:龔彬

開源程式一般使用Mysql資料庫,中文全文索引功能較弱,使用模糊查詢在資料量較小時尚可,另外基於web指令碼語言的中文分詞演算法也比較耗資源,所以搜尋功能一般借助第三方實現,如Lucene,Sphinx以及中文分詞引擎實現,它們都需要在伺服器端配置,開源程式本身無法滿足這些功能,日語也存在類似問題。

有人曾提出這樣乙個問題 大部分讀過的書最後都會忘掉,那讀書的意義何在?

君陌 讀書的話,我要麼是單純的享受要麼是為解決實際問題,我不會讀我認為沒有意義的書,即使他很火。讀書不是目的而是為了達到某個目的。 吧唧一口甜 讀書的意義就在於閱讀的這個過程,你花時間去讀了,慢慢的他們會進入你的腦海裡,融入你的血液裡,在你不知不覺間產生潛移默化的影響,而且這種影響是不和估量的,你會...

大部分人會認為乙個周圍男性朋友居多的乙個女生是個什麼樣的人呢?

木齊言 我的情況是,我性格不討喜,從不主動和別人搭話,為人正直不會迎合那些虛偽小人,不會掩飾臉上就能看出內心喜惡,說話又太直接,所以很多敏感女生會覺得我難相處。但是很多男性朋友不會太在意,了解我的為人後對我比較包容,所以我的男性朋友居多。 今日困 我本人就是這樣的女生出去玩男性居多一起打球上網或者喝...

為什麼當代大部分的大學生普遍陷入一種安於現狀和迷茫的狀態?

七胖 以為歲月靜好,沒有夢想,也沒有追求夢想的毅力決心信念,不關心國事,被大學的安逸生活蒙蔽了雙眼,不去接觸優秀的人,自我墮落,沒有壓力緊迫感 共花費一分 首先,陷入迷茫的不只有大學生,其次是這個時代的條件造就了這種迷茫。辛苦賺錢的快遞員不被人尊重,網紅直播月入百萬,追求真才實學的科技人員不被大眾傳...