怎麼用kaldi進行語種識別?

時間 2021-12-20 17:00:53

1樓:Leon晉

瀉藥如果要做語種識別,不一定就參考LRE的示例,題主也可以參考SRE的方法。

參考聲紋識別的方法, 語種識別照樣也是可以做,雖然以前的人是把語種識別做成語音識別來識別文字內容,而我這裡介紹的方法還是偏向於聲紋識別系統。i-vector,x-vector都是可以做的,如果會用TF,做成embedding也是可行,本質上還是提取每句話的表徵,只不過標籤從說話人改為語種類別而已。

如果做成表徵向量,需要把資料列表的utt2spk的spk改為language,接著的方法都大同小異了;不過還可以提供幾點建議:

1、如果是閉集的語種分類,可以考慮做成網路直接輸出後驗概率求出max,作為測試句子的類別;

2、由於物件是語種,推薦給特徵加上三維的pitch,pitch代表著韻律和母音,不同語種之間的韻律是相差很大的,這三維pitch會帶來好些提公升;

3、語種識別以前借助語音識別的方式來做的,從這點出發來想就可以很自然知道音素資訊對於區分語種是可以起到幫助!所以我也推薦做乙個音素網路,提取bottleneck feature去輔助聲學特徵,這可以起到不少的提公升;

4、另外,如果語種資料比較少,可以考慮做增廣,這裡我推薦的方式是變速和變音量;如果是做說話人識別的話,我對於變速變音量是保守意見的,但對於語種的話是推薦試試;因為變速變音量不會改變語種屬性(不會讓普通話變成粵語),但說話人就是會變音色(男女老幼間變化),所以資料不多的時候可以加上這個增廣,可行的;

5、在語種上,如果是提取vector/embedding的框架,後端不妨試試SVM,這種結構風險最小化的策略比PLDA更適合做分類,會好上不少;還有最大互資訊的GMM也是可以嘗試的,MMIGMM可以參考這篇:」spoken language recognition using xvectors「

OLR Challenge 2018

西班牙語過去分詞到底怎麼用?

輔助進去我不動 首先你的理解是對的,preparado過去分詞不能修飾動詞,相當於形容詞。句子裡一共三個詞,如果修飾的不是viene這個動詞,那當然只能是 l啦。說的是 l 準備好了 的乙個狀態 然後第二句話感覺有一點彆扭,最好是prepar ndose或者給preparando加個賓語,及物動詞單...

西班牙語中幾個是到底怎麼用

500Miles 建議好好描述下自己的問題。另外關於ser 和estar的用法網上都有的,這樣的問題沒必要在知乎提問,如果有不懂的地方請具體描述問題。 熠熠生然 猜測樓主是想問ser和estar的區別。據此可以分幾個方面進行判斷。首先,ser後的成分表示永久的含義,而estar後的成分表示短暫存在的...

同事堅持用VI進行MAC開發,怎麼破?

鄭碧峰 我所有的開發都是vim,效率遠遠高於其他。但是別的同事問我時,我都建議使用IDE。我愛蘿蔔,我習慣蘿蔔,但是別人的事誰知道呢? 我是來支援lz的。從事windows和linux平台開發多年,一直用source insight。這貨太神了,N年過去了,一直沒有找到替代品。 蔣樂天 vi tag...