對於語音識別,哪個語種是最容易被正確識別出的?

時間 2021-05-31 07:24:20

1樓:PeterChen

可以了解下ICONTEK的NI-NLP技術,語種的機器學習問題,已經突破了當前傳統基於聲學模型的識別方法,應該來說,任何語言發發音,機器學習都變得異常簡單。

BTW,Dan Povey是ICONTEK的語音顧問之一。

2樓:果果

換個角度回答一下。

我們公司的產品就是做語音識別的,叫訊飛聽見。

目前做的就是英語語音識別,和漢語語音識別,其他語種還在開發當中。

所以,結合王贇 Maigo的回答,我也覺得應該是英語比較容易識別。

當然也有可能是,英語和漢語應用的人群和場景比較多,所以目前才之開發出來中文和英文的。

3樓:侘寂

黏著語因為黏著語大部分是表音文字,既你完全不知道意思也能聽寫,其中日語最為突出,全是母音,基礎拼音少,抗噪能力好,採集的時候正確率高,這對進一步的糾錯翻譯提供了良好的先決條件。

4樓:charlary

首先你要定義什麼叫「正確識別」。

漢語是表意文字,所以寫出來就大體上能知道什麼意思。但是這實際上在世界語言裡面是很特殊的情況。對於拼音文字,語音文字對應,但是和語義不對應。

比如西班牙語,相當於我們的漢語拼音,只要看著字母就能讀出來,聽著讀音(只要口音不是特別重)也能寫出來,但是具體要說什麼,很可能不知道。

所以如果你的正確識別是指語音和文字的轉換的話,西班牙語葡萄牙語等純拉丁語是最簡單的,只要你有讀音,就很容易把字母寫出來。可能也包括日語(不含漢字)。但如果你說要理解語言裡面表達的意思,我的感覺是全世界的語言其實都差不多,並沒有明顯的難易之分。

5樓:吳建民

用傳統框架做過日、英、印、西的來拆解一下,主要還是從輸出空間大小和組合複雜度來看,對應的語言學現象可以和 @王贇 Maigo 的回答對應一下

聲學模型的準確率受到以下因素影響:

音素空間的粒度和組合複雜度

目標語種的方言、口音的數量(例如西語的多國變種)2. 去到下游的WER/CER受以下因素影響詞表大小

黏著、屈折形變造成的詞表膨脹

文化融合造成的新詞、外來語oov 甚至code-mixing(日語的每年冒出來的茫茫多的新詞,美西相比墨西更多的英語,印地語混合英語等等)

分詞同音字造成的歧義

可獲得語料規模

其他語種特定現象

日語送り仮名、當て字

從實踐角度來講,還要依賴現實中音訊語料和語種人才的可獲得難易程度,例如中國和西班牙語國家間的經濟、文化交流相對英、日來說太少了,不好開展。。。

6樓:ishameal

只考慮比較常見的語言的話應該是西班牙語其次是日語

語音識別的語種問題的的難點應該在於音素的準確判別。其中日語在常用語言中屬於音素最少的(只有五個基礎原音和乙個鼻音,但是有乙個獨特的促音)西班牙語音素雖然比日語多一點音素(五個基礎原因和兩個鼻音,以及送氣清音)但是屬於音節語,不存在日語中的促音問題。對機器識別來說應該更加容易。

當然以上是基於完全相同的語料資源和訓練時間的問題。現實中因為不對稱的語料資源和研究經費,實際上做的最好的應該還是英語。

最容易移民的國家是哪個?

快速移民入籍 買房移民是一種移民方法,直接投資移民的有以下國家 新加坡 菲律賓 溫納圖保加利亞愛爾蘭瓜地馬拉哥斯大黎加 厄瓜多尔 巴拉圭 圣基茨 摩爾多瓦 羅馬尼亞美國 台灣省.具體要看菜吃飯,好的國家費用不便宜 北北 希臘吧,只需購買一套25萬歐的房產,就可以實現一家三代的移民和永居權,享受希臘的...

不同的語種最開始是怎麼被互相翻譯的?

歲餘 你不知道他說什麼,但是他做了個手勢,你有點懂了,但是並不準確,後面他畫了幅畫來表達自己的意思,你這次是真的懂了。後面你逐漸明白了他每個聲音表達的是什麼意思,因為你以前看他畫過,用手勢表達過,後面逐漸誕生了文字,每個字都有他獨特的意思,你一看到這個字就明白他是什麼意思了。中國的文字是最接近自然的...

CSGO最容易回本的箱子是哪個?

蛋蛋蛋 可能是紅了 論宿舍三個憨包非法集資打CSgo開箱過程 拉萊耶leo 開箱的話就不要考慮回本啦。在不上頭的情況下,開箱帶來的類似賭博的快感和偶爾才有的驚喜才是這17塊的價值。如圖,本人開箱其實算少,會衝一下大行動的任務換幾個箱子開開,平時藍紫開多了突然爆了個粉都已經很開心了 不要嘲笑不要嘲笑 ...