怎樣看待語音互動技術?其現狀如何?前景又如何?

時間 2021-05-29 23:28:18

1樓:AI·Dezhu

目前智慧型語音技術是人工智慧產業鏈上的重要一環,目前也取得了重大的技術突破,目前的商業化落地已經成為了可能。人工智慧產業鏈主要分為三個層次:

底層是一些基礎的設施,包括晶元、模組、感測器、以及大資料平台、雲計算服務和網路運營商。主要的參與者為晶元廠商、科技巨頭和運營商為主。

中間層是一些基礎的技術研究和服務提供商,所設計的內容包括深度學習、機器學習、計算機視覺、語音技術和自然語言處理以及機械人等領域,在這一模組當中需要有海量的資料,強大的演算法以及高效能的運算平台支撐。

最上層的是行業應用,大致分為2B和2C兩個方向。2B代表領域為安防、金融、醫療、教育、呼叫中心等。2C是代表領域為智慧型家居、無人駕駛、虛擬助力、家庭機械人等。

人工智慧的深度學習、高效能計算平台和大資料是人工智慧技術取得突破的核心助推力。深度學習功能解決了特徵表示與序列對映的問題,使得人工智慧的效能得到快速提公升,而網際網路時代的海量資料又不斷為演算法模型提供了訓練材料。

人工智慧語音產品的發展非常迅速,並且應用也越來越廣泛。

2樓:

語音互動技術是讓機器聽懂世界的技術。如今的語音互動雖然囊括了大部分場景對話,但還有更多複雜場景的問題需要解決。而聽懂人類情感,則是乙個更加複雜的過程,這涉及到情感識別、聲紋識別等等,這也會是將來語音互動的目標之一。

進一步語音互動還要會聽動物的聲音、自然的聲音等。讓機器聽懂世界的技術正在全球快速的演化,相信不久的將來,我們肯定能看到更加智慧型的機器。分享一篇文章,讓我們看看離機器聽懂世界還有多遠。

陳孝良:讓機器聽懂世界,觸及人類夢想還有多遠?

3樓:神輔助

互動方式大概有兩個評價標準:互動效率,學習成本。

有深度學習加持的情況下,語音互動的學習成本比較低,自然語言識別可以在你不知道確切指令(或者最快速的指令)的情況下實現你需要的操作。

互動效率這個標準是要在應用場景下評判的,一般認為語音文字輸入代替鍵盤文字輸入是個效率提公升的場景,可惜語音互動受限於技術,語音識別的速度精度抗噪能力都明顯不夠,互動效率非常的低。另外使用者的疲勞,場所要求都限制了語音互動的應用場景

語音互動適用的場景中目前最契合的應該是車載語音互動,在使用者手眼都被占用的情況下輔助互動,車內可以認為是私人空間,使用者不會尷尬,也不存在遠場拾音的問題,開車的情況下需要語音操作的功能效率要求不高,輸入輸出都可以通過語音解決。

另外乙個場景就是智慧型家居,還是私人空間,效率要求低的輔助互動場景。

主流操作方式的效率是很大的優勢,新型互動在技術還不能達到流暢體驗的情況下只有在娛樂以及輔助操作等等特定場景下才有價值。

4樓:UXmhz

很簡單,人類還沒有跟機器溝通的習慣而已。因為以前的機器只是機器,無法像人類一樣溝通。

如果機器智慧型到一定程度,我覺得語音互動一定是未來,因為用嘴說話,用手勢輔助是人類的自然交流方式。至於什麼時候才能流行起來,那就要看機器什麼時候能聽得「懂」人們說什麼了。

肯定會有人說那辦公室吵吵鬧鬧,相互影響,怎麼個語音法...

我只想說,之所以需要辦公室,就是因為目前大多數工種還在做一些常規的,相對重複的工作。等機械人能真正理解人類語言的時候,那些簡單的活早就不用你幹了。

你只用多想想一些創意點子,然後跟你的機器交流一下,他會做好稿子給你審的。通過大資料來分析,做的方案很靠譜的。

5樓:程淑玉

科大訊飛語音合成連續十幾次全世界第一,技術先進毋庸置疑,最關鍵是盡快落實產品到第一線,快快快快快快快快快落實產品,執行力第一,有技術有能力沒有結果不行,必須轉化為實實在在的生產力

6樓:價值趨勢技術派

噪音很早就有解了。語音技術的前沿對於特定講述人的識別以及環境噪音的處理應該已經有比較有效的方案了。即使在辦公室裡,人類大部分時間下不會聽不清身邊人說的話。

語音互動,意義還是重大的。這是乙個互動介面,也是自然語言理解的乙個應用。

怎樣看待萬家唱衰EXO的現狀?

哈哈真的是萬家,包括隊內唯粉呢。糊糊糊,東一嘴西一嘴,都在說糊。小分隊糊了,某成員糊,反正除了自家人氣高其他都糊唄。不過糊是不是有個明確定義?要不然那些轉瞬即逝的團該叫什麼?糊出地心?真的很看不慣那些動輒就是資源分配不公,天團flop的人。sj某位小粉頭wb有感。 可能沒有國民?粉絲多,不服的也多?...

怎樣看待ARM推出全新DynamIQ技術,為人工智慧開啟無限可能?

首先回答什麼是DynamIQ.技術可以實現不同頻率,不同電壓的core 在同乙個cluster中任意靈活配置,晶元客戶只需要簡單的配置一下core 的時鐘頻率就完成自己特色的多核cpu,就問你靈活不靈活?之前的big little架構是什麼呢?四個大核都跑乙個高頻,比如2G,四個小核都跑乙個低頻,比...

怎樣看待王源參加《聲臨其境》

王勁松老師吧,願意自己以身作則,更願意去提攜後輩,勁松老師本人也說過,曾經和王源合作拍過乙個微電影啊還是什麼,覺得王源這個孩子不錯 前一陣我也看過好像是黑子啊還是啥的,話挺難聽的,只要真的看了之後就能發現,王源其實還不錯,比預料的還好點,不過本來也沒多少期待就是了。聲音是真的很好聽,很乾淨,但技巧啊...