聯系我們
重慶峰恒普洛科技發展有限公司
李 先 生:18723272806
嚴 女 士:18502327507
電 話:023-88239699
網 址:www.rafz.com.cn
地 址:重慶市九龍坡區科技大道120號4棟14-2
聯系郵箱:654683835@qq.com
智能語音識別能否引領智能家居聲控潮
作者:峰恒普洛 時間:2014-08-19
提到聲控的語音識別技術,我們不免想起蘋果hone的Siri功能,通過該語音系統,用戶可以通過手機讀短信、介紹餐廳、詢問天氣、語音設置鬧鐘等,Siri還支持自然語音輸入,并且可以調用系統自帶的天氣預報、日程安排、搜索資料等應用,還能夠不斷學習新的聲音和語調,提供對話式的應答。Siri針對用戶詢問所給予的回答,也不至于答非所問,有時候更能給人一種心有靈犀的感覺,這就是智能聲控的創新技術。
近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。很多專家都認為語音識別技術是2000年至2010年間信息技術領域十大重要的科技發展技術之一。
智能語音識別主要有以下五個問題:
1、對自然語言的識別和理解。首先必須將連續的講話分解為詞、音素等單位,其次要建立一個理解語義的規則。
2、語音信息量大。語音模式不僅對不同的說話人不同,對同一說話人也是不同的,例如,一個說話人在隨意說話和認真說話時的語音信息是不同的。一個人的說話方式隨著時間變化。
3、語音的模糊性。說話者在講話時,不同的詞可能聽起來是相似的。這在英語和漢語中常見。
4、單個字母或詞、字的語音特性受上下文的影響,以致改變了重音、音調、音量和發音速度等;
5、環境噪聲和干擾對語音識別有嚴重影響,致使識別率低。
語音識別在移動終端上的應用最為火熱,語音對話機器人、語音助手、互動工具等層出不窮,許多互聯網公司紛紛投入人力、物力和財力展開此方面的研究和應用。在我們周圍,最熟悉的就是蘋果的siri系統,這是一個很炫的功能,但真正使用這個語音系統的用戶,卻寥寥無幾。
雖說聲控系統的存在著固有問題,但是該技術在智能化行業應用將對行業掀起一陣波瀾,但由于以下特點注定其不能應用于各系統的上位控制:操作容易出錯;完全性較低;識別率錯誤率可能性較高(對于需要高精度要求尤其如此)。但是其控制特性,如簡便性、易用性、互動性、娛樂性對于領域的應用卻再適合不過了。
首先,作為基于云計算和語音識別技術的智能家居系統將會為現有的智能家居系統提供更多操作控制方式。目前智能家居系統的控制方式有以下三種:面板控制、原裝觸摸屏、第三方面板控制(ipad、智能手機等)。如采用基于云計算和語音識別技術的智能家居系統不僅是增加一種操作方式,更是智能家居領域的革命。在人機界面上,直接以語音進行操作也無需面板的存在,同時采用云計算本地無需計算能力。因此控制端可以設計成便于隨身攜帶的,如手表,掛耳式耳機等更加方便的控制端形式。
其次,通過語音直接人機語音對話代表了更好的用戶的體驗度。通過語音直接人機語音對話方式即對人類語音的詞匯語法的分解,并將內容轉換為計算機可讀的輸入,例如按鍵、二進制編碼或字符序列。思維是人腦的機能,是對外部現實的反映;語言則是現實思維、鞏固和傳達思維成果即思想的工具。語言是思維本身的要素,思想的生命表現的要素;語言是思維的工具,是思想的直接現實。語言是人類最方便、也最能理解的命令方式,除非未來傳感器可以直接作用于人腦,否則很難出現更方便快捷的方式。
再次,自然語言回答代表未來智能化的產品的終極形式?;谠朴嬎愕牡淖匀换卮鸸δ芙Y合智能家居系統在功能和應用上更是可以開拓無數,如簡單的對其下語音命令,“開”、“拉窗簾”等,更可以利用云計算功能對其命令甚至是普通語言進行深度理解。如“問:天太熱了。答:空調再開下去要低于舒適溫度了,你確定真的要調低?”又如“問:我要輛車,15分鐘能過來。智能家居自動撥號,并訂車。”
雖說智能家居系統中也早已有廠家將語音控制引入其中,并吹噓這將是未來主流方向,但是鑒于目前存在著種種辨析度底、環境干擾度等因素的影響,致使語音系統并未能真正進入智能家居系統,而所謂的引領智能家居聲控潮流,還為時尚早!唯有技術不斷升級及產品的更新方能真正讓聲控技術進入智能家居市場!
近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內,語音識別技術將進入工業、家電、通信、汽車電子、醫療、家庭服務、消費電子產品等各個領域。很多專家都認為語音識別技術是2000年至2010年間信息技術領域十大重要的科技發展技術之一。
智能語音識別主要有以下五個問題:
1、對自然語言的識別和理解。首先必須將連續的講話分解為詞、音素等單位,其次要建立一個理解語義的規則。
2、語音信息量大。語音模式不僅對不同的說話人不同,對同一說話人也是不同的,例如,一個說話人在隨意說話和認真說話時的語音信息是不同的。一個人的說話方式隨著時間變化。
3、語音的模糊性。說話者在講話時,不同的詞可能聽起來是相似的。這在英語和漢語中常見。
4、單個字母或詞、字的語音特性受上下文的影響,以致改變了重音、音調、音量和發音速度等;
5、環境噪聲和干擾對語音識別有嚴重影響,致使識別率低。
語音識別在移動終端上的應用最為火熱,語音對話機器人、語音助手、互動工具等層出不窮,許多互聯網公司紛紛投入人力、物力和財力展開此方面的研究和應用。在我們周圍,最熟悉的就是蘋果的siri系統,這是一個很炫的功能,但真正使用這個語音系統的用戶,卻寥寥無幾。
雖說聲控系統的存在著固有問題,但是該技術在智能化行業應用將對行業掀起一陣波瀾,但由于以下特點注定其不能應用于各系統的上位控制:操作容易出錯;完全性較低;識別率錯誤率可能性較高(對于需要高精度要求尤其如此)。但是其控制特性,如簡便性、易用性、互動性、娛樂性對于領域的應用卻再適合不過了。
首先,作為基于云計算和語音識別技術的智能家居系統將會為現有的智能家居系統提供更多操作控制方式。目前智能家居系統的控制方式有以下三種:面板控制、原裝觸摸屏、第三方面板控制(ipad、智能手機等)。如采用基于云計算和語音識別技術的智能家居系統不僅是增加一種操作方式,更是智能家居領域的革命。在人機界面上,直接以語音進行操作也無需面板的存在,同時采用云計算本地無需計算能力。因此控制端可以設計成便于隨身攜帶的,如手表,掛耳式耳機等更加方便的控制端形式。
其次,通過語音直接人機語音對話代表了更好的用戶的體驗度。通過語音直接人機語音對話方式即對人類語音的詞匯語法的分解,并將內容轉換為計算機可讀的輸入,例如按鍵、二進制編碼或字符序列。思維是人腦的機能,是對外部現實的反映;語言則是現實思維、鞏固和傳達思維成果即思想的工具。語言是思維本身的要素,思想的生命表現的要素;語言是思維的工具,是思想的直接現實。語言是人類最方便、也最能理解的命令方式,除非未來傳感器可以直接作用于人腦,否則很難出現更方便快捷的方式。
再次,自然語言回答代表未來智能化的產品的終極形式?;谠朴嬎愕牡淖匀换卮鸸δ芙Y合智能家居系統在功能和應用上更是可以開拓無數,如簡單的對其下語音命令,“開”、“拉窗簾”等,更可以利用云計算功能對其命令甚至是普通語言進行深度理解。如“問:天太熱了。答:空調再開下去要低于舒適溫度了,你確定真的要調低?”又如“問:我要輛車,15分鐘能過來。智能家居自動撥號,并訂車。”
雖說智能家居系統中也早已有廠家將語音控制引入其中,并吹噓這將是未來主流方向,但是鑒于目前存在著種種辨析度底、環境干擾度等因素的影響,致使語音系統并未能真正進入智能家居系統,而所謂的引領智能家居聲控潮流,還為時尚早!唯有技術不斷升級及產品的更新方能真正讓聲控技術進入智能家居市場!