您現在的位置:網站首頁行業資訊 > 中國的ARM - 百度牽頭成立的智能語音聯盟

字號:   

中國的ARM - 百度牽頭成立的智能語音聯盟

瀏覽次數: 日期:2019年7月6日 14:58
語音技術作為人工智能的重點研究領域,不僅可以帶來全新的、變革式的人機交互方式,還有機會催生出人類和機器的情感交流。源於語音對人類的重要性,科技巨頭們再一次將目光投到了智能語音領域。近日,由百度、海爾、京東、中興通訊、中國普天、北汽股份、京東方聯合發起,二十餘家單位共同組成的智能語音知識產權產業聯盟正式成立。該聯盟通過組建專利池的方式,引導和促進語音技術跨行業的實施和應用,並對聯盟成員免費開放專利池專利。
 
 
這是百度繼兩年前開放語音能力後,又一次“工程師式的理想主義”的實現。基於在智能語音核心技術中的的長期積累,百度率先將首批滿足專利池標準的100多件語音技術專利放入專利池中開放許可給聯盟成員使用。
 
從開放語音能力,到開放技術專利,百度分享的初衷和盡頭永遠都是希望科技能真正解決人們的問題讓生活更美好。在過去的兩年中,包括聯想智能電視、小米手機、信利智能可穿戴設備、特斯拉電動汽車等廠商以及去哪兒、陌陌等APP都使用了百度語音開發技術成果。這種免費開放的合作接入為企業提供了語音問題的解決方案,極大的縮短了開發周期,也在一定程度上減少了開發成本。除此之外,對許多創業型的中小開發者而言,技術的開放為他們的創新提供了更多的可能。
 
同樣,事實也在不斷證明投桃總會報李,正是由於百度平台技術的提供與核心技術的免費開放,才吸引到了更多更優秀的開發者。對語音技術來說,一個重要依賴便是“語料”。大量開發者帶來足夠多的用戶頻繁使用語音功能所積累的語料,讓百度語音有機會被不斷訓練,進而提升了準確率、抗噪率、語義識別準確性,不斷獲得完善。同時也搭建了有效獲取用戶的生態係統。
 
在今年的百度世界大會上,百度首席科學家吳恩達就現場演示了百度新一代語音識別技術。測試顯示在比較嘈雜的環境下,機器識別已經超過人類。百度語音識別率接近95%,成為目前世界上最先進的漢語語音識別技術。日前資料顯示,百度的漢語安靜環境普通話語音識別技術的識別相對錯誤率比現有技術降低15%以上,識別率已接近97%。而從95%-99%是量變到質變的過程,這也許會徹底改變人與設備的交互方式。
 
語音技術的這一突破與百度開放的思維與模式是不無關係的,包括成立聯盟將專利拿出來分享,都是以一種更為開放的心態希望能夠共享語音技術成果,推動技術的進步和語音產業發展,服務於移動時代。這是一條樸實的道路卻有孕育創新與顛覆的泥土。
 
所謂顛覆式技術,就是說有一種技術可以取代原有技術,讓人類需求更好的實現,語音識別也是如此。在2011年之前,語音識別技術主要是采用混合高斯模型。2011年深度學習技術引入語音識別領域,並推進了整個工業界的人工智能技術應用進入深度學習時代。
 
而隨著物聯網、車聯網的發展,將會有越來越多的設備對語音控製提出需求,因為語音識別是以一種非物理接觸式的交互方式,讓機器擁有真正的“聽覺”,使人們甩掉鍵盤。這將解放用戶的雙手,節省用戶的時間和體力,以百度新聞的語音播報為例,借助於自然語言處理技術生成新聞的摘要,在信息嚴重過載的今天,無異幫助用戶提高了信息獲取的效率。因此未來語音識別功能將向電腦芯片一樣,成為每個智能終端必備的能力。並實現人機交流之上智慧生活的重要切入口。
 
語音聯盟讓我想到了過去英國的ARM,它將技術專利開放出去,打破了技術壟斷,現在全球超過95%的智能手機和平板電腦都采用ARM的技術架構,讓各家企業都能享受到性能高、成本低、能耗低的芯片技術,讓老牌芯片製造商intel備受挑戰。
 
同樣,語音聯盟也許就是下一個中國式顛覆,未來通過分享語音技術專利及成果,可以在人工智能、移動互聯網、智能終端、智能家居、可穿戴設備等領域深入發展。比如用於聲控語音撥號係統、信息網絡查詢、醫療服務、銀行服務等,為更多產業上下遊企業提供更多尖端技術,帶動智能語音以及相關產業的發展,形成新的業態與增長點。
 
語音聯盟通過開放式創新與開放式知識產權許可的結合,共享語音技術成果,孕育出一個連接各種智能硬件設備並且提供各式各樣服務的語音交互新平台。甚至可以想象除了技術之外,語音識別這種富含人類情感的交流方式,未來的發展也許不僅僅是一個幫助香蕉视频app解決問題的功能和應用,更是科學計算中情感與文化的承載與體現。

所屬類別: 行業資訊

該資訊的關鍵詞為: