首頁>國企·民企>深·觀察深·觀察
識別精確度超過95% 智能語音技術讓生活更簡單
新華社北京12月11日電 題:識別精確度超過95% 智能語音技術讓生活更簡單
新華社記者胡喆
多部門合力打造國家級專家庫,百度、阿里云、騰訊、科大訊飛等分別啟動建設“自動駕駛、城市大腦、醫療影像、智能語音”4家國家新一代人工智能開放創新平臺……近日,隨著我國新一代人工智能發展規劃暨重大科技項目的啟動實施,我國在人工智能領域頻頻發力、引發社會高度關注。
作為在這四大領域當中走在前列的一隅,我國的智能語音識別技術有何“長處”?識別精確度超過95%的智能語音新技術又將怎樣改變生活?
從60.2%提升到95%以上:語音識別已經“準出新高度”
連珠的妙語、閃爍的字幕……科大訊飛董事長劉慶峰在一次演講中,向人們展示了智能語音識別技術和其應用所具備的“魔力”。劉慶峰在演講的同時使用著最新的智能語音識別技術——可以讓他演講的內容實時以中英文雙字幕的形式呈現在大屏幕上,反應迅速、幾乎沒錯。
“基于‘訊飛超腦計劃’,科大訊飛開啟了一場以語音和語言為入口的‘認知革命’。”劉慶峰介紹,過去6年中,他們的語音識別技術準確率從60.2%提升到95%以上,已全球領先。
6年前,科大訊飛推出了全球首個語音云開放平臺。目前,該平臺的日處理次數達到40億次。“在語音合成方面,中國已是國際上的領先者。”科大訊飛副總裁胡郁介紹。
劉慶峰認為,人工智能面臨前所未有發展機遇,科大訊飛如果只做技術提供方,會處于一個相對被動和弱勢的地位,所以提出了“平臺+賽道”發展路徑,將人工智能技術賦能給廣大開發者,加快推廣應用。
導航、醫療、公檢法:多的是你不知道的“智能語音”
“我是羅永浩,你鎮定一下,我要開始導航了。”這是高德地圖羅永浩版本的導航聲音片段。高德地圖2014年首次使用語音合成技術實現明星導航,林志玲語音上線即引發轟動。隨后,先后推出羅永浩等明星導航音。
近年來,隨著人工智能熱潮的襲來,以智能語音為代表的各類應用也層出不窮。如QQ閱讀調用訊飛語音合成技術推出有聲聽書;蝦米音樂使用訊飛語音識別技術,推出哼唱檢索……
科大訊飛通過與公檢法系統開展創新合作,使智能語音技術不斷拓展著應用的新疆域。2016年在安徽開展的測試顯示,人工智能判斷詐騙電話的準確率極高;人工智能還充當起法庭書記員,經測試,智能語音識別參與庭審取得實際效果,庭審時長縮短30%。
在中部某省立醫院門診大廳,兩臺機器人格外吸引人。“您好,我是導診機器人‘曉醫’,很高興為您服務。關于科室位置在哪,去哪個科室,還有就診遇到的問題,這些都可以問我哦。”熟悉219個常見病和癥狀對應的科室信息,“曉醫”可通過智能語音識別技術,每天服務近5000次。
“人工智能的關鍵是把復雜的世界簡單化。”百度公司董事長兼首席執行官李彥宏表示,未來30年至50年,人工智能將成為推動人類歷史進步的強大動力。
讓未來充滿“意想不到”:人工智能會否成“脫韁野馬”?
按照業內人士的預估,未來不僅在我們已知的領域,在一些未知領域,“智能語音”技術也會帶給人們許多“意想不到”的突破。
人工智能在“改卷子”方面的能力,就超乎了人們的想象。在江蘇省的高考智能閱卷驗證中,兩個不同的人工智能語文作文閱卷分差小于7分,一致率達92.82%,比兩位老師的閱卷評分的一致率高出5%以上;在湖南省研究生考試的智能閱卷驗證中,兩個不同的人工智能分別對英語作文進行閱卷評分,分差小于6分的一致率竟高達99.83%,比兩位老師的閱卷評分一致率高出了4%以上。
據悉,教育部考試中心正聯合科大訊飛建設人工智能聯合實驗室,在教育領域醞釀著更多“黑科技”的誕生。
自平臺開放以來,科大訊飛基于這一平臺的各類開發者數量由去年同期的20.2萬增至45萬,增長123%,語音云日均使用次數由25.7億次增至超過40億次。開發者們在平臺將語音技術快速集成到產品中,讓產品具備“能聽會說會思考會預測”的功能。
專家指出,一方面要構建開放協同的人工智能科技創新體系,加強關鍵共性技術攻堅,增加人工智能創新的源頭供給。另一方面,要培育高端高效的智能經濟,圍繞教育、醫療、養老等民生需求和熱點難點,加快創新應用,促進人工智能與各產業領域深度融合,積極培育新興業態,布局產業鏈高端,全面提升質量和效益。
編輯:劉小源
關鍵詞:語音 技術 識別