智能語音領域取得突破:猿輔導斬獲國際人工智能賽事冠軍
國際聲學、語音與信號處理會議(ICASSP)近期公布的比賽結果顯示,來自猿輔導人工智能實驗室的研究團隊在“M2VoC(多說話人多風格音色克隆大賽)”中獲得子賽道第一名。這表明該研究團隊在智能語音的部分關鍵核心技術和應用上取得重要進展。
作為2021年聲學、語音和信號處理國際會議(ICASSP)信號處理挑戰旗艦任務之一,多說話人多風格音色克隆大賽吸引了來自全球百余家知名高校和企業研究團隊的參與,目標是為音色克隆、語音識別等前沿技術提供創新探索的平臺。
ICASSP是全世界最大的、最全面的信號處理及應用方面的會議,也是IEEE(電子技術與信息科學工程師協會)的重要會議。這次比賽共有來自各大知名公司和大學研究機構的150多支隊伍報名參加。最終,在極少樣本開集賽道,猿輔導AI Lab語音實驗室的5人研發團隊奪得冠軍。
據了解,此次在極少樣本開集賽道獲得第一名的研究團隊來自猿輔導人工智能實驗室。研究團隊成員楊明祺介紹,智能語音是人工智能技術的重要組成部分, 在經濟社會中有著非常多應用場景,此次在語音合成技術方面取得實質進展,未來能夠被進一步應用到教育、醫療等行業和領域中,推動我國人工智能技術的發展。
該技術聽起來生澀難懂,實際上小猿口算、猿輔導網課等產品中早已廣泛應用。例如,它可以在低年齡學員還未形成一定閱讀能力的情況下,將題目從難以理解書面文字轉換成學員得以接受的語音,幫助學員理解題目及文章內容。一些英語聽力練習題對咬字發音的要求十分嚴苛,AI語音也可以自動生成標準的英音、美音聽力音頻。語音實驗室研發團隊的日常工作之一,就是要去找到把題目文本轉化成讀題音頻的方法,甚至有時候需要根據老師具體的出題需求,控制合成句子的發音、語調和語速。
因為有工作過程中的長期積淀,猿輔導研發團隊僅花了5天時間就準備好了參賽作品。他們認為,猿輔導的語音合成作品勝在韻律信息足夠自然流暢,而這也跟智能語音技術在教育領域的實際應用場景和需求高度相關。
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據。
相關推薦: