本文摘要:摘 要:音視頻新聞相比于文字、圖片等新聞類型,往往在攜帶信息量、傳播影響力等方面更具優勢。 近年來,音視頻新聞數據量爆發式增長、人工智能理論與技術創新式發展,為新聞生產傳播流程與語音智能技術深度融合創造了無限可能。 本文從媒體智能化升級探索中
摘 要:音視頻新聞相比于文字、圖片等新聞類型,往往在攜帶信息量、傳播影響力等方面更具優勢。 近年來,音視頻新聞數據量爆發式增長、人工智能理論與技術創新式發展,為新聞生產傳播流程與語音智能技術深度融合創造了無限可能。 本文從媒體智能化升級探索中,語音智能在多場景應用、多語種識別、多品類終端與強算力支撐等不同角度切入,對新華社“語音智能+”采編應用矩陣“音訊”的相關工作進行了闡述與展望。
關鍵詞:語音智能; 人工智能; 新聞生產
導語
新華社作為國家通訊社、世界性現代通訊社,每天24小時同時使用十余種語言滾動發稿,權威、準確、及時播發國內外重要新聞和重大突發事件。 近年來,音視頻素材與稿件的制作需求與日俱增,這既對音視頻智能化分析技術提出了更多的挑戰,也給相關技術的更大空間發展創造了無限可能。
從全球范圍看,媒體智能化進入快速發展階段[1]。 人工智能技術正深刻改變著人類社會生活,改變著世界,同時也成為突破媒體融合發展的前沿技術和體現國際競爭力的關鍵技術之一。 語音智能技術作為音視頻智能化處理領域的代表組成部分,新的科研成果也層出不窮。
為進一步利用人工智能技術提升“采編發供”各階段生產傳播效率,新華社技術局推出“語音智能+”采編應用矩陣(下簡稱“音訊”)。 經過一年多的技術建設,目前已支持9種國內外語種、8種國內方言的語音智能分析功能,包含移動客戶端、PC桌面端、網頁端以及多款智能硬件等產品形態,全面賦能記者編輯采訪整理、會議記錄、唱詞制作、稿件校對及旁白配音等采編場景。 同時,音訊業界領先的智能算法、各具特色的智能終端、自主可控的超級算力與安全高效的使用體驗,實現了移動化與智能化下音視頻素材整理與新聞制作效率的大幅提升。
1.語音智能應用,加速媒體智能化升級
1.1 多場景語音智能,賦能采編業務
1.1.1 AI實時速記,采訪邊說邊識別
時間性越強,新聞的社會效果就越大。 音訊將語音實時轉寫技術有效嵌入至新華社采編客戶端中,可將語音信息實時轉換成文字,并支持一鍵建稿至新華社采編系統。 在實際采訪過程中,記者僅需攜帶安裝有客戶端的智能手機,即可實現“AI錄音筆”與“AI速記本”的效果,進一步提高編稿與簽發時效。
圍繞PC機音視頻信息實時轉寫文字的采編需求,音訊同步推出桌面版應用,實現了PC機音頻信息的實時采錄與轉寫等功能。 該工具不僅能實現瀏覽器內的各種直播、點播音視頻同傳字幕,而且能對系統播放軟件的音視頻進行實時轉寫,可對重要報道中領導人或記者會的發言與翻譯內容進行實時記錄與快速整理,有效壓縮稿件生產過程中錄音整理方面的重復工作。
1.1.2 AI錄音轉寫,素材整理好助手
面對采訪過程中收集的大量錄音或視頻素材,記者從中去粗取精,提煉新聞靈感與線索,往往需要反復回放錄音與核查信息。 為此,音訊定制研發了音視頻語音轉錄工具,可支持小時級的錄音或視頻文件在數分鐘內的高效轉寫,準確率可達95%以上,并針對實際業務場景推出采訪發音角色分離、口語表達智能過濾、視頻唱詞智能切分及SRT字幕導出等采編功能,可大幅提升采訪素材整理與視頻后期的工作效率。
1.1.3 AI語音互聯,解放雙手更省勁
人機交互的方式正在因語音輸入而改變,其便捷、快速與個性化等特點賦予媒體領域更多落地場景。 在全國兩會前夕,音訊推出了“大屏智能聲控”方案。 管理員僅需對著遙控拾音設備口述大屏頁面跳轉指令,大屏即可根據指令內容做出切換,實現更智能、便捷地大屏操控體驗。
1.1.4 AI稿件唱校,機器輔助讀校審
語音合成技術即將文字信息轉化為聲音信息,使文字化的新聞更加“聲情并茂”。 音訊結合新聞稿件檢校需求推出了“AI唱校”功能,稿件校對時可以選擇不同的播放語速、男女聲進行智能唱校,同時支持各個標點符號、回車換行等字符的朗讀,一定程度上緩解了人工校對的工作壓力。
1.1.5 AI視頻配音,一鍵搞定畫外音
音訊“智能配音工具”則主打音視頻制作需求。 它具有57位AI配音員,包括9大語種及6種地方方言。 該工具操作簡單,用戶可一鍵合成純正地道的AI配音,也可根據實際采編需求修改音色、音調、語速,甚至可以指定插入圖片與變更多音字的讀法,實現了方便快捷的視頻多語種配音制作,為視頻新聞創作帶來無限可能。
1.2 多語種語音智能,堅持內外并重
進入新時代,構建內外并重的體制機制成為新華社技術建設新目標之一[2]。 音訊近年來不斷拓寬語音智能技術的支持語種。 目前已支持中、英、西、法、俄、阿、葡、日、韓語在內的9種語種(其中還包括加拿大法語、墨西哥西語等8國語言變種),廣東話、河南話、四川話等8種國內方言的語音智能處理功能,推動對內對外報道新聞素材整理與制作效率進一步提升。
1.3 多品類定制終端,錄音提質增效
“音訊盒子”是基于3D技術打造、具有自主知識產權的智能硬件系列產品,可與電視、固定電話、終端及機頂盒等設備外接,通過對音視頻信號的高保真降噪與極速轉碼,實現音源更精準的實時轉寫效果。 適合于新聞采訪、新聞發布會等業務場景,可提高采訪報道新聞生產效率。
除此之外,音訊還與市面在售的若干款錄音筆硬件實現“智能互聯”。 圖8是一款具有8麥環形高保真拾音、數據多重保障、智能電池控制等特性的專業錄音筆,經過新華社技術人員的研發,目前已實現了與新華社新采編客戶端的無線信息傳輸,支持手機遠程控制錄音筆啟停、錄音轉錄及采編一鍵建稿等功能,滿足了更高品質拾音與轉寫、安全距離采訪與整理等場景需求,可進一步提升采訪智能化體驗。
1.4 強算力極致安全,架構穩若磐石
目前,音訊具有新華社遍布全球各地的龐大采編用戶群體,基礎設施的自主可控、核心數據的存儲傳輸等安全要素也顯得尤為重要。 為此,音訊圍繞實際需求打造了“超強算力+智能中臺+全球加速”的全鏈路一體化系統架構。與市面商業化產品不同,其核心功能均部署在新華社自主可控的GPU高性能計算平臺之上,處理性能大幅提升的同時,也完全保證了數據安全; 音訊“智能語音中臺”目前具有強大定制與高擴展能力,可通過靈活開發,滿足新華社不同部門與分社定制化語音智能需求; 同時,為保證駐外采編人員的使用體驗,音訊針對性實現全球內容分發網絡(CDN)鏈路加速優化,大幅降低了海外訪問延遲,使北美等地區的使用體驗進一步提升。
2.產品效能初顯,用戶活躍度口碑高漲
當前,音訊產品的用戶已達數千人,分布在全球各地。 自2019年上線至今,已累計語音轉寫各語種素材超1.9萬小時,共計7.3萬余單,平均1小時錄音僅需9分鐘即可獲得轉寫結果(圖9為轉寫工具用戶數目及轉寫單數月活躍量數據示例); 另一方面,累計語音合成超過4700萬字的稿件內容,合成時長超過2400小時。 音訊通過與新華社采編流程打通并融合,為采編人員節省了大量寶貴的人力與物力,受到了廣泛認可。
在2019年一帶一路高峰論壇及中國國際進口博覽會等重大報道期間,音訊多次輔助新華社前后方采編人員素材整理素材,提升各語種出稿效率; 亞洲文明交流大會開幕式的報道前方,音訊盒子對領導人講話中文原聲和英文同聲進行實時語音轉寫,在無英文稿情況下供新華社多個編輯部參考與發稿,加快了發稿時效; 2020年全國兩會期間,音訊轉寫工具輔助音視頻編輯聽打唱詞,節省了大量人工拍詞工作; 抗擊疫情期間,音訊“智能遠程錄音”的采訪模式,使記者在采訪錄音與記錄的同時,保證了采訪安全距離,成為疫情相關報道的重要助力。
3.融合潛力巨大,媒體智能化未來可期
近年來,音視頻產業爆發式增長,逐漸成為新聞傳播的重要媒介載體。 媒體融合發展的路上,語音智能未來仍具有很大的應用空間。 音訊將圍繞采編需求,繼續在如下方面進行更深入的研究,持續推進媒體智能化工作縱深發展。
3.1增強語音智能應用的融合力度
本文所闡述的語音智能的應用主要集中在新聞生產系統,當前新華社技術局還在對語音識別與合成技術在智能硬件及交互式AR/VR產品等方面的集成應用等方面不斷拓展,增強系統實用性、激發產品趣味性,將現有技術更全面地賦能新聞生產傳播各個流程。
3.2擴展語音成熟技術的應用廣度
語音智能的新技術也日新月異。 例如,語音識別中的聲紋識別技術,不僅可用于標記采訪錄音中更多的講話者,亦可用于權限認證,提升新聞素材整理的便捷性與新聞審核簽發的安全性; 基于語音遷移學習、小樣本學習等技術[3],可在數分鐘內實現個性化配音角色的快速制作,合成語音的自然度和相似度均可以假亂真; 藏語及維語等少數民族語言語音智能技術,可輔助記者提升采訪溝通與記錄效率。
音頻論文投稿刊物:《當代江西》雜志是一本教育黨員,指導基層黨組織建設的綜合性黨刊,由中共江西省委主管主辦,2005年1月10日,出版創刊號。《當代江西》是2003年10月,整合省委7家部門刊物,創辦的一本以全面反映黨的建設為重點的綜合性黨刊,并明確由中共江西省委主管主辦。
3.3細化音視頻的跨媒介檢索粒度
隨著語音轉文字技術準確度的不斷提升,所有音視頻稿件中的語音內容,均可以文字形式予以保存并建立索引,進而實現稿件中語音內容的精準檢索。 這樣可大幅提升新聞采編素材的選擇范圍,即使是文字稿件也能廣泛采用視頻同期聲等文字內容。
參考文獻:
[1]習近平.加快推動媒體融合發展 構建全媒體傳播格局[J].當代江西,2019(3): 4-7.
[2]蔡名照.始終履行好黨中央“喉舌”“耳目”職能[J].求是,2016(6):33-34.
[3]俞棟,鄧力.解析深度學習:語音識別實踐[M].電子工業出版社,2016.
作者:李澤魁 孫 霏 劉一聞
轉載請注明來自發表學術論文網:http://www.zpfmc.com/wslw/25367.html
2023-2024JCR鐟滄澘宕幖鐑藉炊閻樿尙鎽�
SCI 閻犱胶鍎ら弸鍐焻婢跺﹤鐏侀柕鍡曠劍婵洨绮欑憗銈傚亾娴i攱鍙忛柛銉у仜閸欏繘骞愰崶褍纭€
SSCI缂佲偓閸欍儳绐楃紒澶嬪灥椤掔喖寮甸悢宄扮亖闁硅埖娲滄灙閻犙冨椤旓拷
濞戞搩鍘奸ˇ濠氬棘閸ャ劎澹嬮煫鍥у暞濠€锟犲礆婵犱胶鐭欑紓浣哥С缁楀矂骞庨弴鐘屽綊骞愰崶褍纭€
sci闁告粌顔抯ci闁告瑥鏈弫纭呫亹閺囩喐鍩傞柛鎺炴嫹
EI闁衡偓鐠鸿櫣绉块柣銊ュ閼垫垿宕堕懞銉﹀焸闁告帪鎷�
闁告艾瀚鐔虹矓閹插檻ci
闁告艾瀚鐔虹矓閹插樈i
闁告艾瀚鐔虹矓閹辩牪ci
EI闁哄牏鍠庨崹鎿烶XSourceList
闁告ê妫楅惇缍緎sci闁哄秶枪缁洪箖寮甸悢宄扮亖婵懓娲﹂埀顒婃嫹
闁告ê妫楅惇缍緎cd-濞戞搩鍘煎ù妤冪矓閹存繍鍔呯€殿喗娲橀弸鍐极閻楀牆绁﹂幖瀛樻尰濞奸潧鈹冮幇顓熷焸闁告帪鎷�
CSCD闁挎冻鎷�2023-2024闁挎冻鎷�
濞戞搩鍘鹃~鏍⒔閵忕姴鐎婚柛鏍細閵嗭拷2023
濞戞搩鍘煎ù妤冪矓閹寸偛螚闁哄秶枪缁洪箖寮甸悢宄扮亖闁告ê妫楅惇楣冩儎椤旇偐绉�
2023妤犵偛顕晶妤佺▔椤撶偞绂囩紒澶嬪灦婵⊙囧冀缁嬭法濡囬柡鍫㈠枎閸ㄦ棃鎯勯鑲╃Э闁挎稑鐗愰崵婊堟倿閸撲緡娼犻悗娑宠缁憋拷
2023妤犵偛顕晶妤佺▔椤撶偞绂囩紒澶嬪灦婵⊙囧冀缁嬭法濡囬柡鍫㈠枎閸ㄦ棃鎯勯鑲╃Э闁挎稑鐗忛妵鐐村濮橀硸娼犻悗娑宠缁憋拷
闁告ê妫楅惇楣冨礌濡も偓閵囧洭寮界粙璺ㄥ
2023闁绘鐗忛鍥础娴e搫顣煎☉鎿冨幗閺嬪啴寮界粙璺ㄥ闁烩晩鍠栫紞锟�
2023-2024JCR鐟滄澘宕幖鐑藉炊閻樿尙鎽�
SCI 閻犱胶鍎ら弸鍐焻婢跺﹤鐏侀柕鍡曠劍婵洨绮欑憗銈傚亾娴i攱鍙忛柛銉у仜閸欏繘骞愰崶褍纭€
SSCI缂佲偓閸欍儳绐楃紒澶嬪灥椤掔喖寮甸悢宄扮亖闁硅埖娲滄灙閻犙冨椤旓拷
濞戞搩鍘奸ˇ濠氬棘閸ャ劎澹嬮煫鍥у暞濠€锟犲礆婵犱胶鐭欑紓浣哥С缁楀矂骞庨弴鐘屽綊骞愰崶褍纭€
sci闁告粌顔抯ci闁告瑥鏈弫纭呫亹閺囩喐鍩傞柛鎺炴嫹
EI闁衡偓鐠鸿櫣绉块柣銊ュ閼垫垿宕堕懞銉﹀焸闁告帪鎷�
闁告艾瀚鐔虹矓閹插檻ci
闁告艾瀚鐔虹矓閹插樈i
闁告艾瀚鐔虹矓閹辩牪ci
EI闁哄牏鍠庨崹鎿烶XSourceList
闁告ê妫楅惇缍緎sci闁哄秶枪缁洪箖寮甸悢宄扮亖婵懓娲﹂埀顒婃嫹
闁告ê妫楅惇缍緎cd-濞戞搩鍘煎ù妤冪矓閹存繍鍔呯€殿喗娲橀弸鍐极閻楀牆绁﹂幖瀛樻尰濞奸潧鈹冮幇顓熷焸闁告帪鎷�
CSCD闁挎冻鎷�2023-2024闁挎冻鎷�
濞戞搩鍘鹃~鏍⒔閵忕姴鐎婚柛鏍細閵嗭拷2023
濞戞搩鍘煎ù妤冪矓閹寸偛螚闁哄秶枪缁洪箖寮甸悢宄扮亖闁告ê妫楅惇楣冩儎椤旇偐绉�
2023妤犵偛顕晶妤佺▔椤撶偞绂囩紒澶嬪灦婵⊙囧冀缁嬭法濡囬柡鍫㈠枎閸ㄦ棃鎯勯鑲╃Э闁挎稑鐗愰崵婊堟倿閸撲緡娼犻悗娑宠缁憋拷
2023妤犵偛顕晶妤佺▔椤撶偞绂囩紒澶嬪灦婵⊙囧冀缁嬭法濡囬柡鍫㈠枎閸ㄦ棃鎯勯鑲╃Э闁挎稑鐗忛妵鐐村濮橀硸娼犻悗娑宠缁憋拷
闁告ê妫楅惇楣冨礌濡も偓閵囧洭寮界粙璺ㄥ
2023闁绘鐗忛鍥础娴e搫顣煎☉鎿冨幗閺嬪啴寮界粙璺ㄥ闁烩晩鍠栫紞锟�
閻犲洤鍢查敐鐐哄礃濞嗗簼绻嗛柟顓у灲缁辨繈宕欐潪鏉垮/濞戞挻鎸搁崺锟�/闁搞儴妫勯崬瀛樺緞閿燂拷/濞戞搩鍙€鐎氭娊寮敓锟�/闁稿繈鍔岄鐔虹矓閹寸偞鍩傞柛鎺戯攻鐢綊鎳¢幇顏嗙憿闁告瑦鍨奸妴鍐箰閸パ屽殼