日韩一区二区三区在线免费观看-开心久久婷婷综合中文字幕-欧美激情91-久久国产福利-欧美日韩日本国产亚洲在线-国产精品极品国产中出

首頁 > 新聞 > 智能 > 正文

基于擴散模型的音頻驅動說話人生成,云從 & 上交數字人研究入選 ICASSP 2023 世界最新

2023-06-18 13:26:19來源:ZAKER科技  

機器之心發布

機器之心專欄

近日,國際語音及信號處理領域頂級會議 ICASSP2023 在希臘成功舉辦。大會邀請了全球范圍內各大研究機構、專家學者以及等谷歌、蘋果華為、Meta AI、等知名企業近 4000 人共襄盛會,探討技術、產業發展趨勢,交流最新成果。


(資料圖)

云從科技與上海交通大學聯合研究團隊的《 基于擴散模型的音頻驅動說話人生成》成功入選會議論文,并于大會進行現場宣講,獲得多方高度關注。

論文地址:https://ieeexplore.ieee.org/document/10094937/

ICASSP(International Conference on Acoustics, Speech and Signal Processing)是語音、聲學領域的頂級國際會議之一, ICASSP 學術會議上展示的研究成果,被認為代表著聲學、語音領域的前沿水平與未來發展方向。

本次入選論文,圍繞 " 基于音頻驅動的說話人視頻生成 " 這一視覺 - 音頻的跨模態任務,將語音與視覺技術結合,提出的方法能夠根據輸入的語音片段技術,生成自然的頭部動作,準確的唇部動作和高質量的面部表情說話視頻。該項成果在多個數據集上,都取得了優于過去研究的表現。

此外,在實戰場景中,隨著現實生活中對于數字人引用的愈來愈廣泛,實現用音頻驅動的生成與輸入音頻同步的說話人臉視頻的需求也越來越大。本項成果基于擴散模型的跨模態說話人生成技術,可以推廣到廣泛的應用場景,例如虛擬新聞廣播,虛擬演講和視頻會議等等。

簡介

基于音頻驅動的說話人視頻生成任務(Audio-driven Talking face Video Generation):該任務是根據目標人物的一張照片和任意一段語音音頻,生成與音頻同步的目標人物說話的視頻。由于其生成的說話人更自然、準確的唇形運動和保真度更高的頭部姿態、面部表情,該任務廣泛應用于如數字人、虛擬視頻會議和人機交互等領域,作為視覺 - 音頻的跨模態任務,基于音頻驅動的說話人視頻生成也受到了越來越多的關注。

為了構建音頻信號到面部形變的映射,現有方法引入了中間人臉表征,包括 2D 關鍵點或者 3D morphable face model ( 3DMM ) ,盡管這些方法在音頻驅動的面部重演任務上取得了良好的視覺質量,但由于中間人臉表征造成的信息損失,可能會導致原始音頻信號和學習到的人臉變形之間的語義不匹配。

此外基于 GAN 的方法訓練不穩定,很容易陷入模型崩塌,往往它們只能生成具有固定分辨率的圖像。針對以上問題,AD-Nerf 引入了神經輻射場,將音頻信號直接輸入動態輻射場的隱式函數,最后渲染得到逼真的合成視頻。但是基于神經輻射場的方法計算量大導致訓練耗時長,算力要求高。并且這些工作大多忽略了個性化的人臉屬性,無法準確的將音頻和唇部運動進行同步。因此本文的研究者們提出了本方法,通過借助去噪擴散模型來高效地優化人臉各部分個性化屬性特征,進而合成高保真度的高清晰視頻。

方法

該方法首先基于一個關鍵的直覺:唇部運動與語音信號高度相關,而個性化信息,如頭部姿勢和眨眼,與音頻的關聯較弱且因人而異。受到最近擴散模型在高質量的圖像以及視頻生成方面已經取得了快速進展的啟發,因此研究者們基于擴散模型重新構造音頻驅動面部重演的新框架,本方法來優化說話人臉視頻的生成質量和真實度。

本方法一共包含四大部分:(1)人臉屬性解耦;(2)唇 - 音對比同步;(3)動態連續性屬性信息建模;(4)基于去噪擴散模型的說話人生成

人臉屬性解耦部分中,研究者采用 3DMM 提取源身份圖像的頭部姿態和表情系數,然后借鑒之前 DFA-nerf 的工作采用全連接的自編碼器從表情參數解耦得到唇部運動和眨眼動作信息。

唇 - 音對比同步模塊中,研究者通過引入自監督跨模態對比學習策略來部署一個確定性模型來同步音頻和唇部運動的特征。

動態連續性屬性信息建模模塊中,由于頭部姿勢和眨眼等個性化人臉屬性是隨機的和具有一定概率性的,因此為了對人臉屬性的概率分布進行建模并生成長時間序列,研究者提出采用了基于 transformer 的變分自動編碼器(VAE)的概率模型,一是 VAE 可以用于平滑離散的屬性信息并映射為高斯分布,二是利用 Transformer 的注意力機制充分學習時間序列的幀間長時依賴性。

基于去噪擴散模型的說話人生成模塊中,研究者生成的個性化人臉屬性序列與同步的音頻嵌入相連接作為擴散模型的輸入條件。然后利用條件去噪擴散概率模型(DDPM)將這些驅動條件以及源人臉作為輸入,通過擴散生成的方式生成最終的高分辨率說話人視頻。這些個性化人臉屬性序列與同步的音頻嵌入用來豐富擴散模型,以保持生成圖像序列的一致性。

實驗結果

研究者們通過實驗驗證了本方法對于基于音頻驅動的說話人視頻生成任務的優越性能。

定量比較實驗

研究者將本方法與現有音頻驅動的人臉視頻生成方法通過定量化分析實驗進行比較,采用了峰值信噪比 ( PSNR ) , 結構相似度(SSIM),人臉關鍵點運動偏移(LMD),視聽同步置信度 ( Sync ) 等多個客觀的評估指標,具體信息如表 1 所示。

本文所提出的擴散生成框架在所有的性能指標上都優于其他方法,其中 PSNR 和 SSIM 驗證了人臉屬性解耦方案能夠更好地捕捉說話人的頭部姿態、眨眼等個性化信息。而本方法的 LMD 分數意味著本方法的唇音一致性更強。此外,受益于輸入音頻和唇部運動的跨模態對比學習,本方法在 Sync 指標上大幅超越其他方法。

定性比較實驗

研究者將本方法與現有音頻驅動的人臉視頻生成方法進行比較。通過個性化屬性的學習以及擴散模型的優化,我們的方法生成具有個性化的頭部運動,更加逼真眨眼信息,唇 - 音同步性能更好的人臉視頻。

模型中每個模塊帶來的效益

為了突顯出模型中每個模塊的重要性,研究者們做了消融實驗,如表 2 所示,當添加 DDPM 模塊之后,在推理速度和視覺質量方面相比于其他模塊的提升是最大的,其次,受益于解耦的人臉屬性信息以及 VAE 的屬性平滑以及動態連續性建模的作用,說話人人臉的自然度得到了提高。此外,唇音對比學習的模塊通過自監督的方式顯著提高了唇部運動和與輸入音頻的同步質量。

模型的效率

研究者們還展示了模型的可訓練參數量,推理速度以及輸出的分辨率大小,并和之前的 SOTA 模型進行了對比,由于使用去噪擴散概率模型,該模型利用變分方法而不是對抗性訓練,并且不需要部署多個鑒別器,因此極大緩解了訓練時模型容易陷入模型坍塌的問題,并且采用了較短的時間步長,推理速度大大提高,效率得到了提升。

結論

針對基于音頻驅動的高保真度說話人視頻生成這個任務,云從 - 上交的聯合研究團隊提出了,基于擴散框架的音頻驅動說話人視頻生成方法,只需要一幀或幾幀身份圖像以及輸入語音音頻,即合成一個高保真度的人臉視頻,實現了最先進的合成視頻視覺質量。此外利用了跨模態唇音對比學習的方法,從而提升了唇部和音頻的一致性,在公開數據集上取得了 SOTA 表現。

THE END

轉載請聯系本公眾號獲得授權

投稿或尋求報道:content@jiqizhixin.com

關鍵詞:

責任編輯:hnmd003

相關閱讀

相關閱讀

推薦閱讀

中文字幕乱码亚洲无线精品一区| 乱码第一页成人| 欧美专区一区| 精品国产91乱码一区二区三区四区 | 青草久久视频| 免费一级片91| 日本美女一区二区| 91嫩草精品| 亚洲一区免费| 在线国产精品一区| 另类在线视频| 国产免费拔擦拔擦8x在线播放 | 精品国产一区二区三区av片 | av在线视屏| 一区二区日韩欧美| 99久久夜色精品国产亚洲1000部| 91青青国产在线观看精品| 久久悠悠精品综合网| 加勒比色老久久爱综合网| 精品国产免费人成网站| 国产免费久久| 亚洲精品1234| 亚洲美女91| 欧美成人久久| 免费成人毛片| 久久精品国产亚洲夜色av网站| 久久爱91午夜羞羞| 欧美日韩播放| 蜜桃视频一区二区三区在线观看| 欧美国产高清| 黑丝一区二区三区| 久久资源综合| 伊人情人综合网| 另类人妖一区二区av| 99精品在线免费在线观看| 亚洲国产尤物| 久久人人精品| 日韩毛片网站| 亚洲午夜视频| 青青国产91久久久久久| 亚洲国产不卡| 国内视频精品| 亚洲第一毛片| 亚洲日本视频| 亚洲激情偷拍| 国产精品探花在线观看| 亚洲综合丁香| 亚洲欧美日本伦理| 超碰99在线| 爱爱精品视频| 99亚洲伊人久久精品影院| 精品久久中文| 久久精品一区二区三区中文字幕| 竹菊久久久久久久| 国内精品久久久久久久影视蜜臀| 女生裸体视频一区二区三区| 中文字幕一区二区精品区| 久久成人在线| 亚洲2区在线| 久久精品免费观看| 激情91久久| 久久爱www.| 99精品欧美| 视频一区视频二区中文| 久久久精品区| 国产精品成人国产| 国产农村妇女精品一二区| 日韩电影在线观看一区| 热久久久久久| 99成人在线| 在线精品视频一区| 欧美成人毛片| 奶水喷射视频一区| 国产精品极品| 在线观看亚洲精品福利片| 免费精品99久久国产综合精品| jizz性欧美2| 亚洲理论在线| 碰碰在线视频| 伊人久久大香线蕉综合热线| 亚洲国产欧美在线观看| 国产欧美亚洲一区| 久久毛片亚洲| **女人18毛片一区二区| 日韩免费一级| 日本特黄久久久高潮| 亚洲黄色中文字幕| 欧美日韩三级| 精品久久电影| 亚洲电影一级片| 一区二区三区国产在线| 欧美aaaaaaaaaaaa| 最新成人av网站| 欧美成人基地| 日韩电影在线一区| 亚洲毛片一区| 福利精品一区| 伊伊综合在线| 丝袜诱惑制服诱惑色一区在线观看| 国产91精品对白在线播放| 久久不见久久见中文字幕免费| 国产精品伊人| 国产精品字幕| 欧美国产小视频| 亚洲欧美不卡| 好吊一区二区三区| 欧美色图一区| 国产一区丝袜| 日韩精品成人| 亚洲区小说区图片区qvod| 亚洲久久成人| 日本视频中文字幕一区二区三区| 欧美天堂一区二区| 国内激情视频在线观看| 模特精品在线| 午夜一区不卡| 日本伊人午夜精品| 亚洲专区一区二区三区| 久久福利综合| 日韩精品看片| 久久久天天操| 欧美精品中文字幕亚洲专区| 免费精品一区| 嫩呦国产一区二区三区av| 亚洲人挤奶视频| 欧美视频精品全部免费观看| 久久男人av| 91精品一区| av成人在线网站| 欧美黄在线观看| 久久综合社区| 中文字幕一区二区三区久久网站| 亚洲精品裸体| 国产激情精品一区二区三区| 亚洲人成久久| 亚洲天天综合| 亚洲伊人伊成久久人综合网| 国产激情一区| 同性恋视频一区| 一区二区三区在线免费看| 日韩欧美中文字幕一区二区三区| 日本亚州欧洲精品不卡| 亚洲三区欧美一区国产二区| 国产精品白丝av嫩草影院| 精品中国亚洲| 亚洲精品888| 午夜亚洲性色视频| 欧美激情黄色片| 亚洲黑人在线| 麻豆精品一区二区综合av| 久久香蕉网站| 日韩高清一级| 岛国精品一区| 91九色精品| 国产午夜久久| 欲香欲色天天天综合和网| 色诱色偷偷久久综合| 久久精品国产色蜜蜜麻豆| 日本aⅴ亚洲精品中文乱码| 国产精品中文| 香港久久久电影| 久久日文中文字幕乱码| 亚洲国产成人精品女人| 蜜臀av性久久久久av蜜臀妖精 | 日韩av久操| 久久电影tv| 色综合久久久| 成人久久精品| 99久久免费精品国产72精品九九| 99国产**精品****| 免费日韩视频| 91精品国产66| 亚洲一区二区三区无吗| 日韩精品一级| 欧美裸体在线版观看完整版| 蜜桃一区二区三区在线| 久久精品99国产精品日本| 国产精品成人3p一区二区三区| 一区中文字幕| 制服诱惑一区二区| 天堂中文在线播放| 欧美精品大片| 国产另类在线| 久久国产精品久久w女人spa| 精精国产xxxx视频在线野外| 一区二区三区中文| 国产一区调教| 免费久久精品视频| 日本美女视频一区二区| 欧美日韩天堂| 蜜桃一区二区三区在线观看| 久久精品一区二区国产| 日本一区二区三区电影免费观看| 女人色偷偷aa久久天堂| 成人免费网站www网站高清 | 欧美黄色大片在线观看| 日本成人在线电影网| 成人在线免费观看网站| 免费的国产精品| 亚洲欧美网站在线观看|