合作咨詢
半夜,女人醒來,感覺有點熱。隨口喊了句:“小乖乖,把空調調低點”,“好的?!薄霸僬{低點”,“這個溫度睡眠剛好,再低你就感冒了”。聽見響起的聲音里帶著微微的責備,女人嘟囔了一句,轉過身睡了。
但其實,小乖乖不是一個人,是她的臥室空調。
房間內,男人剛剛通過手機訂了一張明天飛往成都的機票。他還對剛剛客服小姐姐甜甜的聲音以及溫馨的提示回味不已:“先生您好,成都明天預計溫度是23-28°,您要記得帶涼爽的衣物與預防腸胃不適的藥哦”。
走下電梯,男人快速向車的方向走去。已經馬上12點了,他要去見一位老朋友——午夜場的《深夜有約》。在無數個需要陪伴的夜晚,這個略帶慵懶的聲音溫暖了他無數次。
但其實,他不知道的是,電話對面并沒有什么小姐姐,只有一臺AI智能電話機。陪伴他很久的《深夜有約》,也不是想象中的知心姐姐,而是姐姐提前錄好的聲音。
晚上10點,孩子的房間,一個男人的聲音正聲情并茂地講《水滸傳》,孩子講,必須要聽著這些英雄的聲音才能睡著;
但其實,聲音不是孩子的爸爸,而是手機正在播放的有聲書;
有人分享過來一個視頻鏈接,隨手打開,是漫威各個主角與西游記里邊各路神仙吵架的視頻。伴隨著雷神暴躁的怒吼與觀音菩薩中英文混雜的淡定……你覺得有點迷幻。
但其實,這不是什么賽博朋克的科技大片,而是現在正流行的TTS應用場景。
以上這幾則小片段講的并不是科幻懸疑故事,而是當下生活中正在經歷的真實場景。
說得更具體點,就是語音合成技術(Text-To-Speech,簡稱TTS)照進現實的具體表現。它讓我們的生活更具質感與溫度,隨時隨地體驗科幻片的生活。從電影走向生活。
語音合成技術中,讓聲音富有情感和表現力,一直是一大難點。而近日,云知聲AI開放平臺上線的新產品功能:面向企業,由專業團隊提供服務的云知聲音庫定制功能,融合了業界領先的神經網絡聲學模型和神經網絡聲碼器的端到端合成技術讓合成語音有了情感的溫度,高保真音色可媲美真人。
一經推出后,受到了眾多智能家居、智能客服、電臺、有聲讀物、視頻自媒體創意視頻合成等具有AI智能化需求的企業定制與好評。
與市面上傳統的TTS產品所不同的是,云知聲音庫定制是一款主要針對企業做個性化定制的產品,不僅可以根據企業的個性化場景需要定制專屬的IP發音人,還可以通過私有化部署語音服務,將定制發音人部署到客戶自身的服務器上,使用更私密、更安全。
音庫定制是語音合成技術(TTS)的個性化應用。語音合成是將文字轉化為聲音“朗讀出來”。
常見的Siri、小愛同學等語音助手的聲音,都是TTS技術的“杰作”。
音庫定制通過遷移學習技術,在千句級別的錄音上進行深度定制音色,訓練出來的音庫定制效果取決于原始錄音的質量,錄制語音越干凈、穩定和自然,合成的語音與原聲的相似度越高,聽感更加自然。
為了使合成發音更具專屬發音人的特點,云知聲音庫定制功能中使用的端到端合成技術,更加重視個性化與情感共鳴,合成效果也具有更高的自然度、辨識度。
它通過端到端聲學模型將輸入文本轉換成聲學參數,然后通過神經網絡聲碼器將聲學參數轉換成語音,對原音的音色和風格全面學習,合成效果貼近真人1:1還原的真人數字聲音,實現真實還原個人音色,實現有溫度、有感情、零距離感的真實分享。
同時,可以滿足企業更多場景定制方向,實現企業的各類定制化需求,比如賦予智能客服更具人情味的生命力,讓智能接待更加真情實感;比如可以豐富企業語音助手的聲音形象,與用戶產生更多情感互動;比如與最近市場火熱的有聲閱讀行業結合,打造專屬的聲音IP形象,技術賦能有聲閱讀行業新生態。
目前,TTS技術已經被應用在各個場景,但根據使用主體的不同,從技術層面可以分為 “大眾應用級”和“專業應用級”。
大眾應用級則主要適用于C端客戶在無干擾噪音的純凈錄音環境,自行錄制不同情感表達的語音數據,上傳到相關語音制作平臺即可,在基礎模型訓練和調優具有一定的還原性,適用于個人娛樂等場景;
專業應用級是則更需要專業TTS數據制作機構進行高質量語料采集,通過專業技術調優后合成效果無限貼近真人1:1。適用于企業做個性化的TTS定制服務。
云知聲音庫定制功能,由專業團隊對接服務,基于客戶的實際使用場景,為客戶提供定制化制作流程,采用標準模型訓練、最終模型訓練多重非實時語音模型訓練方案,定制企業的“專屬IP發音人”,有效保障服務質量和音庫定制質量。
同時,為了保證企業”專屬IP發音人”的私密性與安全性,云知聲聲庫定制通過私有化部署的方式,將定制發音人部署到客戶自身的服務器上,使用更私密、更安全。
未來已來。10年前科幻電影中描繪的生活已經逐漸地走進現實。云知聲作為人工智能獨角獸企業,以人工智能語音技術為企業核心,在TTS技術能力上區別低程度復刻,娛樂化的應用領域,專注為變革中的千行百業提供專業的技術支持與語音智能解決方案,助力國內企業降本增效。
為你,千千萬萬遍!