产业家网 5月28日消息,标贝科技重磅推出情感合成方案,主打高音质及高自然度的情感语音合成效果,满足有声阅读、儿童教育、车载、泛娱乐等多场景使用。据悉,标贝科技本次打造情感合成方案,是继3月成功推出留声机方案之后,推出的又一全新TTS解决方案,通过整体提高情感合成声音效果,提升用户的交互体验。

AI情感合成让语音交互更有温度

声音的可用性,可以通过自然度、可懂度、识别度等维度来考量。语音技术的进步,让机器合成的声音不再顿挫、冰冷,在自然度和可懂度等方面取得了不错的成绩,但当前合成效果在合成音的表现力上,特别是语气和情感方面,还有不足。缺乏情感的声音,何谈传递情感,留住用户?

情感合成,可以具有更进一步的声音表现力,传递出文本文字之外更多的信息,做到声情并茂,以更动听的声音,更富有情感地表达内容。

事实上,不同场景及文本类型,对声音的要求也不同,除了基本的高音质、自然度要求外,让声音拥有情感是不可或缺的。同样的文本内容,用不同情感表达出的传递出的意思也不尽相同, 需要“音”景制宜,以增强用户的融入感、代入感。例如,这句话“为什么你要这么问我?” 试想下用生气、高兴、恐惧等情感说出效果与表达的意思。

此外,随着语音技术推广应用深入不同的服务场景,用户对声音提出了更高的要求。智能客服场景,需要亲和温暖的声音来提高用户的满意度;有声阅读场景,需要根据不同题材搭配出不同声音,让用户感受有声文本的魅力;智慧生活场景的语音交互,需要有情感的声音赋予机器生命力,更懂用户,感受科技生活的美好。

因此,如何进一步提高语音合成的表现力,特别是让合成语音能够模拟表达说话人的情感状态,是语音合成未来发展的趋势,而这也正是标贝科技一直努力的方向。

打造高音质、高自然度、强表现力的情感合成TTS

据标贝科技语音相关负责人介绍,基于深度学习技术及自有定制情感数据,标贝本次推出情感合成TTS,主打高音质、高自然度与多情感,可以呈现出高兴、愤怒、恐惧、哀叹、悲伤等多种情感声音,在韵律表现、声音层次感、情感表达等方面做到更加接近真人情感化表达的语音效果。标贝科技希望通过语音技术的不断创新,打造出更有表现力、更自然、更动听的情感合成语音,持续提升用户交互体验。

例如有声阅读、儿童教育、智能硬件等场景,高音质、自然度的情感很重要。标贝通过使用情感TTS技术,力求在语气、语音、语调、情感等方面接近真人说话,与场景匹配,让用户在不同场景和碎片化时间,进行有声听读获取资讯、体验在线学习教育获得优质体验。

以多角色情感合成为例,由于故事、小说等文本素材包含大量角色人物,通过不同情感合成声音配合文本内容,以展现文学小说人物的的特点,让AI技术生产的有声读物更有“人情味”。

下面通过一个多角色多情感的儿童故事合成样本,来展示标贝情感TTS带来不一样的有声故事体验。

在故事中,我们可以切实感受到故事中人物情感的变化情况,更能够吸引少儿听众,营造一种引人入胜的沉浸感。

来自易观发布《2020年中国音频产业生态发展分析报告》表示,有声市场呈现增长的态势,越来越多的用户开始接受有声阅读这样的形式来收听内容。其中,2020年1季度,在某知名有声书平台的播放量和收听人数上都有显著增长,两者环比分别增长80.32%和39.82%。此外,用户在有声读物的付费购买上也更加积极,2019年该平台整体有声书专辑订单中过半为付费订单。

毫无疑问,有声市场的爆发增长,将诞生大量不同类型的有声内容,相信情感语音合成能够带来更加自然和丰富的语音体验,为有声读物市场提供更有竞争力的差异化产品。

自有数据库加持 让情感合成实现“可定制”

事实上,打造自然、高表现力的声音效果,自然离不开语音情感数据支持。数据库是语音合成技术的基础,也是决定语音合成效果的关键因素之一。据了解,标贝科技本次打造的情感TTS,采用了自有定制的高保真的情感语音库。

目前,标贝科技自有定制型语音库已开发出包括中文女声情感音库、多语种多音色男女声音库、粤语语音库、儿童语音库、葡萄牙语音库、台湾普通话语音库、日语音库、韩语音库、明星语音库等数十种类别,IP语音库还在不断丰富和积累中。

基于领先语音技术+高质量的数据库基础,标贝能够提供业内优质的情感解决方案,呈现出声音的多样性、和个性化的合成效果体验。这也是因为标贝科技自成立起,将语音交互效果和数据质量放在首位,拥有完整的采标一体化解决方案,能够实现快速产出高质量的语音合成、语音识别、自然语言处理、计算机视觉等采标服务,为行业提供一站式语音和数据服务。

未来,随着语音技术不断发展,技术与场景的关系变得紧密,而用户需求变得更加个性化。标贝科技将加大技术创新投入,打造更有温度的情感声音,让语音交互效果更“声入人心”。