文字转语音(TTS)输出怎么用
6个回答
深圳市容大彩晶科技有限公司
2024-11-15 广告
2024-11-15 广告
广告机代理优选容大彩晶,深圳市容大彩晶科技有限公司自2007年成立伊始,一直专注于液晶商用显示产品的技术研发及产品服务。公司依托具有自主研发能力、创新高效的技术团队,打造出行业优质商用液晶显示设备。容大彩晶产品涵盖商用液晶显示、多媒体广告机...
点击进入详情页
本回答由深圳市容大彩晶科技有限公司提供
展开全部
tts 是test to speech的简写。就是文字转语音的意思。可以把文字变成说话发音。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
2018-10-29 · 知道合伙人互联网行家
关注
展开全部
如果手机支持文字转语音功能,设置路径:
设定-语言和输入-文字转语音输出-可以选择TTS引擎.
如需进行文字转语音设置,请点击齿轮图标(设定)-Samsung TTS设置-普通设置-语音效果/安装的语言-可以根据选项选择语音效果或者不同国家的女声语言。
如需实现语音读出文档中文字的内容,建议您:
1.若手机内置Polaris Office/Polaris Viewer,通过该软件打开文本文档-点击右上角菜单键-文本转语音或全文阅读即可。
2.若手机没有内置Polaris Office/Polaris Viewer,建议您可以下载上述软件或其他支持语音朗读的办公软件尝试。
设定-语言和输入-文字转语音输出-可以选择TTS引擎.
如需进行文字转语音设置,请点击齿轮图标(设定)-Samsung TTS设置-普通设置-语音效果/安装的语言-可以根据选项选择语音效果或者不同国家的女声语言。
如需实现语音读出文档中文字的内容,建议您:
1.若手机内置Polaris Office/Polaris Viewer,通过该软件打开文本文档-点击右上角菜单键-文本转语音或全文阅读即可。
2.若手机没有内置Polaris Office/Polaris Viewer,建议您可以下载上述软件或其他支持语音朗读的办公软件尝试。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
1、设置文字转语音(TTS)输出,【设置】开下。
2、【设置】开下后,接着开下【高级设置】。
3、【高级设置】开下后,接着开下【辅助功能】。
4、【辅助功能】开下后,接着开下【文字转语音(TTS)输出】。
5、【文字转语音(TTS)输出】开下后,接着可以设置音高、语速、音调。
6、点下感叹号,可以来到【文字转语音(TTS)输出】的【设置】。
7、这里可以设置我们的语言。
2、【设置】开下后,接着开下【高级设置】。
3、【高级设置】开下后,接着开下【辅助功能】。
4、【辅助功能】开下后,接着开下【文字转语音(TTS)输出】。
5、【文字转语音(TTS)输出】开下后,接着可以设置音高、语速、音调。
6、点下感叹号,可以来到【文字转语音(TTS)输出】的【设置】。
7、这里可以设置我们的语言。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
展开全部
TTS背后的技术原理——前端和后端系统
让语音助手说话的技术叫 TTS(text-to-speech),也就是语音合成。
打造自然、真实、悦耳的 TTS,是 AI 领域的科学家和工程师一直努力的方向。但前进过程中总会碰到各种“拦路虎”,它们究竟是什么? 我们先从 TTS 的基础原理讲起。
TTS 技术本质上解决的是“从文本转化为语音的问题”,通过这种方式让机器开口说话。
为什么你的语音助手说话不像人?关于TTS技术原理及挑战
图 1语音合成,一个从文本转化为语音的问题
但这个过程并不容易,为了降低机器理解的难度,科学家们将这个转化过程拆分成了两个部分——前端系统和后端系统。
为什么你的语音助手说话不像人?关于TTS技术原理及挑战
图 2前端和后端一起组成的TTS
前端负责把输入的文本转化为一个中间结果,然后把这个中间结果送给后端,由后端生成声音。
接下来,我们先来了解一下前端和后端系统是如何分工协作的?
生成“语言学规格书”的前端系统
小时候我们在认字之前需要先学习拼音,有了拼音,我们就可以用它去拼读我们不认识的字。对于 TTS 来说,前端系统从文本转化出的中间结果就好像是拼音。
不过,光有拼音还不行,因为我们要朗读的不是一个字,而是一句一句的话。如果一个人说话的时候不能正确的使用抑扬顿挫的语调来控制自己说话的节奏,就会让人听着不舒服,甚至误解说话人想要传达的意思。所以前端还需要加上这种抑扬顿挫的信息来告诉后端怎么正确的“说话”。
我们将这种抑扬顿挫的信息称之为韵律(Prosody)。韵律是一个非常综合的信息,为了简化问题,韵律又被分解成了如停顿,重读等信息。停顿就是告诉后端在句子的朗读中应该怎么停,重读就是在朗读的时候应该着重强调那一部分。这些所有的信息综合到一起,我们可以叫”语言学规格书”。
为什么你的语音助手说话不像人?关于TTS技术原理及挑战
图 3.前端通过生成“语言书规格书”来告诉后端我们想要合成什么样的内容。
前端就像一个语言学家,把给它的纯文本做各种各样的分析,然后给后端开出一份规格书,告诉后端应该合成什么样的声音。
在实际的系统中,为了让机器能正确的说话,这份儿“规格书”远远比我们这里描述的要复杂。
扮演“发音人”的后端系统
当后端系统拿到“语言学规格书”后,目标是生成尽量符合这个规格书里描述的声音。
当然,机器是不能凭空直接生成一个声音的。在这之前,我们还需要在录音棚里录上几个到几十个小时不等的音频数据(根据技术不同,使用的数据量会不同),然后用这些数据来做后端系统。
目前主流的后端系统有两种方法:一种是基于波形拼接的方法,一种是基于参数生成的方法。
波形拼接的方法思路很简单:那就是把事先录制好的音频存储在电脑上,当我们要合成声音的时候,我们就可以根据前端开出的“规格书”,来从这些音频里去寻找那些最适合规格书的音频片段,然后把片段一个一个的拼接起来,最后就形成了最终的合成语音。
让语音助手说话的技术叫 TTS(text-to-speech),也就是语音合成。
打造自然、真实、悦耳的 TTS,是 AI 领域的科学家和工程师一直努力的方向。但前进过程中总会碰到各种“拦路虎”,它们究竟是什么? 我们先从 TTS 的基础原理讲起。
TTS 技术本质上解决的是“从文本转化为语音的问题”,通过这种方式让机器开口说话。
为什么你的语音助手说话不像人?关于TTS技术原理及挑战
图 1语音合成,一个从文本转化为语音的问题
但这个过程并不容易,为了降低机器理解的难度,科学家们将这个转化过程拆分成了两个部分——前端系统和后端系统。
为什么你的语音助手说话不像人?关于TTS技术原理及挑战
图 2前端和后端一起组成的TTS
前端负责把输入的文本转化为一个中间结果,然后把这个中间结果送给后端,由后端生成声音。
接下来,我们先来了解一下前端和后端系统是如何分工协作的?
生成“语言学规格书”的前端系统
小时候我们在认字之前需要先学习拼音,有了拼音,我们就可以用它去拼读我们不认识的字。对于 TTS 来说,前端系统从文本转化出的中间结果就好像是拼音。
不过,光有拼音还不行,因为我们要朗读的不是一个字,而是一句一句的话。如果一个人说话的时候不能正确的使用抑扬顿挫的语调来控制自己说话的节奏,就会让人听着不舒服,甚至误解说话人想要传达的意思。所以前端还需要加上这种抑扬顿挫的信息来告诉后端怎么正确的“说话”。
我们将这种抑扬顿挫的信息称之为韵律(Prosody)。韵律是一个非常综合的信息,为了简化问题,韵律又被分解成了如停顿,重读等信息。停顿就是告诉后端在句子的朗读中应该怎么停,重读就是在朗读的时候应该着重强调那一部分。这些所有的信息综合到一起,我们可以叫”语言学规格书”。
为什么你的语音助手说话不像人?关于TTS技术原理及挑战
图 3.前端通过生成“语言书规格书”来告诉后端我们想要合成什么样的内容。
前端就像一个语言学家,把给它的纯文本做各种各样的分析,然后给后端开出一份规格书,告诉后端应该合成什么样的声音。
在实际的系统中,为了让机器能正确的说话,这份儿“规格书”远远比我们这里描述的要复杂。
扮演“发音人”的后端系统
当后端系统拿到“语言学规格书”后,目标是生成尽量符合这个规格书里描述的声音。
当然,机器是不能凭空直接生成一个声音的。在这之前,我们还需要在录音棚里录上几个到几十个小时不等的音频数据(根据技术不同,使用的数据量会不同),然后用这些数据来做后端系统。
目前主流的后端系统有两种方法:一种是基于波形拼接的方法,一种是基于参数生成的方法。
波形拼接的方法思路很简单:那就是把事先录制好的音频存储在电脑上,当我们要合成声音的时候,我们就可以根据前端开出的“规格书”,来从这些音频里去寻找那些最适合规格书的音频片段,然后把片段一个一个的拼接起来,最后就形成了最终的合成语音。
本回答被网友采纳
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询