自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(0)
  • 资源 (7)
  • 收藏
  • 关注

空空如也

C#考试系统

一个简单的c#考试系统 希望可以给您做一个参考 微博名是:__zhanghj 希望可以跟您一起交流

2013-12-27

连续语流中韵律层级和调型组合对重音感知的影响.pdf

由于汉语是声调语言,在连续语流中韵律词重音不仅会受到其所在韵律层级的影响,也会受到调型组合的影响。该文在大规模连续普通话语音数据库的基础上,从韵律层级和调型组合2方面对韵律词重音感知作了细致分析。实验结果表明,在不同的韵律层级和调型组合条件下,重音感知呈现出规律性差异,主要表现为 1) 随着韵律层级的上升,时长和基频都随着重音级别的增大而增大,但基频对重音感知的影响更大;2)在相斥的调型组合下,时长对重音感知的作用要显著高于其在相容调型组合下的作用;3)在连续语流中,双音节韵律词的重音模式没有显著稳定性。

2012-06-29

采用重音调整模型的HMM语音合成系统.pdf

韵律模型一直是语音合成中的研究重点,而重音则是目前韵律研究中的主要参战,在已有的研究工作中重音的定性分析较多,便重音生成则相对较少,该文采用基于重音调整的方法,构建了一个支持重音的隐Markov模型(Hmm)语音合成系统。在文本分析模块引入最大熵模型完成了基于文本特征的重音预测,然后根据重音调整韵律参数得到调整后的Hmm模型,最后采用基于Markov模型的语音合成技术系统合成语音。实验结果表明:采用该方法能够合成出抑扬顿挫的语音。该方法的优势在于能够灵活的地扩展到对其他语音表现力的合成。

2012-06-29

实时语音驱动的虚拟说话人.pdf

该文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入,同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议,音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元,因此构建音素识别器,对输入语音信号进行实时音素识别。这提高语音与口型的同步效果,改进了音素识别与输出算法。考虑协同发音影响,利用动态视素生成算法,奖识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照Mpeg-4面部动画标准参数的3-d头部模型,实现面部动画的同步生成。主观Mos评测结果表明:本文所实现的实时语音驱动虚拟说话人在同步性和逼真度上的Mos评分分别达到了3.42和3.50。

2012-06-29

语音技术_推开信息无障碍的窗.pdf

科技的发展最重要的目标是使人们的生活更加便捷,语音技术的不断发展同样也是以此为目的的。它的进步不但使一般人的生活更加方便,对于盲人等特殊群体来说,更是一种福音,从某种意义上来说,语音技术的出现给盲人带来了一丝光亮,给他们创造了新生活。

2012-06-29

网站语音播报程序的设计与实现.pdf

本文详细介绍了两种实现网站语音播报程序的设计与实现方法,内嵌Real Player控件的方法通过自动播放ASP程序生成的一个播放语音列表文件来实现播音,内嵌Flash对象则通过其库文件Linkage Property属性建立音频库文件与动画脚本的链接,在动画中通过脚本调用库文件中相应的声音文件实现播音。

2012-06-29

广东话文本语音转换系统的设计与实现.pdf

汉语的文本语音转换有广泛的应用,用音素或音节为单位的合成方法各有利弊,广东话的语音合成与普通话的合成方法基本类似,但广东话有较多的音节数和罗保铭的单调种类,广东话的多音字和变调字也很多,所以广东话的合成处理技术比较复杂。用广东话语音合成系统作成的盲人用计算机已用于香港地区的盲人界,具有良好的效果

2012-06-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除