Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏
当前位置:首页 > 教育论文 > 正文

用 TTS 技术实现标准普通话语音微课件论文

发布时间:2019-12-09 14:49:15 文章来源:SCI论文网 我要评论














SCI论文(www.scipaper.net):

摘要:本文介绍了一种新的微课件构建模型,即标准普通话-Camtasia Studio-PPT录屏模型(mandarin-camtasia studio-PPT screen capture,MCP)。MCP模型使用文本到语音(text to speach,TTS)技术,自动将讲解词转换为标准普通话语音,从而克服传统微课件构建模型所固有的音频差异的缺点,实现了微课群的语音标准化。

关键词:微课件;构建模型;TTS;标准普通话语音

本文引用格式:王太重等.用TTS技术实现标准普通话语音微课件[J].教育现代化,2019,6(14):185-187

          微课群是由一组涵盖某一学科全部知识点的微课件的集合。在微课件群制作时,因不同作者的普通话水平和方言存在差异,导致不同微课件的音频质量不同,风格迥异,从而影响微课群的质量。全国高等医学院校规划教材《临床生化检验》第3版编委会在建设临床生化检验微课群教学资源时,发现了上述问题,进而提出了研究标准普通话-Camtasia Studio-PPT录屏模型(mandarin-camtasia studio-PPT screen capture,MCP)用于微课群建设的需求,并在实践中成功探索了MCP模型。该模型使用文本到语音(text to speach,TTS)技术,自动将讲解词转换为标准普通话语音,从而克服前述音频差异的缺点,实现了微课群的语音标准化。在MCP模型中,讲解词文本被录入到每张PPT幻灯片的备注页中。当PPT幻灯片播放时,PPT语音工具自动读取备注页中的讲解词,调用TTS引擎将讲解词转换为标准普通话语音,如此,微课群中的每个微课件的语音都是标准的普通话,从而可保证整个微课群的质量。现报告如下。

\

 
一 材料与方法

(一)开发工具


        Camtasia Studio v8.1.0,美国TechSmith公司产品;Microsoft Powerpoint 2010,Microsoft Visual C++2010,Microsoft speech SDK 5.0,均为美国微软公司产品;InterPhonic5.0,Interphonic TTS SDK 1.1,安徽科大讯飞公司产品。

(二)标准普通话语音库安装

       在windows XP环境中,按照InterPhonic5.0说明书,安装InterPhonic5.0男声普通话语音库、女声普通话语音库。

(三)PPT语音工具

       由PPT语音工作室编制。主要使用的技术包括:

        ①PPT对象解析技术;②TTS文语转换技术;③远程线程注入技术。

(四)微课脚本制作

        微课脚本是一个包含知识点和讲解词的PPT文件,可以直接用于在MCP模型中录制微课件。在PPT中,知识点内容被制作成20~25页PPT幻灯片。将每页幻灯片对应的讲解词,输入到该页的备注页中。

(五)标准普通话音频的产生与同步训练

        依次打开微课脚本和PPT语音工具。在PPT语音工具中,点击“挂接PPT”按钮,将PPT语音工具挂接到PPT中。在PPT编辑状态下,PPT语音工具在后台解析PPT备注页中的讲解词,并将讲解词转换为标准普通话并播放。根据听到的音频效果,修改微课脚本的讲解词,以达到预期的语音效果。播放PPT幻灯片,观察并调整PPT视频与PPT语音工具所产生的音频之间的同步程度。

(六)微课件录制

         依次打开Camtasia Studio和微课件脚本,开启Camtasia Studio的PPT录屏。每一页幻灯片被播放时,PPT语音工具在后台用标准的普通话自动朗读该页的讲解词。录制完毕,保存为camrec格式媒体文件。

(七)后期编辑与输出

       在Camtasia Studio中,导入2.6所保存的camrec格式媒体文件,在编辑窗进行编辑,并输出MP4格式微课件。

二 结果

(一)PPT语音工具


       在windows环境中,用Visual C++成功编译了PPT语音工具。PPT语音工具的主要功能包括:①解析PPT备注页的讲解词文本;②调用Interphonic TTS SPI接口函数,将讲解词文本转换为标准普通话语音;③在PPT幻灯片播放状态下,同步自动朗读当前PPT幻灯片的讲解词,实现自动配音。

(二)标准语音微课件构建模型

        成功地构建了MCP微课件构建模型,这种新的微课件构建模型包括以下要素:①微课脚本制作;②标准普通话语音的产生与同步训练;③Camtasia studio同步录制视频与音频;④后期编辑;⑤输出微课件(见图1)。

\

三 讨论

         微课件是微课的载体,其本质是一段微视频,包括三个要素:知识点、视频和音频。微课起源于2009年,美国可汗学院的Salman khan将制作的用于数学教学的小视频上传至YouTube EDU频道,此即最早的微课,此后迅速扩展至全球的教育界[1,2,3]。微课的制作分为两个阶段,一是教学设计(包括确定微课的教学主题、选择微课知识点和制作微课的教学课件),二是微课件的制作(包括视音频录制和后期剪辑)。微课件的制作有视频拍摄式、屏幕内录式、软件合成式,其中PPT录屏方式因方法简单,成本低,应用最为广泛,而软件合成方式应用最少。无论是何种方式,均使用讲解人的原始语音,未见有用文本到语音(text to speech,TTS)技术代替人进行标准普通话讲解的报道[4]。

        TTS技术最早起源于英文的文语转换系统的研究,现在已经发展到几乎每一种语言的文语转换。中文文语转换技术研究起源于1958年,现在较为成熟的有科大讯飞、捷通华声、IBM、Microsoft的中文TTS系统。中文文语转换系统已经广泛应用于交互式语音应答、盲人阅读和自动交通指挥[6,7],其中大部分都能同时进行中文和英文的语音合成,但至今,关于如何将TTS技术融合到PPT中,结合TTS技术和PPT录屏技术制作标准普通话语音的微课件,至今也未见报道。

        我们成功地用TTS技术构建了PPT语音工具,并进一步研究了MCP微课件构建模型。MCP模型包括5个步骤:①微课脚本制作;②标准普通话语音的产生与同步训练;②Camtasia studio同步录制视频与音频;④后期编辑;⑤输出微课件。

          与传统的微课件构建方法比较,MCP模型具有以下优点:①改变了微课脚本的制作方法,提高了工作效率;②使用TTS技术,产生标准普通话语音。传统的微课脚本是Word格式的,即在Word文本中构思PPT课件及其讲解词,微课脚本完成后,再依照脚本构造PPT课件。在MCP模型中,微课脚本是PPT格式的,脚本本身就是PPT课件,PPT讲解词被录入到对应的PPT幻灯片的备注页。这种新的微课脚本制作模式,节省了时间,提高了效率。在传统的微课件构建模型中,使用人的自然语音朗读PPT讲解词,由于不同作者的普通话水平存在差异,不同地域作者的方言千差万别,在制作大规模微课件群时,不同作者制作的微课件之间,音频的质量会不统一,进而影响微课群的质量。MCP模型使用TTS技术,自动用标准普通话朗读PPT讲解词,克服了传统模型的音频缺陷,尤其在大规模微课件群建设时,所有微课件的音频均是标准的普通话,优势明显。

         虽然MCP模型产生的音频是标准的普通话,但与真人相比,自然度还有一定的差距,这个缺点需要进一步改善。

参考文献

[1]Shieh,David.These lectures are gone in 60 seconds.Chronicle of Higher Education,2009,(26):1-13
[2]胡铁生,黄晓燕,李民.我国微课发展的三阶段及其启示[J].远程教育杂志,2013,(4):15-18
[3]王觅.面向碎片化学习时代微视频课程的内容设计.华东师范大学博士毕业论文,2013
[4]胡铁生,周晓清.高校微课建设的现状分析与发展对策研究.现代教育技术.2014,24(2):5-13
[5]DH Klatt.Review of text-to-speech conversion of English.Journal of the Acoustical Society of America,82(3):737-793,1987
[6]张大军.汉语文语转换系统HJ_TTS关键技术的研究与实现.中国科学院博士论文,2000
[7]李大筠.TTS在办公系统的研究与开发.青海师范大学硕士论文,2009

关注SCI论文创作发表,寻求SCI论文修改润色、SCI论文代发表等服务支撑,请锁定SCI论文网!
文章出自SCI论文网转载请注明出处:https://www.scipaper.net/jiaoyulunwen/8682.html
本文标签: 微课件 ,构建模型 ,TTS

相关内容

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版 | 豫ICP备2022008342号-1 | 网站地图xml | 百度地图xml