研究方向
基于神经网络的语音合成 语音合成是将文字转换为语音任务,旨在合成可理解的自然语音。语音合成在人机交互过程中具有重要意义,在人类交流中有着广泛的应用。例如,手机智能助理siri以及语音提醒机器人等。本研究课题预期通过深度网络模型进行语音合成,将文本通过网络学习生成对应的发音。研究会尝试目前主流的语音合成网络框架Fastspeech2以及transformer进行搭建语音合成系统。提出新的语音合成方法,在模型结构上进行创新性研究。通过控制说话人特征表示进行模型嵌入,可以达到多说话人语音合成系统的目的。另外通过控制文本内容和语音内容的解耦合可以同时达到不同说话人语音合成中音色转换的目的。网络结构上会引入注意力机制,对语音合成中关键的文本内容和语音内容进行关注。通过本项目的研究会提出一种语音合成方法,能够提升合成语音的自然度以及对应MOS打分。最终实验会在公开数据集LJ speech上进行语音合成。
相关学科
计算机科学技术
科研导师
X. Z
- 复旦大学计算机博士,国内某高科技公司高级算法研究员;
- 研究领域为:文本语音合成(TTS),音乐人工智能,音乐信息检索,语音检测,歌手识别等;
- 发表多篇SCI和国际顶会论文,并申请多项国家级专利;
- 有多年中学生、本科生教学经验。
科研成果
成果一:在英文期刊中发表学术论文
有方学者项目能够为学员在正规的英文学术期刊中发表论文。正规的学术期刊均要求由独立审稿人决定论文的录用与否。因此,论文的成功发表标志着这篇文章已达到学界公认的学术标准。有方学者最优秀的学生,不但可以冲击EI、SCI等高级别期刊,而且有机会参与全球顶级的学术会议。
成果二:第一作者身份
有方学者项目坚持帮助学生以第一作者身份发表论文。在申请过程中,招生官最看重的是学生在科研项目中的参与程度,而第一作者顺位恰恰是这一点的最佳证明。近年来,有大量的中国学生在教授署名的论文中挂名,这使得第一作者身份的含金量更为突出。
成果三:独一无二的课题
有方学者项目的导师会为每个学生提供独一无二的课题,连接最前沿的科研方法和学生感兴趣的学术方向,每个学生的研究内容具有差异性。
成果四:顶尖院校导师的推荐信
有方学者项目将为学生提供项目导师撰写的推荐信。导师作为推荐人,来自于美国顶尖学府的科研团队,影响着推荐信的可信度;而导师所提供的丰富的细节和生动的描述能更好展现学生的过人之处,从而大大提高了推荐信的价值。
成果五:高效备战具有高影响力、高含金量的科研竞赛
学生可以直接使用有方学者项目的成果论文冲击多项全球顶级的科研赛事,其中包括:被誉为“中国青年的诺贝尔奖”的丘成桐科学奖、ISEF 国际科学与工程奖、全国青少年科技创新大赛等。
了解更多详情
请扫描二维码
关注「有方背景提升」