有方学者【基于深度神经网络的歌声检测】独立第一作者论文发表|留学背景提升

研究方向

基于深度神经网络的歌声检测 歌声检测是对给定的音频文件进行检测是否含有歌声的起止时刻。歌声检测任务在音乐信息检索研究领域属于基础研究,通常作为其他研究课题的一个子任务。例如,歌曲识别、歌手识别、旋律提取以及歌声伴奏分离等。通过明确包含歌声的歌曲片段位置可以进一步准确的识别歌声所包含的其他信息例如歌手。本项目预期结合深度学习模型进行歌声检测,将歌声检测作为二分类任务,利用深度模型在分类任务上的优势进行研究。通过本项目会研究一种基于深度网络的歌声检测方法,实验会对比基于CNN以及基于LSTM的不同神经网络方法。提出新的模型结构,融合CNN与LSTM构成LRCN以及CRNN模型。融合后的模型结构在处理音频频谱特征时,既可以学习空间上的时频分布特征同时可以利用序列模型学习语音在时序上的关联性。会掌握音频频谱以及音频特征的处理和应用。实验数据集会选用目前公开的Jamendo数据集进行实验分析。

 

相关学科

计算机科学技术

 

科研导师

X. Z

  • 复旦大学计算机博士,国内某高科技公司高级算法研究员;
  • 研究领域为:文本语音合成(TTS),音乐人工智能,音乐信息检索,语音检测,歌手识别等;
  • 发表多篇SCI和国际顶会论文,并申请多项国家级专利;
  • 有多年中学生、本科生教学经验。

科研成果

成果一:在英文期刊中发表学术论文

有方学者项目能够为学员在正规的英文学术期刊中发表论文。正规的学术期刊均要求由独立审稿人决定论文的录用与否。因此,论文的成功发表标志着这篇文章已达到学界公认的学术标准。有方学者最优秀的学生,不但可以冲击EI、SCI等高级别期刊,而且有机会参与全球顶级的学术会议。

成果二:第一作者身份

有方学者项目坚持帮助学生以第一作者身份发表论文。在申请过程中,招生官最看重的是学生在科研项目中的参与程度,而第一作者顺位恰恰是这一点的最佳证明。近年来,有大量的中国学生在教授署名的论文中挂名,这使得第一作者身份的含金量更为突出。

成果三:独一无二的课题

有方学者项目的导师会为每个学生提供独一无二的课题,连接最前沿的科研方法和学生感兴趣的学术方向,每个学生的研究内容具有差异性。

成果四:顶尖院校导师的推荐信

有方学者项目将为学生提供项目导师撰写的推荐信。导师作为推荐人,来自于美国顶尖学府的科研团队,影响着推荐信的可信度;而导师所提供的丰富的细节和生动的描述能更好展现学生的过人之处,从而大大提高了推荐信的价值。

成果五:高效备战具有高影响力、高含金量的科研竞赛

学生可以直接使用有方学者项目的成果论文冲击多项全球顶级的科研赛事,其中包括:被誉为“中国青年的诺贝尔奖”的丘成桐科学奖、ISEF 国际科学与工程奖、全国青少年科技创新大赛等。

 

 

了解更多详情

扫描二维码

关注有方背景提升

有方订阅号