语音合成应用论文 (语音合成的论文)

工作以来主要从事TTS工作,平时看些文章做些笔记。文章中难免存在错误的地方,还望大家海涵。如转载,请标明出处。平时搜集一些资料,方便查阅学习:

本文主要向读者推荐该三篇文章。虽然我已经阅读了这三篇文章,但我不想直接翻译出来。读者想学习更多的知识,需要自己通读一遍。(综述的文章都很简单,阅读综述文章其实是一种享受).

Review of end-to-end speech synthesis technology based on deep learning(西安交通大学在4月份更新的文章)

A Survey on Neural Speech Synthesis(亚洲微软在6月份更新的文章)

A Survey on Audio Synthesis and Audio-Visual Multimodal Processing(中国电子科技大学在8月份更新的文章)

Review of end-to-end speech synthesis technology based on deep learning

该篇文章主要介绍基于神经网络的语音合成技术,也就是近五年来的发展状况。该篇文章的重点在声学模型和声码器的介绍以及优缺点,当然也简单总结了可用的数据集。

语音合成的论文,语音合成应用论文

A Survey on Neural Speech Synthesis

重点向大家推荐这篇谭旭撰写的文章。该篇文章的组织架构更加清晰简洁而且更加全面。该文章从多个角度进行分类归纳,首先从TTS的每个组成部分进行归纳,然后对TTS前沿话题进行归纳。

语音合成的论文,语音合成应用论文

图三展示的是按照TTS组成进行划分,图6对模型的进化史进行全面展示,这张图还是挺有意思。图7总结了TTS的前沿话题。最后,本文对TTS的代码库和数据也进行总结。

语音合成的论文,语音合成应用论文

语音合成的论文,语音合成应用论文

A Survey on Audio Synthesis and Audio-Visual Multimodal Processing

该篇文章总结的范围更加广泛,包括语音合成,音乐生成和音视频多模态等等。虽然该篇文章没有上边谭旭文章的详细,但对多个领域进行整理。

语音合成的论文,语音合成应用论文

语音合成的论文,语音合成应用论文

语音合成的论文,语音合成应用论文

语音合成的论文,语音合成应用论文

语音合成的论文,语音合成应用论文