语音合成应用论文 (语音合成的论文)

工作以来主要从事TTS工作，平时看些文章做些笔记。文章中难免存在错误的地方，还望大家海涵。如转载，请标明出处。平时搜集一些资料，方便查阅学习：

本文主要向读者推荐该三篇文章。虽然我已经阅读了这三篇文章，但我不想直接翻译出来。读者想学习更多的知识，需要自己通读一遍。（综述的文章都很简单，阅读综述文章其实是一种享受）.

Review of end-to-end speech synthesis technology based on deep learning（西安交通大学在4月份更新的文章）

A Survey on Neural Speech Synthesis（亚洲微软在6月份更新的文章）

A Survey on Audio Synthesis and Audio-Visual Multimodal Processing（中国电子科技大学在8月份更新的文章）

Review of end-to-end speech synthesis technology based on deep learning

该篇文章主要介绍基于神经网络的语音合成技术，也就是近五年来的发展状况。该篇文章的重点在声学模型和声码器的介绍以及优缺点，当然也简单总结了可用的数据集。

语音合成的论文,语音合成应用论文

A Survey on Neural Speech Synthesis

重点向大家推荐这篇谭旭撰写的文章。该篇文章的组织架构更加清晰简洁而且更加全面。该文章从多个角度进行分类归纳，首先从TTS的每个组成部分进行归纳，然后对TTS前沿话题进行归纳。

语音合成的论文,语音合成应用论文

图三展示的是按照TTS组成进行划分，图6对模型的进化史进行全面展示，这张图还是挺有意思。图7总结了TTS的前沿话题。最后，本文对TTS的代码库和数据也进行总结。

语音合成的论文,语音合成应用论文

A Survey on Audio Synthesis and Audio-Visual Multimodal Processing

该篇文章总结的范围更加广泛，包括语音合成，音乐生成和音视频多模态等等。虽然该篇文章没有上边谭旭文章的详细，但对多个领域进行整理。

语音合成的论文,语音合成应用论文