于是他很自然地选择后者文字转WAV音频