然后串联出一个自己的结论文字转WAV音频