也直接说出了自己能够接受的最低限文字转WAV音频