所以他直接就说文字转WAV音频