但基本原则还是有的……至少文字转WAV音频