他们应该只是知道一部份文字转WAV音频