或者再到各地去调集文字转WAV音频