整个过程一直用了将近四个月的时间文字转WAV音频