毕竟这时候不可能拍照文字转WAV音频