他发现如果舍弃其中的部分功能文字转WAV音频