提取audio时长并输出