安装
客服
格式工厂®官方手机版
音频视频图片文档批量处理专家
音频设置参数介绍

今天给各位使用格式工厂手机版和PC版的同学们带来一篇关于音频转码中各种参数设置的名词解释。这篇文章可能会涉及到一些音频编解码的专业知识,不明白的地方欢迎大家在网页内的“意见反馈”处留言,我会在后续的文章中对大家的问题一一进行解答。

 

音频编码

PCM编码

通常我们采用的是脉冲代码调制编码,即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。PCM编码的最大的优点就是音质好,最大的缺点就是体积大。我们常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。

WAV格式

这是一种古老的音频文件格式,由微软开发。WAV是一种文件格式,符合RIFF (Resource Interchange File Format) 规范。所有的WAV都有一个文件头,这个文件头包含了音频流的编码参数。WAV对音频流的编码没有硬性规定,除了PCM之外,还有几乎所有支持ACM规范的编码都可以为WAV的音频流进行编码。很多朋友没有这个概念,我们拿AVI做个示范,因为AVI和WAV在文件结构上是非常相似的,不过AVI多了一个视频流而已。我们接触到的AVI有很多种,因此我们经常需要安装一些Decode才能观看一些AVI,我们接触到比较多的DivX就是一种视频编码,AVI可以采用DivX编码来压缩视频流,当然也可以使用其他的编码压缩。同样,WAV也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被PCM编码处理的WAV,但这不表示WAV只能使用PCM编码,MP3编码同样也可以运用在WAV中,和AVI一样,只要安装好了相应的Decode,就可以欣赏这些WAV了。

在Windows平台下,基于PCM编码的WAV是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,WAV也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于PCM编码的WAV被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如MP3转换成WMA。

MP3编码

MP3作为目前最为普及的音频压缩格式,为大家所大量接受,各种与MP3相关的软件产品层出不穷,而且更多的硬件产品也开始支持MP3,我们能够买到的VCD/DVD播放机都很多都能够支持MP3,还有更多的便携的MP3播放器等等,虽然几大音乐商极其反感这种开放的格式,但也无法阻止这种音频压缩的格式的生存与流传。MP3发展已经有10个年头了,他是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3的简称,是MPEG1的衍生编码方案,1993年由德国Fraunhofer IIS研究院和汤姆生公司合作发展成功。MP3可以做到12:1的惊人压缩比并保持基本可听的音质,在当年硬盘天价的日子里,MP3迅速被用户接受,随着网络的普及,MP3被数以亿计的用户接受。

采样率(赫兹)

采样频率,也称为采样速度或者采样率。常用的音频采样率44100、48000Hz ,相当于一秒打点采样44100、48000次。

如果要对一段音频进行准确采样, 那么采样的频率至少要达到这段音频最高频率的2倍以上。采样率越高,音质未必越好。44100、48000Hz的采样率足够满足音质效果。

 

比特率(Kb/s)

比特率是指每秒传送的比特数。单位为 bps(Bit Per Second),比特率越高,传送的数据越大,音质越好。

 

声道

立体声:左右两个耳朵听到的音乐内容不一样,这样两边的声音能有方向和大小的区别,更加贴近实际生活中我们对声音的感受。左声道和右声道是立体声中的两个音频通道。

单声道只有一条音频轨道,在不需要太高音质的环境下有用处,比如说收音机。 单声道不是指只有耳机的一边有音乐,而是两边的声音一样,没有左右的区别。

音量

声音大小

VBR

VBR(Variable Bit Rate)动态比特率。也就是非固定的比特率,音频编码软件在编码时根据音频数据的复杂程度即时确定使用什么比特率,这是以质量为前提兼顾文件大小的编码方式。VBR是一种可变编码速率的MP3压缩方式,其原理就是将一首歌的复杂部分用高比特率编码,简单部分用低比特率编码,通过这种动态调整编码速率的方式,进一步得到音质和文件体积之间的平衡。它的主要优点是可以让整首歌都能大致达到我们的音质要求,缺点是编码时无法估计压缩出来的文件体积大小。

采样格式(和用户关系不大)

FFmpeg中的样本格式主要有:

1.U8(无符号整型8bit)、S16(整型16bit)、S32(整型32bit)、FLT(单精度浮点类型)、DBL(双精度浮点类型)、S64(整型64bit),不以P为结尾的都是interleaved结构,以P为结尾的是planar结构。
2.Planar模式是FFmpeg内部存储模式,我们实际使用的音频文件都是Packed模式的。
3.FFmpeg解码不同格式的音频输出的音频采样格式不是一样。测试发现,其中AAC解码输出的数据为浮点型的  AV_SAMPLE_FMT_FLTP  格式,MP3解码输出的数据为  AV_SAMPLE_FMT_S16P  格式(使用的mp3文件为16位深)。具体采样格式可以查看解码后的AVFrame中的 format 成员或解码器的AVCodecContext中的 sample_fmt 成员。

淡入效果

音频开头的过渡过程

淡出效果

音频结尾的过渡过程

回声

音频回声效果

降噪

音频降低噪音

反向

反向音频指的是将音频进行从右到左的反向,实现声音自后向前的播放目的。反向后的音频会变得混杂而无规律,一些专业的音乐人士会利用音频反向来创作更具趣味性的音乐。另外,大家还可以利用反向音频来处理音乐中敏感性字眼。

 

格式工厂®官方手机版
格式工厂(Format Factory)于2008年正式发布上线,官方手机版致力于更好的解决音视频图片等各种文件格式转换需求,,一键保存分享;同时支持视频压缩、提取音频、音视频裁剪合并剪辑处理,及音视频降噪、变速和视频图片加去水印、修改MD5等等专业音视频图片处理需求。