Jul 02, 2021

当你的耳朵不仅仅属于你自己

注：由于博客迁移，许多图片也许无法显示。虽然作者懒得重新更新，但不会影响读者理解。

我的工作和「音频」有密切的联系，仔细了解的话，你会发现音频（audio）是一个很神奇并且充满魅力的存在。我曾介绍过关于音频的一些基础知识，也感慨过音乐的奇妙之处，最近播客、clubhouse、创作者经济等等讨论也都避不开「音频」这个领域。因此，我想以我的经验谈一谈对音频的理解。

傅里叶变换

提到音频技术，不得不介绍一位伟大的数学家——傅里叶（Joseph Fourier）。傅里叶出生于法国，父亲是一位裁缝，母亲在他9岁的时候去世，父亲也在随后的一年去世。13岁的时候，傅里叶对数学产生了浓厚的兴趣，很快就完成了六卷《Mathématiques》的学习。他曾参加过政治活动，甚至还一度进过监狱。在1794年的时候，傅里叶有机会进入巴黎的高等师范学校（École Normale）学习，在那里他遇到了拉格朗日、拉普拉斯等伟大的数学家老师，开始了对数学的进一步学习和探索。

1822傅里叶提交了一篇关于牛顿定律冷却的论文。在那篇论文中，他断言，任何函数都可以转化为正弦函数之和，而且这个过程是可逆的。这是一个十分深刻的见解，这个观点就是「傅里叶变换」，是对科学家和工程师们最有帮助的工具之一。

在音频领域，所有复杂的声音—比如我们的声音—实际上只是许多正弦和余弦信号的总和。因此复杂的声音可以被分割成很多容易分析和测试的正余弦波。使用傅里叶变换，时间维度上的复杂波形被转换成为在频率维度上的许许多多简单波形。

傅里叶变换是一种「分而治之（devide-and-conquer）」的思想。其中的伟大和奇妙之处就在于，一件看起来完全没有规律的庞大而复杂事物，竟然可以被拆分为很多简单的、微小的、有规律的事物，并且这个过程是可逆的。

傅里叶变换对音视频行业、生物医疗行业有着巨大和决定性的影响。傅里叶在发明它的时候一定不曾想过这个发明会对如今的世界造成翻天覆地的改变。傅里叶变换解释了一个世界运转的规律，和其他所有伟大的数学定理一样，如此的简单却重要。

音频的发展

回到音频技术的发展。音乐一直是世界上发展最为快速的行业之一。其发展起源于1877年的以此技术突破——托马斯·爱迪生发明了留声机。当时，留声机是有一条锡箔包裹着一个旋转的圆桶构成的。由于他的发明是一个巨大的突破，直接各地都开始效仿他，在这个过程中涌现出了一些类似的产品。Charles Cros 发明的「Paleopraph」和 Édouard-Léon Scott de Martinville 的「Phonautograph」都可以捕捉到声波然后在视觉上加以呈现。由于这些人的发现，留声机技术的发展变得更加成熟。

同样的逻辑在今天也是一样：一旦有一个新的产品进入了市场，获得了好评，世界各地的公司都试图以更好的标准和更少的成本来实现它。由于公司的竞争以及音乐人对音频设备的需求，音乐设备市场开始飞速发展。

19世纪末

1881年 Clement Ader 发现了「立体声」，他将这种逼真的立体音效称为：双耳试听（biauricular audition）。

1888年，即留声机发明11年后，爱迪生发布了以马达为动力的留声机，它可以自动旋转汽缸。随着十年间滚筒式录音的增加，马达驱动的留声机被全国各地的发明家所模仿，很快占领了市场。

20世纪初

1901年，马可尼（Marconi）成功地将无线电信号从英国的康沃尔发送到纽芬兰的圣约翰。这是第一次跨大西洋的电信号传递

1906年，Lee De Forest 发明了三极管 Audion，这是一种能够使微弱的电信号变强的电子装置。这项发明开启了长途电话、电视和广播的革命。

1910s

1917年，斯卡利（Scully）家族发明了第一台磁盘录刻机（lathe）。这是由一个缓慢旋转的圆盘组成的，用一个非常精确的切割头来雕刻。这是对圆筒唱片的一种替代。

1920s

1925年，第一个带状话筒被发明出来。同时，他们还发明了带状扬声器，技术上是将带状电路反了过来。RCA 对带状麦克风进行了更深入的研究，并很快通过加入磁场线圈和永久磁铁而得到完善。音调和模式控制使 RCA 带状话筒与其他话筒不同，因为它减少了回声。它们至今仍被使用和珍藏着。

1928年，诺伊曼成立了一家公司，开发他的 CMV 3电容式话筒的计划。这是第一个商业上可用的电容话筒。它有几个可更换的头，帮助改变话筒的极性模式。

1930s

磁带录音机（Blattnerphone）是由路易斯·布拉特纳（Louis Blattner）在1930年发明的。它是最新的录音设备，使用6毫米的钢带来记录非常基本的音频信号。由于它的简单性，Blattnerphone 主要用于记录声音而不是音乐。在20世纪30年代，它用来记录公开演讲和诗歌。

1935年，从 BASF 拆出来的 EMTEC 公司制造了第一个塑料磁带。1936年，BASF 用这种磁带为伦敦爱乐乐团录音。

1939年，埃德温·阿姆斯特朗（Edwin Armstrong）经过多年的完善，播出了第一批调频无线电信号（FM）。调频（FM），即频率调制，允许你在一定的频率范围内改变每秒的波数。调幅（AM）只允许你改变无线电波的振幅和功率，而且是静态的，所以它只在一个频率上。

1940s

1946年，韦伯斯特-芝加哥公司生产了一种「有线录音机」，可以在自己家里舒适地使用。这引发了家庭录音的流行。它包括一个被快速拉到录音头周围的电线，录音头根据音频信号的极性和强度对电线的每个点进行磁化。

1960s

1965年，杜比推出了A型降噪器。当时，它被用于大多数专业录音室，其工作是减少录音中不需要的噪音。该设备使用了一些低通和高通滤波器，以挑选出噪声最大的频率并切断它们。

1967年，Altec-Lansing 公司推出了 Acousta-Voicing，这是一个均衡器。它允许你增加或减少某些频率的噪音，并且可以控制带宽。

1970s

1970年，第一条数字延迟线是由 Lexicon 发明的。这个设备最初是用来监测心跳的，但在通过系统发送音频后，他们发现了一条100毫秒的音频延迟线。该设备将噪音推低到-90dB，并展示出了数字录音在未来的可能性。

1975年，数字录音正在蔓延到世界各地的大多数专业录音室。与此同时，EMT 发布了第一个数字混响系统，Ampex 发布了另一个高输出母带。一年后，第一个16位数字录音由斯托克姆（Stockham）博士制作而成。

1980s

1980年，索尼、三菱和 Studer 都发布了多轨数字录音机。EMT公司发布了硬盘数字录音机，索尼公司推出了第一台被称为「随身听（Walkman）」的可移动磁带机。

一年后，CD被展示出来，MIDI 被标准化为通用合成器接口，IBM 发布了第一台16位个人电脑。

1982年，索尼发布了第一个 CD 播放器。当人们使用 CD 播放器时，他们可以听到数字和模拟录音之间非常明显的区别。CD 的质量更清晰、更明亮，噪音或爆破声更少。

1984年，苹果公司发布了第一台 Macintosh 电脑。它最初的售价约为2500美元。Macintosh 被用于非常基本的音频编辑和播放，但由于当时 Macintosh 的复杂性，它的主要职责是基于文本。

1985年，杜比将他们的降噪设备 A、B 和 C 结合起来，创造了 SR，提高了动态范围。

1986年，第一批数字控制台出现。这包括雅马哈 DMP7，它有内置的均衡器，电动推子和参数，可以通过 MIDI 控制。

1990s

1991年和1994年，第一台「价格亲民」的数字多轨录音机发布，价格为1000英镑。这使得更多的人可以很容易地用较新的设备建立起一个最新的家庭工作室。

同时，杜比公司提出了一个用于家庭影院系统的五声道环绕声方案。数字和体验时代已经开始，数字音频系统正在迅速取代模拟系统。

音频技术的发展离不开「模拟」和「数字」的讨论，二者都有各自的优缺点。

有的人认为模拟录音能产生更自然、更温暖的声音，同时，剪辑和修改也更简单。模拟音频的缺点是声音中的嘶嘶声、噼啪声和爆裂声。黑胶相片的成本昂贵，并且需要用心保养和维护。

而数字录音则是一个简单的录音过程，数字信号是一种已经转换为数字形式的声音信号，其中音频信号的声波被编码为连续序列的数字样本，它具有更好的音频质量。在互联网的帮助下，一段数字音频可以通过网络传输，被世界各地的人听到。同时，数字录音创造了丰富的处理器，可以添加到音频中，改变原本的音乐。但数字录音的缺点是，由于添加了处理器，音频失去了温暖和深度。而且数字音频文件可能会面临损坏的风险。

但是音频的数字化已经随着互联网技术的兴起到达了一个新的时代——一个无线、创作、娱乐的音频时代。

音频的新时代

更紧凑高效

在过去，音频工程师需要许多体积庞大的放大器来进行表演，因为每个放大器只能产生有限的功率。现在，音频工程师可以在更小的空间里装下同样的功率，因为功放已经变得尺寸更小、功能更强大。

正如所有消费电子产品的发展，技术的进步要求音频产品使用更小的元件，更轻便的材料，与模拟的同类产品相比有更强大的能力。

模拟调音台不具备所有的处理器和效果单元。数字调音台的出现带来了将更多内容纳入同一设备的能力。

数字音频传输技术

数字音频现在可以通过以太网音频、IP音频或其他流媒体标准和系统进行网络传输。数字音频可以通过数字音频接口传输，如 Dante（提供超低延迟和近乎完美的同步）、AES3（也被称为AES/EBU，这是由音频工程协会（AES）、欧洲广播联盟（EBU）、MADI（多通道音频数字接口）共同开发的。

HDMI 和 DisplayPort 接口更是可以同时传输数字视频和音频。

掌上控制

现代技术现在允许每个人在他们的口袋里都有一台电脑。正如我们的手机一样，技术越来越小，但屏幕却越来越大。人们希望只需添加一个应用程序，就能做所有的事情。这为音频工程师提供了从智能手机或平板电脑上调音和设计的能力，使他们能够灵活地评估房间内任何地方的声音质量，而不必往返于控制台进行调整。

未来

随着音频技术的硬件进步已于平稳，软件成为了音频技术的突破口。软件让音频技术更加灵活、先进，提供了强大的控制能力和创造能力。

音频产品的相关市场也在近些年得到了快速发展。

2019 年 Apple Airpods 的收入超过了10亿美元，比 NVDIA 公司的总收入还要高。
我所从事的车载娱乐市场被 Emergen 预测会从2019年到2027年以9.8%的年增长率，实现25.51亿美元到52.76亿美元的增长。
播客（Podcast）市场被预测从2020年的110亿美元，以27.5%的复合年增长率到达2027年的605亿美元。
有声书（Audiobooks）市场被预测从2020年的33亿美元，以24.4%的复合年增长率到达2027年的150亿美元。

我可以想象到的未来音频发展：

更小更强

更轻便、更小尺寸、更高功率的组件，会减少大象音频系统的存储、运输和搭建的成本。让用户的使用场景更加广泛，使用时间进一步增长。

无线

无线技术的持续进步无疑会带领音频产品的进一步发展，更可靠的连接质量，更快的音频数据传输，更少的连接线缆为人me提供了一个更理想便捷的音乐环境。

创作者经济

Covid 疫情让更多的人们居家隔离、办公，但是人们也需要一种途径满足沟通的需求。无论是工作用到的视频会议软件、Clubhouse 的爆火、还是 Podcast 的发展都证明了音频在人们生活中的比重越来越高，人们对于音频的要求也越来越高。

截止到2021年6月，Podcast 的创作者数量已经达到了接近4,000,000。Apple Podcasts的单集数量也已经达到了52,990,000。播客正在和 Newsletter 一样吸引着越来越多的创作者，在视频平台抢占了用户的大部分注意力之后，音频平台正在寻找用户们剩余那部分空间，比如通勤的时候、开车的时候、做家务的时候、运动的时候。

未来的市场会有更多的创作者，更多的消费者，因此需要更可靠的音频技术，更大量的音频设备，更多的使用需求。同时，内容的增长也会对审查制度提出新的要求，尤其是在中国市场。因此，也对语音识别技术和相关的文化产业提出了新的要求。可以预见到的是，这会是一个更加火热的市场，也充满机遇和挑战。

我们的注意力已经不仅仅属于我们自己，正在被各大视频平台抢占。算法也甚至比我们更加了解我们自己的喜好和需求。我们的耳朵已经不再只属于我们自己，它们也是创作者产品的消费者，科技公司生产力和了利润的来源。不久后，这样的场景或许会变成一种奢望——什么视频新闻都不去看、什么音乐博客都不去听、安安静静和自己、和家人度过一天。