网易云信实时音频框架背后:算法优化带来产品体验全面提升

网易云信实时音频框架背后:算法优化带来产品体验全面提升

作者:佚名 2018-10-22 20:42:42

云计算

算法 2018年10月19日,一年一度的LiveVideoStackCon音视频技术大会在北京召开。网易云信资深音频算法工程师李备在教育专场中的主题演讲上,分享了软件层实时音频解决方案中,网易云信NRTC针对WebRTC 源生算法不足的优化,以及在音乐内容特殊场景下的新思考。

2018年10月19日,一年一度的LiveVideoStackCon音视频技术大会在北京召开。本届会议以“技术开启新‘视’界”为主题,汇集资深的音视频技术工程师,探讨在音频、视频、图像等技术的实践与思考。网易云信资深音频算法工程师李备在教育专场中的主题演讲上,分享了软件层实时音频解决方案中,网易云信NRTC针对WebRTC 源生算法不足的优化,以及在音乐内容特殊场景下的新思考。

[[247165]]

网易云信资深音频算法工程师李备主题演讲

火爆的市场衍生更丰富的音视频应用场景
互联网产品对实时音视频技术的需求正在各个千亿、百亿规模的市场中爆发,并逐渐成为基础设施型的重要技术。李备认为,随着未来更多可玩性的开发被挖掘,音视频的应用仍有很大增长空间。此外,实时音视频技术助推了互联网产品的创新和进化,赋予了产品以更丰富、更高效的场景表达,也促进了实时音视频技术自身的进化。
实时音视频技术需要与行业和应用场景紧密结合。当前及未来,客户的核心诉求除了对稳定高效等技术性能的要求之外,个性化的需求也在增加。李备介绍,网易云信基于自研的全功能工业级的音视频技术框架NRTC,进行了诸多场景化和针对性的技术优化,形成了对实时音频应用的观察与思考。

网易云信NRTC优化算法,弥补WebRTC源生算法的局限
李备强调,尽管当前针对一般行业的软件层实时音频框架已经日益成熟,但仍然有两个较明显的痛点需要解决:一是在复杂变化的网络状况中,因为信号弱或者网路拥塞而造成的延时或丢包现象;二是随着终端种类和应用场景跨度的增加,不同类型终端设备和使用环境的巨大差异对整体解决方案的适配度提出了更高的要求。一般行业基于交流的目的,在对于实时音频的诸多需求中,首先看重框架的流畅性,低延时、音量足够大的同时没有明显的回声、噪声和杂音。在满足以上需求之外,***才会去关注音质、双讲体验以及其他性能。
那么一个解决以上痛点稳定运转的音频框架该如何设计?以WEBRTC的音频框架图为例:

(图:webrtc的线程模型与数据驱动方式,不同颜色表示不同线程,蓝色箭头表现数据驱动方式)

但每个模块为了保障实时音频的稳定都有很多方面的问题需要注意,例如采集回声非线性、音量大小,以及delay中系统内在延迟的大小与变化等,都是平台下音频采集和播放的常见问题。
由于音频前处理的挑战及WebRTC 源生算法的一些不足等原因,需要技术人员进一步优化以提升整个框架的技术表现,确保终端用户的产品体验。网易云信的全功能工业级的音视频技术框架NRTC针对这些不足做了一系列的优化。比如,采集回声的非线性是目前线上采集面临的普遍问题,其稳定性会直接影响回声的消除和处理效果。WebRTC在这方面的不足使得一些厂商为了服务回声消除,不得不以降低音量为代价。针对源生WebRTC Delay Estimation 的稳定性问题,网易云信的NRTC将远端和近段的 delay进行了对齐优化,提升了整体框架消除回声、杂音和降噪方面的性能。
再譬如,对于用户在沟通中产生的气声的采集和处理,也是音频框架面临的普遍难点之一。因为气声发音能量低,回声大,而且能量集中在中高频,所以正常算法无法满足处理需求。以源生WebRTC AEC 和NRTC 在iPhone6P 气音发音下的表现进行对比,经NRTC框架进行算法优化后的效果明显更优。

源生webrtc aec VS NRTC 在iphone6p 气音发音下的表现

网易云信针对音乐场景下实时音频解决方案如何取舍的新思考
除了一般性沟通场景下的音视频应用,音乐内容及其应用场景对技术有更为特殊的要求。李备介绍,与普通场景相比,音乐内容场景对声音的要求存在较大差异。譬如,人耳对于音乐的感知是更加敏感的,稍有音质的下降人耳就能察觉,这对于声音处理提出了更高的要求。而相对于以交流为目的一般场景,音乐内容对实时音频技术要求的优先级也有所不同:稳定和音质成为***诉求,降噪和低延迟降级为次要需求。
由于音乐内容场景的上述特殊性,一般的实时音频框架在音乐内容场景下便会呈现某些局限性。比如,适用于一般场景的音频框架的低采样率、非全频段处理、对近端声音和对双讲的粗糙处理、码率设置较低、简单的Audio QoS都不足以支撑音乐内容的特殊场景。再如,在采用更高码率的情况下,如果还沿用一般的策略,便会造成比较严重的拥塞或丢包。那么,面对这些新的需求、痛点和局限性,在资源有限的情况下如何取舍,李备分享了网易云信的四点新思考:
• AGC(auto gain control) 在音乐内容下新需求——因为音乐场景下有情感投入的特殊需求,比如在情感舒缓的时候音量较低,在情感猛烈时音量较高。因此,如果在AGC算法中对能量进行相近处理,对于音乐内容的传输是非常大的伤害;
• Howling Control 在音乐场景下的危害——在对音乐demo处理时,如果对某个频段的回声做过分的消除处理,会对人的听觉感受造成很大影响;
• NS(Noise Suppression)在音乐内容下的痛处——有些音乐场景乐器众多,NS处理会对某些声音造成一定的损伤。为了追求对原声的***体验,有些工程师干脆关闭NS模块,宁愿忍受噪声,也不愿损失音乐效果。李备介绍,网易云信深知这一技术问题给产品和用户造成的困扰,在实践中不断优化自己的NS算法,力争给到客户更好的技术服务;
• TSM(Time Scale Modification)在音乐场景下的影响——如果将用于一般场景的TSM算法直接照搬到音乐内容场景下,会导致音乐内容在传输时节拍的变化,所以需要做出专门适配音乐场景的TSM算法。

“在垂直领域愈发丰富的今天,针对不同的场景,对策略进行调整,是每个底层技术提供商应该思考的问题,也是网易云信一直努力的方向。”李备总结道。让技术匹配客户,让服务更加细致,既是整个行业生态追求的结果,也是推动行业生态进步的动力。

 

 

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/239768.html<

(0)
运维的头像运维
上一篇2025-04-23 13:43
下一篇 2025-04-23 13:44

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注