Polycom的数字音频Siren 22算法介绍
来源:中国数字音视网 编辑:数字音视工程 2009-05-25 00:00:00 加入收藏 咨询

咨询
所在单位: | * |
姓名: | * |
手机: | * |
职位: | |
邮箱: | * |
其他联系方式: | |
咨询内容: | |
验证码: |
|
确定
Polycom的数字音频Siren 22算法介绍
Polycom 的 Siren™ 22 专利算法与早先的超宽频带音频技术相比具有突破性的优势。在音频和可视化通讯应用中,它的 CD 级音质可以让声音更清晰、听者更轻松。而在远程呈现应用中,它先进的立体声能力则可随着讲话人在室内的来回走动,对其声音进行理想的跟踪,让人们更加感到身临其境。
Siren™ 22 对计算能力的要求显著低于替代型宽频带音频技术,而时延却大幅缩短。为了说明 Siren™ 22 的质量,我们将它与MP3(MPEG-1/2 Layer-3)音频编解码器进行了对比。后者是另一种立体声编解码器,在便携式音乐播放器中得到了普遍使用。
Polycom Siren™ 22 算法具有若干优点:
更为宽广的音频频带,带来更加优良的音频动态性能
- Siren™ 22 Stereo 覆盖的音频频带上达 22 kHz,而 MP3 却止步于 18 kHz。尽管人耳能听到的声音通常都不超过 18 kHz,但 Siren™ 22 更高的频率上限还是带来了更加优良的音频动态性能,这一点对于音乐来说尤其重要。
低运算能力解决方案,电池供电型设备的理想选择
- 在编码/解码器作业过程中,Siren™ 22 需要的 WMOPS(每秒加权百万次操作数)不到 15,而同类其它算法却需要 100 到 200。比如说 MP3就需要 100 个 WMOPS。
- 因此 Siren™ 22 可用于电池耗电量较少的低成本处理器,如PDA、手机甚至手表。
低时延令通话更加自然、无拘无束
- Siren™ 22 采用 20 毫秒帧长,算法延迟 40 毫秒。这是目前超宽频带编解码器可提供的最低时延,让实时沟通更加自然、无拘无束。与之相比,MP3 在 48 kHz 和 32 kHz 采样率的算法延迟分别为 54 毫秒和 81 毫秒。
轻松处理语音、音乐与自然界的声音
- 无论是语音、音乐还是自然界的声音,Siren™ 22 都能同样轻松地驾驭。而同类其它多数编解码器却是针对语音而设计的,在处理自然界声音或者音乐时就显得捉襟见肘。
带宽要求低,有助于提高视频质量
- Siren™ 22 Stereo 要求的码率相对较低,为 64、96 或 128 kbps,可留出更多的可用带宽来提高视频质量。与之相比,MP3 却需要 128kbps 以上的码率才能达到类似质量。
标准化之路
2008 年 5 月 ITU-T 批准了新型的 G.719 全带宽(full-band)编解码器。这种编解码器依据的就是 Polycom 的Siren™ 22 以及 Ericsson 的先进音频技术。G.719 这个编号让这种编解码器极其引人瞩目,同时体现了其中所含技术的重要性。正如 ITU-T 决定指出的,目前我们越来越迫切地需要一种能够涵盖整个人类听觉带宽的音频编码技术:
- 人们越来越多地使用会议系统进行更加细致复杂的演示,而其中往往会包含一些音频带宽大于语音的音乐和音效。
- 目前人们喜欢用多媒体来装点演示内容,从 DVD 和 PC 机播放音频和视频内容的做法日益受到青睐。
- 新型的远程呈现系统为用户提供了高清质量的音频与视频,这就要求以较高的质量来传递媒体内容,从而营造出让人沉浸其中的体验。
- 提高远程会议的质量有助于减少出差,并进而降低温室气体排放量、限制气候变化。
免责声明:本文来源于中国数字音视网,本文仅代表作者个人观点,本站不作任何保证和承诺,若有任何疑问,请与本文作者联系或有侵权行为联系本站删除。(原创稿件未经许可,不可转载,转载请注明来源)
评论comment