全网唯一标准王
ICS 35.040.40 YD CCS L70 中华人民共和国通信行业标准 YD/T 6391.4—2025 媒体处理服务技术要求 第4部分:音频处理 Technical requirements for media processing service Part 4: Audio processing 2025-04-10发布 2025-08-01实施 中华人民共和国工业和信息化部 发布 YD/T6391.4—2025 目 次 前言 II 引言. III 1 范围.. 2 规范性引用文件 3术语和定义. 缩略语.. 4 本功能定位.. 5 基本业务要求, 6 7 关键功能要求. 关键性能指标 8 9 面向基础设施的适配能力 5 10运营能力支持要求 11运维能力支持要求 6 12 安全保障能力支持要求. 13 完备性能力支持要求 YD/T6391.4—2025 前言 本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》给出的 规定起草。 本文件是YD/T6391《媒体处理服务技术要求》的第4部分,YD/T6391已经发布了以下部分。 第1部分:功能性框架。 一第2部分:管理平台。 一第3部分:视频处理。 一第4部分:音频处理。 一第5部分:智能处理。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本文件由中国通信标准化协会提出并归口。 本文件起草单位:中国联合网络通信集团有限公司、阿里云计算有限公司、中兴通讯股份有限公司 北京百度网讯科技有限公司。 本文件主要起草人:贾武、蔡鼎、缪川扬、邢怀飞、乔治、陈俊江。 II YD/T6391.4—2025 引言 随着互联网技术的发展,多媒体内容带来的网络流量,特别是音频和视频服务爆炸性增长。同时, 视频服务已被广泛应用于娱乐、金融、教育、医疗等领域。4K/8K和虚拟现实(VR)/增强现实(AR) 视频业务将流行。直播和短视频服务的兴起,推动了专业生产内容(PGC)和用户生成内容(UGC, 如网络直播和短视频业务)的内容发展。面对这些大量的媒体内容,需要对媒体内容进行满足业务需求 的媒体处理,为内容提供者快速、经济地提供服务。 一是减少内容提供方、业务提供方的成本。通过在云端部署媒体处理业务功能,规模化处理内容提 供方及业务提供方对各类媒体视频的处理,大大节省业务提供方单独提供媒体处理的成本,并降低其技 术研发成本。 二是丰富业务形态,提升用户体验。媒体处理业务在云端进行批量化部署于应用,在CDN分发之 前可进行各类媒体处理,通过各类媒体处理应用,丰富业务形态,可开发各类增值性业务,又可提升用 户对视频业务的体验。 由于视频数据量巨大,媒体处理方式多样,本地计算系统的处理方式已经不能满足当前视频业务的 计算要求。目前,计算技术得到了广泛的应用。媒体处理服务(MPS)基于云计算技术的概念,为各种 视频服务中的音频和视频的处理提供了一种低成本、易使用、有弹性、按需使用、高度可扩展的方法。 在一个典型的从头到尾的MPS流程中,视频内容首先由内容提供者采集。在视频被上传到云服务器后, MPS开始工作。为了适应不同的网络环境和终端,视频通常会在云端进行转码处理。个性化的增值服 务包括数据统计服务、内容审查服务、实时水印服务等。经过媒体处理后,视频内容被CDN分发并加 速到终端设备。视频内容被解码并在终端设备上播放。 媒体处理服务技术要求系列标准结构和名称如下。 一一第1部分:功能性框架。目的在于规定媒体处理的功能性框架,主要包括处理域的功能要求(含 总体要求、业务指配要求、可用性和可扩展性要求、业务管理需求)、安全要求,各功能块之 间的参考点划分及定义,同时提供了应用场景。 一第2部分:管理平台。目的在于规定媒体处理服务中管理平台相关的需求、架构和功能技 术要求。 一一第3部分:视频处理。目的在于规定媒体处理服务中视频处理相关的业务需求、功能要求、系 统架构的技术要求。 一一第4部分:音频处理。目的在于规定媒体处理服务中音频处理相关的业务需求、功能要求、系 统架构的技术要求。 一第5部分:智能处理。目的在于规定媒体处理服务中智能处理相关的多模态分析、特定内容检 测等。 III YD/T6391.4—2025 媒体处理服务技术要求第4部分:音频处理 1范围 本文件规定了媒体处理服务中音频处理相关的业务需求、功能要求、系统架构及技术要求。 本文件适用于面向公众客户和企业客户的云端媒体处理服务平台中的音频处理子功能块。 2规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 YD/T6391.1一2025媒体处理服务技术要求第1部分:功能性框架 ITU-TH.644.7(2023)媒体处理服务功能架构(Functionalarchitectureformediaprocessingservices) 3术语和定义 下列术语和定义适用于本文件。 3.1 媒体处理服务mediaprocessingservice 一种用于多媒体数据转码的云服务,可提供一种经济高效、简单易用、弹性大、可扩展性强的方 法,将音频和视频转换成适合在PC、电视和移动界面上播放的格式,还可对海量数据进行基于深度 学习的技术处理,对媒体的文字、语音等内容进行多模式场景分析,实现智能审核、内容理解、智能 编辑等功能。 4缩略语 下列缩略语适用于本文件。 AAC 高级音频编码 Advanced Audio Coding Al 人工智能 Artificial Intelligence CDN 内容分发网络 ContentDeliveryNetwork CPU 中央处理器 Central Processing Unit 1 YD/T6391.4—2025 DDoS 分布式拒绝服务 Distributed Denial of Service DTS 解码时间戳 Decoding Time Stamp FLAC 无损音频编码器 Free Lossless Audio Codec HTTP 超文本传输协议 Hypertext Transfer Protocol HTTPS 超文本传输安全协议 HypertextTransferProtocol Secure Iaas 基础设施即服务 Infrastructure as a Service I/0 输入/输出 Input/Output M3U8 一种视频播放列表文件格式, Moving Picture Experts Group Audio Layer 3 即Unicode版本的M3U, UniformResourceLocator-UTF8 用UTF-8编码 MP3 动态影像专家压缩标准 Moving Picture Experts Group Audio Layer III 音频层面3 动态图像专家组4 MP4/MPEG-4 Moving Picture Experts Group 4 MPG/MPEG 动态图像专家组 Moving Pictures Experts Group Oss 对象存储服务 Object Storage Service 个人计算机 PC Personal Computer PTS 显示时间戳 Presentation Time Stamp RTMP 实时消息传输协议 Real Time Messaging Protocol 5 本功能定位 媒体处理服务的功能架构如图1所示,参考ITU-TH.644.7第7章及第8章。它分为4个域:内容 域、处理域、分发域和呈现域,其中内容域为处理域提供需要处理的媒体源和素材,处理域根据内容提 供者的相关输入进行各种媒体处理,并把处理结果进行存储或者通过分发域进行分发,而呈现域上的终 端用户是可以通过分发域的分发来播放观看最终处理的媒体效果。 图中灰色背景块(内容域、分发域、呈现域以及存储和基础设施即服务(IaaS)模块)不在本文件 的研究范围内。 2

.pdf文档 YD-T 6391.4-2025 媒体处理服务技术要求 第4部分 音频处理

文档预览
中文文档 12 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
YD-T 6391.4-2025 媒体处理服务技术要求 第4部分 音频处理 第 1 页 YD-T 6391.4-2025 媒体处理服务技术要求 第4部分 音频处理 第 2 页 YD-T 6391.4-2025 媒体处理服务技术要求 第4部分 音频处理 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2025-08-30 21:48:21上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。