党的二十届四中全会明确提出:“抓住新一轮科技革命和产业变革历史机遇”“推动科技创新和产业创新深度融合”,这为主流媒体深化变革、践行高质量发展提供了行动指南。
媒体对于人类社会的发展发挥了重要作用,报纸最早出现在中国汉朝和古罗马时期。1605年,德国发行了第一张现代报纸《通告报》;1920年,第一个广播电台美国匹兹堡KDKA电台开播;1936年,英国伦敦开播了第一个电视广播。报纸、传统广播电视都是单向广播,近百年来,一直是人类社会获取信息的主要手段。
网络媒体出现于20世纪90年代,随着计算机技术和互联网技术的发展,出现了新闻门户网站,如新浪、搜狐、网易等门户网站;本世纪初,博客与个人主页的出现,用户开始自主创作内容(如新浪博客),这是“自媒体”雏形;随着智能手机的发展,出现了社交媒体平台,有了微信、微博出现,兼具信息传播与社交功能。随着5G移动互联网的发展,出现了短视频平台,头条、抖音、快手以碎片化、视觉化内容吸引用户,成为人类获取信息的主要手段。
2023年,工信部等七部委联合发布《关于加快推进视听电子产业高质量发展的指导意见》;2024年,广电总局、工信部、文化和旅游部、中央广播电视总台和北京、上海、广东联合签署《超高清电视先锋行动计划》;2025年,全国九省市卫视超高清频道相继正式开播,标志着广电媒体系统性变革、行业高质量发展迈出了关键一步。
媒体是科技的产物,媒体发展史本身就是信息科技发展史。在信息科技高速发展的今天,如何运用科技推动主流媒体系统性变革?
首先是从媒体呈现质量的视角,要运用全媒体超高清视听技术,提升视听媒体的品质。
全媒体包括电视机、手机、PAD、公共大屏、车载电视等终端,超高清视音频制作系统要满足各类不同终端的呈现要求。超高清这五大指标大家都很熟悉,除4K/8K分辨率外,我们从高清发展到超高清,视频亮度动态范围需从高清的0-103要提升到人眼无瞳孔调节的0-105,色彩从高清占比色彩空间的33.5%提升到63.4%,帧率从高清的25帧提高到50帧,采样率从高清的8bit提升到10bit或12bit。
总台牵头研发了HDR Vivid菁彩影像技术和Audio Vivid菁彩声技术,并发布了行业技术标准和国家标准,为我国全媒体超高清发展提供了坚实的基础。总台针对4K电视机、8K公共大屏、手机竖屏有比较成熟的经验,但针对全媒体各终端一体化制作才刚刚起步。
为了让广大用户便捷地收听到三维声或环绕声,总台牵头系统性解决三维声采集、制作、编码传输和终端呈现四个环节取得突破。人们收听三维声或环绕声主要有两种方式:一是通过音箱构建5.1+4H声场呈现,这可在影院、剧场、家庭客厅、汽车内部署;二是通过耳机呈现双耳渲染三维菁彩声,这可通过手机部署。总台研制的菁彩声制作系统已开始在总台超高清制作系统部署。菁彩视听技术HDR Vivid菁彩视频和Audio Vivid菁彩声,已率先在总台云听、央视频、百城千屏开始新媒体平台应用。
总台自 2015 年便开启超高清制作探索,从录像制作逐步实现超高清直播突破,2021 年首次完成 8K 超高清春晚直播,通过持续研发超高清设备、建设制播系统,构建起IP化全媒体超高清制播体系,进而带动整个超高清产业的高质量发展。
提升超高清虚拟制作水平,自2020年以来,总台牵头开展了XR虚实融合超高清制作技术创新,持续推进迭代升级,整合了XR、AR、VR、VP、大场景扫描重建和数字孪生技术,陆续研发了“XR+VR”、“XR+VP”、“XR+数字孪生+VP”融合拍摄制作系统,把演播大厅打造成为惟妙惟肖、无限延展的虚拟舞台空间,有力地支撑了总台春晚等文化类节目创新。
为推动全媒体超高清制作,总台牵头研发网络视频架构NVI标准,该标准支持超低延时传输、精准时间同步、便捷组网接入、灵活数据封装、多编码器选择和云化部署,满足超高清信号的轻量化和安全可靠生产需求。总台将建设覆盖采集、编辑、传输的NVI架构的全媒体超高清轻量化制播平台,具备“云+本地”部署的多样化制作模式,在总台新媒体平台、地方总站和新闻移动直播开展示范应用,同时满足横竖屏智能裁切制作,基于人工智能能力实现直播快速剪辑切条成片等新形态敏捷化业务需求,为广电向全媒体超高清发展提供更灵活的解决方案。
二是从媒体传播形态的视角,要运用互联网技术,提升媒体的互动性。
竖屏影像特别适合移动互联网时代视觉呈现,但需要建立竖屏视觉语言体系。轻量化、碎片化、社交化是竖屏影像的重要特征,短视频是首选形式。手机触屏操作为用户提供高互动性、沉浸式审美体验的应用场景,竖屏影像必须为此进行定制化制作。总台在央视春晚和九三纪念大会上采用竖屏制作,都取得了很好的传播效果,今年在全运会上我们将对羽毛球比赛提供竖屏制作和呈现。
总台依托“双千兆”网络,创新开展超高清电视大小屏融合传播。总台建设了高码率超高清电视源站,并将“央视频电视投屏助手”植入海信、小米、创维和华为电视机中,可HDR Vivid、Audio Vivid、AVS2、AVS3等主要视音频编码及解码;通过云网分发平台,实现总台超高清电视直达用户手机和客厅电视机,用户在收看高清和超高清电视节目的同时,通过手机耳机还能收听到三维菁彩声的电视伴音,完成投屏操作只需5秒。
2023年,总台国重实验室已完成车载三维菁彩声播放系统研发,首次在汽车内实现环绕声和三维声音箱渲染播放。总台将“云听”和“央视频”车联业务植入到车载系统,通过我国自研的Audio vivid和HDR vivid技术标准构建端到端产业生态,打造沉浸式视音频体验。
总台牵头打造的“百城千屏”项目,目前在112个城市超过1075块地标大屏体验8K视频+三维菁彩声,总台国重实验室提出了异构网络的视音频控制方法,实现了不同网络传输的音频与视频的精准同步,解决了超高清公共大屏传播中视频与移动端伴音的同步呈现,为“百城千屏”公共大屏落地推广提供了支撑。
三是从科技推动人类发展的视角,要运用人工智能技术,重构媒体制播流程,打造媒体新质生产力,实现媒体的高质量、高效制作和精准传播。
总台积极探索人工智能技术在媒体领域的创新应用, 构建人工智能媒体应用5大平台,在内容生产、 传播分发、互动呈现和效果评估全流程中充分注入人工智能的赋能作用。
今天2月,总台发布了“央视听媒体大模型2.0”,全面对接了书生、混元、豆包、通义和星火等多个基础大模型,已上线89个面向节目制作的智能体,支持综艺、体育、科教、动画、译制等节目制播场景制作,目前已向总台各节目中心下发2000个应用账号。“央视听媒体大模型2.0”以总台丰富的制播应用场景为导向,构建起覆盖策、采、编、审、播、存、管7大业务环节35种典型场景的应用体系。大模型平台分为六大核心模块:文本创作、图像创作、视频编创音频编创、专业创作及智媒体库。其中,智媒体库是结合总台多元制播场景与专业节目流程打造的多模态智能应用。
总台在上海总站建设了AI视频修复增强平台,采用去噪、分辨率提升、插帧、色彩和人脸增强等技术,为大量经典影视素材的修复提供了手段和方法,但是如何利用生成式AI技术来提升视频修复增强的性能,尤其是对高价值、低质量图像进行生成式视频超分和人脸增强。因此我们要依托大模型生成式修复增强技术,开展划痕、抖动、褪色等噪点损伤的智能修复,同步进行分辨率提升与色彩准确还原,显著提升画面清晰度,同时可与总台现有判别式超分、插帧进行级联,提升图像清晰度和视频质量。
总台利用央视听媒体大模型参与节目内容制作,目前已深度融入节目生产全流程,广泛用于专题短片、宣传片、片头/片尾包装、插播片段、AI编曲、AI作词等场景,2025年已应用于《空天逐梦》、《中华考工记》、《CMG世界机器人大赛》等各类型节目中,显著提升内容生产效率与视听体验。
最后总结一下,我们利用媒体行业丰富的应用制播场景,抓住视音频技术升级换代和人工智能高速发展的契机,运用超高清视音频、互联网、人工智能等信息领域高新技术,构建国际领先、自主可控的全媒体超高清技术体系,打造媒体领域的新质生产力,为主流媒体系统性变革提供强有⼒的科技⽀撑。



