你看到的4K,真的是4K吗?

作者: 祝越 叶晴朗

你看到的4K,真的是4K吗?0

“影视飓风”团队把视频清晰度问题抛给各大视频平台(视频截图)

视频的清晰度,比四年前更低了?

2024年10月8日,全网粉丝数超千万的“影视飓风”团队把这一问题抛给各大视频平台。在题为“4K清晰度不如4年前,视频变糊是你的错觉吗”的视频中,“影视飓风”UP主潘天鸿提到,视频平台通过多种方式,过度降低了视频的码率,甚至会给视频后期添加锐化,使其看起来不那么 “糊”。最后,他得出结论:在同等分辨率的条件下,我们现在看到的视频清晰度可能达不到四年前的水平。

视频压缩,本是个由来已久的话题。1972年左右,堪萨斯州立大学的电气工程师、计算机科学家Nasir Ahmed提出使用DCT编码压缩图像。DCT的基本原理与如今的压缩算法类似,它将图像分成不同的小块,舍弃高频信息,保存低频信息,最终得到的图像与最初版本并不完全相同,但大多时候,这种差异不会被人们察觉。

进入21世纪,我们先后拥有了H.264、H.265、AV1等新的编码技术。2020年7月,最新的H.266编码也已发布。算法不断更新的背景下,为何视频清晰度在倒退?

事实上,视频压缩早已不只是关乎技术,更关乎用户的体验,和流媒体视频平台需要算的一笔账。

必要与过度

在创作者圈子中,视频上传平台后会“变糊”,早已是一个公开的秘密。

创作者李山就曾留意到这种现象。他做过几次旅游vlog视频,内容大多是沿途风景。拍摄和制作时,他尤其注意细节,想让视频呈现更好的画质。可视频上传平台后,他发现画质下降得比较明显,原本具有丰富细节的树叶、草丛等植被,“变成了块状”。

影响李山视频的关键因素,并非大多数观众熟知的1080P、4K等“分辨率”的概念,而是“码率”。简单而言,“码率”指的是单位时间内传输的数据量。视频中的每一个细节——从色彩变化到物体运动,都是由数据构成的。在相同的分辨率下,单位时间内传输的数据越多(即码率越高),视频展现出来的画面就会更加细腻和真实。

而视频“变糊”,就是平台通过压缩降低了视频的码率。创作者万泉曾于2014年开始,做过两年多的UP主,他的视频大多上传至哔哩哔哩平台(后简称“B站”)。万泉记得,视频上传前,B站会提醒视频的码率不要超过6Mbps,否则平台会对视频进行编码压缩。

“那时候会有相当多的攻略,告诉你怎么去规避(B站的)二次压缩这件事。”万泉告诉南风窗。南风窗记者搜索发现,不少创作者分享的技巧提到,如果UP主不自行压缩直接投稿,视频的码率会被平台压缩得更低。

降低码率,是因为它受到网络带宽的限制。对于流媒体视频平台来说,播放高码率的视频就像是容许多辆大卡车同时通过,给公路增加了负担,平台需要支付更多的流量成本。而对观众而言,能否正常观看高码率视频,也受到自身网络环境的影响,如果家里的“网络公路”容不下多辆卡车通过,视频播放便会卡顿、不流畅。

于是,为了节省网络带宽费用,也保证用户在不同网络条件下的观看体验,流媒体视频平台有必要对视频进行压缩。平台常用的H.264(AVC)、H.265(HEVC)、VP9以及AV1等视频编码格式,目的就在于将视频文件大幅缩小,降低码率的同时尽量减少画质损失。

而在必要的压缩之外,影视飓风的视频中提到的,是更多“过度的压缩”。

以H.265编码格式为例,它比H.264编码格式更为高效,能够在保证相同画质水平的基础上,减少50%左右的数据量,也就是将码率降低至H.264编码下的近一半水平。这样一来,既能给观众提供相当的画质体验,又能节省平台流量成本,实现双赢。

但影视飓风对比发现,事实上H.265编码格式的视频,在码率大幅降低的情况下,并未保持与H.264相近的画质。以B站为例,2019年前后,B站给创作者上传的1080P视频设定了一个6Mbps码率的上限,平台压缩视频后,码率也能达到4—5Mbps。而如今,一个1080P的视频,码率可能只有1—1.5Mbps。

更为直观的是,2023年7月,一位UP主对比了同一视频在AV1、H.265、H.264三种编码下的画质,发现H.264编码的视频反而是最清晰的。AV1、H.265两种高效率编码,确实降低了视频的码率,却并未真正保证画质的清晰度。

视频和游戏业务对流量消耗越来越大,流量越高成本越高,这是国内视频产业难盈利的重要原因。

码率的下降,可能已经超过了“高效压缩”的界限。

带宽成本之重

那么,为什么?这最终仍要回到平台降低码率的目的,也就是带宽成本“降本”。

早在2014年,搜狐公司创始人张朝阳就在采访中提到,“高居不下的成本带宽成本是造成(当时)搜狐亏损的重要原因”。他进一步解释,搜狐的视频和游戏业务对流量消耗越来越大,流量越高成本越高,这是国内视频产业难盈利的重要原因。他同时透露,搜狐视频一年的带宽成本达到数亿元人民币。

而根据2024年3月发布的《中国网络视听发展研究报告(2024)》,截至2023年12月,我国网络视听用户规模达10.74亿,网络视听的“第一大互联网应用”地位愈加稳固。用户规模增长的背后,平台也背上了带宽成本压力,不得不通过压缩视频、降低码率来降本增效。

毕竟,2020年B站UP主“动动枪”就曾计算过,像《影流之主》这样一个4000万播放量的视频,平台要把它推给每一个观众,大约要消耗10万GB的流量,以当时阿里云公开的流量价格计算,花费的流量费用超过了两万。

从流媒体视频平台的财报数据中能看到,近年来各平台都在努力降低带宽成本。B站2021年财报显示,自2019年以来,B站的服务器和带宽成本支出占总成本的比重不断下降,由2019年的16.5%,降到了10.2%。2023年财报中同样写到,相比于2022年,B站的收入成本下降了5.3%,主要原因是降低了服务器和带宽成本、员工成本、内容成本及其他成本,具体而言,带宽成本较上一年下降了15.7%。

但同样要支付带宽成本,为何YouTube的视频能够提供更高码率?2020年,微信公众号“红流AKASHIO”曾推送了一篇文章,详细讲解了Google是如何与各运营商谈判、降低YouTube的宽带成本的。

文章梳理出了国内外带宽成本问题的两个关键差异。一方面,运营商与平台方的关系不同。国内的运营商比平台方更强势,平台需要向运营商支付带宽费用,来保障用户的访问体验。而在国外,Google比运营商更强势,运营商反而需要主动与Google的机房对接,来改善自己用户的访问速度。

另一方面,海内外运营商的收益模式也不同。海外运营商也许没有从YouTube那里赚到钱,但却从C端个人用户手中收取更高昂的网费,但国内运营商面向个人的收费则更低。2022年,运营商财经网统计对比了我国与美国、韩国、英国等国的5G套餐资费,得出结论:“我国的5G套餐资费确实处于最低水平。”

更重要的是,国内运营商还要承担互联网普及的社会责任。

如此一来,国内运营商面向流媒体视频平台的高收费,似乎也无可厚非。毕竟在这背后,是缩小城乡、区域间数字鸿沟的愿景。

在未来,压缩算法技术的不断更新,能为平台提供新的解法,以化解带宽成本与用户体验之间的矛盾吗?在实际应用中,我们看到的反而是新的挑战。其中之一便是,算法的更新带来了编码复杂度的增加,这意味着平台需要为视频编码过程投入更多的时间和算力,而算力的消耗,也会带来额外的成本投入和基础设施升级。

也许技术的发展迭代,就是不断地在跷跷板的起落中,找到那个最佳平衡点的位置。

谁来定义画质?

由影视飓风的视频引发的讨论,表现出视频平台与观众对于视频清晰度的不同认知与定义。

长期以来视频平台所呈现的,是以1080P、4K等分辨率为标准的清晰度等级。当观众越发认识到了码率的重要性,编码算法这一新的变量又冒了出来,告诉人们视频可以在码率较低的情况下达到较高的画质。直到有观众较真地进行了对比,才发现算法的“高效”可能只是大幅节省带宽的手段。

视频画质的好坏究竟要如何定义?还有更多的变量需要纳入考量。2022年,哔哩哔哩技术发布了一篇科普文章,题为“是什么影响了视频的码率”,介绍了码率背后的多个影响因素。要评价一个视频的画质,码率是一个重要指标,但这并不简单地等同于“码率越高越好”。

码率与视频信息的复杂程度有关。假如一个视频从头到尾都是一张纯色图片,即使它压缩后码率很低,观众也不会察觉出画质的差异。相反,在李山的旅游vlog里,树叶、草丛具有更多的纹理细节,属于需要更多码率支撑的“高频信息”,如果码率被压缩得太低,观众就能看出明显的失真。

国内运营商面向流媒体视频平台的高收费,似乎也无可厚非。毕竟在这背后,是缩小城乡、区域间数字鸿沟的愿景。

Netflix使用的视频质量评估算法VMAF的评分结果显示,不同类型的视频要达到基本相同的画质,所需要的码率差距很大。动画片中有很多大色块,运动也相对简单,在Netflix上即使以4K规格播放,码率也常常在1—2Mbps之间。而一部电影中有大量运动镜头,一些画面可能还有灰尘、水汽等细节,如果同样保持4K分辨率,码率常常需要在16Mbps及以上。

视频中不同部分的重要性,也影响着码率的分配。“重要”意味着“人眼更敏感”,研究发现,越是简单规则、在画面中停留时间长的内容,人眼对其越敏感。相较于一片杂乱无章的草地,人眼更容易注意到蓝天中渐变色彩的失真;同时,对于人眼来说,一个长时间停留的人物,要比快速走过的人影更加“重要”。

人脸也是重要的信息之一。哔哩哔哩多媒体算法组的蔡春磊曾在一次讲座中提到,编码算法的前提假设,其一就是人眼对结构性信息的丢失很敏感,如果人脸、眼睛、鼻子等轮廓模糊,观众就能感知出来。

也正因此,视频的压缩是有选择性的。即使在一个视频内部,信息的复杂和重要程度也并不均衡,码率可以根据视频内容进行动态调整。例如相比于静止的背景,运动中的人物更复杂,那么给后者分配更多的码率,就能够做到压缩视频的同时不影响观众的观感。

而算法对信息的压缩结果究竟如何?它们对信息的筛选是正确的吗?要回答这些问题,人们又开发出了视频质量评价指标,上述的VMAF就是其中之一,同样常用的指标还有峰值信噪比(PSNR)、结构相似性(SSIM)。这些指标的目的,都是要更贴近人眼所感知的信息,以此对视频画质做出评价。

但它们有时也会被迷惑。一个博主在测试VMAF对视频的画质评价时发现,如果只是将视频画面的对比度增强,VMAF的评分值会有所提高。但实际上,视频的信息量并未真正提升,且原有的马赛克、噪点依旧存在。

“学术界一直都在不断探索,去寻找若干个贴合人眼主观感知的客观指标。”知乎博主芯动的信号从事视频压缩相关算法的开发已有8年,他告诉南风窗记者:“这些指标都不能完全等价于人眼主观(感受),也无法适用于所有的场景。”

如何更好地平衡视频压缩与画质观感,是未来平台与研究者们将要持续探讨的话题。而不论如何,相信自己的眼睛,也许是最简单、却也最能抵达正确答案的方式。

(文中李山、万泉为化名)

上一篇 点击页面呼出菜单 下一篇