(报告出品方/作者:方正证券,杨晓峰,杨昊)
1、VR:演唱会树立“技术标杆”,“才艺直播”紧随其后
1.1、VR演唱会破圈:从郑钧到汪峰,VR直播体验迎来拐点
汪峰 VR 演唱会带动 VR 直播实现破圈。2022 年 7 月 2 日,汪峰于 Pico 平台举办 VR 乐享会,微博相关词条曝光度已超 1.9 亿,成功实现破 圈。4 月 9 日以来,PICO 已于其平台主办了 3 场直播演唱会,分别邀 请王晰、郑钧、汪峰进行演唱。根据微博数据,历次 VR 演唱会相关 词条曝光次数逐渐提高,总体微博曝光度已超 3 亿,VR 线上演唱会形 式逐步走进大众视野。
除明星自身带来的巨大流量外,VR 演唱会直播质量的革新,是其得以 成功出圈的主要原因之一。4 月举办的王晰演唱会为业界首场 8K 3D VR 实时互动演唱会,而后郑钧、汪峰的演唱会也均采用 8K 3D 180°VR+ 实时互动的形式。这几次演唱会在清晰度、视角设置、场景交互等关 键观感因素方面实现巨大突破,VR 直播体验大幅提高。

1.1.1、高清晰度:8K180°的VR视频已能达到43PPD
PPD(Pixels Per Degree 角分辨率,像素每度),即用户沿某一方 向每个单位角度内能够看到的像素数量,是衡量 VR 头戴设备与 VR 视 频清晰度的核心指标。PPD 达到 30 时,人眼已无法看出像素颗粒,我 们认为即为清晰度达标水平。而 8K 180°的 VR 视频已能达到 43 PPD, 从视觉体验上已达到较高清晰度的水平。
1.1.2、可转换视角:多视角选择+超近距离观影,打破传统空间限制
VR 演唱会可实现现实中需花费较大成本才能获得的近距离观影位,以 及现实中不可能实现的多视角转换观影,具有更大的视觉冲击。 多视角选择:Pico VR 演唱会采用多机位设置,用户可自由选择 最佳观影视角进行观看,且可以在该视角周围进行小范围移动, 观影过程中视角可随时转换。7 月 2 日举办的汪峰 VR 演唱会共设 置 5 大视角,覆盖方位从左到右、距离舞台从近到远、视角从平 视到俯瞰。近距离观影:距离歌手最近的视角通常设置在舞台边缘上的中央 位置,可实现比线下第一排观影位更优的超近距离观影。舞台上 的歌手“触手可及”,带来更具冲击力的视觉体验。
早期 VR 视频/直播均以单视角为主,Pico 也是从单视角向多视角突 破。最早举行的王晰 VR 演唱会全程仅舞台中央单一视角。而后举行 的郑钧演唱会则为双视角,分别位于舞台边与舞台下方看台处。最近 举行的汪峰演唱会则突破至 5 大视角,选择更加多样化。除 Pico 外, Go Now 运营的 SNH48 演唱会直播于近期推出多机位功能,可实现 3 机 位转换。其他更早期的 VR 演唱会或者直播等,均以单机位为主。

1.1.3、VR独有的互动技术:可交互虚拟场景+弹幕实时互动
除致力于还原真实的演唱会现场外,Pico 通过可交互虚拟场景+弹幕 实时互动,打造与众不同的视听互动体验。演唱会直播均采用 180° 的形式录制,剩余 180°场景则由虚拟场景进行填充。Pico 打造的虚 拟场景将会配合现场曲目及氛围,让演出达到最佳效果。在汪峰 VR 演唱会中,Pico 将虚拟场景进一步扩展至舞台后侧,形成 360°无边 舞台,并加入可交互场景元素,如可触碰音符等,进一步增加演出的 娱乐性。同时,观众也可实时发送支持语音识别输入的弹幕与歌手、 其他观众进行互动。
1.2、复盘微信视频号:通过演唱会实现快速破圈逻辑可复制
微信视频号同样通过直播演唱会的形式实现快速破圈。2021 年 12 月 17 日微信视频号举办的西城男孩 westlife 直播演唱会在当时的朋友 圈形成 “刷屏”,用户大范围的主动分享让本次演唱会成功出圈, 观看人次超 2700 万。随后微信视频号直播或复播了*月天五**、张国荣、 崔健、周杰伦、罗大佑的演唱会,均收割超千万级的流量,带动微信 视频号活跃用户数量的进一步增长。
微信视频号的线上演唱会通过邀请或放映具有情怀要素的老牌唱将 演唱会,匹配其用户画像,收获巨大用户传播流量。微信视频号与微 信共享用户池。观察微信视频号邀请的明星规律可看出,微信视频号 有意识地选择了崔健、周杰伦、罗大佑等兼具实力、地位与情怀的老 牌唱将。这些歌手迎合了 25-34 岁的主要用户群体,让线上演唱会具 有极高的基于大众情怀的情绪价值与社交价值,并通过微信的熟人社 交场景实现,造成朋友圈刷屏现象,最终实现出圈。
参考微信视频号的出圈逻辑,Pico 可通过邀请更加迎合年轻用户群体 的明星,通过举办高质量演唱会,实现逐步破圈。关注 VR 的用户群 体与微信用户群体的年龄分布有所不同,VR 用户群体以 19-24 岁的年 轻人为主,他们关注的明星也与 25-34 岁用户有所区别。根据 360 趋 势,关注汪峰的用户群体仍以 25-34 岁年龄段居多。参考微信视频号 的逻辑, Pico 可选择更多年轻化的明星、歌手、偶像等,以吸引更 多用户观看 VR 演唱会,提高用户传播意愿,推动 VR 演唱会形式走向 破圈,拉动 VR 用户量的进一步提升。

2、体验为何迎来拐点?UGC模式促进大量“8KVR内容”, 突破临界PPD30
过去没有影视公司大量投入制作 8K VR 内容的原因是制作 PGC 内容成 本较高,且缺少大的采购方。但是在字节 Pico 视频提供 180 °VR 相机背景下,主播开始逐步产生大量“8K VR 内容”,走出一条低成 本生产“8K VR 内容”的路径。 VR直播的清晰度水平取决于VR视频内容的清晰度与VR头显设备的清 晰度。 ① 采集端:VR 视频内容清晰度 。VR 视频内容的清晰度主要取决于其录制视频内容的分辨率。分辨 率决定了视频清晰度能达到的上限。受益于相机性能的提高,VR 视频内容的分辨率已从过去主流的 4K 提升至 8K,甚至是 12K。 VR 视频内容的清晰度也受相机镜头、编解码等其他因素影响,视 频格式则影响计算清晰度的方式。相机镜头质量主要影响拍摄出 的画质效果;编解码技术则主要影响视频的码率,从而影响视频 压缩后的效果。
② 硬件端:VR 头显设备清晰度 。VR 头显设备的清晰度则主要取决于其双眼分辨率与视场角这两 项参数。目前 Pico Neo 3 与 Oculus Quest 2 均采用 3664*1920 的双眼分辨率,视场角均为 100°左右。 处理器性能则决定了 VR 头显能够解码的上限。目前 Pico 搭载的 骁龙 XR2 最高支持 8K@60fps 的视频解码。
VR 头显与 VR 视频清晰度如何匹配?VR 头显清晰度与 VR 视频清晰度 相互制约。 VR 头显分辨率为其屏幕最多能显示出来的像素数量,出厂即定, 不可变动;VR 视频分辨率则为视频所具有的像素数量,但可进行 拉伸或者缩放。 当 VR 头显分辨率大于 VR 视频分辨率时,VR 设备会将 VR 视频内 容放大*放播**,由此视频内容将变得比较模糊,类似于在 1080P 屏 幕上*放播** 480P 视频的效果;而当 VR 头显分辨率小于 VR 视频分 辨率时,处理器将会进行解码,让高分辨率内容能够在低分辨率 设备上进行*放播**,但设备的物理分辨率不可变动,因此仍只可显 示 VR 头显设备的像素数量。但基于色度抽样、码率等因素,最 终播出画面在视觉效果上清晰度会高于头显匹配的清晰度。
Pico 演唱会所采用的 8K 180°VR 视频清晰度高于 Pico Neo 3 头显 的清晰度。Pico Neo 3 头显的 PPD 为 19,而 4K 180°与 8K 360°VR 视频的 PPD 为 21,从像素数量方面来看,4K 180°与 8K 360°VR 视 频已能较好匹配 Pico Neo 3 头显的清晰度。而 8K 180°VR 视频的 PPD 则为 43,较 Pico Neo 3 高出近 1 倍的 PPD,单位视野范围内的像素 总量则为 Pico Neo 3 的 4 倍。

但基于色度抽样、码率等因素,8K 180°VR 视频在 Pico Neo 3 呈现 出的视觉效果,会好于与其匹配的视频格式所呈现出的视觉效果,带 来清晰度感知的提高。 8K 较 4K 多出的不仅为像素点,还有色度信息。影响画面清晰度 的不仅是像素的数量,还有像素的质量。在较低分辨率设备上播 放较高分辨率视频时,即便无法输出原本的高分辨率视频,但设 备会通过算法将画面多个像素相加取平均值,成为新的像素显 示,色度信息并不会丢失,从而使画面的色彩过渡更加顺滑、细 节更加丰富,带来清晰度感知的提高。
8K 较 4K 视频的码率更高。视频码率是数据传输时单位时间传送 的数据位数,单位时间内码率越大,精度越高,处理出来的文件 就越接近原始文件。而码率与文件体积成正比,8K 视频的文件体 积较 4K 视频文件体积高出近 4 倍,带来更高的码率,同时也带 来更高的精度,让观影清晰度感知提高。
2.1、采集端:“360°到180°”清晰度上升至“2倍”
2.1.1、VR视频清晰度如何计算?
区别于平面视频,VR 视频内容展示形式为球体,不适用 ppi 等常用测 算指标。普通视频中所常用的 1080P 的概念,其定义是该视频分辨率 为 1920*1080=2073600,即该视频横向每行有 1920 个像素,纵向每列 有 1080 个像素,总计约 200 万像素。目前在电脑或手机上观看的 1080P 视频,在视觉体验上已经能达到非常清晰的程度,但相比于 VR 视频 对清晰度的要求仍有较大差距。由于 VR 视频拍摄后,视频并非平铺 于手机或电脑等平面进行*放播**,而是通过算法拼接到球面上,因此对 于像素的需求也被数倍放大,VR 视频清晰度的衡量标准也较日常视频 所使用的分辨率、ppi 等指标有所区分。
如何去衡量 VR 视频的清晰度?首先需引入 PPD 这一概念。 人眼对清晰度的感知主要受人眼在一定视野范围内所能获取的 像素点数量的影响,因此衡量清晰度首先需衡量单位视野面积所 能捕捉到的像素数量。 基于VR球面视频与平面视频的区别,行业内通常采用PPD(Pixels Per Degree 角分辨率,像素每度)作为衡量 VR 视频清晰度的标 准。 PPD 定义为每一度视场角的像素数,其计算公式为 PPD=视频分辨 率/视场角。以 8K 180°视频为例,8K 视频的分辨率为 7680*4320, 可视角度有 180 度,因此该视频的横向 PPD 等于 7680/180=43, 即用户每度角能捕捉到 43 个像素点。业内普遍认为,60PPD 的图 像即可达到视网膜分辨率,而当 PPD 达到 30 时,人眼已经注意 不到像素粒的存在。

2.1.2、为何选择8K180°相机?180°相机更满足VR演唱会需要
180°VR 相机与 VR 演唱会此类应用场景相匹配。根据画面覆盖的视场 角不同,VR 视频主要分为 360°与 180°两类,两者适用于不同场景。
① 180°VR: 180°VR 主要适用于体育赛事、综艺节目、演唱会等场合。因为 该类场景需要展示的范围较为集中,赛场或舞台之外的场景对于用户而言为无效画面,因此 180°VR 即可满足用户观影需要。此 外,类似于此次 Pico 汪峰 VR 演唱会,主办方可构建配合演出现 场的虚拟场景以填补非直播区域的内容,增强沉浸感与娱乐性, 也可在此区域植入广告、赞助等元素,方便实现商业化。180°VR 对拍摄场地、人员安排的要求也更低。360°摄影需注意 全方位场景控制,以及摄影师等工作人员位置安排。如果是摄影 师需实时控制相机的场景,则 360°视频会将摄影师拍入画面, 影响观影体验。 180°VR 更加节省码率,对带宽要求更低。在视频清晰度相同的 情况下,180°VR 比 360°VR 少一半的画面,因此传输的文件大 小、码率、带宽的要求也随之降低。
② 360°VR: 360°VR 则适用于需全方位呈现的场景内容,如旅游、风景等相 关题材的直播拍摄。 还原真实场景,观影沉浸感体验更优。
2.1.3、采集端设备一:相机性能提升
目前市面上主流 180°VR 相机,国产厂家西顾视频的 FM DUO 为行业 内较为前沿的水平。解析相机参数,以西顾视频为例,参数中的 12K 与 12000*6000 即相机拍摄时可达到的最大分辨率,而 30/60 FPS 则指可达到的帧率。帧率定义为每秒所*放播**的画面数量,主要影响画面 流畅度,但高帧率也对码率提出较高的需求。
相机性能的提升是 VR 内容清晰度提高的主要因素之一。各相机厂商 给出的参数均为能够达到的最大参数,为保证 8K VR 直播的质量,西 顾视频的 FM DUO 仍为 8K VR 直播的较好选择。作为一款专业级直播 相机,FM DUO 于 2020 年 9 月发布,并于 2021 年初开始批量生产,西 顾视频同时提供配套的 VR 直播解决方案。在此之前,VR 相机仅可达 到 4K-6K 的水准;或者需通过两台微单相机来拼接,拍摄程序繁琐。 而相机性能的提升使 VR 直播可达到 8K 180°的高清晰度水平,同时 简化拍摄程序,节省成本。
Pico VR 演唱会若采用 FM DUO 进行拍摄,12K 超采样 8K 3D VR 直播 技术进一步带来画质提升。Pico neo 3 目前搭载的是骁龙 XR2 处理器, 最高支持 8K 解码,而 FM DUO 提供的超采样技术则可在此限制条件上 进一步提升画质效果。 视频超采样技术,是在一般采样的基础上,扩大采样范围,并将多个 像素点合并为一个超级像素。简单理解即为相机用 12K 的像素进行拍 摄,经过机内处理、算法合成压缩成 8K 的视频输出。由此输出的视 频可进一步减轻画面的锯齿感,让颜色过渡更加自然、细节更加丰富等。在视觉体验上,超采样 8K 视频相较于普通 8K 视频可带来画质的 进一步提升。

2.1.4、采集端设备二:关注未来手机对VR直播的影响
拍摄 8k 视频要求摄像头至少达到四千万像素,同时未来手机镜头能 有一定的错位(保持两眼距离),那么 VR 内容制作门槛将进一步降 低。8k 的分辨率为 7680*4320,3317.76 万个像素点,摄像头像素超 过 3317.76 万,则在清晰度上能够达到拍摄 8k 照片、视频的技术要 求。2017 年,首部摄像头达到 4100 万像素的手机,诺基亚 808 上市, 相片分辨率接近 8k 清晰度。市场上主流手机摄像头的像素在 5000 万左右。我们选择京东销量前 10 的手机进行统计,其中有 4 部手机主摄像素在 5000 万,3 款在 4800 万,1 款 3200 万和 2 款 1200 万。
8k 视频尚未普及或主要受到内存的影响,直播或可解决这一问题,VR 直播有望进一步普及。8k 视频由于像素数高,所以占用内存较大。同 样手机录制一小时的视频,1080P 的清晰度在 3-10G(30fps 占用内存 3-6G,60fps 占用内存 5-10G)左右,而 4k 视频则在 11G 左右,8k 视 频所需内存则更大(由于手机配置不同,因此录制相同清晰度的视频 占用内存不同,此数据为华为手机和苹果手机评测所得)。而手机内 存多为 128G 和 256G。但直播不存在占用手机内存的问题,因此在技 术达标的前提下,直播有望达到 8k。而 VR 直播对于清晰度最低的要 求是 4k,VR 直播有望进一步普及。
若未来使用手机进行 VR 直播,手机摄像头之间的距离将在 6-7cm。由 于拍摄 VR 内容,需要 VR 相机模拟人眼的双目立体成像效果,而人双 眼的距离通常在 6-7cm 之间。 因此需要手机摄像头之间的距离也在 6-7cm。
2.2、VR头显设备清晰度:核心是处理性能
2.2.1、VR头显清晰度如何计算?影响VR头显清晰度的关键指标为双眼分辨率与视场角。
双眼分辨率即 VR 头显屏幕的分辨率,但人眼实际接收到的分辨率为 单眼分辨率。VR 设备给出的分辨率参数为其屏幕分辨率,但由于其一 块屏幕为两眼共用,其中间有隔断,屏幕两侧分别展示独立的视频, 因此人眼所接收到的实际分辨率需对半分。且由于光学成像原理,为 保留无边缘感,VR 屏幕边缘通常需预留部分“无效分辨率”,因此实 际分辨率会再略微降低。以 Pico Neo 3 为例,Pico Neo 3 屏幕双眼 分辨率为 3664*1920,其单眼分辨率则为 1832*1832。
视场角与屏幕分辨率共同决定 VR 头显清晰度,但并非越大越好。视 场角(FOV,Field of view)指戴上 VR 头显后,人眼可看到的视角 范围,一般指水平视场角。更大的视场角意味着更广的视野范围,也 就带来更强的沉浸感。但在屏幕分辨率一定的情况下,视场角越大, 单位视野范围内的像素量就越小,整体的清晰度也就越低。Pico neo 3 的视场角为 98°,Oculus quest 2 的视场角为 100°。
如何计算 VR 头显清晰度?头显 PPD = 单眼分辨率/视场角。头显清晰 度原理与 VR 视频清晰度计算原理相同。以 Pico Neo 3 为例。Pico Neo 3 屏幕双眼分辨率为 3664*1920,单眼分辨率为 1832*1832,视场角为 98°。根据前文所述的原理计算,Pico Neo 3 的 PPD = 1832/98 = 19, 其 1°单位视线范围内的像素量=π*(PPD / 2) 2 = 274。此外,VR 处理器性能决定了 VR 头显能显示的分辨率上限。VR 视频从 采集端到云端到头显终端,需经过编码再到终端解码的过程,而处理 器则是负责终端解码的部分。目前 Pico Neo3 搭载的骁龙 XR2 最高支 持 8K@60fps 与 4K@120fps 的视频解码,若视频为更高的分辨率,则 超出处理器能够处理的性能,无法进行*放播**。

2.2.2、Pico VR头显的清晰度演变:分辨率仍需提高
从 2019 年 5 月推出的 Pico G2 4K 开始,Pico 头显已经使用双眼 4K 屏,PPD 达到 19 左右,而后推出的 Pico Neo 2 仍保持该水准。2021 年 5 月推出的 Pico Neo 3 在其他性能方面相较于 Pico Neo 2 有所提 高,但在清晰度方面降低了屏幕分辨率与视场角,PPD 也有小幅降低。 从未来发展来看,如今 VR 视频内容的清晰度已远高于 VR 头显的清晰 度,将来也会持续提高。为匹配 VR 视频内容清晰度的提升,VR 头显 的分辨率仍需继续提高。为达到人眼视网膜分辨率,VR 屏幕的分辨率仍需进一步提高。我们假 设未来的视场角依然保持在 98°左右,根据不同级别的 PPD,测算未 来所需的屏幕分辨率。PPD 为 30 时,人眼将注意不到像素粒,此时屏 幕需达到 6K 的分辨率。而目前业界普遍认为人眼视网膜分辨率在 60 左右,经测算,需 12K 屏幕方可达到此清晰度。
3、“VR才艺直播”有望带动Pico进入早期抖音的发展路径
3.1、VR演唱之后,开启VR才艺直播
3.1.1、Pico VR直播发展现状:仍处于起步阶段
Pico 视频内的直播类型分为 VR 演唱会直播与 VR 才艺直播两类。2022 年 4 月 4 日,Pico 专属应用“Pico 视频”上线,但其功能与内容均 较为局限,页面较简单,仍有极大提升空间。Pico 个人才艺直播处于加速起步阶段。2022 年 6 月 8 日,Pico VR 才艺直播上线,并于固定时段 19:30 -01:30 进行直播,其主播资源 均来源于抖音,才艺类型涵盖唱歌、跳舞、聊天等。根据我们的统计, 7 月 22 日晚 8:30 左右,个人才艺直播间共 9 名主播在播,主播人数 较少,以女生为主。
Pico 直播内功能也较为局限,但版本更新较快。目前 Pico 直播功能 较少,近期才上线 2D/3D 切换、预览其他直播间等功能。直播格式均 为 180°,清晰度可在 2K、4K、8K 中切换,已达较高清晰度水平。但 直播常用的关注、打赏等功能暂未上线,可见目前 VR 个人直播尚未 进入商业化阶段。互动层面也只停留在弹幕互动阶段,尚未实现 VR 演唱会独有的虚拟场景+互动元素功能。但其版本更新较快,每月会 更新一到两个新功能左右,功能建设正逐步完善。
3.1.2、“抖音时刻”:VR才艺直播与抖音早期发展逻辑一致
抖音早期直播同样依靠才艺直播起家。2017 年 11 月,抖音上线直播 功能;2018 年 2 月,抖音与公会合作,开启首批主播招募计划,招募 主播类型包括才艺主播等。根据抖音平台的网红粉丝数量排名,用户 对才艺类网红偏好明显。截止 2018 年 5 月数据,抖音粉丝排名前 6 的网红中,有 5 名是才艺类网红/主播,粉丝量均在千万级以上。直播业务+广告投放助力抖音用户高速增长。自 2017 年 11 月抖音开 放直播功能以来,抖音的内容生态进一步丰富,配合春节期间的广告 投放策略,抖音用户数量迎来高速发展时期。

3.2、为什么看好VR直播内容增长性?基于字节在用户转化与内容生产方面的巨大优势
3.2.1、用户认知:主站抖音重视频内容,用户能较好向VR直播用户转化
抖音用户均为短视频、直播偏好类用户,且对明星相关内容偏好明显。 字节旗下拥有抖音、抖音火山版、西瓜视频三大视频类应用,长久以 来已积累巨大的偏好视频类应用的用户池。且明星相关视频/直播在 抖音具有较大热度,2021 年抖音新发布的明星类视频数量达 6300 万, 视频*放播**次数超 6200 亿;明星在抖音直播超 11 万场次,看播人次超 169 亿。
视频/直播偏好类用户对 VR 视频接受度较高,通过主站引流,抖音用 户能较好向 VR 直播用户转化。自收购 Pico 后,抖音已通过直播带货、 明星/KOL 推广等多种营销方式为 Pico 带来巨大的站内流量。根据艾 瑞咨询,视频用户对 VR 视频、虚拟人视频等新形式视频内容的认可 度超 60%。站内高强度曝光+高用户接受度,使 Pico VR 在 2022 年春 节期间全渠道销量同比增长 32 倍,销售额同比增长 29 倍,实现了用 户流量向 VR 领域的转化与变现。
3.2.2、资源对接:丰富主播+娱乐资源储备,虚拟偶像团体A-SOUL拉动VR直播
主播为 VR 直播内容中的核心要素,而字节在主播储备方面具有巨大 优势。 庞大的明星资源为今后的 VR 演唱会、VR 综艺娱乐等内容形式打 下基础。截止 2021 年,抖音上入驻的明星数量已达 5593 位,在 抖音直播过的明星超 2500 位。 抖音个人主播天然为 VR 主播储备。除明星活动、体育赛事外, 个人 VR 直播将构成 VR 直播内容的重要组成部分,弥补大型活动 赛事长周期导致的空窗期。截止 2022 年 7 月 21 日,抖音粉丝数 量超 100 万的直播达人已达 9668 位,千万级主播则有 238 位。目前,抖音已与 Pico 合作,部分抖音主播已入驻 Pico VR 直播,丰富直播内容生态。
虚拟偶像团体 A-SOUL 现已入驻 Pico,站内热度超明星直播演唱会。 A-SOUL是于2020年由字节跳动和乐华娱乐联合推出的虚拟偶像团体, 字节跳动负责提供技术支持,乐华娱乐提供演员以及内容运营等方面 的帮助,其团队微博官方账号粉丝数量现已超 200 万。2022 年 6 月 17 日,A-SOUL 于 Pico 首次开播,区别于其他 VR 直播形式,本次直播场景、主播形象均为虚拟建模,主播通过动作捕捉技术实现互动。 本次直播共吸引超 8000 人报名观看,报名人数超汪峰 VR 直播演唱会。
虚拟人粉丝画像与 VR 用户画像相符,可为新突破口拉动 VR 直播用户 增长。虚拟人目前已形成巨大的流量市场与粉丝经济,根据艾媒咨询, 2021 年中国虚拟人带动的产业市场规模已达 1074.9 亿元。在受众群 体方面,部分虚拟人粉丝画像与 VR 目标用户画像吻合。以 A-SOUL 为 例,A-SOUL 受众群体以年轻人为主,20-39 岁人群占比达 70%,而对 VR 感兴趣的群体中 20-39 岁年龄段占比同样达 70%,在受众年龄上具 有一致性。在男女比例方面,两者受众男女比均为 6.5:3.5 左右。结 合 A-SOUL 在 Pico 首播热度,虚拟人粉丝可较好转变为 VR 用户,进 一步拉动 VR 用户增长。

3.2.3、内容创作:抖音内容创作生态服务体系完善,且具备强大内容自制能力
除丰富主播储备外,优质直播内容也为 VR 直播的重点方向。字节在 创作者支持方面,拥有完善的内容创作与生态运营体系。 以抖音为例,抖音平台具有完善的内容创作支持体系。在内容制 作方面,抖音平台内部为创作者提供包含音乐、滤镜、模板等多 类素材支持,并提供多种直播玩法。此外,抖音专门开设的创作 者服务平台也为创作者提供了数据分析服务与运营课程教学,从 平台功能性上全方位助力个人内容创作,推动其内容生态繁荣。
国内已催生健全的服务商体系,提供专业化的运营服务。国内短 视频和直播生态服务商作为中间人,对接平台与创作者,目前已 衍生出完善的运营链路,为创作者提供包括营销孵化、人员培训、 内容创作、账号运营、数据分析等全方位服务。抖音也与众多 MCN 机构、直播公会等具有强合作关系。在服务商的参与下,平台、 创作者、服务商三者的分工趋于专业化,内容创作的效率与质量 有效提高,三方共同构建出抖音完善的生态运营体系。
同时,字节本身具备强大的内容自制能力,其自制短剧、综艺等均具 有较高质量与热度。2021 年,抖音自制短剧超 20 部,在抖音*放播**量 前 5 的短剧中,抖音出品的短剧占 3 部,排名第一的短剧《做梦吧, 晶晶》也为抖音自制,累计*放播**量超 2.8 亿。自制综艺方面,2021 年 抖音联合浙江卫视、江苏卫视等推出《为歌而赞》、《点赞!达人秀》等高质量综艺。
3.3、当前网速已匹配VR直播带宽需求,云技术商提供解决方案
VR 直播对网络传输速率的需求主要受视频清晰度、视角场、帧率及 2D/3D 选择的影响。 清晰度:视频清晰度越高,每帧总像素数也就越高,对带宽的需 求也就越高。 360°/180°:在同清晰度条件下,360°视频相较 180°视频多 出一倍的画面,其文件大小也多出约一倍,对带宽的需求也约为 两倍。

帧率:帧率则是指一个视频*放播**时,每秒钟*放播**的画面数,主要 影响视频的流程度。fps(frame per second)为其单位,30fps、 60fps 为各类视频常用帧率格式。根据定义,60fps 的视频相较 于 30fps 的视频每秒显示的图像数多出一倍,因此 60fps 的视频 相较于 30fps 的视频文件大小也约为两倍的关系,对带宽的要求 也约为两倍。 2D/3D:VR 视频存在 2D/3D 视频的区别。在现实中,人的双眼因 存在间距,左右眼所捕捉的画面并不相同,存在视差。在观看 2D 视频时,双眼看到的都是同一画面,画面立体感弱,而 3D 成像 则更具立体感。3D VR 相机需模拟双眼间距,分配不同的摄像头 分别记录两眼所看到的不同内容。因此其形成的视频文件大小也 较 2D 视频约为两倍,对带宽的需求也约为两倍。
码率:视频码率即数据传输时单位时间传送的数据位数,一般单 位是 kbps。码率主要受视频源文件大小与后期编码技术影响,码 率越大,对带宽的需求也就越高。 其他:此外,VR 对带宽的需求也受色深等因素的影响。
3.3.1、我国网速发展:已与8K180°3DVR直播传输需求相匹配
带宽曾为限制 VR 清晰度提高的瓶颈之一。我国 4G 网络的*载下**速率在 20-30Mbps 之间,远无法满足 VR 高清 晰度直播的需要,受限于网速,VR 直播行业发展缓慢,5G 成为 行业增长新希望。 我国 5G 于 2019 年 6 月进入商用时期,2019 年 11 月,三大运营 商正式上线 5G 商用套餐,而后 5G 用户才逐渐积累。 5G 普及率的提升才使 VR 高清晰度直播成为可能,而其发展节点也恰 好与 VR 相机性能提高的节点相对应。
Pico 采用的 8K 180°3D VR 直播对网络带宽的典型需求为 100Mbps, 已与我国当前平均网络速率相匹配。当前 VR 直播一般采用 30fps 的 帧率、8Bit 的色深,在采用 H.264 编码技术的情况下,8K 180°3D VR 直播对网络带宽的典型需求为 100Mbps。若替换为 360°全景,或者 提高帧率等情况,VR 直播对带宽的需求则根据前文所述将成倍增加。 根据中国信通院数据,2022 年第一季度,我国 5G 网络的平均*载下**速 率已达 304.8Mbps,Wi-Fi 网络的平均*载下**速率达 179.7Mbps,已较好 匹配 VR 直播对网络带宽的需求。

3.3.2、火山引擎等云技术商提供直播解决方案,近期将推出完整的H.266视频解决方案
VR 直播关键业务流程主要分为 5 步:内容采集、视频拼接、编码推流、 内容分发、视频传输。内容采集:使用 VR 相机拍摄 VR 直播内容素材 。视频拼接:将每个镜头拍摄的局部画面拼接合成为完整画面 编码推流:将拼接后内容经过编码压缩、协议封装后,方可实时 推送至网络进行传输 。内容分发:将视频上传至 CDN 内容分发网络,即将源站资源缓存 到全国各地的边缘服务器,供用户就近获取 。视频传输:将 VR 直播画面从云端传输至 VR 头显终端,终端解码 后即可显示直播内容
云技术商可通过视频处理与编解码等技术,压缩视频文件,降低视频 所需码率,以节省 VR 传输带宽。除通过调整视频格式以匹配网络带 宽需求外,编解码等技术的应用则是从技术角度提出更优的解决方 案。编解码技术旨在在有限的带宽条件下传输更高质量的视频, H.264、H.265 是目前主流的视频编码技术。
火山引擎为 Pico 提供技术支持,近期将推出完整的 H.266 的视频解 决方案。2022 年 2 月,字节跳动火山引擎首次公开其视频云服务产品 矩阵,覆盖视频直播、点播、实时音视频、云游戏和云渲染等全链路 产品。此外,火山引擎也针对 VR 应用场景做出了专门的优化,目前 已可支持高清晰度大码率传输、低时延、多人接入。而针对 VR 直播 对视频编码和传输要求较高的痛点,火山云表示近期会提出完整的 H.266 视频解决方案,大幅降低超高清视频应用上的门槛,在受限的 网络条件下提升用户视频体验。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)
精选报告来源:【未来智库】未来智库 - 官方网站