显卡大战CPU!视频编码谁更强,超详细测试    

显卡 01-04 12:43:02 9 0

文章内容有点硬核和专业,建议先关注和收藏再看。

大家好,我是波导终结者。

录游戏解说视频这么多年,又做了几年直播,对视频这一块一直在寻求更高效率的方法。当年显卡编码还刚露头的时候,我就做过尝试,不过那个时候软件硬件都不成熟,效果很差。

就跟大家说一个真事儿,当时我用的GTX750,想看看显卡编码能不能比CPU快一点,搜索CUDA,百度问我:你要搜的是不是“粗大”?这是真事儿,可惜硬盘坏过一次,截图没了。但是从侧面可见,当时搜这个的人,以及网上的相关资料确实是少。当年我也试过,那时候显卡编码质量较差,码率浪费严重,不是很实用。

过了这么多年,相关的软硬件已经更新了非常多,效果早已可以令人满意。我也是自己用了这么多年,积累了不少的经验,慢慢跟大家分享。这几年我一直用一块GTX1050Ti来进行显卡加速,这也是支持新架构的最低型号(确切的说应该是GTX1050)。丐虽然丐点,至少比i7-7700快不少。

最近,我也是更新了一下装备,i7-10700K+Z490+3070和i5-10400F+B460M+2060的阶梯都搭起来了。本来是想做一个从750-1050-2060-3070的阶梯测试,但是前段时间有恙,后来也想了想,生产力工具嘛,谁不是奔着中高端卡去用的,太丐也没啥意义,最后决定直接用10700K和3070来一篇详细测试了。

CPU是盒装的10700K,不过这次先不超频,贴近一下大部分人的使用场景。显卡是工作室楼上小伙伴抢到的影驰3070星曜,先找他借过来用一段时间。主板功耗已经手动开到200W,海盗船水冷,CPU睿频让它自动超。

32G内存,3G速度NVMe固态,基本是民用中端往上配置,整机性价比算是比较不错的,除了CPU和显卡以外的配置稍有区别,对实际表现影响也不大。

请注意,本文并非横评,也非极限性能测试,只是探讨一下,在纯编解码范畴内,显卡和CPU到底谁更强。

对于编码质量,我已经用OBS录了好几年的H265,经过充分验证,现在的NVENC质量直逼CPU软压,无须多虑,也不再进行这方面的测试。

另外,由于我懒,本次的视频源是H265格式,懒得再测一次H264,现在的电脑配置解码小菜一碟,大部分还是吃编码。

图源是4K截的,所以缩放之下文字会糊,懒得重截了。

说这么多也只是因为喷子和杠精太多,不管了,直接来看。

首先来看纯CPU干活的效率,当年H265刚出来的时候,算法不成熟加上CPU性能所限,甚至有人用0.1倍速在压东西……而现在纯用CPU也能达到3.2倍左右的速度。从资源占用里可以看到,CPU基本吃满,显卡基本快睡着了。

再来试试纯显卡压制。此时GPU占用基本飙满,速度飙至10.98倍,而CPU彻底成为瓶颈,一个线程都没吃满。现在知道我为什么CPU不超频了吧,要超也是超显卡~

接下来要进入稍微有点复杂的领域了,就是加速解码。显卡、核显除了编码加速外,也可以提供解码加速,理论上是可以进一步提高整个编码过程的速度的,不过也不是任意搭配都能用,这里也把各种方案都试试,看看哪一种最快。

这是使用Intel核显的QSV(Quick Sync Video)帮助解码的成绩,可以看到处理速度又有小提升,达到11.13倍。并且从资源管理器中可以明显看到CPU的使用率有所提升。

这里可能有的小伙伴会有和我一样的想法:如果能核显和独显同时编码,能不能把CPU和GPU全部跑满呢?理论很美好,现实你懂的。以前曾经有款软件叫VIRTU MVP,可以实现核显和独显的“交火”,后来被爆出作弊。再退一步,现有的软件没有任何一款针对这个可能性做过开发,所以我试过了,并不可行。

唯一有可能的是双开,一个用CPU满载的方案,一个用GPU满载的方案,但是实测并无法达到双满,其中一个会被抢光资源。所以还是暂时放弃吧,等以后看会不会有软件上的更新。

接下来我们再来看更复杂的一层。

同时有核显和独显时,如何使软件或游戏正常工作,这么多年来一直困扰着不少人,然后软件上也一直没有一个完全的解决方案,最终还是得切换主图形适配器。刚才说到的QSV,在独显设为主图形适配器时,只能用于解码,不能用于编码,我已经替你们试过了。

所以这里,如果要加上核显编码的比较,就必须先来主板这里设置一下主图形适配器,然后线最好接主板上,避免性能损耗。

核显作为主适配器时,独显NVENC不兼容,所以这里只能让CPU左右互搏。

默认设置下,CPU软解,核显QSV压,速度达到8.86倍,比纯CPU快很多,但是离显卡还是有一定差距。

接下来是QSV加速解码,QSV编码。可以看到,成绩进一步提升,到了9.46倍。


到这里先来小结一下。

首先是,目前并没有一种方案能确保把CPU、核显、独显都跑满,虽然这样理论上利用率最高。其实也很好理解,三种不同方案,它的编码库和指令集都是不一样的,自然不可能交火串用。理论上可以多线程,比如多开,或者多个任务同时进行,但是这样的话,线程之前互相抢占资源,如何调配使它们满速?目前没有解决方案,只会出现反效果,互相抢占导致有的线程停滞。

接下来我们再来看看压H264的成绩。虽然我自己已经全面H265化了,毕竟能省将近一半的码率,但是现在还是有很多地方停留在H264的。

其实现在CPU的性能已经很强,x264的优化基本也已经到达顶峰了,全软能达到10.21倍的速度。为什么说已经到顶了呢?

因为纯CPU工作已经比QSV要快了。这其中当然有利用率的问题,纯CPU的话,CPU是满的,而使用QSV之后,无法满载。但是刚才也谈到过了,目前并没有靠谱的方案,能稳定把CPU软和核显、独显同时吃满,所以也只能这样了。

当然,独显压制的速度仍然是最快的,CPU软解达到了15.91倍,QSV辅助解码则是最快的18.66倍。

用问答的方式总结一下:

Q1:什么方案最快?

A:独显编码,QSV解码。

Q2:H265目前实用吗?

A:我已经用H265实时录制了好几年的视频,目前无论是速度还是质量都完全没有问题。你唯一该担心的是兼容性,毕竟有的地方不支持H265。

Q3:我不玩游戏,还需要买独显吗?

A:我个人觉得,不管你玩不玩游戏,都值得买一张独显。要玩游戏自然不用说,如果不玩游戏,说明你是用作生产力工具。既然用作生产力工具,我怎么反而觉得更应该买了……

Q4:多买一块独显感觉性价比有些低?

A:就凭1.2-1.8倍的干活速度,我就觉得值。而且一台电脑的配置是一个整体,不能脱离其他硬件单独拿出来看。更何况,你还可以拿来玩游戏不是~

Q5:那我还可以让独显发挥其他作用吗?

A:现在很多软件都支持显卡加速,比如非线编软件,AE、PR、VEGAS、EDIUS、达芬奇等,还有我没咋用过的那些建模、渲染工具。就算是Photoshop,都支持显卡加速。这些加速在日常使用中,可能不会有像视频编码那么明显的体验上的区别,但它们确实在节省着你的时间。时间就是金钱呀。事实上,2020年传出了一个不怎么引人注目的消息:NVIDIA放弃了Quadro丽台这个品牌,最普遍的说法就是,现在图形卡和专业计算卡的界限已经逐渐模糊。

Q6:怎么没有汇总图表?

A:懒。

今天的分享就到这里,感谢大家观看,如果想了解其他内容的话,点赞关注留个言呗?我们下期再见。

显卡大战CPU!视频编码谁更强,超详细测试   
广告声明:文中若存在对外跳转的链接(涵盖商品链接、超链接、二维码等各类形式),其目的在于为您呈上更多与内容相关的产品信息,助您迅速甄别。但我们不对其做任何明示或暗示的保证,烦请您谨慎参考,依据自身的需求与判断来做出决策。
网友评论