大家好,我是黄昏百分百,感谢英伟达与七彩虹的联合邀请,参与到NVIDIA GeForce RTX 30系列显卡的终极旗舰,RTX 3090 Ti的首发测评,作为最强大的RTX 30系列显卡,RTX 3090 Ti到底有哪些优点,又适合哪些朋友选购呢?今天我将一一为大家解答。好了,废话不再多说,我们开车吧。
众所周知,在图灵架构的NVIDIA GeForce RTX20系列显卡中,最高端的是RTX 2080 Ti,并没有RTX 2090与RTX 2090 Ti,而RTX 3090则是安培架构的首发显卡之一,其24GB超大GDDR6X显存更是让大家眼前一亮,这并不只是一张游戏卡啊!
▲经过与英伟达官方确认,RTX 3090 Ti、RTX 3090的定位与图灵架构的TITAN RTX相同,同样具有24GB的超大显存。稍有不同的是,RTX 3090与RTX 3090 Ti被归为了NVIDIA GeForce系列,所以既是最顶配的旗舰级游戏卡,又是性能强劲的生产力工具,可以满足部分AI、数据科学、3D渲染相关的生产力软件的需求。
RTX 3090 Ti 作为NVIDIA GeForce RTX 30系列显卡的封顶之作,在详细介绍它之前,我们再来回顾一下NVIDIA GeForce RTX 30系列显卡所采用的安培架构以及英伟达同时带来的新技术吧。
▲从图灵架构开始,英伟达开始采用 流式多处理器 (Streaming Multiprocessor,SM)架构以执行光线追踪等运算工作,在图灵架构中,一个处理器被分为了4部分,每部分含有2个Turing Tensor Core,所以共有8个Turing Tensor Core。而在安培架构下,则用一个性能为Turing Tensor Core性能二倍的GA10x Tensor Core取代了两个Turing Tensor Core,所以之前8个Turing Tensor Core才能完成的工作,目前只需要4个GA10x Tensor Core就可以完成了。
另外,与图灵架构相比,GA10x SM的L1数据缓存和共享内存的组合容量增加了33%。对于图形工作负载,与图灵架构,GA10x SM 缓存分区容量增加了一倍,从32KB增加到64KB。
▲得益于芯片制程从14nm到8nm的巨大飞跃以及其他新技术的加持,在同样的实际功率下,安培架构的图形处理能力是图灵架构的1.9倍。
▲左图为第一代光线追踪技术,右图为第二代光线追踪技术。相对于第一代光线追踪技术,第二代光线追踪技术增加了时间这个自变量,从而使光线效果变得更加真实,这一点,我们从下面几张图进行详解。
▲左图为第一代光线追踪技术,右图为第二代光线追踪技术。在多重光线照射运动物体的情况下,会产生多重,暗度不一的影子,更贴近实际生活中的场景,所以画面也就变得更加的真实。
▲美剧《指定幸存者》剧照,可以看到,摩托车灯光并没有在地面上反射出清晰的影子,而是在运动的光源以及漫反射,散焦等因数等共同的作用下,形成了亮度不均,模糊的影子。这才是现实中的光线效果,游戏中的光线追踪效果越贴近这种效果,则画面效果越真实。
▲刚才说到的散焦,指的是光线经光滑金属或透明物体表面反射/折射后,产生汇聚或发散,从而形成新的光源照亮周边的其他物体,比如上图中的被打碎的玻璃瓶便是一个散焦光源。(图片出自光明记忆Benchmark)
▲左图有散焦效果,右图没有散焦效果,可以看出画面效果区别巨大。
正是由于有了如此之多的光追新技术,我们的画面才能日趋真实。
那么,光线追踪到底的实际画面到底进化到了什么地步呢?我们用一组《赛博朋克2077》游戏的实机画面来看一看:
在4K分辨率光追效果最高的情况下,游戏帧数能够稳定在60帧以上,因为这个游戏没有benchmark,所以我没有计算平均帧数,我们重点来看一看,在最新发售的大作中,光线追踪技术运用到了什么程度。
▲在汽车追逐桥段中,中间路过了一个旅馆,大家可以清楚地看到,旅馆招牌上的霓虹灯与其在车顶的反射是一一对应的,十分的真实。
▲广告牌与路灯在淋湿的马路上的光线也特别真实,给人一种电影的感觉了。
▲来一段汽车转弯的动图,随着玩家位置的改变,路边广场上的积水反射的画面也随之改变,这种游戏画面已经足以乱真了,代入感超强!
▲英伟达在RTX 30系列显卡中同时使用了GDDR6显存与全新的GDDR6X显存,以RTX 3070 Ti为分水岭,其上(包括RTX 3070 Ti)均采用了全新的4段电压的GDDR6X显存,其下则依旧采用传统两端电压的GDDR6显存。
▲左图为GDDR6显存的2段电压,右图为GDDR6X的4段电压,所以,传输同样数量的数据,GDDR6X只需要GDDR6一半的频率变动,使得其有效带宽直接翻倍。按阴阳理论来说,基本上就是由太极生两仪(0,1)的维度进化到了两仪生四象(00,01,10,11)的维度。双倍的带宽满足了诸如光线追踪,DLSS等新技术对数据传输速度极高的要求,从而使这些新技术在RTX 30系显卡上的表现要比在RTX 20系显卡上有着极大的提升,比如我马上要说的8K DLSS就是得益于GDDR6X带来的双倍带宽才能够实现的。
▲安培架构内所使用的第三代Tensor 核心支持与的TF32(Tensor Float 32)精度标准,其与FP32标准的工作方式很相近,所以无需更改代码,便可以将AI计算速度提升V100核心的20倍。与此同时,在FP64、FP16、INT8等精度标准上,安培架构的A100核心相较于V100核心均有着不同程度的提升。
▲说回DLSS,DLSS的全名是DEEP LEARNING SUPER SAMPLING(深度学习超级采样),是一种通过基于 AI 的超高分辨率重新定义实时渲染,即渲染更少的像素,然后使用 AI 构建更清晰、更高分辨率的图像的方法,可以有效的在不牺牲画质的情况下通过AI算法提升游戏的帧率表现。
而DLSS 2则在初代DLSS之上有了更大的提升,不仅在画面的细节与锐利程度上可与原生分辨率媲美,且其神经网络推理速度也是初代DLSS的一倍,采用了通用模型使得神经网络通用性变得极强,基本上可以适用于所有游戏。另外,其DLSS性能可以在不同的画质模式下选择,在性能(Performance)模式下支持4倍像素超采样(540P到1080P,720P到1440P,1080P到4K均为4倍超采样)。而如果你有8K分辨率的显示设备,则可以开启全新的“Ultra-Performance”(超高性能)模式,进而获得高达 9 倍的 AI 超分辨率(1440p 到 8K)。
▲因为我并没有8K显示设备,所以这里只能用英伟达官方图进行8K游戏画质的比较,根据官方证实,8K DLSS下的画质会介于4K原生分辨率与8K原生分辨率之间,所以应该是最好的画质了,当然,为了享受这个画质,你得有一台8K显示设备哈哈哈。
▲除了在RTX 30系列与RTX 20系列下大显神威,英伟达还在新驱动中提供了NVIDIA Image Scaling (游戏分辨率缩放和锐化算法)功能,并支持所有GeForce GTX 900 系列及以上的所有GPU。
刚才在GDDR6X部分已经讨论到了,数据的传输速度是图像非常重要的部分,甚至可以说是重中之重,这里介绍一下NVIDIA IO技术相较于传统的数据传输模式的区别,以及其优势。
▲先说一下传统的数据传输模式,数据首先从硬盘中读取,途径NIC通过PCIe总线传输到CPU后再传输到系统内存中(RAM),然后再通过PCIe总线传输到显存中。整个数据的传输途径了硬盘,CPU,系统内存,显存4部分。所以除了硬盘读取速度之外,系统内存的容量和频率也都会对数据传输有影响,在传统数据传输模式下,最大的数据传输带宽大概为7GB/s。
▲那么,如果通过CPU对内存中的数据进行压缩,再将数据传输到显存中,是不是传输速率就可以提升了呢?理论上这个是可行的,也是目前多数游戏运行所使用的方式。但是,现在NVMe固态硬盘的已经非常高了,压缩7GB/s数据就需要24核心的CPU,这比AMD的3960X的核心数都多,可以说,一向被说性能过剩的CPU在压缩数据的任务中却成为了整个工作的性能瓶颈。
▲既然CPU和系统内存容易出问题,而且问题又不好解决,所以,最好的办法,自然就是解决掉提出问题的人啦。在新应用的NVIDIA IO技术中,数据从硬盘中被读取之后,直接走PCIe通道,经过GPU进入显存,这样,就无需担心CPU与系统内存的性能了,可以轻松跑满14GB/s的带宽。
▲在RTX IO的加持下,读取速度可以达到CPU压缩传输方式速度的三倍以上。
▲刚才已经说过,传统加载模式下,游戏的数据是从CPU传输到显存中的,而CPU单次向显存传输数据的大小被限制为了256MB,数据量超过这个体积就需要多次传输,电脑的内存则成为了剩余数据的缓冲区。由于游戏越做越大,庞大的数据使得CPU与显存的数据交换次数也越来越多,不仅使得整体运算效率低,还给了内存非常大的存储压力。
而Resizable BAR 技术让则可以使数据以整体方式进行传输,PCIE4.0的超大带宽也让电脑可以同时进行传输多个数据请求。据NIVIDIA的官方数据,Resizable BAR 技术可以使某些游戏有着10%的帧数提升,这要比显卡核心超频什么的来的更加立竿见影。
NVIDIA REFLEX 低延迟技术主要分为NVIDIA REFLEX SDK与NVIDIA Reflex延迟分析器,其中NVIDIA Reflex延迟分析器涉及到了外设、显示器等其它硬件,本文不做涉及,近介绍一下NVIDIA REFLEX SDK。
▲在传统的图像处理流程中,如果CPU 处理帧的速度快于 GPU 渲染帧的速度(高U低显),则会在CPU到GPU之间有一个等待渲染帧的队列,进而导致渲染延迟的增加。
▲而通过将NVIDIA REFLEX SDK直接集成到游戏中,就可以使CPU的帧处理速度与GPU的渲染速度保持同步,大幅降低渲染队列,并降低CPU背压,进而使游戏能够采样键鼠等外设最新的输入。最终降低画面与输入延迟,提高游戏体验。
▲七彩虹iGame GeForce RTX 3090 Ti Vulcan OC的外观与同系列的其他显卡一样的棱角分明,带有非常明显的赛博朋克元素。最新的施剑者(SWORIZER)散热器3.0更是配备了3把13片扇叶的“捕风手”风扇,将气旋压入散热器内实现风压及进风量的进一步提升,同时给人以非常霸气的感觉。而其LCD侧显示屏也比前代有了大幅升级,分辨率提升到了480*128px,屏幕变得更加清晰,更重要的是,显示屏也调整为了翻转式的,无论显卡是横插还是竖插,显示屏都可以正对着用户视角,可以说同样是一个很大的进步。
▲而七彩虹iGame GeForce RTX 3090 Ti Vulcan OC的背板则与七彩虹其它的RTX30系iGame Vulcan显卡略有不同,有镂空的散热孔,所以其即使在同系列显卡中也具有很容易辨别的特征。
▲视频输出接口方面同样是3个DP 1.4与一个HDMI 接口,在七彩虹的一键切换BIOS的超频按钮做工则明显有所改良。
▲供电方面,RTX 3090 Ti在供电上也正式改为了新的12+4 Pin接口。
▲当然,七彩虹也考虑到很多朋友的电源并没有带全新的12 Pin供电线,所以提供了3x8pin转新12Pin的转换线,所以大家无需担心自己的电源并不支持新显卡了。
前面已经说过,RTX 3090 Ti的定位与TITAN RTX相似,是能够胜任生产力工具这个角色的,这里我们比较一下RTX 3090 Ti、TITAN RTX两张生产力显卡以及NVIDIA GeForce RTX 30系列首发的旗舰游戏显卡RTX 3080(RTX 3080将用于性能对比测评),共三张卡的参数,以更好的为大家解释为了RTX 3090 Ti、RTX 3090与TITAN RTX定位是生产力工具,而RTX 3080、RTX 3080 Ti的定位则是顶级游戏卡吧。
▲得益于新一代的安培架构,RTX 3090 Ti与RTX 3080在规格上都超过了使用图灵架构的TITAN RTX。在显存上,虽然TITAN RTX与RTX 3090 Ti均为24GB显存容量,不过因为RTX 3090 Ti使用的是全新的GDDR6X显存,所以其显存带宽高达1008 GB/s,约为TITAN RTX 672 GB/s显存带宽的1.5倍。除此之外,在CUDA数量上,RTX 3090 Ti更是TITAN RTX的2.3倍。所以RTX 3090 Ti是性能全面超越TITAN RTX的生产力工具级的显卡。
甚至即使是RTX 3080,在CUDA数量与显存带宽上也超越了TITAN RTX,只不过因为其只有10GB-12GB的显存容量,所以在3D渲染、训练深度学习模型、8K视频剪辑等生产力应用时有着爆显存的风险,因此其定位才是顶级游戏显卡,而非生产力工具。
因为我手中并没有TITAN RTX,所以本次测试,我将会使用RTX 3090 Ti与RTX 3080 10G做对比测评,让大家看看,生产力工具与顶级游戏卡,在生产力方面的差距到底有多大。
前面已经说过,RTX 3090 Ti的定位与TITAN RTX相似,是能够胜任生产力工具这个角色的,这里我们比较一下RTX 3090 Ti、TITAN RTX两张生产力显卡以及NVIDIA GeForce RTX 30系列首发的旗舰游戏显卡RTX 3080(RTX 3080将用于性能对比测评),共三张卡的参数,以更好的为大家解释为了RTX 3090 Ti、RTX 3090与TITAN RTX定位是生产力工具,而RTX 3080、RTX 3080 Ti的定位则是顶级游戏卡吧。
▲得益于新一代的安培架构,RTX 3090 Ti与RTX 3080在规格上都超过了使用图灵架构的TITAN RTX。在显存上,虽然TITAN RTX与RTX 3090 Ti均为24GB显存容量,不过因为RTX 3090 Ti使用的是全新的GDDR6X显存,所以其显存带宽高达1008 GB/s,约为TITAN RTX 672 GB/s显存带宽的1.5倍。除此之外,在CUDA数量上,RTX 3090 Ti更是TITAN RTX的2.3倍。所以RTX 3090 Ti是性能全面超越TITAN RTX的生产力工具级的显卡。
甚至即使是RTX 3080,在CUDA数量与显存带宽上也超越了TITAN RTX,只不过因为其只有10GB-12GB的显存容量,所以在3D渲染、训练深度学习模型、8K视频剪辑等生产力应用时有着爆显存的风险,因此其定位才是顶级游戏显卡,而非生产力工具。
因为我手中并没有TITAN RTX,所以本次测试,我将会使用RTX 3090 Ti与RTX 3080 10G做对比测评,让大家看看,生产力工具与顶级游戏卡,在生产力方面的差距到底有多大。
Octane Render是世界上最快的、内置 RTX 光线追踪与GPU 硬件加速的 GPU 渲染引擎。
▲本次测试使用的是多人头渲染工程文件,其仅文件大小便10.6GB,本次将分别测试两块显卡的渲染速度。
▲在同时渲染两个人头的时候,RTX 3090 Ti与RTX 3080 10G均完成了渲染
▲RTX 3080 10G用时42秒而RTX 3090 Ti仅用时12秒,速度差异中有两张显卡的CUDA数目擦差异的原因,而另外一个重要原因则是RTX 3080 10G借用了系统内存,要知道,GDDR6X显存的速度要远远高过电脑内存,借用系统内存会大幅降低渲染效率
▲而RTX 3090 Ti也顺利的完成了4人头同时渲染,用时17秒。
▲在测试过程中,RTX 3090 Ti依旧不需要借用系统内存,24GB大容量显存在生产力方面优势可见一斑。
▲为什么没有RTX 3080同时渲染4人头的结果?因为它同时渲染3个人头就爆显存严重崩溃了,10GB显存在生产力方面果然有些吃紧呢。
▲达芬奇 DaVinci Resolve 是一款非常有名的视频编辑、特效软件,本次使用达芬奇 DaVinci Resolve 17对8K分辨率下的RAW格式视频进行特效调整。
▲调整特效参数如上。
▲RTX 3080 10G因为显存爆了直接罢工,可见其很难胜任8K视频的编辑、特效工作。
▲而同样的参数下,RTX 3090 Ti虽然显存被占满了甚至借用了部分内存,不过却可以稳定的提出特效与其预览,可见RTX 3090 Ti已经能够挤入8K视频编辑用生产力工具的行列了。
▲Blender是一款开源 3D 创建套件。它支持3D 建模、动画、视频编辑等诸多功能,同时支持NVIDIA RTX 渲染OptiX AI 降噪。因为模型会储存在显卡的显存中,所以大容量显存对于Blender用户来说十分重要。
▲首先使用的是Droid_Chase_LFB.blend 无人机3D录像渲染测试,两块显卡测试时均开启了GPU渲染与OptiX降噪。
▲整个过程中会同时进行光线追踪与动态模糊渲染,并同时进行OptiX降噪,左图为过程开始时,右图则为渲染完成后。
▲经测试,RTX 3090Ti相较于RTX 3080 10G无论在第一人称视角渲染还是3D视角渲染上的速度上都有所提升,尤其是3D视角渲染由RTX 3080 10G的5分钟提升到了RTX 3090 Ti的1分45秒,节约了65%的时间,由此可见设备的提升,对数字内容创作生产力的提高是是多么的立竿见影。
▲而在进行 Junk Shop光线追踪渲染测试时,RTX 3090 Ti与RTX 3080 10G都成功的生成了预览。
▲不过在实际渲染输出时,RTX 3080 10G直接因为显存爆了而渲染失败。
▲而RTX 3090Ti则没有爆显存的风险,并在8.62秒后顺利的渲染出了图像。
▲NVIDIA OMNIVERSE MACHINIMA可以从游戏,素材库等资源库导入视频素材,并通过RTX渲染器进行渲染,叠加以语音自动生成面部表情技术,物理引擎计算,AI动作采集等,将素材整合成整体的画面。
▲借由实时动态光线追踪技术所渲染的图片,已经达到了乱真的程度。
▲同时,针对人物的面部动作,还可以通过导入音频进行面部细节动作的自动渲染,这样,生成视频中的人物就不会“木偶感”十足了,同时还剩下的大量的面部东西捕捉工作,让人们能够更加专注在内容本身的创作上。
▲动作捕捉,这点不用多解释了吧,很多电影和游戏,之前都是由专业人士穿着补满传感器的衣服执行那个动作,然后再进行建模,设备成本很高,而通过AI姿势估计功能,则只需要一个摄像头,成本降低明显,且修改动作也变得更加容易了。
将以上这些功能整合起来,视频爱好者就可以相对轻松的创作出属于自己的“史诗般宏伟”的视频作品了。而对于直播主等,NVIDIA BROADCAST则可以帮助他们更加轻松的进行直播。
▲NVIDIA BROADCAST通过智能降噪,虚拟背景,摄像头自动成像功能,将直播主的人像视频源直接合成到主要视频源上,达到炫酷的效果。
▲音频采集时自动降噪,AI自动采集直播主的人像部分,完全无需绿布,就可以扣去背景,再将其无缝融入到直播的视频中去。
嗯,简单总结下NVIDIA BROADCAST,它可以帮助直播主开电脑就开始工作而无需绿布背景,更省时间,更省空间。
RTX 3090 Ti与RTX 3080 10G均能够在DLSS开启的情况下运行8K游戏,那么它们在性能上有什么区别呢?带着这个疑问,我使用了3D MARK DLSS测试,此测试可以在没有8K显示设备的时候测试平台的8K游戏性能。
▲RTX 3080 10G关闭DLSS的时候根本无法运行8K游戏,所以3D MARK DLSS测试自动跳过了此部分,而在开启了DLSS超级性能模式后获取 9 倍的 AI 超分辨率后,游戏平均帧数达到了30.63帧。
▲而RTX 3090 Ti即使在不开启DLSS的情况下依旧可以输出8K游戏画面,只不过不是那么的流畅(平均帧仅8.34帧),开的DLSS 超级性能模式后则获得了37.36帧的平均帧数。
可能有朋友会问差这7帧对游戏的影响大吗?我直接拿帧数折线图为大家介绍:
▲途中箭头所在水平线为30帧刻度线,可见RTX 3080 10G在测试中有约一半的时间低于30帧,所以还是会有比较明显的帧数波动的。
▲而RTX 3090 Ti 在测试过程中基本上都在30帧以上,最低帧数也有28帧之高。
目前无论是视频信号传输线材(DP 1.4、HDMI 2.1)与8K视频输出设备都只支持到了8K分辨率 30Hz,所以我们可以说RTX 3090Ti基本可以跑满8K显示设备,是一款真正的跨时代8K游戏显卡。
比较完了两张显卡的8K游戏性能,我们再来看一看两张显卡在4K分辨率下的性能表现吧,因为时间关系,本次测试中两张显卡均处于默频模式。
首先我们进行Fire Strike Ultra测试:
▲Fire Strike 是一项适用于高性能游戏电脑和超频系统的 DirectX 11 基准测试。即使对于最新的显卡而言,Fire Strike 测试也非常严苛。而Fire Strike Ultra是其4K版本。
▲iGame GeForce RTX 3080 Vulcan OC 10G的总得分为11407分,其中显卡得分11166分,物理得分36705分,综合得分6096分。
▲iGame GeForce RTX 3090 Ti Vulcan OC的总得分13963为分,其中显卡得分13775分,物理得分35136分,综合得分7751分。
在Fire Strike Ultra中RTX 3090Ti的显卡得分13775分是 RTX 3080 10G的显卡得分11166的1.23倍。
▲3D MARK专为DirectX 12设计的Time Spy Extreme, Time Spy是一个DirectX 12 基准测试,支持原生新的API 功能,如异步计算,显式多显卡适配器技术和多线程,而其Extreme版本则是将分辨率提升至4K。
▲iGame GeForce RTX 3080 Vulcan OC 10G的总得分为8722分,其中显卡得分9096分,CPU得分7075分。
▲iGame GeForce RTX 3090 Ti Vulcan OC的总得分10318为分,其中显卡得分11228分,物理得分,CPU得分7073分。
可见在Time Spy Extreme中RTX 3090Ti的显卡得分10318分是 RTX 3080 10G的显卡得分8722的1.18倍。
▲感谢EPIC给我们送上了古墓丽影三部曲,暗影是其最后一部,且正式版已经更新了DLSS 2.0,是一个测试光线追踪与DLSS性能很好的游戏。
▲测试画质如上,分辨率为4K默认最高画质时,将光线追踪开到超高,DLSS为性能模式。
▲测试中,RTX 3090Ti平均帧数126,比RTX 3080 10G平均帧数106的高出19%。
▲《光明记忆:无限》是国内工作室的作品,在英伟达新技术的应用上可以说处于世界领先水准,同时支持第二代光追技术以及DLSS 2.0。目前,《光明记忆:无限》已经在Steam上发售,游戏很好玩,其光线追踪 BenchMark也可以在steam上免费下载了,想要试试自己显卡的朋友可以自行去下载。本次测试参数如上,4K分辨率,RTX质量极高,DLSS性能模式。
▲iGame GeForce RTX 3090Ti Vulcan OC的FPS为67,相较于iGame GeForce RTX 3080 Vulcan OC 10G的54帧提升了24%。
经过上面的比较测试我们可以得出结论,RTX 3090Ti 的4K游戏性能大概是RTX 3080 10G的1.2到1.25倍,所以它也是目前最强大的游戏卡,可以作为电竞极限玩家的大玩具。
▲为了更好的对比光线追踪技术对画面效果的提升,我使用了英伟达官方提供的图像比较分析工具NVIDIA ICAT,它简单易用,不仅可以对多张图片进行对比,甚至可以直接比较视频。所有测试图片均为左侧开启光线追踪,右侧关闭光线追踪。
▲第一款测试的是IGN得分8分的灵媒。
▲首先是效果最明显的镜面反射,主角面对镜面,在关闭光追的画面上一片雾蒙蒙,而在左侧开启光追后则可以清楚看到主角以及其背后的物件在镜子中的倒影,画面变得明显更加真实。
▲当然,光线追踪技术在细节上更是不会出问题,放在桌面上的镜子也反射了上面镜子的镜框。
▲紧接着来看一看室内光照部分,图片左半部分为光线追踪开启时,右半部分为光线追踪关闭时,我们发现书柜部分柜子玻璃右半部分上基本没有任何反射,仅有人工放置的台灯的影子,左半部分则明显有着室内陈设的倒影。
▲我们再来看陈列蝴蝶的相框玻璃,左侧开启光线追踪后窗框的反光,可以看清里面的蝴蝶,而右侧关闭光线追踪后则可以看到光线的反光。而窗外光线明明是从左侧照向右侧的,根本不可能在像框中出现反光,光线追踪技术正是通过算法还原更加真实的光照效果,进而让画面更加真实,游戏的沉浸感更强。
▲在未开启光线追踪的画面中,右侧未来是光线追踪时玻璃显得雾雾的,看不到里面的物品,而左侧开启光线追踪后玻璃后面摆放的物品清晰可见,而且其上天花板的纹路也因有光照而变得更明显了。
▲左侧开启光线追踪后地板砖纹路清晰可见,而右边则没有任何暗部细节。
▲而在几乎全暗的画面下,开启光线追踪后,陈列架玻璃依旧可以透过外面一点点的环境光反射室内的陈设,让画面显得更加压抑(恐怖游戏,就是要的这种气氛。。。)。
▲仔细看画面左侧玻璃反射的画面,同时陈列柜内的罐子中,左边同样有反光且可以清洗分辨,右边则暗部细节几乎丢失殆尽。
▲地板泛光等细节,光线追踪开启后同样很明显。
▲左右两盏台灯,左侧为光线追踪开启后,其反射了部分环境光,所以可以清晰分辨,而右侧因为没有开光线追踪所以几乎无法从图中分辨出灯泡的所在。
▲液体反光方面就显得更明显了,在未开启光线追踪的画面中,几种药液均为原有颜色,丝毫没有受到上方红光灯的影响,显得十分不自然。而在开启光线追踪后的画面中,液体则因为上方红光灯的镜面反射,原有颜色与红色混在一起,变成了类似一种漆黑的颜色,画面变得真实了很多。
第二个游戏则是《光明记忆:无限》,这是一款国内工作室的作品,在英伟达新技术的应用上可以说处于世界领先水准,同时支持第二代光追技术以及DLSS 2.0。
▲首先我们来看一看水上场景,在没有太阳的情况下,不会出现右侧那种反射,水面会像左侧那样显得比较深不见底。
▲再来看这张图,太阳刚刚升起,不过被前方建筑挡住了,无法照射到水面上,所以右侧水面的强反射是不可能出现的,考虑到光源被环境遮蔽这点正是光线追踪技术相较于传统光栅化技术最大的不同点之一。
▲背对着光的部分会稍微显暗,整个画面对比度更高,层次感更强,这也是光线追踪技术所带来的画面提升。
▲在风雨天气下,左侧水面显得波光粼粼,而右侧则古井无波,哪个更真实,相信不用我多做解释了。
另外在最后,我再用光线追踪Benchmark中的画面,为大家更详细的介绍一下光线追踪所应用的技术:
▲散焦是第二代光线追踪技术所特有的,左边无散焦,右边有散焦,可以看到士兵头盔和肩甲上的亮度截然不同,明显左边的更加真实。
▲女主角在汽车玻璃上的倒影是镜面反射,而在车漆上则是漫反射,所以倒影的清晰度截然不同,这点相信大家很容易理解。
▲多次反射的话,在生活中注意观察的朋友们也很好理解是吧?不做过多解释了。
▲面光源产生的软阴影:光栅化方法只能产生清晰的本影(左),而光追能够生成正确的半影(右),这点让我用现实中的剧照举例子。
▲现实生活中的半影:摩托车在地上和墙上产生的是半影,而不是清晰的本影(美剧《指定幸存者》剧照)。
最后再大家介绍下全局照明:
▲全局照明,通常等同于间接照明的效果,比如此图中,太阳光通过太阳能板反射到了空间站上,达到了全局照明的效果,所以基本上画面上没有任何的阴影。
▲动态全局照明,火箭助推器点燃时,宇航服和头盔上会出现反光。而助推器熄灭时则没有对应的反光。
好了,光线追踪的部分就暂时介绍到这里吧,以后有机会再为大家做详细的专题介绍。
RTX 3090 Ti既是生产力工具,又是最高端的游戏显卡。不仅能够胜任8K RAW视频加特效、3D渲染等工作,还能够流畅的在8K分辨率下游玩光追3A大作,不愧为NVIDIA RTX 30系列的巅峰之作了。
关于购买建议,个人觉得如果你手头已经有RTX 3090,那么无论当作生产力工具还是玩游戏,都可以再等等。而如果急需大显存显卡作为生产力工具的话,那么你现在入手RTX 3090 Ti要比入手RTX 3090更加划算稳妥,极限游戏爱好者钱包够深的话也可以买这个。不过如果预算有限,个人觉得入手RTX 3080Ti足以满足绝大多数的游戏场景了,
本次评测所使用的iGame GeForce RTX 3090Ti Vulcan OC,在做工和用料上可以说是整个市面上RTX 3080显卡的金字塔尖了。七彩虹作为显卡销量第一的品牌,在性能,设计,做工上一直在精益求精,比如我测试的这款iGame GeForce RTX 3090 Ti Vulcan OC相较于上代图灵架构 iGame Vulcan显卡有着明显的设计与做工的提升,无论是全新的施剑者(SWORIZER)散热器3.0散热系统还是可翻转的LCD屏幕,无一不是为了提高玩家体验而设计,在这一点上,我十分欣赏,必须要给七彩虹点一个大大的赞。目前显卡价格有所回落,刚需的朋友们可以入手了。
在文末请与许我简单介绍一下我的测试平台,供大家参考。
▲主板采用的是微星的Z690 EDGE TI DDR4 刀锋钛主板,这是微星Z690中的DDR4旗舰款,具有着超凡的CPU与内存超频能力。
▲微星Z690 EDGE TI DDR4 刀锋钛采用了16相75A CPU直连供电,还搭载了DDR4内存加速引擎,采用独立的线路设计,抗阻更低,从而保证高频信号的稳定性,内存超频能力更强。
▲CPU采用的是零元购来的12代酷睿i7-12700KF,Intel 在12代酷睿上首次使用了大小核心设计,i7-12700KF共有12个核心,其中分为8个性能核(P核)+与4个能效核(E核),其中性能核支持超线程技术,所以是一款12核20线程的处理器。
▲i7-12700KF的CPU-Z跑分,仅供参考。
▲本次内存使用的是雷克沙新推出的ARES 战神之刃内存条,其采用了特挑三星Bdie颗粒,超频能力非常强。因为本次测评有生产力部分的测试需求,所以我一次用上了4根8G的,组成了32G双通道。
▲得益于雷克沙战神之刃内存条与微星Z690 EDGE TI DDR4 刀锋钛两者的内存超频能力,直接用微星大名鼎鼎的momery try it即可轻松达到4000MHz C17,未来我还会对这款内存进行进一步的超频,尽情期待。
▲此内存的光效也特别漂亮,同时支持华硕、微星等多品牌的灯效同步软件,让RGB大幅增加电脑的性能。
▲SSD固态硬盘采用的是宏碁掠夺者 Predator的GM7000 2TB, 此前PS5新手向科普文章中使用的就是Predator GM7000,完美支持PS5主机扩容。宏碁掠夺者GM7000官方标称的读写速度分别为7400MB/s与6400MB/s,其中7400MB/s的顺序读取速度在目前的PCIe 4.0固态硬盘中属于绝对的第一匹队,放在此次测试中绝对不会成为显卡读取游戏内容的瓶颈。另外,Predator GM7000采用12nm先进制程主控,PCB布局更紧凑,并附赠定制石墨烯导热垫和金属散热马甲,能够有效降低SSD功耗及发热量,长时间测试下来也不会掉速。
▲经实测,宏碁掠夺者 Predator的GM7000顺序读取速度为7477MB/s,顺序写入速度为6661MB/s,顺序读写速度甚至超过了标称速度,绝对属于目前PCIe 4.0 SSD的第一梯队,可以保证两张显卡测试的稳定运行。
▲电源使用的是鑫谷最新出的GM1250W金牌全模组电源,其是目前少数原生支持PCIe 5.0的电脑电源。
▲GM1250W是一款全模组电源,这款电源的接口中,除了28Pin主板供电接口之外,其还提供了6组PCI-E接口,2组8Pin CPU接口,可以满足多显卡交火或双CPU服务器主板用户的供电需求;另外还有6组SATA接口,能够满足挂载N块硬盘的个人数据中心的接口需求。1250W的供电可以保证绝大多数高端硬件的供电,以确保测试过程中不会有任何电力吃紧。
▲另外,此电源PCIe接口最大单口输出600W供电,足以满足本次测试中所使用的RTX 3090Ti。另外,只要您手上有鑫谷品牌的电源,也可以联系客服免费获得全新规格的12+4Pin供电线材。
▲水冷采用的是鑫谷昆仑 KL360,其最引人瞩目的便是其采用方形设计的冷头,在市面上大多数水冷均采用圆形冷头的当下,鑫谷昆仑 KL360的识别度可以说是相当高了。
▲鑫谷昆仑 360水冷的冷头要比其它水冷冷头更高,因为其创新性的使用了风冷水冷二合一的设计,在冷头的纯铜底座上方配备了一个70mm的 PWM风扇,在为CPU提供散热的同时还可以为主板上其他芯片组提供散热。
▲经实测,在不接CPU下压风扇时,CPU供电为48.7°C,而接了CPU下压风扇后,CPU供电为38.9°C,基本上下降了10°C,内存、固态硬盘等位置也有一定程度的温度下降,可见其不止能对CPU进行散热,还可以对其周边进行散热。
▲为了配合本次两张白色显卡的测评,特选用了超频三的白色机箱神机,这是一款非常实用的ATX机箱。
▲内部设计合理。更值得一夸的是其IO接口与开机按键均位于机箱的左侧下部,我无需起身就可以进行开机、插拔设备的操作,更重要的是,我再也不用担心被我家猫按关机啦!