又到周三十点了,相信不少发烧友们早已翘首以盼这一激动人心的时刻。三张RTX 40 SUPER系列的最后一张显卡,也是最好的一张:RTX 4080 SUPER终于解禁上线了。它的AI Tensor Core中有着836 AI TOPS、52 SHADER TFLOPS、121 RT TFLOP。
七彩虹也是给我们寄来了iGame水神:一款一体式水冷显卡。在显卡上装水冷确实不多见,这次就让我们一起看一下iGame GeForce RTX 4080 SUPER Neptune OC 16GB的表现到底如何。
外观:
iGame GeForce RTX 4080 SUPER Neptune OC 16GB在外形上从30系的黑色变为了白色。全身覆盖银白合金外甲,浅色的金属武装区别于前一代的黑色,更加的显眼,更能表达来自深海失落文明亚特兰蒂斯的元素。正面的圆环变成了双波浪曲线,遵循着水流的运动节奏打造全新的视觉语言。
背面的金属支架能为GPU和PCB平均压力。左侧蓝色的iGame图标呼应着亚特兰蒂斯深海的设计。
左侧不锈钢I/O面板区域,三个DP1.4a接口和一个HDMI2.1a接口。还有一个一键超频按钮。
右侧艺术字体印有水神的英文“Neptune”,颇具一番设计,也像来自亚特兰蒂斯的古文明一般。
在散热上一体式水冷的水神,对硬核玩家,超频爱好者们而言可以实现优秀的温度控制。360冷排设计,能实现高效散热。内部的水泵腔体能加速冷却液循环,提升散热效率。全覆盖铜底直触GPU热源,更利于快递导热。水冷冷头可旋转设计,装机更方便。
在iGame Centen中可以调节ARGB灯效,“波动”灯组和水排风扇都支持神光同步,我们也是调节为了象征亚特兰蒂斯大海的蓝色。
测试环境:
性能:
在参数性能上,iGame GeForce RTX 4080 SUPER Neptune OC 16GB,使用Ada Lovelace架构,核心代号AD103-400,核心工艺TSMC 4N,10240个流处理器,光栅单元112颗,纹理单元320颗,位宽256bit、带宽736GB/s,基础频率2295MHz,加速频率2550MHz,TGP功耗320W。相比RTX 4080,增加了512个CUDA核心,整体规格涨幅5.2%。
iGame GeForce RTX 4080 SUPER Neptune OC 16GB使用的NVIDIA Ada Lovelace 架构,它涵盖了如下创新技术:
(1)全新SM多单元流处理器可以提供高达2倍的性能和功耗效率。
(2)第四代张量核心(Tensor Core)能实现和加速变革性 AI技术,我们熟知的 DLSS 技术就得益于它。
(3)第三代光线追踪核心(RT Core),有着高达 2 倍的光线追踪性能,提供令人难以置信的细节,带玩家前往前所未有的虚拟世界。
(4)着色器执行重新排序(SER)将光线追踪操作提高了2倍。
(5)拥有64MB的 L2 缓存,提供更好的性能、减少内存总线流量和更高的能效。
(6)DLSS 3.5,AI 驱动图形的革命性突破,可大幅提升性能,并通过神经渲染提升光线追踪质量,带来极为逼真的画面。
(7)全新的第八代NVENC双硬件编码器,支持AV1,有效提升了生产力方面的表现,对于创作型用户、游戏主播等群体来说更是如虎添翼。
我们使用3DMark进行了几项常规测试,并与RTX 3080 Ti来进行对比。毫无疑问,4080 SUPER都是碾压的,平均涨幅超过了50%,达到了51%。仅仅是数据上就有如此大的差距,如果在游戏中进行实测,开启DLSS 3、Reflex等黑科技后,恐怕还会更加夸张。
我们使用Furmark进行十五分钟左右的烤机,显卡平均温度在59度,功率约320W,显存频率2875Mhz。
待机时显卡温度29.6度,因为有冷排的缘故功耗在39W。
NVIDIA的DLSS技术本质是通过深度学习算法将单帧的低分辨率提升成高分辨率,让游戏帧率获得大幅度提升。DLSS 3在超分辨率、DLAA的基础上增加了帧生成技术:利用AI技术生成更多的帧,以进一步提高性能。当我们在游戏中开启DLSS 3后,游戏渲染分辨率降低,运算压力也就变小了,AI就会智能的根据当前的图像以及之前渲染好的图像,自动运算构建出在高分辨率下的画面。
目前已经有超过500款游戏和应用支持NVIDIA RTX技术,RTX游戏玩家每周花费8700万小时玩光追游戏,其中97%的时间都是在玩《赛博朋克2077》.我们也期待未来有越来越多的游戏支持这项技术。
接下来是游戏测试,首先是2k和4k分辨率下的DLSS3游戏测试。2k下帧数在150帧左右,4k也是过了100,可以获相当流畅的体验了。
有些游戏暂不支持帧生成技术,例如《地铁离去》,所以只能开启DLSS 2,我们也是对DLSS 2进行了测试。4k下3A游戏开启DLSS2,除了《赛博朋克2077》外,其他游戏差不多在80帧以上的水平。
目前DLSS已经升级到了3.5,主要是针对光追游戏,增加了光线重建技术,这个AI模型可以进一步提升密集型光追游戏和应用的光线追踪图像。光线重建将此前人工设计的图形降噪器替换成了经过NVIDIA 超级计算器训练的AI网络。光线重建可以从训练数据中识别光照模式,例如全局光照或环境光遮蔽的光照模式,其最终效果比需要人工设计的降噪器更出色。
《赛博朋克2077》就是一款支持DLSS 3.5的游戏,我们开启和关闭光线重建来进行对比。这是一处水塘,正好反射出了一块霓虹广告牌,在没有开启DLSS3.5时,水面上非常模糊,几乎看不清楚广告上面的字。而开启后,则是非常清晰,游戏体验拉满。
《心灵杀手2》也支持DLSS3.5,地面上阳光照射在建筑物上的倒影,通过肉眼我们能明显的看出光线重建开关的区别。没开时,地上的阴影就是一团黑,而开启后建筑的轮廓和边缘能清晰的分辨。
现在众多游戏也都已经支持光线追踪,这能让游戏画面达到质的飞跃,但是可能会大大降低帧率。基本上在开启光线追踪后帧数下降了30%-50%。
iGame GeForce RTX 4080 SUPER Neptune OC 16GB的TGP功耗在320W。但是不同游戏的温度和功耗也会不同,就像帧率一样。我们在2k和4k分辨率下都进行了测试。2k到4k功率大约提升了30W,但是温度大约提升了1度。
NVIDIA Reflex技术普遍运用在FPS游戏上,这一技术主要是同步GPU和CPU,通过删除CPU到GPU之间的渲染队列,优化响应速度并降低系统延迟。它包含两项技术:一项是 Reflex 低延迟模式,用于缩短游戏中的系统延迟,以帮助玩家提升竞技表现;另一项是Reflex 分析器,用于轻松快速地测量系统延迟。
我们可以在FPS游戏内将NVIDIA Reflex设置为开启+增强,我们也是选择了几款热门FPS游戏如《Apex英雄》,《无畏契约》在2k和4k下都进行了测试。
除了游戏方面,在STUDIO创作,SUPER系列也迎来了重大提升。NVIDIA STUDIO可为有110多款应用加速,iGame GeForce RTX 4080 SUPER Neptune OC 16GB在3D渲染方面可以缩短渲染时间,DLSS功能的加入也能提升画面帧数;支持AV1解码器可以增加视频清晰度;还有比如超分图片的全新生成式AI软件的加入。
使用Blender Open Data benchmark进行测试,它会自动渲染官方支持的Blender基准测试场景,并显示其渲染时间。他有三项测试,monster,junkshop和classroom,成绩分别为4509,2108,2189个样本每分钟。
OctaneRender是一个公正且准确的 GPU 渲染引擎,能够利用NVIDIA的CUDA和RTX系列GPU为创作者提供快速、高质量的渲染输出。OctaneRender可用于所有创作3D软件。该基准测试将测量 4 个单独场景的渲染性能,每个场景使用 3 个不同的OctaneRender、Info Channels、Direct Lighting和Path Tracing 中的渲染选项,默认状态下为开启光追得分975.83,关闭光追后,得分732.80。
GeForce RTX 40系列GPU使用第八代NVENC为AV1视频编码器提供硬件加速编码功能。AV1与H.265/H.264在相同的比特率下可以提供更好的视觉质量,在画面质量相同的情况下使用AV1,比特率会更低,文件大小更小,视频上传更快。除了添加AV1编码支持外,40系列GPU还具有生成改进功能用于H.265(HEVC)编码的NVENC。
在剪映专业版上已经支持AV1编解码器加速。我们尝试渲染导出了4k30帧,时长为10分钟的视频,来对比AV1和H.264。AV1编码导出视频的大小在1.52GB,而H.264编码导出视频的大小则是1.98GB。
在观看直播时也有AV1和H.264两种编解码器,在4k 60fps、10 Mbps体验一下两者的视觉质量。不难看出AV1下观看直播,视频会高清非常多,H.264则模糊不清。
ON1 Resize A是图片无损放大软件软件,搭载最先进的神经网络和领先的AI人工智能技术以及全新的超分辨率技术。原本一张6M的照片在放大后变成了30M,下图是我们将两张图片放大3倍,可以直观的图像并没有任何失真,色彩过渡自然,根本看不出这是经过放大过后的图片。
D5渲染器是一款基于实时光线追踪技术的3D渲染软件,支持多种模型、材质和光源。它也融合了最新的 NVIDIA DLSS 3.5技术,例如DLSS光线重建以及现有的DLSS技术,例如DLSS超分辨率,以及DLSS帧生成。
我们渲染了一段视频并通过开启或关闭DLSS来观察帧率的变化。在开启DLSS后平均帧率翻了将近2.5倍,1%low帧与平均帧的差值也减少了。
接下来我们再来看一下开启或者关闭光线重建画面会有什么样的变化。第一张椅子脚的照片,可以看到关闭光线重建,噪点肉眼可见。第二张是桌子对窗外景色的反射,光线重建未开启时噪点依旧非常明显,而且画面比较模糊。反观两幅图在开启光线重建后噪点大幅度减少了画面也清晰了。
RTX VSR是一种AI技术用于提升视频播放质量上,在NVIDIA控制面板中,我们可以打开RTX视频增强,同时也有自动、1、2、3、4五个挡位可以调节。1是最低,4是最高。
我们观看了一段视频从关闭,质量1,质量3,三个挡位来对比画面质量,肉眼就能非常直观的发现,从充满像素颗粒到清晰。
Stable Diffusion是一个基于图像的AI模型,使用户能轻松地将文本描述转换为复杂的视觉表现。Stable Diffusion AI模型利用GPU加速优势,使创作者能进行快速创建和完善,以获得理想输出,其速度比在CPU上处理AI模型快数百倍。
在1024×1024图像数据上运行SDXL模型并开启TRT加速,耗时82秒,经计算得出每分钟7.6张图片。关闭TRT加速,耗时150秒,每分钟4张图片。
在512×512图像数据上运行SD1.5模型并开启TRT加速,耗时约17秒,经计算得出每分钟33张图片。关闭TRT加速后,耗时37秒,每分钟16张图片。慢了将近一倍的时间。
仅在SD1.5模型下使用更高批量大小来测试TRT性能,在512×512图像下,耗时60秒,每分钟可生成20张图片。在768×768图像下,耗时177秒,每分钟可生成7张图片。
在SD测试上,两种模型在开启TRT加速后,每分钟生成的图片都翻了一倍。RTX 4080 SUPER上拥有着SUPER GPU中最多的AI Tensor Core,全新的生成式AI,将AI应用的浪潮推向了PC,也将这张显卡的受众拓展到了更加广泛的领域,建模师,剪辑等职业都非常适合。
总结:
iGame GeForce RTX 4080 SUPER Neptune OC 16GB不愧是超快的生成式AI,在生产力和游戏上的提升还是很明显的。4k下轻松100帧。水神的一体式水冷设计,相比一般显卡的风冷在散热上大约能降低两度。和4080相比,性能提升了5.2%,但是价格却要便宜,突出一个加量不加价。如果有更换显卡的需求,游戏发烧友、艺术工作者、视频剪辑等都可以选择4080S。
目前,iGame GeForce RTX 4080 SUPER Neptune OC 16GB已在七彩虹官网商城、京东、天猫、拼多多、抖音等电商平台及全国授权零售经销渠道同步开售。除了本次评测款,七彩虹还同时准备了iGame Vulcan、Advanced、Ultra及「甲辰智龙」龙年定制版 等多个不同系列的GeForce RTX 4080 SUPER显卡供用户选购,售价8099元起。
以上攻略内容的扩展关键词有:亚特兰蒂斯,iGame,技术,评测,核心,性能,游戏,光线,支持,Core,亚特兰蒂斯,4k,游戏,光线,显卡。希望对您有所帮助!