Quantcast
Channel: 英特尔开发人员专区文章
Viewing all articles
Browse latest Browse all 583

基于全新的英特尔® 酷睿™ i9 处理器的系统以卓越的原始计算性能支持极限大型任务处理

$
0
0

最早的计算机即使在执行简单任务时也通常被推至性能极限,在疯狂地锤击硬盘、更换内存和处理计算之间循环往复。随着 Microsoft Windows* 3.1 和后来 Windows 95 的推出,开始形成多任务处理,因为系统最终能够一次处理多个程序。现在,随着单颗 CPU 中开始采用双位数内核,“大型任务处理”的概念开始受到越来越多的关注。面向发烧友的最新产品家族为英特尔® 酷睿™ X 系列处理器家族,采用 4-18 颗内核。这些英特尔® 酷睿™ i9 处理器可同时处理多个任务 — 进入极限大型任务处理,而之前这要求使用多个完整的系统才能完成。

 Intel® Core™ i9 Processor Extreme想想同时畅玩、录制和流传输虚拟现实 (VR) 游戏所带来的挑战。游戏工作室依靠预告片激发受众对最新 VR 游戏的兴趣,但很难在 2D 视频中展现精彩的 3D 游戏体验,因为简单录制玩家的所见所闻只是完整游戏情节的一部分。有一种方法可以解决这一问题,即混合现实,首先在绿色屏幕前拍摄玩家,然后将这一视角与沉浸于虚拟世界的玩家的第三人称视角相融合。(更多有关混合显示技术的信息请参阅本篇文章。)通常要求一台 PC 畅玩和拍摄游戏,另一台 PC 采集玩家的摄像头馈入。加上另一想法,即将全时段会话现场流传输至全球满心期待的粉丝,你可能需要第三个系统来负责将输出编码成高质量的可上传格式。但英特尔团队近期证明,生产人员现在可以在基于单颗英特尔® 酷睿™ i9 处理器的系统上完成这些所有的 CPU 密集型任务,每个参与的内核都保持正常运行,物尽其用。

摩尔定律和系统规格

摩尔定律最初由英特尔联合创始人戈登 摩尔于 1965 年提出,他预测,单枚芯片上的晶体管数量每隔两年便会增加约一倍(图 1)。尽管晶体管的数量和频率有所增加,但目前通常根据可用内核的数量来 衡量原始计算性能。每个内核都可用作 CPU,并用来处理不同的任务,支持更高效的多任务处理。但简单的多任务处理开始变成极限大型任务处理,需要同时运行特意对齐的计算密集型多线程工作负载。

Moore's Law change for technology
图 1.摩尔定律体现了不断加快的技术变革(来源:time.com)

每秒浮点运算次数 (FLOPS) 的计算最初用来衡量超级计算机的性能,而现在应用于台式机游戏 PC。它们用于衡量涉及小数的数学运算,这比整数运算更难。公式为:

FLOPS =(插槽) x (每插槽内核数) x (每秒循环数) x (每循环 FLOPS)

假设一颗单路 CPU,采用 6 个内核,运行频率为 3.46 GHz,每次循环使用单精度 (8) 或双精度 (16) FLOPS。结果为 166 gigaflops(单精度)和 83 gigaflops(双精度)。对比之下,1976 年 Cray-1 超级计算机的性能仅为 160 megaflops。全新英特尔® 酷睿™ i9-7980XE 至尊版处理器的 运行频率约为 4.3 GHz(超频更快),因此计算能力可达到 1.3 teraflops。从这一方面来说,世界上最快的超级计算机运行 1065 万个内核,性能可达 124.5 petaflops。1961 年,1 gigaflop 需要花费大约 190 亿美元的硬件(相当于目前的大约 1450 亿美元)。到 2017 年,成本已降低至 3000 万美元。

为达到这种原始计算性能,英特尔® 酷睿™ i9-7980XE 至尊版处理器进行了多项技术升级。平台上多达 68 条 PCIe* 3.0 通道支持玩家通过快速的英特尔® 固态硬盘(英特尔® SSD)、多达 4 个独立 GFX 卡和超快速 Thunderbolt™ 3 技术解决方案来扩展系统。升级为英特尔® 睿频加速 Max 技术 3.0 显著提高了内核性能。英特尔® 智能高速缓存具备全新的节能特性,可根据需求动态刷新内存。英特尔® 酷睿™ X 系统处理器家族还可进行释放,从而为超频提供更多空间。全新特性包括支持内核超频、英特尔® 高级矢量扩展指令集 512(英特尔® AVX-512)比例控制(以提高稳定性),以及面向极限场景的 VccU 电压控制。与英特尔® 至尊调试实用程序 (Intel® Extreme Tuning Utility)、英特尔® Extreme Memory Profile(英特尔® XMP)等工具相结合,您可获得功能强大的套件最大限度地提升性能。

英特尔报告,相比前代英特尔® 处理器,内容创建者将体验到 20% 的VR 内容创建性能提升,以及 30% 的 4K 视频编辑速度提升(见图 2)。这意味着他们将显著缩短等待时间,而更多地专注于设计新游戏和新体验。玩家和发烧友将在游戏中体验到比前代产品提升 30% 的极限大型任务处理速度。

英特尔公司客户端计算事业部高级副总裁兼总经理 Gregory Bryant 在 2017 年台北国际电脑展表示,这一全新的处理器系将在整个生态系统中释放无限可能。“内容创作者可以拥有快速的图像渲染、视频编码、音频制作和实时预览功能,所有这些功能都可以无缝并行运行,因此可以帮助他们减少等待时间,增加创作时间。玩家可以使用支持 12K 体验的多个显示屏且最多使用四个独立显卡,畅玩其最喜欢的游戏,同时对游戏进行传输、录制和编码,并在社交媒体上共享。”

 Intel® Core™ X-series processor family partial specifications.
图 2.英特尔® 酷睿™ X系列处理器产品家族部分规格。

另外一种衡量系统性能的方法是通过 CPU 利用率,可以通过 Task Manager > Resource Monitor 了解自己的 Microsoft Windows PC 的 CPU 利用率。致力于游戏和 VR 社区的英特尔开发人员关系内容专家 Josh Bancroft 在 2017 年早期台北国际电脑展参与了英特尔® 酷睿™ 至尊版处理器的部署,并在展示 CPU 利用率的过程中帮助创造了术语“极限大型任务处理”。Bancroft 利用一台基于全新酷睿 i9 X-系列的 pC 展示绿屏 VR 混合现实演示,同时以 90 fps 的速度畅玩 VR 游戏、录制游戏播放、从独立的摄像头将玩家合并到场景之中,然后精确地组合和合成图像,并将结果现场流传输至 Twitch*。

之后,Bancroft 在洛杉矶举办的 E3 游戏展参与部署了首颗英特尔® 酷睿™ i9 至尊版,并在采用 18 个内核的系统上进行了相同的演示。他对此仍然记忆犹新:“非常高兴在基于包含 18 个内核的 i9 处理器的系统上进行全球首次公开演示。那次活动真是不可思议,有两根流着蓝色透明液体的水环,非常漂亮。”

Gregory Bryant 主持的演示非常顺利,但也充满了紧张感。Bancroft 解释说:“当你同时堆栈 4 或 5 个极限任务时,系统可能过载并导致崩溃。”当 18 个内核的表现完美,CPU 利用率图表显示了系统内部的运行情况。“当我们开始录制的时候,开始流传输的时候,当我们处理所有任务的时候,可以看到 36 张图全都飙升至超过 90% 的利用率。你可以看到所有线程都在非常努力的运行。”

演示充分说明了英特尔对 VR、PC 游戏,以及将多核处理性能集成至一款小巧的设备当中的承诺。由于 VR 要求大量资源才能正常运行,因此它最适合用来演示新系统。Bancroft 的混合现实技术支持开发人员、流媒体工作者和内容创建者制作预告片,并向人们展示 VR 体验,无需让他们佩戴头盔。最棒的是,一款新系统就可以替代之前所需的多台设备。

在独立开发人员的推广工具套件中,预告片是最重要的工具。对于开发游戏的独立开发人员来说,创建令人叹服、极具吸引力的 VR 游戏预告片具有不可或缺的重要意义。但 2G 预告片不能很好地传达 3D VR 体验,这里就需要用到混合现实技巧。位于加拿大温哥华,由夫妻档 Sarah 和 Colin Northway 运营的Northway Games* 率先尝试使用混合现实 VR,他们在基于 Unity 的游戏 Fantastic Contraption*中添加了支持代码(图 3)。能够记录玩家在有过程中的所见所闻以及它们在第三人称视角中的样子,通过传达这种体验很好地帮助推广 VR 游戏。此外,Northways 还增加了观众坐在沙发上观看游戏和大笑的镜头,以此展示了游戏的娱乐性。

Fantastic Contraption*
图 3.现在可在单台 PC 上创建和流传输混合现实预告片 — 比如Fantastic Contraption*预告片。

并未发明,只是增强

Bancroft 很快对这次在由脚手架、灯光、绿色屏幕和摄像机组成的狭窄工作室所学到混合现实单机演示表达了谢意。Northways 写了一篇博客,详细分享了所涉及的任务的 演练步骤,Bancroft 在很大程度上借鉴了这篇博客。从那之后,他和他的团队进行了许多其他的调整,全都公开开发和分享。

许多软件程序都要求强大的性能;仅仅以 90 fps 的速度玩面向 Oculus Rift* 或 HTC VIVE* 的 VR 游戏就是一项非常艰巨的任务。如果帧速率较低,玩家可能会出现头晕、呕吐和其他身体反应,因此设备必须首先具备能够畅玩游戏的卓越性能,然后才能处理更多负载。

Bancroft 喜欢使用 MixCast* 进行混合与合并,这是一款不断发展的 VR 广播和演示工具,能够简化混合现实视频的创建过程。这款工具由交互式技术领域的领导者、位于加拿大温哥华的 Blueprint Studios* 创建,用于将 MixCast VR SDK 拖放至 Unity 项目,以便最终用户实时展示他们的体验。

此外,Bancroft 还使用 Open Broadcaster Software (OBS),这是一款大多数流媒体工作者非常熟悉的免费开源软件程序,用于合并、录制和现场流传输。它可提供高性能、实时音视频捕捉和混合;面向图像掩码的视频滤波器、色彩纠正和色度键控;并支持流传输平台,比如 Twitch*、Facebook* 和 YouTube*。

淡然还有许多工具用于创建相同的最终结果,但这是当前的软件堆栈。请访问 <link to Mega-tasking step-by-step article> 查看关于 Bancroft 此次工作的完整介绍。

Jerry Makare 是英特尔® 软件 TV 视频制作人,与 Josh Bancroft 合作制作了测试极限大型任务处理的原始计算性能界限的视频。他发现使用一个强大的系统支持 VR 具备许多重要优势。他说:“能将任务分布在多个位置,尤其是渲染,非常重要。一旦开始渲染,基本上机器到最后就会报废。你没有任何办法。将大型的计算机密集型任务(比如渲染与合并)分布在多个区域为我们节省了大量的时间。”

Makare 非常渴望让基于英特尔® 酷睿™ i9 处理器的系统完成构建大规模房间的任务,使用 3D 建模程序获取有关时间节省的基准。他还希望让新系统运行一些真实应用,以便团队从中学习。

展望未来

借助如此强大的原始计算性能,用不同的方法使用这些新系统令人激动万分。玩家将获得更生动、更逼真、更真实的游戏体验。从原始 4K 镜头创建和编辑视频曾经是一项极其复杂的处理密集型任务,但现在不管是专业人员还是新手,都可以在原生 4K 中进行编辑,打造令人惊叹的视觉效果,以及编排更有深度、更玄妙的音乐。VR 技术的应用范围将越来越广,从最初的游戏到现在的虚拟演练、建造规划、城市建模和五叔的模拟场景。借助极限大型任务处理背后强大的原始计算性能,生物学、地质学、化学、医药、天文学等领域的科学家将逐步揭开更多奥秘。

其他资源


Viewing all articles
Browse latest Browse all 583

Trending Articles



<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>