88
NVIDIA NVLink 成就世界上最快超级电脑 崭新连接方式  较 PCIe 介面更具效率
文章索引: NVIDIA
本周美国能源署宣佈计划打造两部搭载 NVIDIA GPU 加速器的超级电脑,每秒运算速度将可达 100 petaflops , NVIDIA 并正为超级电脑开发 NVLink 技术的核心基础,以更流畅方式连接系统的 CPU 和 GPU 处理器,可较现有的数据交换速度提高 5 至 12 倍。

现今大部份最快的超级电脑均採用 GPU 加速器支援,与仅有几十个核心的 CPU 相比,单一 GPU 上搭载有数千个运算核心, GPU 可更快速处理巨量科学资料,速度约比 CPU 快 10 倍。虽然 GPU 的效能不断提升,然而传输资料到 GPU 的连接却没有跟上,现今的超级电脑透过 PCI Express 技术将 GPU 连接到 CPU 上,然而其传输速度仍然不够快。

NVIDIA 推出全球第一个高速 GPU 互联技术 NVLink ,提供更快速的替代方案。 NVLink 可让现今 GPU 和 CPU 之间的数据传输速度加快 5 至 12 倍,足以让数据流畅地由 CPU 记忆体传输至 GPU 。除此之外, NVLink 让 CPU 和 GPU 以崭新的方式连接,能够让伺服器的设计更有弹性,比 PCI Express 更具能源效率。
Linux x86 架构执行 GPU 加速应用  NVIDIA PGI 编译器登陆 IBM POWER 系统
文章索引: NVIDIA
NVIDIA 21 日宣佈针对 PGI 最佳化编译器开发加强版,更可支援採用 IBM POWER CPU 系统中执行 Linux x86 架构 GPU 加速应用。 POWER 专用的 PGI 最佳化 Fortran 、 C 和 C++ 编译器,可提供一个使用者介面、编程语言功能、平行运算编程功能,以及与 PGI Linux x86 编译器相同的最佳化功能,并具备高频宽 CAPI 连接埠和 NVLink GPU 互联功能,让开发人员可更轻鬆开发全新应用。

专为 IBM POWER 系统设计的 PGI 编译器和工具,主要用作加速器专属 OpenACC 指令,在 NVIDIA 最新的 GPU 加速器中针对 PGI 加速器原生 Fortran 2003 、 C11 和 C++11 的 OpenACC 功能提供完备支援,同时也支援统一记忆体。其 PGI CUDA Fortran 扩充功能,拥有与 Linux/x86 平台专用的 CUDA Fortran 相同的功能,为採用 GPU 加速的 POWER 系统原生 Fortran 编译器提供高灵活性和 NVIDIA CUDA 编程模式的运算威力。

加强版 PGI 编译器提供更快的 OpenMP 效能,较採用最新支援 AVX 的 Intel 和 AMD 多核心 64 位元处理器执行的 GCC 4.8 , PGI 编译器针对最新 SPEC OMP 2012 效能评测套件平均可快 75% 效能。而且 Fortran 2003 、 C11 和 C++11 编译器同样具备所有 PGI 多核心最佳化功能,包括完备的迴圈最佳化功能、记忆体层级最佳化功能、 SIMD 向量化、加入行内函式、内部程序分析和最佳化、特性分析回馈等。
多两倍效能及记忆体频宽 比 CPU 高 10 倍 NVIDIA 旗舰级 Tesla K80 双 GPU 加速器
文章索引: NVIDIA
NVIDIA 再为加速运算平台增添最新旗舰级产品,宣佈推出全新 Tesla K80 双 GPU 加速器,专为机器学习、资料分析、科学和高效能运算 (HPC) 等广泛应用而设,提供多 2 倍效能和记忆体频宽,运算效能无法比拟。

全新 Tesla K80 双 GPU 加速器是 Tesla 加速运算系列的旗舰级产品,特别针对大型科学探索和深入分析的顶尖运算平台,结合最快的 GPU 加速器、 CUDA 平行运算以及完整的软体开发者、软体商和资料中心系统 OEM 的产业体系支援。较上代 Tesla K40 GPU 加速器, Tesla K80 双 GPU 加速器可提供将近两倍的效能和双倍记忆体频宽,其效能更可比现今最快的 CPU 高 10 倍,并能在数百种複杂的数据分析和大型运算密集的科学运算应用中远胜 CPU 的运算效能。

效能方面, Tesla K80 双 GPU 加速器可透过一卡双 GPU 提供双倍传输量,内置 24GB GDDR5 记忆体,每颗 GPU 有 12GB 记忆体,比上代 Tesla K40 GPU 提供多两倍记忆体处理更大的资料集分析。 Tesla K80 支援 480GB/s 记忆体频宽,内建 4,992 CUDA 平行运算核心,可比仅用 CPU 运算提升高达 10 倍应用加速效能,加上採用动态 NVIDIA GPU Boost 技术,可根据个别应用灵活提升 GPU 时脉,而且更透过动态平行运算架构,让用家可快速分析关联式和动态的资料结构。
採用 NVIDIA Tesla  GPU + NVLink 传输介面 美国能源部打造两部旗舰超级电脑
文章索引: NVIDIA
NVIDIA 于 17 日宣佈获美国能源部採用旗下 NVIDIA Tesla GPU 加速晶片及 NVIDIA NVLink 高速 GPU 互连技术,并配合新一代 IBM POWER 伺服器,计划打造两部搭载 GPU 加速器的超级电脑,将带来比现今最快强大系统高 3 倍效能,更接近「 Exascale 」等级运算目标,并预计于 2017 年安装完毕。

超级电脑界多年来一直朝建构 「 Exascale 」系统的目标迈进,亦即每秒能进行 1 quintillion 次 、 10 亿个 10 亿或 10 的 18 次方的浮点运算,亦即 FLOPS 。一个 FLOP 相等于执行一次数学运算,像是把两个数字相乘的运算作业。新超级电脑系统象徵着 IBM 与 NVIDIA 持续合作的第一个重大里程碑,并延续先前 OpenPOWER Foundation 的基础,此开放研发团体创立宗旨为了高效能运算与企业资料中心顾客发展新一代的运算解决方案。

此项计划其中之一大进步就是採用 NVIDIA NVLink 高速 GPU 互连技术,将整合到 NVIDIA 的 GPU 以及 IBM POWER CPU ,其核心将作为新系统的动力来源。 NVLink 让 GPU 与 CPU 分享资料的速度比现今系统快 12 倍,最终让未来超级电脑的速度比目前最快系统快上 50 至 100 倍。
Nexus 9 搭载 NVIDIA Tegra K1 晶片 为 Android 平台首款 64 位元运算方案
文章索引: NVIDIA
NVIDIA 于 21 日宣佈新推出的 Google Nexus 9 平板电脑,搭载 NVIDIA 旗下 192 个核心的 Tegra K1 超级晶片, Tegra K1 更是首款针对 Android 进行设计的 ARM 处理器,令 Nexus 9 可支援所有主流绘图标准,包括新推出的 Lollipop Android Extension Pack 扩充套件,把顶级的绘图功能于 Android 平台上尽情发挥,让行动装置执行游戏的表现足以媲美 PC 与电脑游戏。

Nexus 9 平板为首款搭载最新 5.0 版 Lollipop Android 作业系统的平板电脑,採用 192 个核心的 NVIDIA Tegra K1 晶片,搭载前置立体声喇叭及 HTC 的 BoomSound 技术,提供 8.9 吋萤幕,支援 2048x1536 高解析度,配备 800 万画素主镜头与 160 万画素自拍镜头,并即将推出 LTE 版本。另外 Nexus 9 平板更可接上折疊式键盘外盖,无论在家中、办公室或外出亦能轻鬆执行输入操作。

Google Nexus 9 平板电脑
88