自去年11月推出以来,我们一直对Intel的oneAPI(一个旨在从开发AI和其他以数据为中心的代码的任务中抽象出硬件的开发平台)非常感兴趣。本周,英特尔和海德堡大学计算中心(URZ)宣布了一个新的卓越学术中心(CoE),该中心将支持并在oneAPI平台上进行研究。
英特尔自己宣布oneAPI规范达到1.0状态之后,立即进行了新的合作。1.0里程碑意义重大,因为它使合作者能够专注于使硬件适应标准的固定实现,而不必担心规范本身会在他们的脚下快速变化。
URZ自己宣布的oneAPI卓越中心首先要重申oneAPI本身存在的理由:
URZ将把研究和编程工作的重点放在基本的高性能计算(HPC)挑战上,现代计算机利用不同类型的硬件进行不同的计算。加速器,包括图形处理单元(GPU)和现场可编程门阵列(FPGA),与通用计算处理器(CPU)结合使用。使用不同类型的硬件可使计算机变得非常强大,并为各种情况和工作负载提供多功能性。但是,硬件的异构性使这些计算机的软件开发复杂化,尤其是当同时使用来自各种供应商的专用组件时。
造成这种复杂情况的主要原因之一是,许多加速的计算体系结构都需要自己的编程模型。因此,软件开发人员需要为异构系统中的每个处理单元学习和使用不同的(有时是专有的)语言,这增加了复杂性并限制了灵活性。
oneAP的跨体系结构语言Data Parallel C ++(DPC ++)基于Khronos Groups的C ++异构编程的SYCL标准,通过其单一,统一的开放式开发模型来克服这些挑战,以实现高性能和生产性异构编程以及跨供应商支持。
URZ在oneAPI标准方面的合作看起来将是朝着实现英特尔关于oneAPI将涉及所有硬件而不仅仅是英特尔的硬件的承诺的良好开端。开发工作将由Aksel Alpay领导,他专门试图将AMD(Radeon)GPU支持添加到oneAPI。
hipSYCL是更广泛的SYCL硬件抽象生态系统的一部分,它针对CPU和GPU等与供应商无关的,接近本地的性能。
Enlarge / hipSYCL是更广泛的SYCL硬件抽象生态系统的一部分,其目标是在CPU和GPU上均达到与供应商无关的近乎本机的性能。
Aksel Alpay(BSD 2子句许可)
要完全理解这一点,我们需要更深入地研究oneAPI的基础技术。OneAPI建立在Intel数据并行C ++(DPC ++)之上,后者本身是在C ++和Khronos SYCL 代码抽象层标准之上构建的。Alpay本人是 SYCL标准的hipSYCL实现的创始人,他的工作已经明确支持多个CPU,通过CUDA的Nvidia GPU和通过ROCm的AMD GPU 。
新的oneAPI卓越中心将采用Alpay(及其他)来增加DPC ++功能和对hipSYCL的支持,hipSYCL已经本地支持Intel和AMD CPU,Nvidia GPU和AMD(Radeon)GPU。URZ的研究人员和开发人员将可以使用“国际专家网络”,其中包括Intel以及其他学术和政府机构的专家。
这是海德堡大学首席信息官兼URZ董事总经理Vincent Heuveline教授所说的:
对于科学计算中心而言,要获得这种专业知识水平并与全球合作伙伴一起以开放标准开展合作,是一个美好的前景。
英特尔在GPU市场的竞争始于Tiger Lake板载显卡
该大学的工作有助于实现英特尔自第一天以来就做出的承诺,即成为API的有效供应商中立的,跨硬件平台的努力,并且可能并非偶然地打破了英伟达在GPU加速器中享有的几乎垄断地位多年学习生态系统。打破这种 事实上的垄断将有利于英特尔自己的新的和正在崛起的Xe Graphics平台,以及AMD自己的Radeon,Radeon到目前为止在很大程度上仅限于“传统”图形和游戏用途。