长沙本地软件开发-NVIDIA发布65个全新及更新的软件开发工具包

NVIDIA 发布了 65 个全新和更新的软件开发套件,包括库、代码示例和指南,为正在推动各种计算挑战前沿的数据科学家、研究人员、学生和开发人员带来了更好的特性和功能。

NVIDIA 创始人兼首席执行官黄仁勋在 GTC 主题演讲中宣布了这些新增功能,其中包括用于加速量子计算、送货上门算法和图神经网络挖掘的新一代 SDK。

NVIDIA 产品目录中有超过 150 个加速计算工具包,并被近 300 万 NVIDIA 开发者计划成员使用,这一数字在过去五年中增长了六倍。 CUDA(并行计算平台和编程模型)仅去年一年就被下载了 700 万次,自发布以来已下载了 3000 万次。

拓展新市场

新发布的SDK包括:

NVIDIA ReOpt:对于实时物流,它引入了先进的大规模并行算法来优化车辆路线、仓库选择和车队组成。 其动态改道功能可减少出行时间、节省燃料成本并最大限度地减少闲置时间,这将为物流和供应链行业节省数十亿美元。

cuNumeric:用于数组计算长沙本地软件开发,实现了NumPy应用程序编程接口,无需修改代码即可自动扩展到多GPU和多节点系统。 这将为使用 Python 的 2000 万数据科学家、研究人员和科学家带来巨大价值。 该工具包现已在 GitHub 和 Conda 上提供,可扩展到数千个 GPU,为 PyData 和 NumPy 生态系统创建加速计算。

cuQuantum:应用于量子计算,大大加快大型量子电路的模拟速度,让量子研究人员能够研究更广阔的算法和应用空间。开发者可以模拟分子近期突变的量子算法和纠错算法等领域可以识别和容忍错误,并加速来自 Atos、Google 和 IBM 的流行量子模拟器。

CUDA-X 加速 DGL 容器:针对图神经网络,为处理大型图 GNN 的开发人员和数据科学家提供了一种快速设置工作环境的方法。 该容器可以轻松地在结合了 DGL 和 Pytorch 的集成 GPU 加速 GNN 环境中工作。 借助 GPU 加速的 GNN,我们可以从图表中挖掘洞察,甚至是拥有近万亿条边的世界上最大的图表。 例如,Pinterest 使用具有数十亿个节点和边缘的图神经网络来了解其超过 3000 亿个 Pin 图的生态系统。 该网络基于 GPU 和各种用于模型训练和推理的优化库。

Amazon Web Services 机器学习总监 Alex Smola 表示:“我们的团队非常高兴与 NVIDIA 合作,通过用于图形构建的 RAPIDS cuDF、用于图形采样的 RAPIDS cuGraph 以及用于 GNN 的自定义计算内核来加速 DGL。源 DGL 还可以通过 Amazon NeptuneML 作为托管服务提供。”

更新的 SDK 加速应用程序开发

许多最受欢迎的 NVIDIA SDK 都得到了增强和升级,包括 Clara、DLSS、RTX、Nsight 和 Isaac 工具包。

其他更新的 SDK 包括:

RAPIDS 21.10:对于数据科学,提供时间序列数据处理和现有算法的多重加速的新功能。 自今年以来,NVIDIA 最受欢迎的 SDK 之一 RAPIDS 的下载量增长了 400%。

Deepstream 6.0:用于智能视频分析的Deepstream 6.0引入了一个新的图形合成器界面,使具有最少编码能力的用户可以使用计算机视觉,以及一个可视化拖放界面,可以实现简单直观的AI产品开发过程。

Triton 2.15、TensorRT 8.2 和 cuDNN 8.4:针对深度神经网络,为大型语言模型提供新的优化,并为梯度增强决策树和随机森林提供推理加速。

DOCA 1.2:针对数据中心网络,提供零信任安全框架,通过硬件和软件认证、线速数据加密、分布式防火墙和智能遥测来扩展威胁防护。

Merlin 0.8:用于推荐系统,具有预测用户下一步操作的新功能,需要很少或不需要用户数据,并且支持大于 GPU 内存的模型。

SDK新培训课程

据 IDC 称,全球全职开发人员的短缺预计将从 2021 年的 140 万增加到 2025 年的 400 万。这家分析公司认为,创建提供教育和赋权的基础设施是填补这一短缺的长期解决方案。

NVIDIA 深度学习培训中心的两门新课程支持并加速开发人员学习和使用 SDK长沙本地软件开发,为学院的 40 多门课程增添了新的内容。

《DPU DOCA 简介》是一门自学课程。 本课程向开发人员、研究人员和学生介绍 NVIDIA DOCA 的基本概念。 NVIDIA DOCA 是一个在 NVIDIA BlueField DPU 上加速数据中心计算的平台。

本月晚些时候推出的“构建实时视频 AI 应用程序”课程将向您展示如何使用 NVIDIA DeepStream 智能视频分析工具和 NVIDIA TAO 工具套件将原始视频数据转换为基于深度学习的实时洞察构建高性能流管道的硬件加速组件。

与新 SDK 相匹配的 NVIDIA 深度学习培训中心课程包括:

讲师指导的《加速数据科学基础知识》和自学课程《加速端到端数据科学工作流程》使用 NVIDIA RAPIDS 加速数据科学库来应用多种 GPU 加速的机器学习算法,包括 XGBoost、cuGRAPH 的单源最短路径,以及 cuML 的 KNN、DBSCAN 和逻辑回归,以便执行大规模数据分析。

“构建智能推荐系统”涵盖了 NVIDIA Merlin 和其他构建高效推荐系统的基本工具和技术,以及如何部署 GPU 加速解决方案来实现实时推荐。