在今年的 GTC 大会上,Stephen Jones 强调,Python 中的 CUDA 应该保持 Python 的自然风格,让程序员们可以使用自然的 Python 接口和脚本模型,轻松创建运行在英伟达 GPU 上的 AI 程序。Jones 还指出,Python CUDA 绝不仅仅是将 C 代码转换为 Python 语法。它必须要让 Python 开发者们感到自然且亲切。
今年英伟达对 Python 的投入和接口更新,不只是开发体验上的改善,更是 NVIDIA 在构建一个更加开放、多层次开发者生态系统方面的又一次进化。
例如,CuTile 是一个比传统 CUDA 更高层级的抽象(目前还没有正式发布),虽然底层仍依赖部分 C++ 实现,但开发者所接触的接口已完全是 Python。这意味着,开发者无需直接接触 C++,即可利用这些接口进行开发。
另一个例子是新的 Python 接口版本的 Cutlass。Cutlass 原本是一个专注于 GPU 高性能矩阵运算的 C++ 库。而现在英伟达推出了一个全新的 Python 接口版本,完全不需要写 C++。开发者可以直接在 Python 里构建算子,甚至进行一些低级别的优化,同时保留原有性能。