pytorch大更新，编译代码速度暴增35倍！-凯发国际娱乐官

产业

pytorch大更新，编译代码速度暴增35倍！

来源：新智元
2023-10-24 21:37

正式推出executorch。它可以让pytorch在arm、苹果和高通的处理器上运行，实现在移动端设备上大范围地部署ai工具。

新智元报道

编辑：润贝果

【新智元导读】最近，在pytorch发布会上，发布移动端pytorch凯发国际娱乐官的解决方案executorch，实现在移动端设备上大范围地部署ai工具，并推出最新版本pytorch2.1，推理速度大幅提升。

在刚刚召开的pytorch大会上，pytorch发布了一大波更新，把深度学习从业者们高兴坏了！

正式推出executorch。它可以让pytorch在arm、苹果和高通的处理器上运行，实现在移动端设备上大范围地部署ai工具。

伴随着这个更新，在可以预见的未来，手机，vr头显，汽车和可穿戴等移动设备将会全面ai化。

除此之外，pytorch还宣布，torch.compile实现了对numpy代码跟踪的支持，从而可以利用pytorch的编译器生成高效的融合矢量化代码，而无需修改原始numpy代码。

更重要的是，这次更新还允许通过在torch.device("cuda")下运行torch.compile来在cuda上执行numpy代码！

深度学习大佬sebastian也证实，这次更新后，用pytorch编译numpy代码时速度暴增35倍！激动人心！

而就在前不久，pytorch 2.1也正式发布了。

这个新版本在torch.compile、torch.distributed.checkpoint中提供自动动态形状（automatic dynamic shape）支持，可以在多个队列上并行保存/加载分布式训练作业，以及torch.compile对numpy api的支持。

此外，新版本还提供了多个性能方面的改进（例如cpu电感器改进、avx512支持、缩放点积注意力支持）以及torch.export的原型版本、健全的全图捕获机制和torch.export基于量化。

除了新品的发布，业内各路大佬都会在大会上分享关于ai模型训练，ai开源的深度见解。

executorch让ai模型部署到全平台

在这次的pytorch conference上，最重要的内容就是executorch的发布。

executorch是一个面向移动端的pytorch平台，提供基础设施来运行pytorch 程序，支持从ar/vr，可穿戴设备到标准设备上ios和android移动部署。

executorch的主要目标之一是实现pytorch程序更广泛的定制和部署功能。

官方宣称这套工具使机器学习开发人员能够用更加高效的方式对各种平台上的模型进行分析和调试。

pytorch的联合创始人soumith chintala称：

executorch让pytorch能够支持移动和其他边缘设备。它将为开发人员提供一条以前不存在的发展方向，能让这些设备进行小规模，高性能的运算，并让整个社区成员都能在这些设备上加速部署自己的程序，实在是令人兴奋！

executorch让深度学习开发人员能够以组件化的方式，在各种计算平台上从头构建自己的应用，在3个方面体现出了非常强的优势：

无与伦比的便携性

与各种计算平台兼容，从性能最强劲的手机到嵌入式系统都将获得支持。

令人赞叹的生产力

使开发人员能够使用相同的工具链和sdk，在各种平台上实现pytorch模型的设计，调试以及部署，从而大大提高生产力。

前所未有的性能表现

由于任务执行时间比较短，并且可以利用完整硬件功能（包括通用cpu和专用处理器，例如npu和dsp）和能力，最终就可以为用户提供无缝和高性能的体验。

在官方提供的demo中，我们可以看到，在移动端，可以轻松部署深度学习的视觉模型。

如下图，可以在终端对图像进行语义分割，分割的效果虽然比不上使用gpu推理的结果，但是相信随着终端硬件的发展，其图像处理效果会有进一步的提升。

meta已经对这项技术进行了验证，将其应用于最新一代vr头显quest 3当中。

在pytorch大会的主题演讲中，meta软件工程师mergen nachin 详细介绍了新的executorch技术的全部内容及其重要性。

他指出，当今的人工智能模型正在从服务器扩展到边缘设备，例如移动、ar、vr和ar耳机、可穿戴设备、嵌入式系统和微控制器。

executorch通过提供pytorch模型的端到端工作流程来交付优化的本机程序，解决了受限边缘设备的挑战。

nachin解释说，executorch从标准pytorch模块开始，但将其转换为exporter graph，然后通过进一步转换和编译来优化它以针对特定设备。

executorch的一个主要优势是可移植性，能够在移动和嵌入式设备上运行。

nachin指出，executorch还可以通过跨不同目标使用一致的api和软件开发套件来帮助提高开发人员的工作效率。

nachin表示，随着该技术现已作为pytorch基金会的一部分开源，我们的目标是帮助行业协作解决将人工智能模型部署到各种边缘设备时的碎片化问题。

meta相信executorch可以通过其优化且可移植的工作流程帮助更多组织利用设备上的人工智能。

在pytorch大会的主题演讲中，meta软件工程师mergen nachin详细介绍了新的executorch技术的全部内容及其重要性。

作为开源的pytorch项目的一部分，executorch的目标是进一步推动这项技术，让世界迎来在移动设备上进行ai推理的新时代。

numpy代码编译为c /cuda，提速35倍！

quansight工程师在pytorch 2.1中通过torch.compile实现了对numpy代码跟踪的支持。

此功能利用pytorch的编译器生成高效的融合矢量化代码，而无需修改原始numpy代码。

它还允许通过torch.device("cuda")下的torch.compile运行来在cuda上执行 numpy代码。

那么，这项更新具体有多高效呢？在x（twitter）上业界大佬sebastian进行了测试：

他在观看pytorch会议主题演讲之后，尝试了一下numpy的torch.compile。

在macbook上使用pytorch编译numpy代码时都能获得了大约35倍的加速，更别提对scikit-learn的影响了！

网友anirudh tulasi感叹道：哇，这些基准测试结果令人印象深刻！torch.compile在macbook上如此显著地提高numpy代码性能，真是令人震惊。这对scikit-learn等库的影响可能是革命性的。渴望看到更多的应用！

还有ph.d说绝对需要尝试这个功能更新。

不过，在pytorch发布会上，sabastian还发现了一个小花絮，在新版本的pytorch2.1其python占比高达47.8%，比去年版本高了9.1%。

我们知道python代码的执行效率是比c 要低很多的，然而新版本的执行速度比以前快好几倍。

一些网友表示不可思议，不敢相信自己的眼睛。

pytorch2.1发布

本月初，官方发布了pytorch2.1。

pytorch 2.1在torch.compile、torch.distributed.checkpoint中提供自动动态形状支持，用于在多个队列上并行保存/加载分布式训练作业，以及 torch.compile对numpy api的支持。

此外，此版本还提供了许多性能改进（例如cpu电感器改进、avx512支持、缩放点积注意力支持）以及torch.export的原型版本、健全的全图捕获机制和 torch.export基于量化。

除了2.1之外，官方还发布pytorc域库的一系列测试版更新，包括torchaudio和torchvision。下面是最新稳定版本和更新的列表。

地址：https://pytorch.org/blog/new-library-updates/

参考资料：

https://www.linuxfoundation.org/blog/-pytorch-conference-2023-news?hss_channel=tw-776585502606721024

pytorch大更新，编译代码速度暴增35倍！-凯发国际娱乐官

pytorch大更新，编译代码速度暴增35倍！

关键词

相关阅读

《virtual desktop》宣布将发布最新测试版本更新

vr 冒险游戏《budget cuts ultimate》发布万圣节更新“nightmare”

meta 正在调查这件事并承诺进行更新关于 quest 3 麦克风的投诉

ibm最新研发的northpole类脑芯片因能以超快速度运行ai图像识别算法

热门 vr 应用《virtual desktop》发布重大更新

热门 vr 应用《virtual desktop》发布重大更新

openai计划在下个月进行重磅更新

vr 游戏《synth riders》将在一个新更新中获得 mr 支持

openai正在更新chatgpt

steamvr 2.0 测试版更新：steamvr 2.0 之旅的开始

24快报

chao起大鲍岛，畅游元宇宙，体验里院“一天一百年”

中日韩元宇宙高尔夫跨国明星赛，打造亚洲数字竞技新高度

利亚德参展国际“声光视讯显元宇宙”全产业盛会

工商银行申请基于元宇宙的资源转移专利，提高了资源转移的效率和

重庆渝中区：数字化演绎传统经典将国风之美融入元宇宙

全球首个国家级“元宇宙”平台沙特上线主要用于在线旅游

沙特推出世界首个国家级“元宇宙”平台，用户可线上游览当地景点

《元梦之星》元宵节再上央视，星搭子们在“小小元宇宙”共庆佳节

捷安高科：为河南省元宇宙协会副会长单位及专精特新中小企业，获

乐华娱乐签约元隆雅图开展ip衍生品及元宇宙等方面合作

ude2024盛大开幕，开年首展蓄势声、光、视、讯、显、元宇宙六大

重庆：4200 亿元，支持企业研发元宇宙产品，打造特色产业园

周鸿祎：“元宇宙”概念明年可能会东山再起

借力roblox东京造本土元宇宙名片，国内文旅可以学到什么

sora“加速”元宇宙发展，sora 一站式3d数字内容创作工具，将成

北京首个元宇宙“沉浸式”红色主题教育课程开讲

何鸿婷郑一卉：对我国新闻传播学元宇宙研究的反思

sora 一站式3d数字内容创作工具,元宇宙的内容快速建构时代即将到

元宇宙的喜与忧

开启元宇宙的“钥匙”有了合肥造合肥加快打造具有国际领先优势