近日,PyTorch 官方分享了如何实现无 CUDA 计算,对各个内核进行了微基准测试比较,并讨论了未来如何进一步改进 Triton 内核以缩小与 CUDA 的差距。 在做大语言模型(LLM)的训练、微调和推理时,使用英伟达的 GPU 和 CUDA 是常见的做法。在更大的机器学习编程与 ...
我们最近发布了在PyTorch生态系统中启用IBM Spyre加速器的2026年上半年路线图。在配套的技术说明中,我们介绍了该硬件的特性——32个活跃AI核心、混合精度SIMD-脉动阵列以及可编程数据流设计。 在这里,我们想详细介绍路线图的关键主题,以及我们如何在一个主要由GPU塑造的生态系统中为数据流加速器构建一流的PyTorch支持。我们的理念是生态优先——我们利用上游机制,最小化自定义代码, ...
PyTorch公开2024 H2发展路线图,增透明度。 【导读】最近,PyTorch团队首次公布了开发路线图,由内部技术文档直接修改而来,披露了这个经典开源库下一步的发展方向。 如果你在AI领域用Python开发,想必PyTorch一定是你的老朋友之一。2017年,Meta AI发布了这个机器 ...
导语:本书适用于自然语言处理(NLP)和深度学习的新手学习两个领域中的一些重要的知识点。这两个领域研究热点都呈指数增加。由于本书强调深度学习和自然语言处理中的代码实现 本书适用于自然语言处理(NLP)和深度学习的新手学习两个领域中的一些重要的知识点 ...
快科技10月31日消息,摩尔线程宣布,针对PyTorch深度学习框架的MUSA插件“Torch-MUSA”,迎来重大更新新版本v1.3.0,全面兼容PyTorch 2.2.0。 新版进一步提升了PyTorch在摩尔线程GPU MUSA架构上的模型性能与覆盖度,能更友好地支持模型迁移到摩尔线程GPU。 PyTorch是全球 ...
快科技9月25日消息,在2025年Computex大会上,AMD承诺将通过ROCm为Windows系统带来PyTorch支持,如今这一承诺终于兑现。 AMD发布了ROCm 6.4.4预览版本,为Windows系统下的Radeon RX 9000和RX 7000系列显卡以及Ryzen AI系列APU带来了PyTorch支持。 ROCm是由AMD开发的开源GPU计算生态系统 ...
AMD宣布ROCm和PyTorch支持已经开放给同是RDNA 3架构的RX 7900 XT显卡,涵盖了RDNA 3架构的所有顶级产品。 AMD上个月已经放出了Ubuntu Linux的ROCm 5.7.1驱动更新,为Radeon Pro W7900和Radeon RX 7900 XTX显卡带来了ROCm和PyTorch支持。而在12月初的AMD Advancing ...
小扎痛失老将!PyTorch创始人之一今早官宣离职,加入Meta十一年,一手打造出响彻AI界的PyTorch。如今,离职原因也很纯粹:不愿余生只与PyTorch绑定,去开启下一个新篇章。 刚刚,PyTorch创始人Soumith Chintala官宣,将于11月17日离职Meta! 原因很简单,不想一辈子搞PyTorch ...
PyTorch,这一广受欢迎的开源机器学习框架,近期正式推出了其最新版本——2.8版。此次版本更新聚焦于提升量化大语言模型(LLM)在Intel CPU上的推理性能,吸引了众多开发者和研究人员的目光。 在PyTorch 2.8中,开发者团队通过算法优化和技术革新,显著提高了 ...
有人将快速可微分排序算法打包实现,性能还不错。 谷歌去年年初在论文《Fast Differentiable Sorting and Ranking》中,重磅推出了首个具有 O(nlogn) 时间复杂度、O(n) 空间复杂度可微分排序算法,速度比现有方法快出一个数量级! 近日,有人在 GitHub 上开源了一个项目 ...
为优化复杂生物物理模型参数拟合,研究人员开发 PhoTorch 软件,高效准确,意义重大。 人工智能(AI)的进步为植物表型分析和预测建模带来了巨大益处。然而,在利用人工智能进展优化复杂生物物理模型的参数拟合方面,仍存在未被挖掘的机遇。这项研究开发 ...
在硅谷的科技版图上,一场引人瞩目的人才流动刚刚落下帷幕。曾经主导开发PyTorch框架的Soumith Chintala,在正式卸下“PyTorch之父”的头衔后,仅隔24小时便以惊人速度加入了一家名为Thinking Machines Lab(TML)的初创公司。这一举动不仅让行业震动,更被视为技术 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果