
英伟达的cuda是什么东西? - 知乎
你平时看到的 __global__ 、 threadIdx 、 cudaMalloc,只是整个 CUDA 平台最底层的一部分,随着时间推移, CUDA 平台 的范围不断膨胀, 原先首字母缩略词所代表的字面含义,已经很难再准确描述如 …
CUDA到底是什么东西,能不能通俗易懂地解释一下? - 知乎
本人是NLP搬砖工,并不专门研究CUDA算子。我看了几个回答没看见特别通俗易懂的,所以我想尝试以一个外行人的身份给其他外行人解释。所以我主要注重懂,而不是准。 在CUDA生态的最低层就是 …
CUDA是什么?主要应用在什么地方? - 知乎
CUDA,全称 Compute Unified Device Architecture,是 NVIDIA 在 2016 年推出的一种通用并行计算平台和编程模型,它利用 NVIDIA GPU 中的并行计算引擎以比 CPU 更有效的方式解决许多复杂的计算问 …
如何系统地学习CUDA? - 知乎
于是,我决定将自己先前整理的CUDA-Learn-Notes笔记,继续扩展,经过将近一年的业余时间的努力,终于达到了我认为可以开写CUDA基础系列笔记的状态。 材料准备好了,25年继续更新笔记,保 …
CUDA到底是什么东西,能不能通俗易懂地解释一下? - 知乎
本人是NLP搬砖工,并不专门研究CUDA算子。我看了几个回答没看见特别通俗易懂的,所以我想尝试以一个外行人的身份给其他外行人解释。所以我主要注重懂,而不是准。 在CUDA生态的最低层就是 …
DeepSeek 绕开 CUDA 垄断,针对英伟达 PTX 进行优化实现最大性能, …
Feb 2, 2025 · 你以为的:DeepSeek 绕过 CUDA 使用 PTX。 实际上的:DeepSeek 通过在 CUDA 代码里塞入一堆 PTX 代码来优化 CUDA 性能,然后和其他现成 CUDA 工具链结合,在可接收的开发时 …
GPU国产化了还能用CUDA吗或者有类似的库吗? - 知乎
国产GPU厂商非常清楚,当今的AI和高性能计算(HPC)世界是建立在CUDA之上的。 如果要求所有开发者抛弃数十年积累的CUDA代码,去学习一个全新的编程语言,那将是“生态自杀”。 因此,“国产 …
如何评价 Sakana AI 推出的 AI CUDA Engineer? - 知乎
Feb 21, 2025 · 技术报告里有这么一个被优化后比compile speedup 一百多倍的下三角矩阵乘法的算子,我给看官们解析一下笑点在哪里: 在kernel里面,使用的是二维block config,分别表示矩阵的row …
5070 Ti 会成为 50 系显卡中性价比最高的吗,抛开 DLSS 能和 4080S 打 …
Feb 20, 2025 · 所以RTX5070Ti称得上是RTX50系显卡里面性价比最高的一款产品的概率非常大: RTX5080贵了2000块的基础上,首次打不过上代RTX4090,对于5070Ti的帧率优势也很有限 …
都说英伟达CUDA生态好,那么国内的GPU生态怎么样? - 知乎
3)没充分考虑GPU生态发展的时间成本 从GPU的发展历史上看,GPU也是从专用(仅显示)到通用,生态的成长是一个非常烧钱且花时间的事情,生态的成长大概以10年为基本单位,例如CUDA …