DeepSeek 宣布开源 DeepGEMM 具有重要意义。DeepGEMM 是一种高效的矩阵乘法引擎,开源使其能被更广泛的研究和开发社区使用。这有助于推动深度学习领域的发展,促进不同研究团队之间的合作与交流。开源能让更多开发者基于 DeepGEMM 进行创新和改进,加速相关技术的进步。它为解决深度学习中的计算瓶颈提供了有力工具,有望在图像处理、自然语言处理等领域带来更高效的算法和应用,对整个人工智能行业的发展产生积极而深远的影响。
2月26日,DeepSeek宣布开源DeepGEMM。
DeepGEMM是一个专为简洁高效的FP8通用矩阵乘法,GEMM设计的库,具有细粒度缩放功能,如 DeepSeek-V3中所提出。它支持普通和混合专家(MoE)分组的 GEMM。该库采用CUDA编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。
(金羊网综合自澎湃新闻、潇湘晨报)