分类: llm

llm 未读

记录在两台910B4服务器上运行 W8A8 量化的 DeepSeek-R1-0528 模型，并使用 EvalScope 做一个简单的推理性能测试，后面还有一些推理性能相关的参数介绍以及模型报错排查方法一、环境信息模型 DeepSeek-R1-0528-W8A8-MindIE 需要是W8A8量化过

llm 2025-11-11

llm 未读

使用 MindIE、vllm-ascend 推理引擎在华为昇腾910B显卡上运行 Qwen3-30B-A3B 模型，然后简单测试下推理性能一、准备 1.1 环境信息模型 Qwen3-30B-A3B MindIE 运行该模型需要至少2张卡，推荐4张服务器型号 Atlas 800I A2 1台显

llm 2025-11-04

devopsllm 未读

介绍如何在华为昇腾 910B GPU 服务器上安装驱动、固件、CANN等基础工具，NPU卡相关配置以及配置可以让容器使用GPU资源的环境配置说明：这里将 GPU 与 NPU 两个名词混用了下面的步骤是基于 Atlas 800I A2 推理服务器操作一、驱动查找固件安装需要先在服务器上安装驱

devops llm 2025-10-28