南大团队基于华为昇腾突破 MoE 模型优化瓶颈:推理速度提升 2 倍以上,显存占用减半