深智數位股份有限公司

更少GPU卻更強：LLM輕量化壓縮及加速訓練

Name: 更少GPU卻更強 ：LLM輕量化壓縮及加速訓練
Brand: 深智數位股份有限公司
Price: 279.0 HKD
Availability: InStock

更少GPU卻更強：LLM輕量化壓縮及加速訓練

HK$279

銷售額售罄

結帳時計算運費。

產品子類

數量

出版社：深智數位股份有限公司
作者：梁志遠
譯者： 0
規格： 17x23x2.70
裝訂：平裝
頁數： 552
出版日： 12/24/2025
ISBN 13 : 9786267757604
內容簡介： https://youtu.be/cszgj1MeX38

【內容特點】
★Transformer與MoE架構計算特性
★模型壓縮技術：量化、剪枝、蒸餾
★混合精度訓練與分散式訓練架構
★ONNX與TensorRT格式轉換流程
★運算圖最佳化：融合、重寫、記憶體配置
★端側學習與聯邦學習通訊機制
★IR中介表示與計算圖優化策略
★動態Batch與記憶體排程機制
★cuDNN與MKLDNN運算元庫應用
★CUDA核心函數與GPU記憶體管理
★Vulkan推理加速與圖形並行整合
★OpenCL與AVX跨平台加速
★DeepSeek-V3訓練與推理結構
★FP8精度訓練與Sigmoid路由演算法

【內容簡介】
本書從工程實作與架構設計的角度出發，系統地整理了大模型在實際部署中的資源瓶頸與解決方案。從Transformer與MoE架構切入，解析其帶來的計算與儲存壓力，並延伸至量化、剪枝、知識蒸餾等主流模型壓縮技術的原理與實作要點。書中不僅整理了各類加速方法，如混合精度訓練、分散式架構與推理引擎建構，還提供跨框架的模型格式轉換範例，涵蓋ONNX、TensorRT等工具鏈整合流程。進一步深入端側學習、IR最佳化與動態Batch記憶體管理等核心技術，並透過cuDNN、MKLDNN、CUDA與Vulkan等元件展示運算元優化的具體實作。本書最大特點是涵蓋理論與部署細節，並以DeepSeek-V3為案例展現整體技術鏈條如何協同降本增效。對於實際從事大模型研發、推理部署或系統最佳化的工程人員而言，是一本兼顧理論深度與實務操作的實用指南。

目錄：
作者簡介：

查看完整資訊

訂購須知

更少GPU卻更強 ：LLM輕量化壓縮及加速訓練

更少GPU卻更強 ：LLM輕量化壓縮及加速訓練

更少GPU卻更強：LLM輕量化壓縮及加速訓練

更少GPU卻更強：LLM輕量化壓縮及加速訓練