深智數位股份有限公司
實用DeepSeek技術 - 開發真正可用的LLM 應用程式
實用DeepSeek技術 - 開發真正可用的LLM 應用程式
無法載入取貨服務供應情況
出版社: 深智數位股份有限公司
作者: 韓曉晨
譯者: 0
規格: 17x23x2.51
裝訂: 平裝
頁數: 512
出版日: 10/22/2025
ISBN 13 : 9786267757390
內容簡介: https://youtu.be/PHG1XsG5UZk
☆Transformer 架構與 MoE 專家路由解析
☆DeepSeek 系列模型架構與優化策略
☆FP8 混合精度與 DualPipe 平行算法實作
☆多頭注意力與跨節點通訊技術最佳化
☆程式自動生成、自動補全與偵錯技術
☆Prompt 工程與 Few-shot、Soft Prompt 設計
☆多工任務調度與跨領域特化模型應用
☆零售、製造等行業的訂製化實戰案例
☆資料構建、自監督學習與模型微調
☆DeepSeek-R1 自回歸快取與長上下文推理
☆分散式訓練與推理部署策略
☆API 呼叫設計、吞吐調校與系統整合
本書共分為十一章,涵蓋大模型核心技術與實務應用。第一章介紹大模型的演進歷程與基礎概念,說明深度學習、Transformer 與 MoE 架構的發展脈絡。第二章深入解析 DeepSeek 的核心設計,包括多頭注意力、FP8 混合精度與跨節點通訊技術。第三章建立大模型開發基礎,從 API 調用到資料準備與模型訓練。第四章聚焦對話生成與語義理解,實作多輪對話與語意分析。第五章實作從文字到程式的智慧開發流程,包含程式補全與錯誤偵測。第六章說明多工學習與跨領域應用,包括少樣本調適與領域特化。第七章系統介紹 Prompt 工程設計與調優策略。第八章探討模型最佳化與分散式部署。第九章解析資料構建與自監督學習流程。第十章展示訂製化模型開發在零售與製造業的應用案例。第十一章專章說明 DeepSeek-R1 的推理引擎與最新優化技術。全書內容完整銜接理論與實踐,適合開發者快速掌握 DeepSeek 的開發核心。
目錄:
作者簡介:
