略過產品資訊
1 / 1

深智數位股份有限公司

LLM開源大物 - DeepSeek深入技術多模態開發

LLM開源大物 - DeepSeek深入技術多模態開發

定價 HK$279
定價 售價 HK$279
銷售額 售罄
結帳時計算運費

出版社: 深智數位股份有限公司
作者: 王曉華
譯者: 0
規格: 17x23x2.55
裝訂: 平裝
頁數: 520
出版日: 10/20/2025
ISBN 13 : 9786267757383
內容簡介: https://youtu.be/PDfNwFzQBUc

►剖析 DeepSeek 核心架構與 MLA 注意力模組
►系統講解 MoE 混合專家模型的設計與調度
►建構完整的 PyTorch 多模態開發環境
►從基礎到進階掌握自注意力與位置編碼原理
►實作自回歸架構下的文字生成與情感分類
►探討 GQA、MQA、差分注意力等調優策略
►整合 API 調用與應用場景中的任務鏈設計
►部署本地多模態模型並實作 LoRA 微調
►實戰多模態圖文問答與交叉注意力語音轉換
►實現 Token 壓縮與特徵融合技術於影像識別
►使用 VQ-VAE 與 FSQ 進行影像與語音重建
►完整開發跨平台智慧客服應用與 UI 前端整合

本書重點在於多模態大模型 DeepSeek 的核心技術架構,深入解析其高效注意力機制(如MLA、MQA、GQA)與混合專家模型(MoE)在實際應用中的設計與優化策略。內容涵蓋從PyTorch環境建置、API串接到LoRA/PEFT微調等多個開發環節,並透過情感分類、語音辨識、圖文問答、影像生成等跨模態實例,具體展示各模組在不同任務中的運行特性與效能差異。書中對於特徵融合策略、位置編碼設計、token壓縮方法等議題也有細緻探討,尤其在調優章節中,對各類注意力變種模型的適用條件與實作瓶頸提供實證分析。對於希望深入理解高性能Transformer架構、多模態任務建模及部署流程的開發者與研究者而言,本書可作為技術參考與實作指南。

目錄:
作者簡介:

查看完整資訊