深智數位股份有限公司

LLM走進你的電腦 - 自己動手開發大型語言模型應用

Name: LLM走進你的電腦 - 自己動手開發大型語言模型應用
Brand: 深智數位股份有限公司
Price: 250.0 HKD
Availability: InStock

LLM走進你的電腦 - 自己動手開發大型語言模型應用

HK$250

銷售額售罄

結帳時計算運費。

產品子類

數量

出版社：深智數位股份有限公司
作者：張奇、桂韜、鄭銳、黃萱菁著
譯者： 0
規格： 17x23x2
裝訂：平裝
頁數： 408
出版日： 06/20/2024
ISBN 13 : 9786267383766
內容簡介：本書共分四部分，第一部分詳細介紹大型語言模型的基礎理論知識，包括語言模型的定義、Transformer 結構，以及大型語言模型框架等內容，並以 LLaMA 所採用的模型結構為例的程式碼。
第二部分主要介紹預訓練的相關內容，包括在模型分散式訓練中需要掌握的資料平行、流水線並行和模型平行等技術也介紹了ZeRO 最佳化，介紹預訓練資料分佈和資料預處理，以DeepSpeed 為例，介紹大型語言模型的預訓練。
第三部分為大型語言模型在指令理解，如何在基礎模型的基礎上利用有監督微調和強化學習方法，理解指令並給出回答，包括高效微調方法、有監督微調資料構造方法、強化學習基礎和近端策略優化方法，並以 DeepSpeed-Chat和 MOSS-RLHF 為例訓練類 ChatGPT 系統。
第四部分重點介紹了大型語言模型的擴充應用和評估。包括與外部工具和知識源連接的LangChain 技術。

【本書看點】
●LLM基礎，包括GPT、Transformer、LLAMA
●常用的模型倉庫Huggingface的介紹
●LLM的預訓練資料的介紹及整理
●多GPU分散式訓練的基礎及實作
●SFT有監督微調的應用實例及基礎，包括LORA、PEFT
●強化學習在LLM中的應用，包括獎勵模型及PPO
●LLM的應用，包括COT及LLM瑞士刀LangChain
●用科學方式來評估LLM的能力

目錄：
作者簡介：

查看完整資訊

訂購須知