深智數位股份有限公司
LLM走進你的電腦 - 自己動手開發大型語言模型應用
LLM走進你的電腦 - 自己動手開發大型語言模型應用
無法載入取貨服務供應情況
出版社: 深智數位股份有限公司
作者: 張奇、桂韜、鄭銳、黃萱菁 著
譯者: 0
規格: 17x23x2
裝訂: 平裝
頁數: 408
出版日: 06/20/2024
ISBN 13 : 9786267383766
內容簡介: 本書共分四部分,第一部分詳細介紹大型語言模型的基礎理論知識,包括語言模型的定義、Transformer 結構,以及大型語言模型框架等內容,並以 LLaMA 所採用的模型結構為例的程式碼。
第二部分主要介紹預訓練的相關內容,包括在模型分散式訓練中需要掌握的資料平行、流水線並行和模型平行等技術也介紹了ZeRO 最佳化,介紹預訓練資料分佈和資料預處理,以DeepSpeed 為例,介紹大型語言模型的預訓練。
第三部分為大型語言模型在指令理解,如何在基礎模型的基礎上利用有監督微調和強化學習方法,理解指令並給出回答,包括高效微調方法、有監督微調資料構造方法、強化學習基礎和近端策略優化方法,並以 DeepSpeed-Chat和 MOSS-RLHF 為例訓練類 ChatGPT 系統。
第四部分重點介紹了大型語言模型的擴充應用和評估。包括與外部工具和知識源連接的LangChain 技術。
【本書看點】
●LLM基礎,包括GPT、Transformer、LLAMA
●常用的模型倉庫Huggingface的介紹
●LLM的預訓練資料的介紹及整理
●多GPU分散式訓練的基礎及實作
●SFT有監督微調的應用實例及基礎,包括LORA、PEFT
●強化學習在LLM中的應用,包括獎勵模型及PPO
●LLM的應用,包括COT及LLM瑞士刀LangChain
●用科學方式來評估LLM的能力
目錄:
作者簡介:
