ScratchLLMStepByStep

欢迎来到这套全面的从零开始编写并训练大语言模型的教程！本项目旨在为对语言模型和深度学习感兴趣的开发者提供一套系统的、易于理解的学习资源。通过本系列教程，您将逐步了解并掌握大语言模型的基本概念、核心算法及其实现细节。

本教程将会带你从分词器训练开始，一步一步编写和实现自己的attention、transformer以及gptmodel，并对这个模型进行预训练、监督微调(SFT)，最终训练出一个可以进行对话聊天的大语言模型。

💥 目标受众

本教程适合具有以下背景的读者：

具备基本的编程知识，尤其是Python
对机器学习和深度学习有一定的了解
希望深入理解语言模型的工作原理和实现方法

💥 章节结构

💥 数据集

相关训练所需数据集的下载地址。

💥 运行环境

仅是我个人的软硬件环境配置，自行酌情更改：

Ubuntu == 18.04
Python == 3.10
Pytorch == 2.4.0
CUDA == 12.1

前面编写模型结构的部分对GPU不是强依赖，后面预训练、SFT需要使用GPU进行训练，并且尽量是多块GPU（个人使用的4块24G的GPU进行训练）。

有两篇配套的环境搭建教程可以作为参考：

💥 如何开始？

克隆本项目到本地：

git clone https://github.com/golfxiao/ScratchLLMStepByStep.git

下载上面列出的依赖数据集，将notebook中用到的数据集地址修改成你本地地址
按照顺序阅读每个Notebook，并运行其中的代码。
根据需要修改和实验代码，以加深对相关概念的理解。

最后，感谢您阅读这个教程。如果觉得对您有所帮助，可以考虑送我一杯奶茶作为鼓励😊

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
bak		bak
img		img
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
SFT之分类微调.ipynb		SFT之分类微调.ipynb
SFT指令微调之数据处理.ipynb		SFT指令微调之数据处理.ipynb
SFT指令微调之训练.ipynb		SFT指令微调之训练.ipynb
attention_v1.py		attention_v1.py
pretrain_dataset.py		pretrain_dataset.py
pretrain_start.sh		pretrain_start.sh
pretrainer.py		pretrainer.py
pretrainer_single.py		pretrainer_single.py
sft_dataset.py		sft_dataset.py
trainer.py		trainer.py
transformer.py		transformer.py
分词器训练.ipynb		分词器训练.ipynb
模型推理之选词算法.ipynb		模型推理之选词算法.ipynb
模型结构之MiniGPT.ipynb		模型结构之MiniGPT.ipynb
模型结构之TransformerBlock.ipynb		模型结构之TransformerBlock.ipynb
模型结构之因果注意力.ipynb		模型结构之因果注意力.ipynb
模型结构之多头注意力.ipynb		模型结构之多头注意力.ipynb
模型结构之自注意力.ipynb		模型结构之自注意力.ipynb
模型结构之词嵌入和位置编码.ipynb		模型结构之词嵌入和位置编码.ipynb
预训练之从零起步.ipynb		预训练之从零起步.ipynb
预训练之多卡并行.ipynb		预训练之多卡并行.ipynb
预训练之运算加速.ipynb		预训练之运算加速.ipynb
预训练之高效数据加载.ipynb		预训练之高效数据加载.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ScratchLLMStepByStep

💥 目标受众

💥 章节结构

💥 数据集

💥 运行环境

💥 如何开始？

About

Releases

Packages

Languages

License

golfxiao/ScratchLLMStepByStep

Folders and files

Latest commit

History

Repository files navigation

ScratchLLMStepByStep

💥 目标受众

💥 章节结构

💥 数据集

💥 运行环境

💥 如何开始？

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages