个人技术分享

必须记住我们学习的时间是有限的。时间有限，不只由于人生短促，更由于人事纷繁。我们就应力求把我们所有的时间用去做最有益的事情。

备案号：鄂ICP备2023027962号-1

垂域LLM训练经验之谈

文章目录

前言
一、全参 SFT
二、LORA SFT
三、LORA继续预训练
四、Llama pro 预训练 + SFT
总结

前言

本文将按以下几个部分进行叙述：

全参 SFT
Lora SFT
Lora 继续预训练
Llama pro 预训练 + SFT

数据说明：

预训练数据：由SFT数据的Query 与 Answer 的拼接
SFT数据：由GPT4根据垂域文档抽取问答对+人工挑选而来，大概20000条，其中包括公司的介绍
自我认知数据：大概200条，从公开的自我认知数据整理而来
通用数据：匠数科技大模型sft数据集

显卡
4 * A100 (40G)

训