《吵架机器人》-资料
训练数据生成
1:自定义(根据生活中的经验自定义数据语料)
2:爬虫抓取
3:利用现有aigc进行生成部分
大模型选择
https://arxiv.org/pdf/2305.11206.pdf lima: less is more for alignment
https://huggingface.co/datasets/GAIR/lima
https://arxiv.org/pdf/2305.15717.pdf The False Promise of Imitating Proprietary LLMs
根据这几篇论文我们得出:选择好的预训练模型 + 多样化的、高质量的数据集做微调。
less is more
LLaMA