源2.0大模型适配LLaMA
北京2024年1月18日 /美通社/ -- 近日,模型源2.0开源大模型与LLaMA-Factory框架完成全面适配,适配用户通过LLaMA-Factory,模型即可快捷、适配高效地对不同参数规模的模型源2.0基础模型进行全量微调及高效微调,轻松实现专属大模型。适配
LLM(大语言模型)微调,是适配指在大模型的基础上,针对特定任务或领域进行调整和优化,模型以提升模型的适配性能和表现,有效的模型微调方案与工具也正是解决基础大模型落地私有领域的一大利器。基于开源大模型的适配微调,不仅可以提升LLM对于指令的模型遵循能力,也能通过行业知识的适配引入,来提升LLM在专业领域的模型知识和能力。
当前,业界已经基于LLM开发及实践出了众多的微调方法,如指令微调、基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback)、直接偏好优化(DPO,Direct Preference Optimization)等。以高效微调(PEFT,Parameter-Efficient Fine-Tuning)方案为例,可有效解决内存和计算资源的制约,通过LoRA、QLoRA等高效微调技术,在单张GPU上完成千亿参数的微调训练。因此,一个能够实现上述功能的简洁、高效且易用的微调框架正是开展LLM微调工作的最佳抓手。
LLaMA-Factory是零隙智能(SeamLessAI)开源的低代码大模型训练框架,旨在为开发者提供可视化训练、推理平台及一键配置模型训练。基于LLaMA-Factory, 用户可轻松选择业界最全面的微调方法和优化技术,通过使用私域数据,或是LLaMA-Factory内置的中文数据集(GPT-4优化后的alpaca中文数据集、ShareGPT数据集和llama-factory提供的模型认知数据集),对源2.0进行轻松微调,基于有限算力完成领域大模型的定制开发。实测数据显示,在一台搭载8颗GPU的主流AI服务器NF5468M7,7小时内即可实现千亿模型(Yuan2.0- 102B)的高效指令微调,10分钟即可完成Yuan2.0-2B参数的指令微调,轻松实现即调即用。
Step by Step
单机即可实现千亿参数模型微调
- Step 1: 容器化环境部署,数条指令即可轻松完成
- Step 2: 开源可商用Yuan2.0 Huggingface模型获取
- Step 3: 一键"启动"web UI服务
- Step 4: 构建LLM助手-可视化界面配置完成Yuan2.0微调
- Step 5: 搭建我们的私有LLM助手
GitHub项目地址:
https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2_llama-factory.md
相关文章
- 2023年7月10日,吉林洮南,黄德义在洮儿河畔。南方周末记者 陈佳慧/图)在吉林省洮南市瓦房镇振林村,一座已经拆除的浮桥正受到瞩目。修桥者名叫黄德义,曾经是名教师。因为私搭浮桥收费,2018年10月2025-01-17
- 让分类全环节 有人管理有人监督全市生活垃圾分类工作部署推进会召开日前,泉州市召开全市生活垃圾分类工作部署推进会,强调各级各部门要拿出攻坚克难、久久为功的精神,对照问题清单,积极寻找突破口,全力以赴完成2025-01-17
- 七、八月份,正是旅游的旺季,北京一些热门景点吸引了全国各地的游客。一些原本对公众免费开放的博物馆,却被“黄牛”炒出高价,成了他们牟利的工具。究竟怎么回事?八月初,记者连续几天登录国家博物馆的微信小程序2025-01-17
- 【建材网】今天正值夏至,进入炎炎夏日,太阳日晒强烈,建筑室内容易变得闷热,如何让建筑物“保持清凉”是建设时需要考虑的问题。一款优质的外墙保温材料,能保温隔热的同时兼具装饰功能,2025-01-17
- 2022年9月28日,沈阳的极兔速递快递员正在骑着快递车运送货物。视觉中国/图)2023年6月16日晚间,极兔速递向港交所递交了上市申请,计划募资5亿-10亿美元,最快将在年内上市。极兔速递是一家加盟2025-01-17
- 本期主持:南方周末记者 王瑭琳编辑 姚忆江校对 星歌防务俄乌边境战火蔓延,俄指责北约参与当地时间2024年8月15日,乌克兰苏梅地区,俄乌边境附近的房屋被俄罗斯空袭击中,人们用防水布盖住屋顶。视觉2025-01-17
最新评论