会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 phi-3安装指南:如何在 MacBook Pro 上微调 phi-3!

phi-3安装指南:如何在 MacBook Pro 上微调 phi-3

时间:2024-07-02 04:11:55 来源:带水拖泥网 作者:自媒体 阅读:701次

phi-3安装指南:如何在 MacBook Pro 上微调 phi-3

CSS站长资源(ChinaZ.com) 4月25日 消息:博主Abhishek Thakur在博客中向大家展示了如何在 MacBook Pro 上训练/微调 Microsoft 的南何最新 phi-3模型!用户需要使用 M1或 M2mac 来执行此操作。之后将使用 AutoTrain Advanced来微调 phi-3。上微

要安装 AutoTrain Advanced,南何您可以执行以下操作:

$pipinstallautotrain-advanced

注意:autotrain不安装pytorch、上微torchvision等,南何所以需要自己安装。上微您可以创建 conda 环境并安装这些依赖项:

$condacreate-nautotrainpython=3.10

完成后,南何您可以在 Mac 计算机上使用 AutoTrain CLI 或 UI!我们将看看两者!

AutoTrain 不仅提供 LLM 微调,上微还提供许多其他任务,南何例如文本分类、上微图像分类、南何dreambooth lora 等。上微但在这篇博文中,南何我们正在研究 LLM 微调。上微

您可以通过执行以下操作来查看可以调整 llm 微调的南何所有参数

$autotrainllm--help

下一步是抓取数据。在这篇博客中,我将向您展示如何在 MacBook 上通过 SFT 训练和 ORPO 调整(DPO 的大而小的兄弟)进行训练。

  • 对于 SFT 训练,我们需要一个具有单个文本列的数据集。我们可以使用timdettmers/openassistant-guanaco或 alpaca 之类的数据集。注意:这些数据集已经格式化为带有系统提示、用户指令和辅助消息的文本。如果它们的格式如下:
[{ "content":"Definition:Inthistask,youneedtocountthenumberofvowels(letters'a','e','i','o','u')/consonants(alllettersotherthanvowels)inthegivensentence.\nInput:Sentence:'abaseballplayerisinhishittingstanceasafewpeoplewatch'.Countthenumberofconsonantsinthegivensentence.\nOutput:","role":"user"},{ "content":"32","role":"assistant"}]

您可以使用 AutoTrain 的 chat-template 参数。我们将在本文后面看到它,但用于 ORPO 培训。因此,我们将介绍使用预格式化数据集进行 SFT 训练,并使用聊天模板进行 ORPO 训练。

  • 对于 ORPO 训练,您可以使用argilla/distilabel-capybara-dpo-7k-binarized等数据集。该数据集有很多列,但我们只对chosen&列感兴趣rejected。

使用 AutoTrain,仅创建或查找数据集将是最耗时的部分。现在,当我们拥有数据集时,我们可以使用以下方法进行 SFT 训练:

autotrainllm\

其中 $HF_TOKEN 是您的拥抱面部写入令牌,以防您希望将经过训练的模型推送到拥抱面部中心以方便部署和共享。您可以在这里找到您的代币。

请注意,我们使用的是 lora,这就是我们有--peft参数的原因。另外,如果text您的数据集中未调用文本列,您可以添加另一个参数--text-column your_datasets_text_column。如果您想使用自己的 CSV/JSON 文件而不是拥抱面部中心数据集,您可以将其命名为 train.csv / train.jsonl 并将其放置在本地文件夹中。训练命令将略有变化:

autotrainllm\

接下来,我们来进行orpo培训。对于 orpo 训练,我们更改--trainer sft为--trainer orpo.

autotrainllm\

以上有4处变化。只有列映射发生了变化,训练器,当然还有数据集。另一项主要变化是--chat-template设置为 的参数的使用chatml。对于--chat-template,选项有:zephyr、chatml或tokenizer无。如果您已经像我们在 SFT 训练中那样自行正确格式化了数据,则不会使用任何内容。

现在,如果 CLI 对您来说太难了,您还可以使用 UI!这更容易,并且还允许您上传文件。

要使用用户界面:

$exportHF_TOKEN=your_huggingface_write_token

然后在浏览器中访问https://127.0.0.1:10000并享受AutoTrain UI! 🚀 与上面 ORPO 训练具有相同参数的屏幕截图如下所示:

如果您无法在模型下拉列表中找到 phi3,您可以使用以下 URL:https://127.0.0.1:7860/?custom_models=microsoft/Phi-3-mini-4k-instruct。注意:我已添加 phi-3作为自定义模型。您可以对 Hub 中的任何其他兼容型号执行相同的操作。 ;)

SFT 和 ORPO 训练均在 M2Max MacBook Pro 上成功进行了测试。

详细文档点此查看:https://huggingface.co/docs/autotrain/index

(责任编辑:业界)

相关内容
  • 专访椰树 | 一年播放10亿,我是如何打造爆款直播间
  • 超美国!报告称中国汽车去年销量1340万辆:全球排第二
  • Nothing OS 3.0设计细节公布 预计9月推出
  • 新一代载人登月火箭新在哪:拥有智慧大脑
  • 一件近500元的羽绒服仅赚3毛 胖东来回应:属实
  • 大学生活理想伴侣:三款高性能亲民手机精选
  • 为电竞正名!国际奥委会执委会提议举办电竞奥运会
  • 华为展出“十倍带宽”方案:支持10万兆宽带 可持续演进至80万兆
推荐内容
  • 医疗博主发布女性隆胸视频被处罚:已删除相关视频
  • Scaling Law触礁「数据墙」?Epoch AI发文预测LLM到2028年耗尽所有文本数据
  • 孙坚喝霸王茶姬也失眠了:比咖啡管用得多
  • 曝小鹏总裁王凤英离职 本人朋友圈亲自辟谣
  • “尔滨”的年猪宴来了!13道菜每一道精心烹制
  • 一加Ace 3 Pro包装盒泄露:全球首发宁德新能源6100mAh超大电池