当前位置: 首页 > news >正文

怎么用抓爬工具做网站东莞商城网站建设

怎么用抓爬工具做网站,东莞商城网站建设,wordpress code 显示,大石桥城乡规划建设局网站微调大语言模型是常见的需求,由于模型参数量大,即使用 Lora/Qlora 进行微调也需要 GPU 显卡,Mac M系是苹果自己的 GPU,目前主流的框架还在建立在 CUDA 的显卡架构,也就是主要的卡还是来自英伟达。如果要用 Mac 来做训练…

微调大语言模型是常见的需求,由于模型参数量大,即使用 Lora/Qlora 进行微调也需要 GPU 显卡,Mac M系是苹果自己的 GPU,目前主流的框架还在建立在 CUDA 的显卡架构,也就是主要的卡还是来自英伟达。如果要用 Mac 来做训练和推理,需要用MLX,MLX 类似于 Pytorch,对苹果芯片做了支持,从而使得苹果电脑也可以进行深度学习。本文将介绍如何用 MLX 训练 Phi3 大语言模型:

安装 MLX

pip install mlx-lm

模型下载推理

这里需要访问 HuggingFace 下载,可以使用国内镜像

国内镜像
https://hf-mirror.com/export HF_ENDPOINT=https://hf-mirror.compython -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt  "<|user|>\nCan you introduce yourself<|end|>\n<|assistant|>"

在这里插入图片描述

HF 模型转换为 MLX 模型

mlx 的命令都有一些默认值,-h 中没有具体说明, 只能去源码里看。

在这里插入图片描述
例如,转换完成的模型会保存到 mlx_model 目录下。

python -m mlx_lm.convert --hf-path microsoft/Phi-3-mini-4k-instruct

通过 MLX 进行调优

首先准备数据,MLX 使用 jsonl 数据格式进行训练,从 github 下载数据集并存放到 data 目录下,一共三个文件,test、train 和 valid,文件下载好之后我们就可以开始训练了。

https://github.com/microsoft/Phi-3CookBook/tree/main/code/04.Finetuning/mlx/data

消耗资源比较多,M2 风扇又开始转了。

python -m mlx_lm.lora --model microsoft/Phi-3-mini-4k-instruct --train --data ./data --iters 1000 

模型推理

  • 运行未训练的模型和训练好的模型,并对推理的结果进行比较。
python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --adapter-path ./adapters --max-token 2048 --prompt "Why do chameleons change colors? " --eos-token "<|end|>"    

在这里插入图片描述

  • 原始模型
python -m mlx_lm.generate --model microsoft/Phi-3-mini-4k-instruct --max-token 2048 --prompt "Why do chameleons change colors? " --eos-token "<|end|>"    

在这里插入图片描述

合并模型

将训练好的 Lora adapter 合并到原始模型中。

python -m mlx_lm.fuse --model microsoft/Phi-3-mini-4k-instruct

生成 GGUF

通过 llama.cpp 生成 GGUF,量化参数支持 ‘f32’, ‘f16’, ‘bf16’, ‘q8_0’,根据需要自行修改。Phi3 模型默认没有 tokenizer.model,需要从 HF 下载
https://huggingface.co/microsoft/Phi-3-mini-4k-instruct/tree/main

在这里插入图片描述
将 tokenizer.model 复制到 /lora_fused_model/ 目录下,完成后运行生成GGUF 的转换命令。

git clone https://github.com/ggerganov/llama.cpp.gitcd llama.cpppip install -r requirements.txtpython convert-hf-to-gguf.py ../lora_fused_model  --outfile ../phi-3-mini-ft.gguf --outtype q8_0

在这里插入图片描述

创建 Ollma 模型

首先创建 Ollama 的模型文件 ModelFile,和上一步生成的 gguf 文件放到同一个目录下

FROM ./phi-3-mini-ft.gguf
PARAMETER stop "<|end|>"

创建模型

ollama create phi3ft -f Modelfile

Ollama 启动模型并进行推理

ollama run phi3ft

在这里插入图片描述

总结

MLX 模型推理非常简单,数据准备好就可以训练和推理,本次使用的是 phi3 模型,中文支持的不好,以后可以试试 Qwen2 怎么样。

http://www.mmbaike.com/news/105466.html

相关文章:

  • 网站 伪静态北京营销公司排行榜
  • 物流公司做网站百度竞价点击价格
  • 企业网站收录自媒体服务平台
  • 浙江建设特种证书查询seo搜索引擎优化期末及答案
  • 携程旅行的网站建设友链交换有什么作用
  • 政和网站建设如何设置友情链接
  • 濮阳做网站做的好的公司济南百度竞价
  • 安新网站建设北京百度seo公司
  • 南昌房产网官方网站十大营销手段
  • 电商网站的建设的主要目的百度优化关键词
  • 网站上的个人词条怎么做的太原seo团队
  • 布吉做棋牌网站建设哪家服务好优化推广服务
  • 网站框架包括哪些专业seo服务商
  • 手机网站快速建设电商网站公司
  • 哪些网站是django做的如何用html制作一个网页
  • 西宁微网站建设多少钱客服外包
  • wordpress+左侧导航网站优化公司怎么选
  • 在境外做色情网站广州网络广告推广公司
  • 北京建设网站的公司培训心得体会200字
  • 自建网站怎么关闭4p营销理论
  • 微信群二维码推广平台长沙网站优化体验
  • 景区网站建设策划书2345网址导航官网下载安装
  • 做网站需要哪些框架三叶草gw9356
  • 用wordpress怎么生成pdf_word_图片文件seo关键词大搜
  • 多种手机网站建设快速排名网站
  • 洛阳市建设委员会网站品牌推广策划营销策划
  • 如何做亚马逊跨境电商平台武汉seo和网络推广
  • 专业做电子的外贸网站微博搜索引擎优化
  • 山西大同企业做网站宁波seo推广优化
  • 招远专业做网站公司招聘网络营销推广人员