当前位置: 首页 > news >正文

网站备案 幕布游戏优化大师

网站备案 幕布,游戏优化大师,二手网站建设论文答辩,郑州专业网站制作当模型参数越来越大的情况下,如果我们的GPU内存比较小,那么就没办法直接进行全参数微调,此时我们可以借助deepspeed来进行微调。 1、deepspeed的配置文件:deepspeed.json {"train_batch_size": 4,"train_micro_b…

当模型参数越来越大的情况下,如果我们的GPU内存比较小,那么就没办法直接进行全参数微调,此时我们可以借助deepspeed来进行微调。

1、deepspeed的配置文件:deepspeed.json

{"train_batch_size": 4,"train_micro_batch_size_per_gpu": 1,"zero_optimization": {"stage":1}
}

这里我们启动的ZeRO-1:优化器状态跨 GPU 分区

2、在TrainingArguments里面增加配置参数,来加载deepspeed的配置文件:

training_args = TrainingArguments(output_dir=output_dir, 
evaluation_strategy="steps", num_train_epochs=100,learning_rate=5e-6,
save_strategy="steps", greater_is_better=True, metric_for_best_model="precision",
per_device_train_batch_size=1,per_device_eval_batch_size=1,
load_best_model_at_end=True,local_rank=0,save_total_limit=10,deepspeed="deepspeed.json"
)

3、利用deepspeed的命令来启动训练:

nohup deepspeed train.py > logd.txt 2>&1 &

当前我们利用44G的GPU全参微调了Qwen2.5-3B的模型

http://www.mmbaike.com/news/75523.html

相关文章:

  • 做网站建设 个体经营 小微企业网店运营策划方案
  • 阿里云网站备案幕布如何自建网站?
  • 私人路由器做网站株洲seo优化
  • 怎么盗用网站网络热词英语
  • 邢台做wap网站的地方搜索引擎推广的关键词
  • 广州微信网站建设公司百度怎么优化关键词排名
  • 手游推广联盟东莞seo托管
  • 校园网站开发设计报告百度一下官方网
  • 怎么区分营销型和展示型的网站51趣优化网络seo工程师教程
  • 济南卓远网站建设公司郑州手机网站建设
  • 沈阳企业网站建设seo优化顾问
  • 网站开发公司是互联网公司网址seo分析
  • dede中英文网站切换热点事件
  • 公众号免费素材网站输入关键词进行搜索
  • 泗洪网站建设公司网站信息
  • 网站开发如何避开法律软文一般发布在哪些平台
  • 河北建设工程信息网官方网站seo引擎
  • 安卓app软件开发教程seo搜索引擎优化服务
  • 做网站什么空间好百度集团总部在哪里
  • 番禺营销型网站建设网站优化排名首页
  • 创业做网站 优帮云文案短句干净治愈
  • 做类似淘宝网站多少钱互联网项目推广
  • 重庆市网络公司aso优化怎么做
  • 湛江有哪些网站建设公司“跨年”等关键词搜索达年内峰值
  • 山西建立网站营销策划搜索seo
  • 池州市建设管理处网站怎么优化关键词排名优化
  • 做网站ui设计多少钱整站优化包年
  • wordpress 获取子分类网站seo推广招聘
  • 美容店会员管理系统aso关键词优化计划
  • wordpress代码执行先后合肥seo按天收费