当前位置: 首页 > news >正文

专业的手机网站开发如何做网销

专业的手机网站开发,如何做网销,烟台网站建设方案推广,企业名称自主申报【学而不思则罔,思维不学则怠】 本文总结一下常见的一些算法训练超参数调优思路(陆续总结更新),包括: batchsize学习率epochsdropout(待添加) Batch_size 2023.9.29 简单来说,较…

【学而不思则罔,思维不学则怠】

本文总结一下常见的一些算法训练超参数调优思路(陆续总结更新),包括:

  • batchsize
  • 学习率
  • epochs
  • dropout(待添加)

在这里插入图片描述

Batch_size

2023.9.29

  • 简单来说,较大的bz可以加快训练速度,特别是基于GPU进行模型训练时,应该在显存允许范围内,尽量使用较大的bz。
  • 两个极端:假设内存/显存足够大,每次都是使用全量数据进行梯度计算,此时训练效率最高,但训练极容易陷入鞍点(局部最优)而无法跳出,表现出来就是loss还比较高,但是已经开始收敛了。
  • 但bz不是说越大越好,越大bz意味着用更多的数据来计算梯度,越容易陷入鞍点,但若batch数量较多,则当一个batch的数据使算法陷入鞍点了,另一个batch的数据有机会使算法跳出鞍点。
  • 因此bz尽可能选大一些,同时保证batch数量不太少,最简单的方法就是从GPU显存或CPU内存运行的最大值开始实验,若发现出现了loss过早收敛且比较高时(陷入鞍点),此时则放弃充分利用GPU,而应考虑减少bz,使loss能够继续下降。
  • 结论:从显存/内容利用率角度和防止陷入鞍点两个角度来思考bz。

学习率

2024.1.16

  • lr若太大,则会导致训练波动,不容易收敛,表现出来就是算法的loss在下降一段时间后,又突然增加,然后又下降,然后有增加,就像乒乓球落地上,弹弹弹。loss曲线并不光滑,如锯齿版的下降(就像下图的样子)。甚至始终无法收敛。
  • lr若太小,最大的问题就是需要更长的时间来进行收敛。
  • 对lr的设置除了经验值外,就是观看loss收敛情况。
    在这里插入图片描述

epochs

2024.1.16

  • 它就很简单了,先推荐设置一个较大的值,然后观察能收敛的epoch即可

dropout

待添加

http://www.mmbaike.com/news/32983.html

相关文章:

  • 中建三局招聘出国务工关键词优化公司前十排名
  • 河南郑州哪里可以做公司网站天眼查企业查询
  • wordpress 建立网站微信指数是搜索量吗
  • 广西南宁电商网站建设网络推广推广外包服务
  • 做网站要买多大服务器正规赚佣金的平台
  • 创新的网站建站宁波seo排名优化培训
  • 网站建设公司宣传标语seo168小视频
  • 网站建设服务怎么样百度云盘网官网
  • 做url网站网站域名ip地址查询
  • 怎么给钓鱼网站做防红济源新站seo关键词排名推广
  • 企业公司动态网站设计与实现阿里指数数据分析平台
  • 淘宝网站建设的特点平台营销策略都有哪些
  • 网站上的图文介绍怎么做网络营销是什么意思
  • 建设个人网站赚钱的经历云客网平台
  • 怎么防止网站攻击关键词推广排名软件
  • javaweb企业网站开发做优化关键词
  • 怎么进入企业的网站外贸网络营销
  • 域名停靠网站 2015添加友情链接的技巧
  • 网站开发列表百度官网下载
  • 做的很好的黑白网站宁波seo网络推广外包报价
  • 重庆做网站的如何推销自己的产品
  • 昆明做网站找天度百度推广入口
  • 瓯北网站制作义乌最好的电商培训学校
  • 鞍山百姓网招聘信息seo应用领域有哪些
  • 无锡新区建设环保局网站泰安百度推广公司
  • 做婚姻介绍网站赚钱吗怎样进行seo
  • 哈尔滨建设网站的免费咨询网站排名怎么做
  • 安庆网站开发人员免费推广的方式有哪些
  • 谁帮58同城做的网站即刻搜索
  • 手机营销推广方案如何推广seo