当前位置: 首页 > news >正文

深圳做网站要多少新闻发布会新闻通稿

深圳做网站要多少,新闻发布会新闻通稿,杭州鼎易做的网站,做电影网站用什么软件叫什么目录 1. 网络设计2. 代码实现2.1 网络代码2.2 train 3. 完整代码 1. 网络设计 输入是手写数字图片28x28,输出是10个分类0~9,有两个隐藏层,如下图所示: 2. 代码实现 2.1 网络代码 第一层将784降维到200,第二次使用…

目录

  • 1. 网络设计
  • 2. 代码实现
    • 2.1 网络代码
    • 2.2 train
  • 3. 完整代码

1. 网络设计

输入是手写数字图片28x28,输出是10个分类0~9,有两个隐藏层,如下图所示:
在这里插入图片描述

2. 代码实现

2.1 网络代码

第一层将784降维到200,第二次使用200不降维,输出层200降维到10,每一层之后加一个激活函数relu,每一层都需要梯度信息所以requires_grad=True;
forward函数最后不要加softmax,因为后面CrossEntropyLoss中包含了softmax操作。
在这里插入图片描述

2.2 train

优化目标是w1、b1、w2、b2、w3、b3,使用SGD优化器,使用CrossEntropyLoss计算loss
在这里插入图片描述

3. 完整代码

import  torch
import  torch.nn as nn
import  torch.nn.functional as F
import  torch.optim as optim
from    torchvision import datasets, transformsbatch_size=200
learning_rate=0.01
epochs=10train_loader = torch.utils.data.DataLoader(datasets.MNIST('../data', train=True, download=True,transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))])),batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(datasets.MNIST('../data', train=False, transform=transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.1307,), (0.3081,))])),batch_size=batch_size, shuffle=True)w1, b1 = torch.randn(200, 784, requires_grad=True),\torch.zeros(200, requires_grad=True)
w2, b2 = torch.randn(200, 200, requires_grad=True),\torch.zeros(200, requires_grad=True)
w3, b3 = torch.randn(10, 200, requires_grad=True),\torch.zeros(10, requires_grad=True)# torch.nn.init.kaiming_normal_(w1)
# torch.nn.init.kaiming_normal_(w2)
# torch.nn.init.kaiming_normal_(w3)def forward(x):x = x@w1.t() + b1x = F.relu(x)x = x@w2.t() + b2x = F.relu(x)x = x@w3.t() + b3x = F.relu(x)return xoptimizer = optim.SGD([w1, b1, w2, b2, w3, b3], lr=learning_rate)
criteon = nn.CrossEntropyLoss()for epoch in range(epochs):for batch_idx, (data, target) in enumerate(train_loader):data = data.view(-1, 28*28)logits = forward(data)loss = criteon(logits, target)optimizer.zero_grad()loss.backward()# print(w1.grad.norm(), w2.grad.norm())optimizer.step()if batch_idx % 100 == 0:print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(epoch, batch_idx * len(data), len(train_loader.dataset),100. * batch_idx / len(train_loader), loss.item()))test_loss = 0correct = 0for data, target in test_loader:data = data.view(-1, 28 * 28)logits = forward(data)test_loss += criteon(logits, target).item()pred = logits.data.max(1)[1]correct += pred.eq(target.data).sum()test_loss /= len(test_loader.dataset)print('\nTest set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(test_loss, correct, len(test_loader.dataset),100. * correct / len(test_loader.dataset)))

如下图:
未使用torch.nn.init.kaiming_normal_(w1)初始化参数的情况,可以看出Loss在2.302585后就不下降了。
在这里插入图片描述
如下图:使用了torch.nn.init.kaiming_normal_(w1)初始化参数的情况下,Loss下降还是比较快的。
在这里插入图片描述
因此使用好的初始化参数对网络的训练起到至关重要的作用

http://www.mmbaike.com/news/81352.html

相关文章:

  • 可以直接做ppt的网站吗个人介绍网页制作
  • 企业年报网上申报流程操作教程百度seo排名技术必不可少
  • 平台网站如何做推广应用商店关键词优化
  • bootstrap设计的精美网站关于进一步优化 广州
  • 企业门户网站设计论文百度app营销软件
  • 做旅行的网站如何查看百度指数
  • 一个做品牌零食特卖的网站今日的重大新闻
  • 网站加https有什么帮助如何网上销售自己的产品
  • 武汉制作公司网站及推广百度应用商店app
  • 网站建设需要多少济南网站优化公司
  • 千阳做网站免费做做网站
  • 粉色网站模板百度推广代理商返点
  • 旅游网页设计模板下载网站免费网站免费优化优化
  • 个人网站如何做淘宝客seo关键词优化的技巧和方法
  • 湘潭做网站电话磐石网络免费自媒体网站
  • 建站工具wordpress绍兴seo计费管理
  • php动态网站开发 课后答案怎么在百度上做推广上首页
  • 做店铺首页的网站查询网址域名ip地址
  • 网站建设主机类型怎么选南京seo排名扣费
  • 企业官网设计思路金融网站推广圳seo公司
  • 中国电信网站备案流程注册查询网站
  • 网站后台这么做视频教程如何自己制作网页
  • 建设推广站网站方案百度竞价有点击无转化
  • 一条专访是哪个网站做的磁力搜索引擎torrentkitty
  • 网站开发程序员岗位职责seo公司上海牛巨微
  • 台州网站制作计划找代写文章写手
  • 怎么做才能设计出好的网站西藏自治区seo 标题 关键词优化
  • 优化系统流程学seo优化
  • 现在建设一个网站还能够赚钱吗seo培训优化
  • 做网站多少钱一张页面提高网站流量的软文案例