当前位置: 首页 > news >正文

网络营销十大成功案例长沙网站优化方法

网络营销十大成功案例,长沙网站优化方法,战鼓的h5网站如何做,住房和城乡建设部网站诚信评价更多 TVM 中文文档可访问 →Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。 | Apache TVM 中文站 TVM 支持带有 SDAccel 的 Xilinx FPGA 板,接下来介绍如何将 TVM 部署到 AWS F1 FPGA 实例。 备注:此功…

更多 TVM 中文文档可访问 →Apache TVM 是一个端到端的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。 | Apache TVM 中文站


TVM 支持带有 SDAccel 的 Xilinx FPGA 板,接下来介绍如何将 TVM 部署到 AWS F1 FPGA 实例。

备注:此功能仍处于测试阶段,目前无法用 SDAccel 部署端到端神经网络。
本教程使用了两个 Python 脚本:

  • build.py - 用于合成 FPGA 比特流的脚本。
import tvmfrom tvm import tetgt= tvm.target.Target("sdaccel", host="llvm")n = te.var("n")A = te.placeholder((n,), name='A')B = te.placeholder((n,), name='B')C = te.compute(A.shape, lambda i: A[i] + B[i], name="C")s = te.create_schedule(C.op)px, x = s[C].split(C.op.axis[0], nparts=1)s[C].bind(px, tvm.te.thread_axis("pipeline"))fadd = tvm.build(s, [A, B, C], tgt, name="myadd")fadd.save("myadd.o")fadd.imported_modules[0].save("myadd.xclbin")tvm.contrib.cc.create_shared("myadd.so", ["myadd.o"])
  • run.py - 将 FPGA 作为加速器的脚本。
import tvmimport numpy as npimport ostgt = "sdaccel"fadd = tvm.runtime.load_module("myadd.so")if os.environ.get("XCL_EMULATION_MODE"):fadd_dev = tvm.runtime.load_module("myadd.xclbin")else:fadd_dev = tvm.runtime.load_module("myadd.awsxclbin")fadd.import_module(fadd_dev)dev = tvm.device(tgt, 0)n = 1024a = tvm.nd.array(np.random.uniform(size=n).astype("float32"), dev)b = tvm.nd.array(np.random.uniform(size=n).astype("float32"), dev)c = tvm.nd.array(np.zeros(n, dtype="float32"), dev)fadd(a, b, c)tvm.testing.assert_allclose(c.numpy(), a.numpy() + b.numpy())

设置

  • 用 FPGA Developer AMI 启动实例。无需 F1 实例来进行仿真和合成,因此推荐用开销较低的实例。
  • 设置 AWS FPGA 开发套件:
git clone https://github.com/aws/aws-fpga.gitcd aws-fpgasource sdaccel_setup.shsource ${XILINX_SDX}/settings64.sh
  • 启用 OpenCL 前设置 TVM。

仿真​

  • 为仿真创建 emconfig.json:
emconfigutil --platform ${AWS_PLATFORM} --nd 1
  • 将 emconfig.json 复制到 Python binary 目录下:因为当前的 Xilinx 工具包假定宿主机的二进制文件和 emconfig.json 文件处于同一路径。
cp emconfig.json $(dirname $(which python))
  • 运行软件仿真:
export XCL_EMULATION_MODE=1export XCL_TARGET=sw_emupython build.pypython run.py
  • 运行硬件仿真:
export XCL_EMULATION_MODE=1export XCL_TARGET=hw_emupython build.pypython run.py

合成​

  • 用以下脚本进行合成:
unset XCL_EMULATION_MODEexport XCL_TARGET=hwpython build.py
  • 创建 AWS FPGA 镜像,并将其上传到 AWS S3:
${SDACCEL_DIR}/tools/create_sdaccel_afi.sh \-xclbin=myadd.xclbin -o=myadd \-s3_bucket=<bucket-name> -s3_dcp_key=<dcp-folder-name> \-s3_logs_key=<logs-folder-name>

这会生成 awsxclbin 文件(在 F1 实例上使用 AWS FPGA 镜像必需)。

运行​

  • 启动 Amazon EC2 F1 实例。
  • 将 myadd.so,myadd.awsxclbin 和 run.py 复制到 F1 实例中。
  • 设置 AWS FPGA 开发套件:
git clone https://github.com/aws/aws-fpga.gitcd aws-fpgasource sdaccel_setup.sh
  • 启用 OpenCL 前设置 TVM。
  • 以 root 身份设置环境变量:
sudo shsource ${INSTALL_ROOT}/setup.sh
  • 运行:
python run.py
http://www.mmbaike.com/news/45360.html

相关文章:

  • 找单位做网站需要注意什么自媒体有哪些平台
  • 疏通下水道网站怎么做天津seo关键词排名优化
  • 学做网站论坛vip教程中超最新积分榜
  • 个人网站引导页源码志鸿优化设计电子版
  • 人民法院公告网查询系统深圳百度关键字优化
  • 太原网站建设公司招聘公司建立网站的步骤
  • 快速网站优化技巧重庆seo关键词排名
  • 武汉做写字楼网站微信软文范例大全100
  • 网站文章模板深圳seo优化公司排名
  • 采购管理软件合肥seo整站优化
  • 郑州专业网站制作的公司深圳seo优化排名公司
  • 孝感网站制作搜索引擎的四个组成部分及作用
  • 做水军那些网站好小游戏推广接单平台
  • 临沂网站制作企业站长之家关键词挖掘工具
  • 珠海网站建设科速网络推广seo教程
  • 普通企业网站费用东莞关键词seo
  • 做网站排名收益广州百度seo排名
  • 网站分几种类型百度指数关键词
  • 自己做的网站转成二维码个人网站推广方法
  • 网站开发设计需求关键词优化的技巧
  • 自己怎么做VIP视频解网站手机制作网站的软件
  • 网站维护中免费站长统计工具
  • 做衣服的网站怎么自己做一个网页
  • 私域电商平台专业北京seo公司
  • 网站左侧漂浮导航重庆seo整站优化报价
  • 靖江做网站哪家好关键词点击排名软件
  • sm做任务的网站百度快照的作用是什么
  • 长沙做网站建设公司哪家好培训心得体会怎么写
  • wordpress 前台上传图片seo如何建立优化网站
  • 做么做好网站运营seo最好的工具