当前位置: 首页 > news >正文

做市场调研的网站2022当下社会热点话题

做市场调研的网站,2022当下社会热点话题,手机制作视频教程,二手物品交易网站设计英文1. 前言 那么这周我们看看如何实现使用Airtest-Selenium实现自动搜索下载可爱的猫猫图片吧~ 2. 需求分析和准备 整体的需求大致可以分为以下步骤: 打开chrome浏览器 打开百度网页 搜索“可爱猫猫图片” 定位图片元素 创建存储图片的文件夹 下载可爱猫猫图片…

1. 前言

那么这周我们看看如何实现使用Airtest-Selenium实现自动搜索下载可爱的猫猫图片吧~

2. 需求分析和准备

整体的需求大致可以分为以下步骤:

  • 打开chrome浏览器

  • 打开百度网页

  • 搜索“可爱猫猫图片”

  • 定位图片元素

  • 创建存储图片的文件夹

  • 下载可爱猫猫图片到文件夹内

在写脚本之前,我们需要准备好社区版AirtestIDE,设置好chrome.exe和对应的driver;并且确保我们的chrome浏览器版本不是太高以及selenium是4.0以下即可(这些兼容问题我们都会在后续的版本修复)。

3. 脚本实现与运行效果

3.1 脚本运行效果

我们在编写脚本时,我们要先明确好代码思路,首先下载图片先要找到对应的图片,在下载前需要先确认图片存储的地方,确认好后就可以进行下载啦。在本次代码编写的时候,我们使用了requests.get的方式去下载图片,目前使用request库里的操作去获取网络上的资源,会更方便快捷,让我们看看脚本实现的效果吧~

3.2 完整代码分享

这里也附上完整的示例代码给大家参考,有需要的同学可以自取学习哦:

# -*- encoding=utf8 -*-from airtest.core.api import *
# 引入selenium的webdriver模块
from airtest_selenium.proxy import WebChrome
import requests
from selenium.webdriver.common.by import Bydef download_image(url, save_path):                    #下载图片response = requests.get(url, stream=True)if response.status_code == 200:                    #网页可以正常访问with open(save_path, 'wb') as file:for chunk in response.iter_content(1024):  file.write(chunk)print("图片下载完成!")else:print("下载失败。")def start_selenium():# 创建一个实例,代码运行到这里,会打开一个chrome浏览器driver = WebChrome()driver.implicitly_wait(20)driver.get("https://www.baidu.com/")# 输入搜索关键词并提交搜索search_box = driver.find_element_by_name('wd')search_box.send_keys('可爱猫猫图片')search_box.submit()# 定位搜索结果中的图片元素image_elements = driver.find_elements(By.XPATH,'//div[@id="content_left"]//div[@class="image-content_1csSY"]//a/img')# 创建存储图片的文件夹save_folder = 'image_folder'if not os.path.exists(save_folder):os.makedirs(save_folder)index = 0# 循环保存图片for i in image_elements:image_url = i.get_attribute('src')  #获取图片列表的网址信息print(image_url)# 下载图片index = index + 1download_image(image_url, f'{save_folder}/image_{index}.jpg')if __name__ == "__main__":start_selenium()
3.2 重要知识点
1)获取下载文件

requests.get()会将请求的响应内容全部下载到内存中,然后再返回给调用者。其中stream默认情况下是stream=False,但是如果文件过大就会导致内存不足的情况,所以这里使用流式传输的方式去进行下载。

 response = requests.get(url, stream=True)
2)一块一块的遍历要下载的内容

get函数的stream参数设置成True时,它不会立即开始下载,使用iter_content遍历内容或访问内容属性时才开始下载。

iter_content:分块去遍历要下载的内容,括号内的数字代表chunk_size处理数据时的块大小,单位是B(字节)

使用该函数下载大文件可以防止占用过多的内存,每次只下载小部分数据。

with open(save_path, 'wb') as file:for chunk in response.iter_content(1024):  file.write(chunk)
3)创建存储图片的文件夹

先判断文件夹是否存在,若不存在则在路径(默认为脚本文件目录下)下创建一个文件夹

 if not os.path.exists(save_folder):os.makedirs(save_folder)
4)获取图片的网址信息

element.get_attribute(name):获得element的属性值。name可以是页面元素所含的属性名。

例如:

src:图片

textContent:标签之间的文本内容

innerHTML:标签之间的完整HTML内容

等等.....

image_url = i.get_attribute('src') #获取图片列表的网址信息

4. 注意事项与小结

4.1 相关教程
  • 如何使用AirtestIDE生产web自动化脚本

  • 如何使用Airtest-selenium进行web端的页面元素交互

  • 如何设置chromedriver以及一些常见的web脚本问题

  • 为什么AirtestIDE无法检索web控件?

4.2 参考脚本的有效性

请各位同学们不要过多依赖于我们给出的参考脚本,通常情况下,网页的控件信息可能会随着前端的改动而更新,所以我们的教程并不是永久有效的。

更多的是参考整体脚本的知识点,查漏补缺,让自己在小实践中对web自动化的熟练程度更高。也非常欢迎热心同学给我们投稿~

http://www.mmbaike.com/news/49116.html

相关文章:

  • 怎么做国外赌球网站代理惠州市seo广告优化营销工具
  • 怎么在360网站做词条关键词优化seo排名
  • 原创文章对网站的好处百度最新版app下载安装
  • 购物网站建设目标seo关键词排名优化价格
  • 成都哪家做网站好it培训学校it培训机构
  • 国内产品网站1688国内seo公司
  • 怎么自己做画册网站游戏推广引流
  • 上海网站开发售后服务有哪些实用的网络推广方法
  • jquery做网站浏览量石家庄seo管理
  • 网站开发与制作毕业论文百度推广管理平台
  • 如何更新动态网站seo搜索引擎优化方案
  • 网站在vps能访问 在本地访问不了快手秒赞秒评网站推广
  • asp.net做网站步骤网络品牌营销
  • 网站备案万网百度网址大全官网旧版
  • 做网站好吗杭州seo外包服务
  • 如何做统计信息的网站电销精准客户资源
  • 淘宝详情页做的比较好的网站百度开放平台登录
  • 陈塘庄网站建设网站推广步骤
  • 搜索引擎yandex入口上海网站seo
  • 教育加盟网站建设seo的培训网站哪里好
  • 百度seo sem长沙seo排名扣费
  • 兰州营销型网站建设新网站怎么推广
  • 建网站卖多少钱如何建立网站平台
  • wordpress视频枫树seo网
  • 如何 网站优化怎样推广app别人才愿意下载
  • 自己做的电影网站犯法吗搜狗搜索旧版本
  • 潍坊市房屋和城乡建设局网站seo流量排名软件
  • 网站建设基础及流程网络营销与市场营销的区别
  • 旅游网站建设怎么做app开发成本预算表
  • 做跨境的网站有哪些内容软文文案范文