当前位置: 首页 > news >正文

做平台销售网站seo技术外包

做平台销售网站,seo技术外包,我做钓鱼网站自首了,余姚网站建设开发先来说实现逻辑,首先我要获取到这个网站上所有的信息,那么我们就可以开始对元素进行检查 我们发现他的每一个学校信息都有一个对应的属性,并且是相同的,那么我们就可以遍历这个网页中的所有属性一样的开始爬取 在来分析&#xff0…

 先来说实现逻辑,首先我要获取到这个网站上所有的信息,那么我们就可以开始对元素进行检查

 我们发现他的每一个学校信息都有一个对应的属性,并且是相同的,那么我们就可以遍历这个网页中的所有属性一样的开始爬取

在来分析,我们会发现,是不是我们不只是要获取到一页的数据,我们要获取这个网站上所有的大学数据对吧,那么我们就要获取到这个按钮然后通过模拟用户操作webdriver,来模拟用户点击执行,然后在对这个数据来进行保存,当然这个数据是保存到数据库中的

import timefrom selenium import webdriver
from selenium.common.exceptions import TimeoutException, NoSuchElementException
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as ECdriver = webdriver.Chrome()url = "https://www.gaokao.cn/lineschool"
driver.get(url)try:# 等待直到元素加载完成element = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.CLASS_NAME, "ant-btn-primary")))# 点击按钮element.click()
except TimeoutException:pass# 提取学校信息
school_infos = driver.find_elements(By.CLASS_NAME, "line-school_schoolInfo__1sdvn")
# 初始化列表用于存储提取的信息
school_data = []# 循环执行点击操作
for i in range(3):print("第" + str(i))# # 将页面滚动到最底部# driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")# 点击下一页next_page_element = driver.find_element(By.CLASS_NAME, "ant-pagination-next")next_page_element.click()try:driver.find_element(By.CLASS_NAME, "login-popup_wordIcon__ljiP9").click()password_login_element = driver.find_element(By.XPATH, "//div[@class='login-popup_passwordItem__OouFG']")password_login_element.click()time.sleep(2)name = driver.find_element(By.CSS_SELECTOR, ".login-popup_inputItem__29c36 .undefined ")name.send_keys("15573491551")password_input_element = driver.find_element(By.XPATH, "//input[@type='password']")password = "Tjt987666"password_input_element.send_keys(password)# 找到复选框并点击选中checkbox_element = driver.find_element(By.XPATH, "//input[@type='checkbox']")checkbox_element.click()# 获取到点击按钮driver.find_element(By.CLASS_NAME, "login-popup_loginBtn__3buCc ").click()except TimeoutException:print("没有继续下一步")school_infos = driver.find_elements(By.CLASS_NAME, "line-school_schoolInfo__1sdvn")# 遍历每个学校信息for school_info in school_infos:print("数据执行")# 提取学校名称和所在城市信息name_element = school_info.find_element(By.CSS_SELECTOR, ".line-school_schoolName__1Zk8b em")city_element = school_info.find_element_by_class_name("line-school_cityName__VnOjC")school_name = name_element.textcity_name = city_element.text# 提取标签信息tags_elements = school_info.find_elements_by_class_name("line-school_tagName__1Hr9k")tags_text = [tag.text for tag in tags_elements]# 获取最后一个 span 标签的文本值last_span_text = school_info.find_element(By.XPATH,".//div[@class='line-school_tags__3Cdah']//span[last()]").text# 提取数字部分score_value = last_span_text.split(":")[-1]# 存储学校信息为元组school_tuple = (school_name, city_name, tags_text, score_value)# 将元组添加到列表中school_data.append(school_tuple)for school_tuple in school_data:print(school_tuple)
http://www.mmbaike.com/news/94955.html

相关文章:

  • 用照片做模板下载网站营销网站方案设计
  • 网站如何做网络营销的方式和手段
  • 宣传片制作方案策划学校seo推广培训班
  • wordpress链接 拼音广州网站营销seo费用
  • 做好中心网站建设工作总结会计培训班的费用是多少
  • 宁波模板建站定制网站seo经典案例分析
  • 做电商什么外推网站好线上销售渠道有哪些
  • wordpress验证主题seo优化基础教程pdf
  • 国际网站怎么样做教育机构在线咨询
  • 湖南做网站新手小白怎么做跨境电商
  • 做网站开票内容是什么网站排名seo软件
  • 有自己的域名怎么建立网站西安专业网络推广平台
  • wordpress可以做网站吗珠海百度关键字优化
  • 代做ppt网站好软文推广发布平台
  • 可以让外国人做问卷调查的网站seo运营做什么
  • 杭州制作网站公司国内疫情最新消息
  • 一站式快速网站排名多少钱谷歌浏览器下载安卓版
  • 怎么建设大淘客网站英文seo推广
  • 网站建设实施网站优化的主要内容
  • 烟台网站搭建站长之家关键词挖掘
  • 做网站常用的小语种有哪些如何推广网址链接
  • 图片网站建站系统品牌推广的三个阶段
  • 网站制作怎么学网站优化外包推荐
  • 安徽常青建设集团网站专业的网站优化公司
  • 上海中国建设银行招聘信息网站湖南正规seo优化报价
  • mobi手机网站建设百度一下生活更好
  • 视频网站怎么做统计表自己代理一款手游需要多少钱
  • 做信息图的网站北京网站优化步
  • 长沙网站 建设推广世云网络百度网盘官网入口
  • 网站建设方案书阿里云郑州seo优化外包热狗网