当前位置: 首页 > news >正文

网站模板使用教程网络营销推广策略有哪些

网站模板使用教程,网络营销推广策略有哪些,淮南帮,深圳app开发价格今天写一个爬虫爱好者特别喜欢的网站煎蛋网 http://jandan.net/ooxx ,这个网站其实还是有点意思的,网站很多人写了N多的教程了,各种方式的都有,当然网站本身在爬虫爱好者的不断进攻下,也在不断的完善,反爬措…

今天写一个爬虫爱好者特别喜欢的网站煎蛋网 http://jandan.net/ooxx ,这个网站其实还是有点意思的,网站很多人写了N多的教程了,各种方式的都有,当然网站本身在爬虫爱好者的不断进攻下,也在不断的完善,反爬措施也很多,今天我用 selenium 在揍他一波。

整体看上去,煎蛋网的妹子图质量还是可以的,不是很多,但是还蛮有味道的,这可能也是爬虫er,一批一批的奔赴上去的原因。

fd4d258ed0eae852398ef4f0febae895.png

1. 网站分析

这个网站如果用 selenium 爬取,其实也没什么要分析的,模拟访问就行,导入必备的模块。

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from lxml import etree
import requests
import time

我使用的是 PhantomJS 去加载浏览器,关于这个 PhantomJS ,去互联网搜索一下吧,资料大把,会看的很爽的,总之呢,它可以模拟一个真实的浏览器做任何事情,得到你想要的数据。

browser = webdriver.PhantomJS()
browser.set_window_size(1366, 768)  # 这个地方需要设置一下浏览器的尺寸
wait = WebDriverWait(browser,10)
browser.get("http://jandan.net/ooxx")

2. 分析数据

Python资源共享群:484031800

程序获取到数据之后就可以对数据进行处理了,编写一个 get_content 函数,用来处理网页源码。

def get_content():try:wait.until(EC.presence_of_element_located((By.XPATH,'//*[@id="comments"]/ol')))#print("正在爬取{}".format(browser.current_url))page_source = browser.page_source  # 获取网页源码html = etree.HTML(page_source)  # 解析源码imgs = html.xpath("//li[contains(@id,'comment')]//img/@src")  # 匹配图片download(imgs)except Exception as e:print("错误")print(e)finally:browser.close()

图片获取到之后,在上面的代码中,注意有一个地方调用了一个 download 函数,这个函数就是用来下载图片的

def download(imgs):path = "./xxoo/{}"  # 路径我写死了for img in imgs:try:res = requests.get(img)content = res.contentexcept Exception as e:print(e)continuefile_name = img.split("/")[-1] # 获取文件名with open(path.format(file_name),"wb") as f:f.write(content)print(file_name,"成功下载文件")time.sleep(0.3)# 循环下载完毕,进行翻页操作 previous-comment-pagenext = wait.until(EC.presence_of_element_located((By.XPATH, '//*[@id="comments"]//a[@class="previous-comment-page"]')))next.click()return get_content()  # 继续调用上面的网页源码分析流程

551031d64e1ec991b9a525847bae0fab.png
http://www.mmbaike.com/news/66534.html

相关文章:

  • 上海做外贸网站建设郑州关键词排名公司电话
  • wordpress隐藏登录页插件海淀区seo引擎优化
  • 新疆健康云app官网下载seo站长工具下载
  • 新乡做网站公司电话营销型网站策划方案
  • 建个网站需要多少钱? 知乎网站seo关键词排名优化
  • wordpress页面无法选择目标郑州技术支持seo
  • 深圳建站费用互联网行业都有哪些工作
  • 网站开发的环境台州seo优化
  • 本地生活网站 源码佛山优化网站关键词
  • 北京大学 讣告郑州好的seo外包公司
  • 网站建设与管理和计算机网络技术广告策划方案范文
  • 蓝色网站模版seo关键词排名优化矩阵系统
  • 下列不属于网站建设规划线上销售水果营销方案
  • 做我男朋友好不好网站b站推广费用一般多少
  • 重庆手机网站推广金阊seo网站优化软件
  • 外贸网站免费模板百度品牌推广
  • 禅城技术支持骏域网站建设软件培训机构有哪些?哪个比较好
  • wordpress 登录弹窗seo网站快速排名
  • 视觉品牌网站建设网络推广的渠道
  • 福清市建设局官方网站刷百度关键词排名优化
  • aspnet网站开发工具宁波网站优化公司价格
  • 河南省建设厅网站打不开公司网站推广
  • 高端网站建设 飞沐抖音广告投放代理商
  • 国外皇色网站seo专员工作容易学吗
  • 免费模板下载简历潍坊seo培训
  • 做外贸自己开公司网站seo排名点击软件
  • 做外贸网站 深圳线上销售方案
  • 先锋大牌周爆款好价 79元起 查看详情seo网站排名的软件
  • centos wordpress 搭建苏州关键词优化怎样
  • 做网站全套500元上海做网站公司网站搜索引擎优化报告