当前位置: 首页 > news >正文

网站栏目管理seo站群优化技术

网站栏目管理,seo站群优化技术,网站制作新报价,互联网彩票网站开发http://archive.org 是一个神奇的网站,可以下载各种古旧的软件、书籍、音频、视频,还可以搜索各个网站的历史网页。 比如说,一些儿童故事音频就可以在http://archive.org下载到,可以用来做英语听力启蒙用。 举个例子&#xff0c…

http://archive.org 是一个神奇的网站,可以下载各种古旧的软件、书籍、音频、视频,还可以搜索各个网站的历史网页。

比如说,一些儿童故事音频就可以在http://archive.org下载到,可以用来做英语听力启蒙用。

举个例子,要下载https://archive.org/details/107frogandtoadallyear_202004这个网页上的所有音频内容,该怎么办呢?

右击,检查网页,点击网络,然后选择媒体,然后可以看到正在播放的音频文件,右击复制链接,如下:

https://archive.org/details/107frogandtoadallyear_202004/2-12+Alone.mp3

查看网页源代码,搜索某一个音频文件标题:Alone.mp3

找到了音频文件的地址:

<button type="button" data-event-click-tracking="TrackList|Item" class="track selected" data-track-number="21">

<!--?lit$3345567357$--><span class="track-number"><!--?lit$3345567357$-->22</span>

<span class="track-title"><!--?lit$3345567357$-->2-12 Alone

<!--?lit$3345567357$-->

</span>

<span class="track-length">

<!--?lit$3345567357$-->

<!--?lit$3345567357$-->05:10

</span>

</button>

接下来就好办了,在ChatGPT中输入提示词:

你是一个Python编程专家,现在要完成一个下载网页中音频的任务,具体步骤如下:

打开网站:https://archive.org/details/107frogandtoadallyear_202004

解析源代码,找出所有itemprop="hasPart"的div元素,定位其中itemprop="associatedMedia" 的link元素;

提取link元素的href值,作为音频下载的URL地址;

多线程下载这个音频文件,保存到电脑D盘的文件夹:Frog and Toad Audio Collection

注意:每一步都要输出信息

要有反爬虫措施,比如下载一个音频文件后暂停3秒;

音频下载的Python源代码:

import requests

from bs4 import BeautifulSoup

import os

import time

import threading

class Downloader(threading.Thread):

def __init__(self, url, path):

threading.Thread.__init__(self)

self.url = url

self.path = path

def run(self):

print(f'Starting download {self.path}')

r = requests.get(self.url, stream=True)

with open(self.path, 'wb') as f:

for chunk in r.iter_content(chunk_size=1024):

if chunk:

f.write(chunk)

print(f'Finished download {self.path}')

time.sleep(3) # pause for 3 seconds

def get_audio_links(url):

r = requests.get(url)

soup = BeautifulSoup(r.text, 'html.parser')

audio_links = []

for div in soup.find_all('div', itemprop='hasPart'):

link = div.find('link', itemprop='associatedMedia')

if link:

audio_links.append(link['href'])

return audio_links

def download_audios(url, directory):

if not os.path.exists(directory):

os.makedirs(directory)

audio_links = get_audio_links(url)

downloaders = []

for i, audio_link in enumerate(audio_links):

path = os.path.join(directory, f'audio{i}.mp3')

downloader = Downloader(audio_link, path)

downloader.start()

downloaders.append(downloader)

for downloader in downloaders:

downloader.join()

url = 'https://archive.org/details/107frogandtoadallyear_202004'

directory = 'D:\\Frog and Toad Audio Collection'

download_audios(url, directory)

程序运行,很快就把网页中的音频下载完了。

http://www.mmbaike.com/news/86382.html

相关文章:

  • 深圳营销网站建设多少钱哈尔滨百度推广联系人
  • 台州网站建设公司哪家好产品宣传推广策划
  • ios软件资源网站谷歌搜索引擎入口google
  • 莱州网站建设费用线下推广方式有哪些
  • 怎样建设赌博网站巨量引擎广告投放
  • 如何写好网站开发技术文档免费外链发布平台在线
  • flashfxp与Wordpress网站关键词优化排名公司
  • 独立网站的建设武汉今日头条最新消息
  • 怎么建网站手机版销售平台软件有哪些
  • 河南专业网站建设公司哪家好seo网络营销推广排名
  • 做类似3d溜溜的网站营销软文范例大全100
  • 个人建站系统友情链接是外链吗
  • 布吉商城网站建设基本流程手机端怎么刷排名
  • 建站平台软件满十八岁可以申请abc认证吗
  • 做网站外国的怎么弄一个自己的网站
  • 成都手机网站建设价格热门seo推广排名稳定
  • 网站关键词搜不到口碑seo推广公司
  • 青岛手机网站设计公司中国万网官网登录
  • 网站建设销售ppt模板网络外贸推广
  • 本地wordpress后台很慢武汉seo网站排名优化
  • 武汉做网站代运营平台免费网站推广软件哪个好
  • app开发教程视频郑州企业网站seo
  • 广州网站建设88美国站外推广网站
  • 做移动网站优化软软文营销文章300字
  • 假电影网站做注册哪些网站推广不收费
  • 揭阳网站定制178软文网
  • 中文网站的seo怎么做百度竞价渠道代理商
  • 网站建设素材模板外包公司软件开发
  • 网站建设网站建设的网络公司在seo优化中
  • 网站开发软件公司自学seo大概需要多久