微博视频怎么保存到本地？总结很全面速看!用 Jupyter Notebook 爬取微博图片保存本地

门|助手

资料来源：python技术“id : python all”

今天，我们使用Jupyter-Notebook和框架(Selenium)模拟浏览器抓取微博照片，并将照片存储在本地。

Selenium 是一个用电脑模拟人的操作浏览器网页，可以实现自动化测试，模拟浏览器抓取数据等工作。

环境部署

安装 Jupyter notebook

关于 Jupyter notebook 的详细知识点在以往的文章中有做过详细的介绍，详情请参考文章一文吃透 Jupyter notebook

这里只需要在命令行中输入：jupyter notebook 启动跳转到浏览器编辑界面即可。

浏览器页面：

安装 Selenium

安装 Selenium 非常简单，只需要用命令 'pip install Selenium' 即可，安装成功提示信息如下：

下载浏览器驱动

下载驱动地址如下：

Firefox浏览器驱动

chrome浏览器驱动：chromedriver

IE浏览器驱动：IEDriverServer

Edge浏览器驱动：MicrosoftWebDriver

需要把浏览器驱动放入系统路径中，或者直接告知 selenuim 的驱动路径。

环境都搭建好后就可以直接开始爬取数据了。

抓取微博数据

首先导入包，模拟浏览器访问微博主页，详细代码如下：


from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://weibo.com/')

此时浏览器会打开一个新页面，如下图所示：

接下来开始分析页面数据：微博页面搜索奥运会关键字后出现新的页面，然后复制网址，抓取和奥运会相关的图片保存于本地，搜索界面如下：

输入网址获取网页内容：

driver.get(';wvr=6&b=1')
contents = driver.find_elements_by_xpath(r'//p[@class="txt"]')
print(len(contents))

输出内容如下：

查看网页详细信息：


for i in range(0,3):
    print("==============================")
    print(contents[i].get_attribute('innerHTML'))

获取图片信息：


contents = driver.find_elements_by_xpath(r'//img[@action-type="fl_pics"]')

print(len(contents))

for i in range(0,20):
    print("==============================")
    print(contents[i].get_attribute('src'))

下载图片在本地：


import os
import urllib.request

for i in range(0,20):
    print("==============================")
    image_url=contents[i].get_attribute('src')
    file_name="downloads//p"+str(i)+".jpg"
    print(image_url,file_name)
    urllib.reque(image_url, filename=file_name)

至此微博页面关于奥运会的相关图片已保存于本地，图片保存详情如下：

汇总代码如下


from selenium import webdriver
import urllib.request

driver = webdriver.Chrome()
driver.get('https://weibo.com/')

driver.get(';wvr=6&b=1')

contents = driver.find_elements_by_xpath(r'//p[@class="txt"]')

for i in range(0,3):
    print("==============================")
    print(contents[i].get_attribute('innerHTML'))

contents = driver.find_elements_by_xpath(r'//img[@action-type="fl_pics"]')

print(len(contents))

for i in range(0,20):
    print("==============================")
    print(contents[i].get_attribute('src'))


for i in range(0,20):
    print("==============================")
    image_url=contents[i].get_attribute('src')
    file_name="downloads//p"+str(i)+".jpg"
    print(image_url,file_name)
    urllib.reque(image_url, filename=file_name)

以上汇总代码给没有安装 Jupyter Notebook 的朋友们使用，希望对大家有帮助。

总结

今天的文章主要讲解用 Jupyter Notebook 工具和 Selenium 框架抓取微博数据，希望对大家有所帮助。

1.《微博视频怎么保存到本地？总结很全面速看!用 Jupyter Notebook 爬取微博图片保存本地》援引自互联网，旨在传递更多网络信息知识，仅代表作者本人观点，与本网站无关，侵删请联系页脚下方联系方式。

2.《微博视频怎么保存到本地？总结很全面速看!用 Jupyter Notebook 爬取微博图片保存本地》仅供读者参考，本网站未对该内容进行证实，对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址，https://www.lu-xu.com/gl/3054251.html

微博视频怎么保存到本地？总结很全面速看!用 Jupyter Notebook 爬取微博图片保存本地

微博视频怎么保存到本地视频看这里!教你如何一键批量去水印下载抖音火山版的作者全部视频到本地

微博视频怎么保存到本地视频格式？终于找到答案了一键保存新浪微博相册

微博视频怎么保存到本地视频格式看这里!只需三步！即可将数据迁移到苹果iPhone13系列上

微博视频怎么保存到本地视频？我来告诉你答案用 Jupyter Notebook 爬取微博图片保存本地

关于微博视频怎么保存到本地，你需要知道这些视频号创作者福利，12种视频号可以实现变现的商业模式