当前位置:首页 > 娱乐

(漫画种子怎么下载)BT种子怎么下载

【一、项目背景】

[蜜柑计划 - Mikan Project] :新一代的动漫下载站。是一个专门为喜欢动漫的小伙伴们打造的动漫视频在线播放网站,为大家第一时间分享最新动漫资源,每日精选最优质的动漫推荐。

【二、项目目标】

实现获取动漫种子链接,并下载保存在文档。

【三、涉及的库和网站】

1、网址如下:

{}

2、涉及的库:reques****ts、****lxml、****fake_useragent

3、软件:PyCharm

【四、项目分析】

首先需要解决如何对下一页的网址进行请求的问题。可以点击下一页的按钮,观察到网站的变化分别如下所示:

1 2 3

点击下一页时,每增加一页Classic/()自增加1,用{}代替变换的变量,再用for循环遍历这网址,实现多个网址请求。

【五、反爬措施】

1、获取正常的 http请求头,并在requests请求时设置这些常规的http请求头。

2、使用 fake_useragent ,产生随机的UserAgent进行访问。

【六、项目实施】

1、我们定义一个class类继承object,然后定义init方法继承self,再定义一个主函数main继承self。导入需要的库和网址。

import requests from lxml import etree from fake_useragent import UserAgent class Mikan(object): def __init__(self): = "{}" def main(self): pass if __name__ == '__main__': Siper = Mikan() Si()

2、主方法(main):for循环实现多个网页请求。

stat = int(input("start :")) end = int(input(" end:")) for page in range(stat, end + 1): url = .format(page) print(url)

3、 随机产生UserAgent。

for i in range(1, 50): = { 'User-Agent': ua.random, }

4、发送请求 获取响应, 页面回调,方便下次请求。

def get_page(self, url): res = reque(url=url, headers=) html = res.con("utf-8") return html

5、xpath解析一级页面数据,for循环遍历补全网址,获取二级页面网址。

parse_html = e(html) one = ('//tbody//tr//td[3]/a/@href') for li in one: yr = "; + li

6、二级页面请求 ,先找到页面父节点,for循环遍历,再用path获取到种子的下载地址。补全种子链接地址。

tow = ('//body') for i in tow: four = i.xpath('.//p[@class="episode-title"]//text()')[0].strip() fif = i.xpath('.//div[@class="leftbar-nav"]/a[1]/@href')[0].strip() # print(four) t = "; + fif print(t)

7、保存在word文档 。

dirname = "./种子/" + four[:15] + four[-20:] + '.torrent' # print(dirname) html3 = reque(url=t, headers=).content with open(dirname, 'wb') as f: f.write(html3) print("\n%s下载成功" % four)

8、调用方法,实现功能。

html = (url) (html)

【七、效果展示】

1、运行程序,在控制台输入起始页,终止页,如下图所示。

2、将下载成功的图片信息显示在控制台,如下图所示。

3、保存.torrent文档。

4、如何打开种子文件?先上传到百度云盘,如下图所示。

5、双击解析下载,如下图所示。

【八、总结】

1、不建议抓取太多数据,容易对服务器造成负载,浅尝辄止即可。

2、本文章就python爬取Mikan Project,在下载种子的难点和重点,以及如何防止反爬,做出了相对于的解决方案。

3、介绍了如何去拼接字符串,以及列表如何进行类型的转换。

4、欢迎大家积极尝试,有时候看到别人实现起来很简单,但是到自己动手实现的时候,总会有各种各样的问题,切勿眼高手低,勤动手,才可以理解的更加深刻。

5、Mikan Project还提供了星期的专栏。每一天都可以看到好看的动漫。专门为喜欢动漫的小伙伴们打造的动漫视频。

6、需要本文源码的小伙伴,后台回复“动漫资源”四个字,即可获取。

****看完本文有收获?请转发分享给更多的人****

IT共享之家

入群请在微信后台回复【入群】

想学习更多Python网络爬虫与数据挖掘知识,可前往专业网站:

1.《(漫画种子怎么下载)BT种子怎么下载》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《(漫画种子怎么下载)BT种子怎么下载》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/3239101.html

上一篇

漫画种子怎么下载,百度云怎么下载种子

漫画种子怎么下载,百度云怎么下载种子

漫画种子怎么下载,百度云怎么下载种子,种子文件怎么下载相关介绍,一、前言 作者:Jack Cui 经过上两篇文章的学习,Python爬虫三步走:发起请求、解析数据、保存数据,已经掌握,算入门爬虫了吗? 不,还远远不够!只掌握这些,还只能算门外汉级别。 今天,就来带

妖尾290多集怎么没看见蕾比

妖尾290多集怎么没看见蕾比相关介绍,《妖精的尾巴》中谁是帅哥?答案当然是一夜。为了寻找拉格萨斯和雷神众,一伙人踏上了旅程。伽吉鲁利用这一年中的资源,不仅知道目标所在,还知道一个温泉所在。大家浸泡在温泉之中,去除旅途中的疲劳,享受着这一刻

新妹魔王的契约者漫画怎么看

新妹魔王的契约者漫画怎么看相关介绍,今日,动画《新妹魔王的契约者》的官方网站宣布,新的60分钟时长的OVA动画即将推出。OVA名为《新妹魔王の契約者 DEPARTURES(暂译:新妹魔王的契约者 离去)》。OVA将会从2018年1月27

[掌阅漫画怎么做漫画]免费漫画阅站怎么变了?

掌阅漫画怎么做漫画,免费漫画阅站怎么变了,掌阅漫画怎么不能看了相关介绍,收购半次元才算真正为今日头条注入了二次元的DNA。 刺猬公社 | 李子涵 号称“剁手之王”的今日头条又出手了,这一次,手伸到了萝莉、御姐们的腰际。 就在“百头大战”激战正酣,诸位吃瓜看官如痴如醉之时,

[什么小说好看推荐几部]什么小说好看推荐几部完结的现代 霸总?

什么小说好看推荐几部,什么小说好看推荐几部完结的现代 霸总,什么小说好看推荐几部完结的女生相关介绍,看完进一步追的小说更新,没事的话,我会推荐几本100万字以上的名牌小说,希望你喜欢。 第一本:《纯阳武神》477万字连载中 玄幻作者十步行的作品,一本2015年12月上线的老书,写了五年多,依旧还没有

精彩!八月完结好文,女追男,破镜重圆,追妻火葬场,都市小甜饼

好看的都市言情小说完本推荐相关介绍,最新的结尾好文本: 1.《家财万贯的我拿了短命剧本》作者:金橙 2。《盛世锦安》作者:美人裕 3。《小娇矜》作者:余家杂志(娇娇公主vs高龄的花老师,追女男,追妻子火葬场) 4。《前任》作者:鱼眼杂志