业界动态
使用Python多线程爬虫实现磁力链接搜索神器
2024-11-11 09:45

因为技术交流群(群号见文末)的人数刚刚到达100人,为了吸引更多的人进技术交流群,从今天开始,我都会写一些好玩的项目,今天这东西估计很多人都会需要,因为磁力链接被很多人认为是……(算了,不说了,我是一个正经人

使用Python多线程爬虫实现磁力链接搜索神器

使用Python多线程爬虫实现磁力链接搜索神器_单线程

)。

磁力链接

讲获取磁力链接之前,首先讲一下什么是磁力链接?磁力链接(Magnet URI scheme),简单的说:类似下面这样以“magnet:?xt=urn:btih:”开头的字符串,就是一条磁力链接;确切的说:“磁力链接”的主要作用是识别【能够通过“点对点技术(即:P2P)”下载的文件】。这种链接是通过不同文件内容的Hash结果生成一个纯文本的“数字指纹”,来识别文件的。而不是基于文件的位置或者名称。

知道磁力链接是什么远远不够,我们还应该知道它在什么地方,如果去整个互联网寻找磁力链接犹如大海捞针,完全没有效率!实际上,磁力链接有专门的网站,一般百度搜索btbook就可以。我找到的是https://www.btbook.tv/这个网站,这个网站的内容如图所示。

使用Python多线程爬虫实现磁力链接搜索神器_多线程_02

查看URL+设计正则表达式

再爬虫之前,随便检索一个东西,我这里检索的关键字是刺客信条(因为我是一个正经人

使用Python多线程爬虫实现磁力链接搜索神器_单线程

),在搜索框中输入“刺客信条”,点击搜索,跳转到一个新的页面,这个页面如图所示。

使用Python多线程爬虫实现磁力链接搜索神器_单线程_04

观察URL,大致格式应该是这样的"https://www.btbook.tv/search/"+关键字+".html"。事实并不是这样,因为磁力链接不止一页,向下滚动到底,会看到如图所示的内容。

使用Python多线程爬虫实现磁力链接搜索神器_搜索_05

这个时候随便点击一个数或者>,看看其他页的URL和第一页有什么不同。当点击第二页,会发现URL变成了"https://www.btbook.tv/search/"+关键字+"/last-"+页码+".html"的格式,那么我们来检测一下,它有多少页,检测过程我就不详细讲解了。经过检测,它有100页,但最后一页或几页可能像这样。

使用Python多线程爬虫实现磁力链接搜索神器_搜索_06

这就告诉我们它可能会有异常的情况,这就要求程序中一定要有异常处理!

现在先看一下正常情况,跳到第一页,按F12,出现的内容如图所示。

使用Python多线程爬虫实现磁力链接搜索神器_搜索_07

然后在上面的网页源码的地方鼠标点击一下,然后按Ctrl+F打开搜索框,在源码位置搜索你所输入的关键字,我这里就是刺客信条啦,然后找到对应的地方,如图所示。

使用Python多线程爬虫实现磁力链接搜索神器_搜索_08

然后我们就点击第一个标题,网页内容如图所示。

使用Python多线程爬虫实现磁力链接搜索神器_单线程_09

首先查看URL,可以发现这里的URL就是"https://www.btbook.tv/"+那个超链接标签的href所对应的值,这个时候就可以轻松的写出正则表达式:r'<a.*?href="(/wiki/.*?.html)".*?>'。接着继续按F12,我们重点要获取的就是4个东西:名称、大小、磁力链接、迅雷链接。这个时候还是和之前一样,找到名称、大小、磁力链接、迅雷链接,存放位置并写出对应的正则表达式。

单线程爬虫实现磁力链接搜索神器

为了方便大家理解,先讲单线程爬虫。为了方便大家理解,代码中写了好多注释,实现代码如下:

使用Python多线程爬虫实现磁力链接搜索神器_多线程_10

使用Python多线程爬虫实现磁力链接搜索神器_多线程_11

多线程爬虫实现磁力链接搜索神器

有些人会认为单线程速度太慢,想提高一下检索速度,想使用多线程爬虫。在使用多线程爬虫之前首先要创建多个线程,想使用多线程就必须导入threading模块中的Thread类,我们大概也能够想到为每一页创建一个线程,实现代码如图所示。

使用Python多线程爬虫实现磁力链接搜索神器_单线程_12

使用Python多线程爬虫实现磁力链接搜索神器_多线程_13

最后提一些注意事项:第一,不要使用分布式多线程爬虫,使用分布式多线程爬虫会造成服务器过载,严重可能出现服务器崩溃,我这还不是分布式,就是一台机器多个线程而已;第二,建议凌晨期间执行此程序,因为凌晨上网的人比较少;第三,我这程序使用了Python3.6的新特性字符串前缀f,如果版本太低建议升级,因为其他原因升不了自己尝试修改。

今天的文章又不懂的可以加群,多线程爬虫实现磁力链接搜索神器的代码也上传到了群文件,群号:822163725,备注:小陈学Python,不备注可是会被拒绝的哦~!

最后欢迎大家扫码关注

    以上就是本篇文章【使用Python多线程爬虫实现磁力链接搜索神器】的全部内容了,欢迎阅览 ! 文章地址:http://www78564.xrbh.cn/news/27056.html 
     文章      相关文章      动态      同类文章      热门文章      栏目首页      网站地图      返回首页 迅博思语移动站 http://www78564.xrbh.cn/mobile/ , 查看更多   
最新文章
华为智能手机为何不能被其他手机蓝牙搜索到华为自拍杆怎么连接手机「华为智能手机为何不能被其他手机蓝牙搜索到」
  华为智能手机不能被其他手机蓝牙搜索到原因是未开启蓝牙。   华为手机目前是全球第六大手机厂商,排在三星,苹果,诺基亚
老牌SLG的逆袭:2亿用户的“魔性营销”藏着对人性的洞察
当SLG都在卷美术、卷题材、卷技术时,一款画风停留在“页游时代”的老产品——《Evony》,却交出累计下载超2亿次、长期霸榜美国
苹果要“卷”起来了?三星预判苹果2024年推出折叠屏,影响几何苹果折叠手机「苹果要“卷”起来了?三星预判苹果2024年推出折叠屏,影响几何」
  苹果可能也要加入“折叠屏战场”了。  据媒体报道,近日,三星的移动业务部门向其供应商透露,苹果将在2024年加入折叠屏领
欧冠反戈旧主!离开皇马4年:神童成长为巨星,身价涨到1亿
北京时间4月9日凌晨3点,欧冠1/4决赛首回合,阿森纳主场迎战皇马。赛前,《阿斯报》特别提到阿森纳1名球员:26岁的队长。他曾是
邢台柏乡:“体育+”激活乡村振兴“健康密码”
近日,河北省柏乡县西刘村文化广场的乒乓球赛,奏响了柏乡镇“全民健身促振兴”主题年活动序曲。这场以体重管理为切入点、覆盖全
OPPO努力冲销量,高端旗舰突降970元,哈苏三摄+120倍变焦
大家都知道啊,由于中美贸易战的升级,目前外贸生意变得越来越不好做了,不少国产手机厂商为了扩大内需,纷纷调低了旗下手机的入
苹果不横屏怎么设置手机怎么调横竖屏「苹果不横屏怎么设置」
苹果手机用户在日常使用中,经常会遇到需要固定屏幕方向,防止其自动横屏的情况。无论是阅读电子书、浏览网页还是进行其他操作,
谷歌地图高清卫星地图手机版人家特色手机卫星地图「谷歌地图高清卫星地图手机版人家特色」
谷歌地图高清卫星地图手机版是一款由谷歌公司推出的手机高清电子地图。用户下载后,可以随时随地的在其中查到世界各地的地图情况
苹果13怎么恢复数据苹果手机数据恢复「苹果13怎么恢复数据」
苹果的手机官方价格非常亲民,目前的售价也是可以接受的。消费者可以通过苹果官方网站或各大电商平台进行购买。随着时间的推移,
能建立自己王朝的游戏合集2023 战争类型策略手游推荐手机策略游戏「能建立自己王朝的游戏合集2023 战争类型策略手游推荐」
今天跟大家一起聊聊能建立自己王朝的游戏。不知道大家有没有想过自己成为一代君王的感觉,通过不断进行排兵布阵,从而让自己一举

loading