怎样使用python网络爬虫抓取视频
小编给大家分享一下怎样使用python网络爬虫抓取视频,希望大家阅读完这篇文章后大所收获,下面让我们一起去探讨吧!
创新互联公司主要业务有网站营销策划、成都网站建设、网站制作、微信公众号开发、重庆小程序开发、H5技术、程序开发等业务。一次合作终身朋友,是我们奉行的宗旨;我们不仅仅把客户当客户,还把客户视为我们的合作伙伴,在开展业务的过程中,公司还积累了丰富的行业经验、营销型网站资源和合作伙伴关系资源,并逐渐建立起规范的客户服务和保障体系。
准备工作:
l Chrome 浏览器、
l Vim
l Python3 开发环境
l Kali Linux
API 寻找 && 提取
1、我们通过 F12 打开开发者模式。
2、再查看一下 Headers 属性
3、再看下看到Request URL这个属性值
代码实现
写好脚本,利用爬虫下载片断
##导入的两个模块,其中requests模块需要自行下载 from multiprocessing import Pool import requests ##定义一个涵数 def demo(i): ##定义了一个url,后面%3d就是截取后面三位给他加0,以防止i的参数是1的时候参数对不上号,所以是1的时候就变成了001 url="https://vip.okokbo.com/20180114/ArVcZXQd/1000kb/hls/phJ51837151%03d.ts"%i ##定义了请求头信息 headers={"user-agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/49.0.2623.221 Safari/537.36"} ##构建自定义请求对象 req=requests.get(url,headers=headers) ##将文件保存在当前目录的mp4文件中,名字以url后十位数起名 with open('./mp4/ {}'.format(url[-10:]), 'wb') as f: f.write(req.content) ##程序代码的入口 if __name__=='__main__': ##定义一个进程池,可以同时执行二十个任务,不然一个一个下载太慢 pool = Pool(20) ##执行任务的代码 for i in range(100): pool.apply_async(demo, (i,)) pool.close() pool.join()
复制电影存放的路径
用进入windows命令行模式,粘贴地址
复制该目录下所有以*.ts结尾的文件,复制成一个文件
进行合并
进行验证
看完了这篇文章,相信你对怎样使用python网络爬虫抓取视频有了一定的了解,想了解更多相关知识,欢迎关注创新互联行业资讯频道,感谢各位的阅读!
分享名称:怎样使用python网络爬虫抓取视频
标题URL:http://scyanting.com/article/pigoog.html