Python爬虫和数据分析项目有哪些

本篇内容介绍了“Python爬虫和数据分析项目有哪些”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

目前创新互联建站已为上1000家的企业提供了网站建设、域名、网页空间、绵阳服务器托管、企业网站设计、枞阳网站维护等服务,公司将坚持客户导向、应用为本的策略,正道将秉承"和谐、参与、激情"的文化,与客户和合作伙伴齐心协力一起成长,共同发展。

项目介绍

  1. LiveStreaming:

  • 内容: 爬取了西瓜直播(今日头条旗下APP)各类型游戏的主播直播数据107.5万条,并分析直播平台和游戏主播行业是否真如我们想象般的暴利

  • 对应微信公众号文章:《游戏直播行业真的如你想象般暴利?》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★★★☆

  1. LaborDay:

  • 内容: 按全国各个城市抓取飞猪“景点门票”栏的景点门票销售数据,并且分析五一哪些景点会人挤人,哪些景点值得一去

  • 对应微信公众号文章:《五一不看人人人人人人,哪儿耍合适?》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★☆☆☆

  1. KrisWu:

  • 内容: 随机抓取吴亦凡发表《大碗宽面》微博的微博转发数据10万条,并分析该条微博的真假转发比例,以及大家对于这首歌的情感倾向如何

  • 对应微信公众号文章:《大碗宽面 VS 律师函警告,情感分析吴亦凡自黑式圈粉!》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★★☆☆

  1. ESL:

  • 内容: 爬取外籍人员招聘网站JobLEADChina上的外籍英语老师招聘数据945条,万行教师人才网上的英语老师招聘数据5780条,以及微信群成员信息498条,分析外教教师的招聘状况

  • 对应微信公众号文章:《没经验没学历的外教为啥能拿1.4W+的高薪?》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★☆☆☆☆

  1. ICU996:

  • 内容: 爬取程序员集体抵制996的Github热门项目996.ICU中,Issues页面讨论数据和点了star的程序员Github个人信息数据,并且分析这群抵制996的程序员都是何方神圣

  • 对应微信公众号文章:《大胆,都是哪些程序员在反对996?!》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★☆☆☆

  1. Paediatrician:

  • 内容: 爬取丁香人才网10950条涵盖儿科、内科、外科、妇产科、眼科的招聘数据,并且分析儿科医生的生存处境

  • 对应微信公众号文章:《儿科医生的眼泪,全被数据看见了》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★★☆☆

  1. CaiXuKun:

  • 内容: 随机抓取蔡徐坤100万+转发的微博《再见,“任性的”千千…》的10万条转发数据,并且分析蔡徐坤真假转发流量的比例以及真假粉丝的用户画像

  • 对应微信公众号文章:《用大数据扒一扒蔡徐坤的真假流量粉》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★★☆☆

  1. BSGS_Rent:

  • 内容: 爬取北上广深四个城市的链家租房房源信息,并且分析四个城市的租房现状和考虑因素

  • 对应微信公众号文章:《北上广深租房图鉴》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★★☆☆

  1. Fireworks_and_Pm2.5:

  • 内容: 爬取全国367个城市的空气质量指数数据,并分析烟花爆竹对空气质量的影响,以及城市禁放烟花爆竹是否有效

  • 对应微信公众号文章:《六万条数据全面解析,城市春节禁放烟花爆竹真的有用吗?》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★★☆☆

  1. TheWanderingEarth:

  • 内容: 爬取电影《流浪地球》的猫眼评论和评分,并分析该电影出现低分的原因

  • 对应微信公众号文章:《十万条评论告诉你,给《流浪地球》评1星的都是什么心态?》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★★☆☆

  1. Weibo_Comment_Pics:

  • 内容: 模拟登陆微博手机端爬取海量表情包

  • 对应微信公众号文章:《开年表情包局部富有指南,盘它!》

  • 适合人群:Python爬虫学习者

  • 难度:★★★☆☆

  1. English_names:

  • 内容: 分析美国婴儿取名数据,为取英文名提供一些建议

  • 对应微信公众号文章:《看完这篇分析,楼下的Tony和Kevin都改名了!》

  • 适合人群:Python数据分析学习者、Pandas使用者、数据可视化学习者

  • 难度:★★★☆☆

  1. shixiseng_packet_capture

  • 内容:主要通过手机抓包分析和获取“实习僧”网站iso端的数据接口,有了接口便可以直接编写代码爬取数据

  • 对应微信公众号文章:《回复“实习僧”CTO之换种姿势爬取实习僧网站》

  • 适合人群:Python爬虫学习者、手机抓包学习者

  • 难度:★☆☆☆☆

  1. PUBG-juediqiusheng-data_analysis

  • 内容:主要分析绝地求生72万场比赛的数据,并结合数据给出吃鸡攻略,用数据吃鸡!

  • 对应微信公众号文章:《【20G】Kaggle数据集强势分析“绝地求生”,攻略吃鸡!》

  • 适合人群:Python数据分析学习者、Pandas使用者、各位吃鸡观众

  • 难度:★★★☆☆

  1. Wechat_article_collector

  • 内容:微信公众号文章采集器,用于采集微信公众号文章并保存至word文档

  • 对应微信公众号文章:《50行代码教你打造一个公众号文章采集器》

  • 适合人群:Python学习者、新媒体运营人群?

  • 难度:★★☆☆☆

  • 注:该项目由于依赖包WechatSogou疏于维护,目前暂时不能使用了。(2019-04-02 updated)

  1. mongoTV

  • 内容:爬取芒果TV的《我是大侦探》节目评论数据,并进行情感分析

  • 对应微信公众号文章:《《我是大侦探》到底怎么了?(上:数据爬取篇)》》、《《我是大侦探》到底怎么了?(下:情感分析篇)》

  • 适合人群:Python scrapy爬虫学习者、Python数据分析学习者、Pandas使用者

  • 难度:★★★☆☆

  1. shixiseng:

  • 内容:爬取实习僧网站中“数据挖掘”等相关岗位的数据,并对数据进行分析

  • 对应微信公众号文章:《帮了个小忙|破解“实习僧”网站字体加密》、《“小忙”连载篇|实习僧网站数据分析》

  • 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者

  • 难度:★★★☆☆

“Python爬虫和数据分析项目有哪些”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注创新互联网站,小编将为大家输出更多高质量的实用文章!


网站题目:Python爬虫和数据分析项目有哪些
网站URL:http://scyanting.com/article/jijodd.html