Python爬虫爬取并简单分析A股公司数据
这篇文章主要介绍“Python爬虫爬取并简单分析A股公司数据”,在日常操作中,相信很多人在Python爬虫爬取并简单分析A股公司数据问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Python爬虫爬取并简单分析A股公司数据”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!
我们提供的服务有:网站设计制作、网站建设、微信公众号开发、网站优化、网站认证、临海ssl等。为上1000家企事业单位解决了网站和推广的问题。提供周到的售前咨询和贴心的售后服务,是有科学管理、有技术的临海网站制作公司
前言
利用Python爬取并简单分析A股公司数据。让我们愉块地开始吧~
开发工具
Python版本:3.6.4
相关模块:
requests模块;
bs4模块;
lxml模块;
pyecharts模块;
wordcloud模块;
jieba模块;
以及一些Python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
数据爬取
目标网站:
http://www.askci.com/reports/
需要爬取的数据如下图所示:
懒得动脑子了,直接借助BeautifulSoup提取的这些数据,简单粗暴,源代码如下:
完整源代码详见个人主页或私信获取相关文件中的Spider.py文件。
运行效果截图如下:
All done~
数据分析
在数据爬取部分,我们共获得了3573条A股公司数据,下面我们就来简单地可视化分析一波吧~
首先让我们来看看A股公司的区域分布吧:
其中A股公司超过三百家的省份有:
广东
北京
浙江
江苏
接下来再来看看A股公司的收入情况吧:
其中主营业业务收入TOP10为:
再来看看A股公司的员工数量呗:
再来看看A股公司的上市时间分布呗:
其中,2013年上市的公司数量最少(2个);2017年上市的公司数量最多(438个)。
OK,要不我们再来看看A股公司所在的行业类型占比TOP10吧:
Emmmm,很真实。
到此,关于“Python爬虫爬取并简单分析A股公司数据”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注创新互联网站,小编会继续努力为大家带来更多实用的文章!
文章名称:Python爬虫爬取并简单分析A股公司数据
标题链接:http://scyanting.com/article/iegohi.html