数据分析行业薪资的秘密,你想知道的都在这里(3)

摘要:本篇文章我们通过分析和对比发现数据分析职位的需求主要集中在北上广深四个一线城市,在行风方面,移动互联网,金融行业和电子商务行业都对数据分析人才有着较大的需求量。

第三部分:数据分析职位需求分布

数据分析师的收入怎么样?哪些因素对于数据分析的薪资影响最大?哪些行业对数据分析人才的需求量最高?我想跳槽,应该选择大公司大平台还是初创的小公司?按我目前的教育程度,工作经验,和掌握的工具和技能,能获得什么样水平的薪资呢?

我们使用python抓取了2017年6月26日拉钩网站内搜索“数据分析”关键词下的450条职位信息。通过对这些职位信息的分析和建模来给你答案。

本系列文章共分为五个部分,分别是数据分析职位信息抓取,数据清洗及预处理,数据分析职位分布分析,数据分析薪资影响因素分析,以及数据建模和薪资预测。这是第三篇:数据分析职位需求分布。

第三篇文章我们来关注数据分析职位的需求分布情况。想要入数据分析坑的小伙伴们需要特别关注。我们以拉钩网的数据为基础,从行业,公司和个人三个层面入手,通过8个主要维度对数据分析的需求分布以及数据分析职位对候选人的硬件要求进行剖析。

数据分析前的准备工作

首先在分析开始之前依然是导入我们所需使用的库文件。这里除了常见的正则表达式库re,数据处理和分析库numpy和pandas以外,还有结巴分词库jieba和图表绘制库pyplot。

#导入所需数据 import re import numpy as np import pandas as pd import jieba as jb import jieba.analyse import jieba.posseg as pseg from matplotlib import pyplot as plt

导入我们之前清洗和预处理后的数据表。

#导入清洗后的数据表 lagou=pd.DataFrame(pd.read_csv('lagou_clear_data_1.csv',header=0,encoding='GBK'))

行业及城市数据分析职位分布情况

首先从行业和城市两个维度进行分析,我们统计了17个不同行业以及中国10个热门城市对于数据分析这个职位的需求,并进行了对比。

不同行业数据分析职位需求情况

在17个细分行业中,对于数据分析这个职位需求量最高的是移动互联网行业,其次是金融和电子商务行业。需求量最少的三个行业则是生活服务,旅游和文化娱乐行业。以下是具体的数据处理和图表生成过程。

industry=lagou["industry_1"].value_counts() #图表字体为华文细黑,字号为15 plt.rc('font', family='STXihei', size=10) #创建一个一维数组赋值给 a=np.array([1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17]) #创建柱状图,数据源为按用户等级汇总的贷款金额,设置颜色,透明度和外边框颜色 plt.barh([1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17],industry,color='#99CC01',alpha=0.8,align='center',edgecolor='white') #设置x轴标签 plt.xlabel('职位数量') #设置y周标签 plt.ylabel('所属行业') #设置图表标题 plt.title('不同行业数据分析职位数量') #设置图例的文字和在图表中的位置 plt.legend(['职位数量'], loc='upper right') #设置背景网格线的颜色,样式,尺寸和透明度 plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='x',alpha=0.4) #设置数据分类名称 plt.yticks(a,('移动互联网','金融','电子商务','数据服务','020','企业服务','游戏','社交网络','教育','信息安全','其他','广告营销','硬 件','医疗健康','生活服务','旅游','文化娱乐')) #显示图表 plt.show()

大数据

不同城市数据分析职位需求情况

从城市维度来看,北上广深一线城市毫无悬念的成为对数据分析人才需求最多的城市。其中尤以北京更为突出。TOP10城市中对数据分析人才需求最少的三个城市是成都,武汉,合肥。职位数量都不足5个。在TOP 10以外还有更多城市仅有一个职位。从数据分析的职位分布情况来看,逃离北上个这个概念明显不适于希望从事数据分析的小伙伴们。以下是具体的数据处理和图表生成过程。

lagou_city=lagou['city'].value_counts() #图表字体为华文细黑,字号为15 plt.rc('font', family='STXihei', size=15) #创建一个一维数组赋值给 a=np.array([1,2,3,4,5,6,7,8,9,10]) #创建柱状图,数据源为按用户等级汇总的贷款金额,设置颜色,透明度和外边框颜色 plt.bar([1,2,3,4,5,6,7,8,9,10],lagou_city[:10],color='#99CC01',alpha=0.8,align='center',edgecolor='white') #设置x轴标签 plt.xlabel('城市') #设置y周标签 plt.ylabel('职位') #设置图表标题 plt.title('数据分析职位城市分布') #设置图例的文字和在图表中的位置 plt.legend(['职位数量'], loc='upper right') #设置背景网格线的颜色,样式,尺寸和透明度 plt.grid(color='#95a5a6',linestyle='--', linewidth=1,axis='y',alpha=0.4) #设置数据分类名称 plt.xticks(a,('北京','上海','深圳','广州','杭州','厦门','南京','成都','武汉','合肥')) #显示图表 plt.show()

大数据


不同公司数据分析职位需求量

用户喜欢...

技术牛逼也要懂点社交:数据科学家公司生存指南TOP30秘诀

作者:SeattleDataGuy 数据科学家老司机的30个经验之谈,教你如何在公司内获得认同,带你绕过他们曾经踩过的坑。 作...


20个数据可视化工具点评

第一部分:入门级工具 1.Excel Excel的图形化功能并不强大,但Excel是分析数据的理想工具,上图是Excel生成的热力地图...


商机 | 大数据/政务云采购清单 招标7起,最高招标价为2089.41万(9.2-9.5)

文 | 36大数据 奥兰多 一、政府、企事业单位大数据/政务云中标成交清单,一共8起,最高成交价为1388.89万 二、政府、...


华为轮值CEO郭平:将长期投入公有云 不靠用户数据变现

作者:郭晓峰 在今日举行的华为 2017 全联接大会上,华为轮值 CEO、副董事长郭平表示,华为承诺长期投入公有云建设...


大数据让人开始怀疑人生

《 大数据时代》,维克托·迈尔·舍恩伯格、肯尼思·库克耶著,盛杨燕、周涛译,浙江人民出版社 一年多前听说了...


在 Airbnb 使用机器学习预测房源的价格

作者:Robert Chang 位于希腊爱琴海伊莫洛维里的一个 Airbnb 民宿的美好风景 简介 数据产品一直是 Airbnb 服务的重要组成...


「数据爆炸」预示着网络舆情分析也正式步入大数据时代

随着计算机技术和人工智能的不断发展,大数据时代的网络舆情分析备受关注。目前,在网民数量直奔8亿的大环境下...


MongoDB数据库遭大规模勒索攻击,被劫持26000多台服务器

刚刚曝出的大新闻,MongoDB数据库叕被攻击了。就在上周末,三个黑客团伙劫持了MongoDB逾26000多台服务器,其中规模最...


大数据处理框架的类型、比较和选择

前言 说起大数据处理,一切都起源于Google公司的经典论文:《MapReduce:Simplied Data Processing on Large Clus...


七牛大数据平台的演进与大数据分析实践

图 1 大数据生态体系 看着图 1 大家可能会感到熟悉,又或者会觉得部分有些陌生,这是一张汇集了目前大数据生态下...


HiTSDB 时序数据库技术架构和产品解析

作者:场景研读 摘要: 8月24日阿里云数据库技术峰会上,来自阿里数据库事业部高级专家钟宇带来HiTSDB 时序数据库...


通过数据分析提高企业销售成功率,GetAccept获160万美元种子轮融资

GetAccept的联合创始人Mathias Thulin非常熟悉销售们面临的一个个常见问题:他们和潜在客户聊得非常好,也能马上用邮件...


大数据早报:谷歌重返中国组建团队 天猫发布大闸蟹消费趣味数据报告(9.5)

数据早知道,上36dsj看早报! 来源36大数据,作者:奥兰多 『谷歌』谷歌重返中国组建团队? AI项目在中国开启招聘...


深度学习可视化工具大盘点

深度网络对机器学习研究和应用领域产生了巨大的影响,与此同时却无法很清晰地解释深度网络的来龙去脉。人们一...


数据中心基础架构标准化能否彻底改变超大规模IT部署?

作者:武晓燕 在日益紧密联系的经济发展中,IT基础设施正在进行重大改造以满足行业需求。 随着日常负载需求的增...


营销转数据,两年半到P7,我都做了哪些事儿?

作者:李宁 缘起 标题含义:传统行业的三年管培后,2014.12转型做数据,先后经历艾瑞、携程,于2017.9入职eleme的新零...