联系我们
  • 电子邮箱:

    business@idata.cn

  • 客服电话:0755-26657095
  • 点击这里给我发消息客服 点击这里给我发消息客服2
返回顶部

大数据告诉你:哪些公务员最辛苦?

来源 : 秘书部落 发布 : 2018-07-02 11:31:38 访问数 : 2875 点赞数 : 3 文章分类 : 查看原文

老秘学习群每周一节免费公开课 作者:团支书数据及算法支持:TalkingData、城市数据团大清早,学姐就推开我寝室的门,说道:“我妈又打电话催我准备国考了。”没错,这就是最近学姐和我之间的主要话题。什么考公务员考到哪里啦,公务员工资高不高啦,工作是不是很轻松啦。其实我觉得这些都不是什么重要因素。收入?轻松?还要考虑这些事?难道当一名光荣的公务员的主要原因不应当是希望自己能够鞠躬尽瘁死而后已地致力于为人民服务的伟大事业吗?当然,这些话我并未出口,大清早的我实在不想再被学姐打了。但为了结束这个絮絮叨叨的话题,我还是决定帮助她研究这么一个小问题:学姐啊,公务员收入什么的我实在搞不清楚,但我们不妨来看看:当一名光荣的公务员,到底有多辛苦呢?--------以下是正式的回答---------假如只是四处打听一下的话,会发现消息往往是两极分化的。城市公共部门工作的小伙伴们总是有的忙碌有的闲。毫无疑问,个体的遭遇总是剧情离奇且难以预料的。但是总体情况如何呢?以魔都为例吧。我们登录上海市人民政府的官方网站,可以看到魔都政府已经非常贴心地把各级各类的城市公共部门信息都公布在了网站上,另外加基层一线的上海所有镇人民政府,我们把这些部门办公楼(共计704栋)整理下来,按照类型和级别把它们放在地图上,可以看到下图:那么,在这700多个公共部门办公楼工作的人(我们假设这些就是上海主要的公务员们),他们的总体工作状态怎样呢?事实上,我们没有办法去查看每个部门的打卡机,通过精确的出勤信息做出精准的分析。但非常恰巧的是,我的电脑正好放着一组来自TalkingData的数据(具体参见注释),是关于上海移动设备的大比例抽样数据(约300多万个吧)。太好了,让我们用这组数据来挖掘一下魔都公共部门的工作状况吧。第一步,我们需要定义这些公共部门在法定工作时间内的工作状态。假设,这些公共部门的公务员们会认真地且相对固定地于9:00至17:00期间在办公室上班,那么,我们则需要找到每个办公地点里在以上时段内高频度出现的移动设备源即可。而这些移动设备源的集聚状况在某种意义上代表了该部门的法定时间工作状况(根据地址频度显著性、分时段地址差异性等各项指标,共筛出来质量较高的约2万个样本落在了704栋办公楼的buffer内)。我们将移动设备源按位置汇总到各个单位,画出图来后大概长这样:从上图中我们可以看到,工作人员规模最大的公共部门均分布在内环线以内,其中浦东新区和徐汇区的若干公共部门在工作人员总数量上遥遥领先,甚至超过了人民广场。第二步,我们需要定义这些公共部门在法定工作时间之外的工作状态。假如某单位工作异常繁重,而领导的爱好又是快下班时过来说,“小团同志啊,这个文件你写一下我明天早上要。”为了满足领导的爱好,可怜的公务员下了班之后往往不能直接回家,还得在18:00到22:00这个时段里鞠躬尽瘁地加班。基于以上假设,为了描绘出公共部门在法定时间之外的工作状态(其实就是加班状况),我们需要从以上数据中再一次筛选出以上时段内(18:00至22:00)仍然在工作地点高频出现的移动设备源。将筛选出的样本(差不多剩下8000个)依然汇总到单位,画出图来大概长这样:可以看到,加班总人数的分布和工作总人数分布基本相符。浦东与徐汇仍然领先,而人民广场附近也逐渐追赶上来。仔细观察的话,在法定工作时间之外高频度移动设备源聚集量最大的部门是(冠军来了):浦东新区地方税务局。看,我们纳税纳得连收税的都得加班加点了。但是,我们需要注意到的是,加班人员总量(法定时间之外的)并不能完全反应该部门的忙碌程度,也许这个部门本来就人多呢。因此,为了相对真实地反应该部门的加班状况,我们还需要第三步。好的,第三步来了,我们来计算不同公共部门的加班人员占比。很简单,我们将第一步和第二步的筛选出的两组数据相除,就可以得到每个单位的加班人员占比并画出下图:可以看到,市中心高高的红色柱子消失了,它们在郊区零零星星地长了出来。虽然郊区公共部门的加班工作人员总量与市中心不可比拟,但是其加班人员的比例还是相当高的,而市中心某些地区甚至出现了塌陷。这是怎么回事呢?这时候,学姐打断我的分析,问道:“会不会是这些郊区的工作人员下了班之后赖在办公室不走喝茶聊天打牌呢?反正我们老家的公务员都是这样的,都是五点下班但赖到七八点才回家或者去外面吃饭。”的确,以我们所能掌握的数据是无法排除这个可能性的。但是,魔都与一般小城市的差别在于上下班回家的通勤时间是截然不同的,以平均通勤时间42分钟计算,假如赖到七八点才走,那晚饭就很难指望,回到家也只能洗洗睡了。因此,本着关怀的精神,让我们再增加一个步骤。第四步,验证一下看看,这些加班的公务员们,他们都住得离家远吗?假设,在领导第二天要看文件的强烈需求下,公务员们虽然很努力地加班,但是不至于总是干通宵啊,一个礼拜也得有个三五天回家睡觉吧。在家时间可能不会很长,差不多也就是24:00至6:00吧。基于这个假设,我们找到了步骤二中筛选出的那些移动设备源在以上时段(24:00至6:00)内高频出现的地点,将至视为该工作人员的居住点。然后将这些点与工作部门所在地进行连线,可以画出一张加班人员通勤OD图:上图中的红点,标示相应的公共部门所在地;而绿线,则表示加班的公务员回家的通勤方向与通勤距离。可以看到,分布在远郊的红点们,其中很多的通勤连线都紧紧地联系着市中心,甚至有些是长途跋涉,比如金山、临港等地区。可以这么理解:对于某些在郊区工作的公务员来说,假如一不小心在办公室多赖了一会儿,那这天也不太用考虑回家这件事了。学姐忍不住问道:“郊区的公务员真的都住的那么远吗?还是这只是个别现象? ”我们可以将以上结论做一个分区的统计,请看下图:从通勤角度来看,的确,大部分市区的加班公务员通勤距离差异不大,保持在8公里左右。但是郊区加班公务员的通勤距离则差异极大。比如,嘉定、松江、青浦和奉贤,在这四个传统区县里,加班公务员的通勤距离非常短,仅有5公里,估计很多都是本地解决。但对于金山和崇明而言,则达到了12公里以上。但从加班指数(加班人员占比)上看,每个区也均有不同。可以看到,公务员加班指数排名最高的三个区分别为静安、崇明、和杨浦,加班比例达到了35%(崇明又加班路又远到底是有多惨)。而相对比较轻松的则是金山、嘉定和普陀,其加班比例略低,但也有20%以上。我愉快地做完了这个分析,试图结束这个话题。但学姐又发话了,“考公务员的话,貌似不是按片考的吧,是按部门吧。”啊,好像真的是这样(我真的应该认真去看一下公务员考试指南了)。那么好的,让我们按照公共部门的类型整理一下分析结果吧(只包括了按照官网分类标准能够准确分类的,无法准确分类的被我无情地剔除了),请看下图:可以看到,加班指数最高的公共部门分别是城市规划部门、其次是人民政府和公安系统,所幸警察叔叔们的通勤距离还不算太长。依次排序下来,则是税务、财政、发改。以上六类虽然通勤距离各有差异,但是加班指数均达到了30%。而相对较为舒适的公共部门看起来还是交通系统啊,加班指数最低(约25%),而通勤距离也最短(3公里)。我若有所思地自言自语道:看来我要劝告那些学城市规划的弟弟妹妹们,赶紧转行学城市交通了才对啊。这时,学姐第三次发话了,“我觉得你这么分析还是不科学啊。难道区规划局和市规划局、区政府和市政府的加班、国税局和地税局的工作模式一样吗?部门类型内部可是差异极大的啊。”好吧,让我再次将这些公共部门按照等级分类,分级到市、区、镇三级(魔都基本上没有国家级部门,有少数几个被我归类在市一级了)。请看下图:额。这个规律也太过于明显了吧。我赶紧指着屏幕说道,“喂,学姐你看。市级部门的公务员平均加班比率最低,不到30%,通勤距离也比较短;而镇级加班率最高,通勤更是达到了9.5公里。。。哎,学姐你看啊。”学姐没有搭腔,我转过头来,发现她已经把手机贴到了耳边,并对我做了一个嘘的手势。我赶紧闭上了嘴,隐隐地听到她手机听筒里嘟了两声之后接通了,然后她急匆匆地问道:“喂,妈,你在市里面有人吗?”*注:1,本文所使用的移动设备数据来自于城市数据团的合作伙伴TalkingData。TalkingData的数据收集依赖于设备使用者的授权,TalkingData不会收集姓名,手机号,通讯记录,居住或通信地址等跟人身份信息。TalkingData的数据服务也是匿名化和模糊化的。本文中所使用的数据,对设备ID做了匿名化处理,不仅无法对应到具体个人,也无法对应到具体设备。研究中,对地理位置数据也做了空间和时间两个维度上的模糊化,使用这些数据无法跟踪,定位具体个人 ,也不能用来确定个人身份。2,其他相关数据均来自于互联网开源数据或公开数据,由城市数据团(MDT)提供。城市数据团不对任何人的职业选择负责,根据文章做出人生抉择的小伙伴请追随你自己的内心,出了任何问题,请不要来找城市数据团。往期精彩写材料难,我想辞职,怎么办?国务院发文:侵犯休息权将对领导追责(5+2、白加黑或统统消失?)省委组织部长传授18法:文经我手无差错,事交我办请放心!开滴滴被查副镇长:当天赚了4块钱,我给公务员丢脸了一位国贫县挂职副县长直言:我来捅捅精准识别的窗户纸!原来开场白有这么多种形式,跟着习近平学说开场白!