据说
《中国城市统计年鉴》
将会在4月出版
趁着它还没出版的这个空挡
数读菌整理了
城市统计年鉴
部分数据
约多个城市的各类统计数据
整理为主流BI软件可以识别的格式
分享一下
数据介绍
数据整理自《中国城市统计年鉴》,多个城市的部分数据整理在了一张统一的表格上,这也是方便各类BI软件识别,也方便添加到arcgis的属性表中。主要是各地级市的数据,不过,三沙、灵芝这样的,除了户籍人口外没有别的数据。需要说明的是,统计年鉴收录的是年的数据。这个真的要吐槽一下,某年的城市统计年鉴一般在下一年的四五月份出版,然后收录的是前一年的数据,也就是说,数据到手的时候已经是2年前的数据了。比如马上四月份要出的《中国城市统计年鉴》,收录年数据,差了两年真的是......叹气。
主要数据类别
接下来就直观的看一下这次分享的数据吧~
1
人口
下面这张地图中,圆的大小代表的是城市户籍人口的多少,越大的圆形意味着户籍人口的量越大,而颜色代表自然增长率,自然增长率0‰位于*色处,红*色就是自然增长率为负,*色越往绿色偏移意味着自然增长率越大。接近*色的,不管是红*还是*绿,自然增长率水平都处于较低。整个东北地区,emmmmmm;其实西南地区也不咋地,特别是重庆和成都之间有一个城市叫做南充市,自然增长率仅为-3.03‰,倒数第四;长三角区域*灿灿一片,整体不容乐观;自然增长率较高的是广东省,特别是粤港澳的外围城市,还有就是中原地区。
人口分布地图
利用四分法可以将这些城市分为、、和四类。
:韶关、厦门、防城港、北海、三亚、珠海、淮北等;
:鹤岗、伊春、本溪、鸡西、双鸭山、丹东、抚顺等;
:梅州、聊城、茂名、深圳、清远、驻马店、阜阳等;
:南充、上海、成都、南阳、哈尔滨、南通、沈阳等。
户籍人口-自然增长率四分图
1
经济
下面这张地图中,圆的大小代表每个城市地区生产总值的多少;而颜色代表着地区生产总值增长率的大小,红意味着低,蓝意味着高,中间灰色的转换值取的是年全国生产总值增长率6.7%。东北地区又一次,emmmmmm;整个山西省,是因为能源结构调整还是治理来着?京津冀整体也是忧伤满满。
地区生产总值分布地图
利用地区生产总值和地区生产总值增长率进行了一个聚类分析,发现这些城市可以分为三个群集:以北京、上海、广州、深圳、苏州、天津这样的大城市为代表的地区生产总值高,增长率尚可的瘦死骆驼比马大群集;东北承包了大部分成员的,以沈阳、阜新、鞍山、本溪、营口、抚顺等城市为代表的低增长率群集;以及众多抱团的中小城市为主的希望之星群集。
基于生产总值及增长率的城市聚类分析
分别使用三次产业的比重与人均地区生产总值做相关性的分析,各自的相关性都是,一产比重负相关,二产和三产则正相关。可能是由于城市类型和发展阶段存在很大的差异性,二产与三产比重虽然呈现出显著相关性,但是拟合情况并不理想。与之相对的,一产比重与人均地区生产总值的关系更为明显,不仅是的负相关,而且R2达到了0.53,可以说较好的反映出了这样一件事:城市的经济发展水平越高,其一产比重越少(这不废话么)。
三次产业占比与人均生产总值的相关性分析
地均生产总值,是每平方公里土地创造的生产值,反应土地的使用效率。通过地区生产总值除以行*区域面积得到这一指标。分别取生产总值、人均、地均三个数据进行排名:地区生产总值前20的城市仅有12个排到了人均生产总值前20中,在这12个城市中,又仅有10个城市地均生产总值进入了排名。
城市经济水平排名
使用人均和地均生产总值这两个数据进行聚类,这些城市可以分成4个群集。从人均和地均的维度上来看,第一梯队(群集4)仅有两个城市,上海和深圳。不从别的角度来考虑的话,这两个城市是目前经济发展水平和效益最好的城市。
以上仅仅是描述了本次分享的数据的很小一部分,如果想要这个数据,可以在