使用pandas_bokeh在地图上显示数据
本文记录阿猪使用pandas_bokeh的踩坑过程,供大家参考。
一、简介
pandas_bokeh集成了bokeh、geopandas等模块,除了可以绘制各类图表,还支持直接在地图上显示数据。效果举例如下:
详细介绍和具体用法请参考GitHub - Pandas-Bokeh二、数据文件
pandas_bokeh的MapPlots方法只需要点坐标即可定位,支持直接从csv等常规文件中读取数据。但是功能更丰富的GeoPlots方法是基于GeoJson格式的数据的,需要从GeoJson文件中读取位置数据,如果直接向dataframe写入位置数据,则pandas_bokeh会在读取数据的时候报错Type Error: Unhashable type: 'list'
。
对于type类型为Feature的GeoJson文件,官方给出的基本结构示例如下:
1 | { |
一级key包含type、geometry、properties。其中geometry中存放位置信息,包含type、coordinates两个key。type包含Point(点)、Polygon(多个点连接而成的多边形)、Multipolygon(多个Polygon,比如印尼有很多个岛屿,存储其国土形状信息就需要多个Polygon)。properties存放其他各类数据。
对于type类型为FeatureCollection的GeoJson文件,阿猪总结的基本结构示例如下:
1 | { |
一级key一般包含type、crs、features。猜测crs应该是声明features中keys、values的结构的。features的数据的形式类似于list,可以根据自己的需要放入一个或多个嵌套的类似dict结构的数据。比如你需要画5个国家,显示每个国家的人口数据,那么就对应5个。
这里是重点,你想要显示在地图上的数据,都需要放到feature下每个嵌套”dict”的properties中。例如上边示例中的POP2005、POP2006就是自己加进去的。Pandas_Bokeh也是在properties里寻找你要它显示的数据。
Pandas_Bokeh读取完GeoJson数据后,是以DataFrame形式存放的。所以如果你嫌弃在GeoJson文件中写入不方便,理论上也可以使用传统的csv文件、数据库等方式储存自己的数据,然后在这个DataFrame中增加一列或多列,把你自己的数据放入这个DataFrame。
三、参考信息
关于位置信息的数据,以下几个网站供参考:
(1) World Boarders - TheMaticMapping.org
一个不明觉厉的网站,提供World Borders Dataset的shapefile下载,自行转换为GeoJson格式后即可使用。可以通过Pandas_Bokeh在地图上轻松绘制每个国家的形状。
可以使用geopandas实现shp格式向geojson格式的转换。
1 | import geopandas |
(2) DataV.GeoAtlas DataV.GeoAtlas地理小工具系列 (aliyun.com)
阿里云提供的一个在线小工具,包括范围选择器、边界生成器、层级生成器。