内容简介:最近研究了下postgresql数据库及其空间地理信息拓展插件——postgis。postgis作为新一代空间数据存储标准模型,将空间地理信息数据结构规范为关系型数据库可以承载的sp模式(simple features),这样,使得之前门槛颇高的gis空间数据存储模式变得通俗易懂、简单明了。最重要的只要接触过SQL语言,就可以利用postgis的SQL语法便捷的操纵装载着空间信息的数据框(数据表),这些二维表除了被设定了一个特殊的空间地理信息字段(带有空间投影信息、经纬度信息等)之外,与主流数据管理系统所
最近研究了下postgresql数据库及其空间地理信息拓展插件——postgis。
postgis作为新一代空间数据存储标准模型,将空间地理信息数据结构规范为关系型数据库可以承载的sp模式(simple features),这样,使得之前门槛颇高的gis空间数据存储模式变得通俗易懂、简单明了。
最重要的只要接触过 SQL 语言,就可以利用postgis的SQL语法便捷的操纵装载着空间信息的数据框(数据表),这些二维表除了被设定了一个特殊的空间地理信息字段(带有空间投影信息、经纬度信息等)之外,与主流数据管理系统所定义的各种字段并无两样。
本篇作为postgis数据库的一个前期探索篇,主要简单分享下postgresql+postgis的环境配置,及其与R语言、 Python 的API接口调用,以及如何通过这些接口来将shp、json空间地理信息数据源导入postgis。
1、环境配置篇:(可执行程序安装,如果你命令行比较熟练可以参照百度中的终端命令行进行安装)
关于postgis的环境配置,要先配置好postgresql环境,直接在以下主页下载安装即可:
https://www.enterprisedb.com/downloads
版本不要下载太高,建议9.6即可。
具体过程可以直接参考百度的教程:
https://www.yiibai.com/postgresql/install-postgresql.html
其中有几个细节点需要格外注意(自己踩过的坑)
1、尽量自己命名一个主目录(英文、不要带空格)
2、安装完postgresql之后会自定提示是否安装扩展插件(勾选postgis),如果这一步失败了不用担心,只是postgis没有安装成功,可以单独下载exe文件安装。
3、postgis安装(一定记得要和postgresql的主目录保持一致)
http://postgis.net/2017/07/01/postgis-2.3.3/
4、postgis安装之后会在postgresql库中新建一个带有空间数据表格式的模板库,此时使用postgresql安装环境中自带的pgAdmin4 工具 打开postgresql数据库,并可以新建一个引用空间数据表模板的测试库,这一步也有一个坑,在新建引用模板的测试库之后,一定要先按照官网给的步骤在测试库中运行以下脚本:
-- Enable PostGIS (includes raster) CREATE EXTENSION postgis; -- Enable Topology CREATE EXTENSION postgis_topology; -- Enable PostGIS Advanced 3D-- and other geoprocessing algorithms -- sfcgal not available with all distributions CREATE EXTENSION postgis_sfcgal; -- fuzzy matching needed for Tiger CREATE EXTENSION fuzzystrmatch; -- rule based standardizer CREATE EXTENSION address_standardizer; -- example rule data set CREATE EXTENSION address_standardizer_data_us; -- Enable US Tiger Geocoder CREATE EXTENSION postgis_tiger_geocoder;
5、上一步完成之后,即可通过postgis安装目录中的PostGIS 2.0 Shapefile and DBF Loader Exporter工具来手动导入本地的shp文件。
导入时要先建立与测试库的连接,并加载shp数据,含有中文要设置encoding = GBK。
显示导入成功即可刷新刚才的测试库,在测试库-schemas-public-tables中即可看到你新导入的控件数据集,与普通的数据库表并没有什么两样,仅仅是新增了一列叫做geom(geometry)的空间地理信息字段。
这张表整体就是我们之前在分享 R语言的sf对象和Python中的GeoDataFrame对象的技术雏形。
可以看到地理信息列在postgis中已经被编码成一组特殊数字,而在R中的sf对象中则是嵌套列表,在Python的GeoDataFrame中则是特殊的geomtry列。
- geomtry对象一共分为7中,分别为:
- point/mutipoint
- string/mutistring
- polygon/mutipolygon
- CollectionFetures(前几种种的集合)
我们平时使用最多的地理信息多边形便是mutipolygon格式。
如果觉得pgAdmin4界面信息过于繁杂,可以安装Navicat Premium,它可以直接与postgresql数据库连接,作为一个桌面可视化管理界面。
Navicat Premium界面干净整洁,几乎没有任何冗余信息,具备常用的数据查询、管理功能,非常方便。
2、postgis与R语言通讯:
在R语言中调用postgis库表,需要依赖以下两个包(RPostgreSQL\rpostgis):
library("rpostgis") library("RPostgreSQL") library("sf") library("ggplot2") library("magrittr")
读取空间数据
conn <- dbConnect( PostgreSQL(), #驱动名称 dbname='mytest', #要连接的库名称 host='localhost', #本机地址 port='5432', #port编码 user='postgres', #用户名(在安装时默认生成,也可自定义,记清楚就好) password='*****' #密码(自定义) ) #建立连接池 postgresqlpqExec(conn, "SET client_encoding = 'gbk'") #设定编码(多字节字符串)
以上两句联通了postgresql数据库表mytest,并设定了编码适应中文环境。
读入方法1
my_spdf <- pgGetGeom( conn, #连接池名称 name=c("public","bou2_4p"), #指定schemas和表名,长度为2的向量,顺序不要乱 geom = "geom" #指定表中的地理信息字段列名称 ) %>% st_as_sf() #导入数据默认为sp格式,转换为sf格式
读入方法2
map_data <- st_read(conn,"bou2_4p")
方法一实在是太麻烦了,sf包的导入函数中封装了更加简便高效的导入函数:
直接指定连接池和测试库中空间数据表表明即可。
写入空间数据:
写入空间数据时,一般要以sp格式写入(就是之前用的最多的,maptools、rgdal包导入的默认格式),但是好在sf包中提供了一键转化sf和sp对象的函数,所以这里的写入数据格式转换非常高效。
world_map <- st_read(system.file("shape/nc.shp", package="sf")) %>% as("Spatial")
写入方法1
pgInsert( conn,name=c("public","world_map"), #链接池名称+写入的表表明(自定义) data.obj = world_map #本地sp对象表 )
写入方法2
sf包中也封装了直接写入postgis数据库的函数:
nc <- st_read(system.file("shape/nc.shp", package="sf")) st_write( nc, #本地表名 dsn = conn, #指定连接池 "world_data", #写入后在库中名称 layer_options = "OVERWRITE=true" )
写入之后在pgAdmin平台上刷新对应测试库之后即可看到新写入的表内容。
关闭链接
dbDisconnect(conn)
最后用刚才导入的表做一个简单的填充图。
ggplot() + geom_sf(data = map_data,aes(fill = perimeter)) + coord_sf(crs = 4326) + scale_fill_distiller(palette ='BrBG') + theme_void()
3、postgis与Python交互:
python中的数据库交互操作路径比较多,这里仅使用geopandas提供的写入接口以及sqlalchemy写出接口,探索出可行的读写代码即可。
import geopandas as gpd from sqlalchemy import create_engine from geoalchemy2 import Geometry,WKTElement
建立连接
engine = create_engine( "postgresql://postgres:******@localhost:5432/mytest", encoding = "gbk" )
create_engine函数创建客户端与postgresql数据库的链接,连接参数是一个包含数据库驱动、用户名、用户密码、本机环境:端口及测试库名称的长字符串。最后指定编码(这里涉及到中文字符串)
df = gpd.read_postgis("select * from bou2_4p",engine,crs = 4326)
使用geopandas包中提供的postgis接口函数,导入engine连接池mytest库中的bou2_4p表所有数据。
china_map = gpd.GeoDataFrame.from_file("D:/R/rstudy/CHN_adm/bou2_4p.shp", encoding = 'gb18030') china_map['geometry'] = china_map['geometry'].apply(lambda x: WKTElement(x.wkt,4326))
因为GeoDataFrame中默认存的simple features 对象与postgis库中定义的默认simple features对象存在差异,这里需要使用geoalchemy2包提供的Geometry,geoalchemy2接口将GeoDataFrame转换为postgis库可识别的模式。
最后利用pandas封装的sqlalchemy写出函数,将刚才规范过之后的表china_map写入postgis库中。
china_map.to_sql( name = "world", #表名 con = engine, #连接池 if_exists= 'replace', #若已存在同名表,则替换 dtype = { 'geometry': Geometry(geometry_type ='POLYGON',srid = 4326)} #声明地理信息字段模式 )
本篇分享仅就postgis的安装,与R和Python之间的简单交互做一下梳理,之后如果有新的成果再做分享,期待各位小伙伴儿利用postgis结合R语言中的ggplot2+sf+shiny以及Python中的GeoDataFrame做出更多具备商业价值的东西,感兴趣的也可以一起分享交流心得。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 码农网
猜你喜欢:- 《ArcGIS 地理信息系统教程》概念笔记
- 使用openlayers在网页中展示地理信息
- 西子湖畔话创新,共谋地理信息产业新未来
- GPU云驱动GIS技术变革 支撑测绘地理信息行业升级
- ZETTAKIT GPU云加速陕西测绘地理信息局GIS升级
- 探访中海潮科技展台:自研次时代三维海洋地理信息平台
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Reversing
艾拉姆(Eilam,E.) / 韩琪、杨艳、王玉英、李娜 / 电子工业出版社 / 2007-9 / 79.00元
本书描述的是在逆向与反逆向之间展开的一场旷日持久的拉锯战。作者Eldad Eilam以一个解说人的身份为我们详尽地评述了双方使用的每一招每一式的优点与不足。 书中包含的主要内容有:操作系统的逆向工程;.NET平台上的逆向工程;逆向未公开的文件格式和网络协议;逆向工程的合法性问题;拷贝保护和数字版权管理技术的逆向工程;防止别人对你的代码实施逆向工程的各种技术;恶意程序的逆向工程;反编译器的基本......一起来看看 《Reversing》 这本书的介绍吧!
HTML 压缩/解压工具
在线压缩/解压 HTML 代码
RGB HSV 转换
RGB HSV 互转工具