[GIS] GIS 란? 데이터 형식과 저장 구조
제목
[GIS] GIS 란? 데이터 형식과 저장 구조
관련게시글
[GIS] GIS 란? 데이터 형식과 저장 구조
목차
0. GIS?
1. Spatial Data, 지리 정보 데이터, 공간 데이터 유형
2. 데이터 형식과 저장 구조
0. GIS(Geographic Infromation System, 지리 정보 시스템)
GIS는 공간 데이터를 수집, 저장, 분석, 관리 및 시각화하는 시스템입니다.
공간 데이터는 지도에 표시할 수 있는 데이터를 말합니다.
예컨대, 건물위치나 이동 경로, 역세권 등이 공간 데이터에 속합니다.
GIS는 단순한 지도를 넘어, 공간 데이터를 활용하여
다양한 분석을 수행, 의사 결정을 지원합니다.
(예: 네비게이션, 상권 분석 등)
GIS는 공간 데이터를 2D, 3D로 가시화하여
의사결정을 더 쉽게 내릴 수 있도록 합니다.
2D, 3D 에 주로 사용하는 도구는 아래와 같습니다.
2D - OpenLayers, MapLibre, ...
3D - Cesium, three.js, MapLibre, ...
GIS의 핵심을 이야기하자면,
"공간 데이터를 가공하고 분석하며, 이를 효과적으로 가시화하여 의미 있는 정보를 도출하는 것"
이라고 볼 수 있습니다.
예컨대, 바람의 흐름을 가시화한다면 태풍 경로를 추론할 수 있을 것입니다.
1. Spatial Data, 지리 정보 데이터, 공간 데이터 유형
공간 데이터는 지구상의 특정 위치를 나타내는 데이터로
좌표(위도/경도) 정보를 포함하여 실제 공간에 매핑할 수 있습니다.
공간 데이터는 크게 Vector , Raster 두 가지 형태로 나눌 수 있으며,
Raster(레스터)는 연속적인 정보를 Vector (벡터)는 개별 객체를 저장합니다.
1.1. Vector Data, 벡터 데이터
Vector Data는 점(Point), 선(Line), 다각형(Polygon)과 같은 기하학적 요소를 활용하여 공간 객체를 표현한 것입니다.
예시로 도로망, 건물 경계, 지형 경계, POI(Point of Interest)가 있습니다.
1.2. Raster Data, 래스터 데이터
Raster Data는 공간데이터를 격자(grid)로 표현한 것입니다.
예시로 위성 이미지, 항공사진, DEM(Digital Elevation Model, 디지털 고도 모델), 기온 · 습도 등
연속적 데이터가 있습니다.
2. 데이터 형식과 저장 구조
공간데이터의 자료형식은 Shapefiles, GeoJSON, GeoTIFF 등이 있습니다.
Vector, Raster 데이터에 따라 지원하는 자료형식이 다릅니다.
2.1. Vector Data Type
2.1.1. Shapefile
Shapefile은 GIS에서 널리 사용되는 벡터 데이터 형식으로,
ESRI(Environmental Systmes Research Institute)에서 개발하였습니다.
하나의 단일 파일이 아니라 여러 개의 파일이 함께 존재해야 합니다.
기본적으로 .shp .shx .dbf 파일이 필수적이며,
추가적인 보조 파일이 있을 수 있습니다.
2.1.1.1. Shapefile 장점
기본적인 지리 객체(Point - 점, Polyline - 선, Polygon - 다각형)를 지원합니다.
다른 GIS 형식보다 간단한 구조를 지녔기에 비교적 다루기 쉽습니다.
2.1.1.2. Shapefile 단점
파일 하나 당 하나의 피처 유형만 구성해야 하며,
(예컨대, 하나의 파일에 점, 선이 함께 저장될 수 업습니다)
위상구조(topology)에 대한 정보를 저장할 수 없습니다.
db가 아닌 파일 기반으로 데이터를 관리하기에 대규모 데이터에 적합하지 않습니다.
(최대 10자) 필드 길이 제한이 있습니다.
Shapefile은 PostGIS, GeoJSON 등
다른 공간데이터 형식과 함께 사용하면 더 유용합니다.
2.1.2. SQLite 데이터베이스 - GeoPackage
GeoPackage(gpkg)는 SQLite 기반의 공간 데이터 저장형식으로,
공간 데이터를 효과적으로 관리하기 위해 개발된 파일 기반 공간 데이터베이스입니다.
2014년 OGC가 GeoPackage를 표준으로 채택하였으며,
Shapefile의 한계를 극복하고자 만들어졌습니다.
2.1.2.1. SQLite 데이터베이스 - GeoPackage 장점
하나의 GeoPackage 파일에 벡터, 레스터, 메타데이터 등을 모두 저장할 수 있습니다.
SQLite 기반 데이터베이스이므로 데이터 무결성이 보장됩니다.
읽기/쓰기 성능이 우수하며, 대용량 데이터 처리가 가능합니다.
모바일에 친화적입니다.
2.1.2.2. SQLite 데이터베이스 - GeoPackage 단점
래스터 데이터를 포함할 경우 용량이 급격히 증가할 수 있으며,
파일 크기가 Shapefile보다 더 커질 수도 있습니다.
대용량 데이터를 저장하면 성능 저하가 발생할 가능성이 있습니다.
데이터베이스 파일이 손상될 경우, 전체 데이터 접근이 불가능할 수 있습니다.
(Shapefile은 여러 개의 파일로 구성되어 있어 일부 손상 시 복구 가능성이 있습니다)
파일 기반 데이터베이스이므로, 다중 사용자 환경에서 성능이 떨어질 수 있습니다.
(서비스에 따라 PostGIS가 더 적합할 수 있습니다)
PostGIS보다 대규모 공간 연산 성능이 낮습니다.
2.1.3. GeoPackage vs. Shapefile
GeoPackage와 Shapefile을 비교하면 아래와 같습니다.
2.2. Raster Data Type
2.2.1. GeoTIFF
GeoTIFF(Georeferenced Tagged Image File Format)는
위치 정보를 포함하는 래스터 데이터 저장 형식으로,
OGC 표준을 따르는 공간 데이터 포맷 중 하나입니다.
GeoTIFF는 기존의 TIFF(Tagged Image File Format)에
지리적 참조 정보(Geo-Referencing)를 추가한 것으로,
위성 이미지, 항공 사진, DEM-디지털 고도 모델 등 다양한 공간 데이터를 저장합니다.
GeoTIFF는 좌표 참조 시스템(CRS, Coordinate Reference System)을 포함하여
WGS84, UTM, EPSG 등 다양한 좌표계를 지원합니다.
2.2.1.1. GeoTIFF 장점
다양한 공간 데이터를 표현할 수 있으며,
전 세계 모든 좌표계를 지원합니다.
대용량 데이터(단일 파일로 GB 급 이상)를 지원합니다.
압축 기능을 지원하여 이미지 크기를 최적화, 저장 공간을 절약할 수 있습니다.
대부분의 GIS 소프트웨어와 호환되며,
특히 GDAL 라이브러리로 데이터 가공을 쉽게 할 수 있습니다.
2.2.1.2. GeoTIFF 단점
대용량 데이터를 다룰 수 있다는 것은, 저장공간이 많이 필요할 수 있다는 것을 의미합니다.
따라서 Shapefile이나 GeoPackage보다 파일 크기가 훨씬 클 수 있습니다.
파일 기반 형식이므로 여러 사용자가 동시에 편집하기 어렵습니다.
벡터 데이터처럼 개별 객체를 직접 수정하는 것이 어렵기 때문에,
새로운 파일을 생성해야 하는 경우가 많습니다.
GIS 소프트웨어에서 고해상도 GeoTIFF 파일을 불러오면 성능 저하가 발생할 수 있습니다.
2.3 좌표계 Coordinate System
좌표계는 지구 상의 특정 위치를 수치적으로 표현하는 체계로,
지표면의 위치를 수학적으로 정의하는 방식입니다.
좌표계는 크게 지리 좌표계(GCS)와 투영 좌표계(PCS)로 나뉩니다.
지리 좌표계는 지구를 3차원의 구형 또는 타원체(Ellipsoid)로 간주하고
위치를 위도(latitude)와 경도(longitude)로 표현합니다.
투영 좌표계는 지구의 곡면을 평면(2D)으로 변환하여 표현합니다.
좌표계를 수학적으로 변환하여 X,Y 좌표를 사용합니다.