Растрове представлення даних: загальні риси, ієрархічні структури, стиснення даних
Растровий спосіб формалізації просторових даних, чи растрова модель просторових даних, у найпростішому випадку полягає в зображенні просторових об'єктів у вигляді мозаїки, що суцільно покриває територію. Ця мозаїка і називається растром. Кожен елемент растра називається коміркою растра або пікселем.
Ієрархічні растрові структури
Растрові структури зручні для відображення ієрархічно організованої географічної інформації. Подання растрової інформації у вигляді кількох внутрішньо пов'язаних рівнів, при якому нижній рівень відповідає вихідному поданню растра, що має розмір NxM елементів, а кожний розміщений вище є узагальненням інформації в т комірках нижчого рівня, називається ієрархічною растровою структурою. Ієрархічні растрові структури іноді називають пірамідальними, або деревоподібними.
Стиснення растрових даних. Зменшення витрат машинної пам'яті для збереження растрових даних досягається використанням алгоритмів стиснення. Одним із простих і досить ефективних методів стиснення растрових даних є групове кодування (run-length encoding*, що використовує просторову автокорельованІсть даних, особливо чітко виражену на класифікованих картах, тобто на картах контурів або ареалів, у межах яких всі комірки містять однакове значення*. Так, у межах даного ґрунтового контуру на ґрунтовій карті, ландшафтного контуру на ландшафтній карті і т.ін. всі комірки растра мають те саме значення, що відповідає, наприклад, номеру даного таксона в легенді відповідної карти.
Ефективним способом стиснення растрової інформації є використання квадротомічних структур даних. Особливістю квадродерев є те, що вони дозволяють зберігати й обробляти тільки значущі фрагменти растра. Перехід на нижчі рівні в квадродереві здійснюється лише для просторово неоднорідних комірок даного рівня. Якщо комірка є однорідною, вона кодується на даному рівні. Саме це в поєднанні з жорстко заданою архітектонікою даної ієрархічної структури і відсутністю необхідності зберігати інформацію з незначущих фрагментів растра забезпечує значну економію машинної пам'яті. Крім цього, жорстко задана архітектоніка Q-дерева дозволяє здійснювати швидкий доступ до даних.
Векторне представлення даних.
Векторним способом подання просторових даних, або векторною моделлю, називають спосіб формалізації просторових даних, що ґрунтується на використанні набору елементарних графічних об'єктів, або «графічних примітивів».
В основу векторної моделі покладено точку (point* - первинний графічний елемент із координатами (х, у*, місце розташування якого відоме з довільно заданою точністю. Дві точки з координатами (xv yt* і (х2, у2* формують другий графічний примітив, лінію (line* - відрізок прямої, що з'єднує ці точки. Замкнута послідовність ліній відокремлює частину поверхні - полігон (polygon*, який є третім з основних елементарних графічних об'єктів, або графічних примітивів, на яких базується векторна модель просторових даних.
Сукупність цих трьох елементарних графічних об'єктів - точки, лінії та полігону - цілком достатня для опису форми як лінійних, так і просторових картографічних об'єктів, які в цьому випадку кодуються як сукупність координат точок, що апроксимують форму лінійного об'єкта, наприклад, адміністративного кордону, русла ріки і т.п., або контуру (границі* територіального об'єкта, наприклад, території землекористування населеного пункту, басейну ріки і т.п. У базі даних у цьому випадку зберігається пооб'єктна інформація про координати точок введення. У структуру таблиць може бути введена атрибутивна інформація для об'єктів, що цифруються, а також інформація про графічне зображення об'єктів на карті.
Спосіб векторного подання метричних даних з використанням трьох зазначених вище елементарних графічних об'єктів має назву точкової полігональної структури (Point Polygon Structure* векторних даних. Він належить до категорії нетопологічних векторних структур даних, які часто називають «спагеті».
Цей різновид векторних структур просторових даних відповідає початковому періоду розвитку ГІС-технології, хоча деякі сучасні ГІС-пакети використовують цей формат і далі. Прикладом може бути формат MIF/MID - Maplnfo Data Interchange Format - відкритий обмінний формат пакета Maplnfo, а також шейп-файли {shapefiles* ГІС-пакетів фірми ESRI.
Основний недолік цього способу формалізації просторових даних полягає у відсутності в запису даних топологічної інформації (інформації про взаємне розміщення об'єктів*, що вимагає при введенні метричних даних за допомогою дигітайзера проводити повний обхід кожного полігона. Це призводить до подвійного проходу по спільних для двох суміжних полігонів межах, що обумовлює значне збільшення витрат часу на введення, а також появу двох, що не збігаються через неточності позиціонування дигітайзера, спільних границь суміжних просторових об'єктів, які створюють так звані «паразитні» полігони.
Значного поширення в наш час набули топологічні векторні структури, у яких, крім ідентифікаторів об'єктів і координат, кодується також інформація про взаємне розміщення об'єктів. Лінійно-вузлові (топологічні* структури векторних даних представлені досить великою кількістю різновидів. Відзначимо модель TIGER (The Xopologically Integrated Geographic Encoding and Referencing data format*, яку було розроблено в Бюро переписів США для заміни DIME-структури наприкінці 80-х років XX ст., а також DLG-структуру (Digital Line Graph Structure* -стандарт Геологічної служби США (USGS* для пошарового кодування інформації, що міститься на топографічних картах і DLG-Е - Digital Line Graph-Enhanced - розширену версію формату DLG, а також покриття (coverage* - топологічний векторний файл ГІС-пакетів фірми ESRI.
Часто використовуваною векторною полігональною структурою (моделлю* просторових даних є трикутна нерегулярна мережа (Triangulated Irregular Network*, відома під абревіатурою TIN. Вона будується шляхом об'єднання відомих точкових значень у серії трикутників за алгоритмом тріангуляції Делоне. Модель використовується для представлення поверхні у вигляді сукупності суміжних тривимірних (3D* трикутних граней, що не перекриваються.
Основний принцип алгоритму тріангуляції Делоне полягає в тому, щоб з наявного набору точок з відомими висотними позначками (значеннями координати Z* побудувати трикутники, які всі разом будуть максимально близькими до рівносторонніх фігур. Досягається це постійним контролем умови, відповідно до якої будь-яке коло, проведене через три вузли в трикутнику, не включатиме ніякого іншого вузла.
Завдяки своїй «нерегулярності* TIN-модель є більш гнучкою порівняно з растровою і дозволяє більш компактно і з меншими похибками описати поверхні з вкладеними формами, такі, як, наприклад, топографічна поверхня. Тому TIN-модель звичайно використовується для побудови цифрових моделей рельгфу, зокрема, у рамках програмних ГІС-пакетів фірми ESRI (ARC/ INFO, Arc View GIS, ArcGIS*.