Технологічні засоби трансдисциплінарного представлення геопросторової інформації
Loading...
Date
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Інститут телекомунікацій і глобального інформаційного простору Національної академії наук України
Abstract
Приходнюк В. В. Технологічні засоби трансдисциплінарного представлення геопросторової інформації. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 «Інформаційні технології». – Інститут телекомунікацій і глобального інформаційного простору Національної академії наук України, Київ, 2017.
Дисертаційну роботу присвячено вирішенню актуальної науково-технічної проблеми підвищення ефективності роботи користувачів з великими масивами слабо і неструктурованої інформації (зокрема, геопросторової), шляхом розробки та впровадження програмних засобів структуризації та трансдисциплінарного представлення такої інформації. У дисертаційній роботі в першому розділі розглянуто існуючі програні засоби, що можуть застосовуватись для обробки природномовних текстів. Перелік проаналізованих засобів складається із 35 систем та включає такі програмноінформаційні рішення обробки знань, як: Palantir Gotham, Convera Excalibur, Oracle Endeca Information Discovery, General Architecture for Text Engineering (GATE), SAS Text Analytics. Розроблено список критеріїв відповідності, що включає в себе 30 критеріїв, об’єднаних у такі класифікаційні групи: загальні параметри, технічні параметри, можливості системи, когнітивні параметри, спеціалізовані параметри. На основі розроблених критерії проведено оцінку і ранжування розглянутих програмних засобів. Показано, що в даний момент не існує програмних засобів, що повністю відповідали б поставленій задачі, однак найбільш оптимальним програмним засобом, що може використовуватись в якості основи для її розв’язку, є система ТОДОС (Трансдисциплінарні діалоги об’єктно-орієнтованих систем). Також в першому розділі проведено оцінку і ранжування існуючих ГІС (зокрема, програмних продуктів компаній ESRI та Intergraph і ГІС з відкритим кодом GRASS) та дано загальну трактовку трансдисциплінарності. В другому розділі розроблено метод структуризації природномовних (ПМ) текстів на основі їх рекурсивної редукції. Даний метод передбачає виконання перетворення структуризації тексту, і являє собою багатокроковий процес. У рамках даного процесу для певного тексту визначається його первинна структура, яка послідовно перетворюється в тезаурус, таксономію і онтологію. Перший крок даного процесу – лексичний аналіз, в результаті якого текст представляється у вигляді послідовності речень, які складаються з лексем (слів або символів, таких, як розділові знаки). Також у ході аналізу формується множина синтаксичних зв’язків. Отримана в результаті лексичного аналізу первинна структура тексту є вхідною інформацією для власне рекурсивної редукції, що проходить поетапно. В рамках відповідних етапів формуються множина об’єктів, зв’язків і функцій інтерпретації результуючої онтології. Редукція ПМ тексту виконується за допомогою спеціалізованого оператора редукції. Оператор редукції – комбінація кількох операторів, що представляють етапи аналізу ПМ тексту. Кожна з складових оператора редукції є перетворенням, заданим відповідною базою правил виконання даного перетворення. Правило виконання перетворення має уніфіковану для всіх етапів структуру і складається з функції застосовності, що визначає, чи може правило бути застосоване до певного набору вхідної інформації, і функції перетворення, що задає перетворення вхідної інформації. Виконання функції застосовності полягає у перевірці певної умови. Умова складається з предикатів, серед яких є одномісні (предикати ідентифікації лексем, що задають умову, якій повинна відповідати певна лексема з вхідної множини) і двомісні (предикати ідентифікації зв’язків, що визначають, чи міститься між двома заданими лексемами зв’язок заданого типу). Умова застосовності означає існування гомеоморфізму між орієнтованим графом, утвореним вхідною послідовністю лексем (а також синтаксичними зв’язками між ними) і певним еталонним орієнтованим графом, що являє собою обраний користувачем підграф первинного представлення певного тексту – як поточного, так і будь-якого іншого (наприклад, тезауруса ПдО). Також в другому розділі розроблено модель інтерактивного документу, який представлений парою з онтології і натуральної системи виду {дія результати}. Натуральна система забезпечує інтерактивну взаємодію з наявною в онтології інформацією. На основі моделі інтерактивного документу розроблені моделі онтологічного ГІС-додатку і трансдисциплінарного представлення інформації. Онтологічний ГІС-додаток являє собою інтерактивний документ, натуральна система якого реалізує функціональне представлення афінного простору. Він призначений для представлення геопросторової інформації, що міститься в онтології, у вигляді ГІС. Трансдисциплінарне представлення інформації реалізується спеціалізованою натуральною системою, що використовує функції індексації і повнотекстового пошуку. Трансдисциплінарне представлення дозволяє динамічно формувати зв’язки між об’єктами, описаними в різних документах, що належать єдиному понятійному інформаційно-аналітичному середовищу, і забезпечувати таким чином оперативний доступ до великих обсягів інформації, важливої для виконання поставленої перед користувачем задачі. В третьому розділі розроблено інформаційну та функціонально-компонентну модель системи трансдисциплінарного представлення геопросторової інформації. Інформаційну модель системи представлено сукупністю модулів власне системи трансдисциплінарного представлення геопросторової інформації, що інтегрується з певною підмножиною модулів системи ТОДОС. При цьому реалізується відображення інтеграції функцій окремих програмних модулів системи, що перетворює об’єднання множини функцій кожного з її програмних модулів в узагальнену (цільову) функцію – трансдисциплінарне представлення геопросторової інформації. Функціонально-компонентна модель програмної системи трансдисциплінарної інтеграції геопросторової інформації включає в себе моделі: поведінки системи, структури системи, структури програмних сутностей, компонентів програмної системи а також включає в себе предикат цілісності системи. Дана модель включає в себе множину UML-діаграм варіантів використання, активності та взаємодії. На основі вищенаведених моделей сформовано архітектуру програмної системи трансдисциплінарного представлення інформації. Вона показує склад, структуру та особливості функціонування даної системи.
В четвертому розділі представлено технологічні засоби трансдисциплінарного представлення геопросторової інформації. Зокрема, вказано особливості їх функціонування та взаємодії з користувачем. В даному розділі описано приклади роботи розроблених інструментальних засобів, зокрема: 1) Представлення даних про сміттєзвалища, наданих у відкритий доступ Міністерством екології та природних ресурсів України, зі створенням онтологічного ГІС-додатку «Місця видалення відходів» на основі даних сайту «Інтерактивна карта мінприроди». 2) Представлення реєстру дорадників та дорадницьких організацій, а також наявної у відкритому доступі інформації про оренду агротехніки з допомогою онтологічного ГІС-додатку «Агро». 3) Представлення даних про житлово-комунальне господарство м. Біла Церква зі створенням ГІС-додатку «Біла Церква». 4) Обробка документів, присвячених Т. Г. Шевченку (книги обсягом до 500 сторінок) та їх трансдисциплінарне представлення у вигляді інтерактивних документів (зокрема, онтологічного ГІС-додатку). Також в розділі показано результати обчислювальних експериментів, проведених для визначення ефективності роботи розроблених технологічних засобів. З допомогою обчислювальних експериментів показано, що інструментальні засоби можуть обробляти вхідні природномовні тексти з достатньо високою точністю (до 80%). При цьому інструментальні засоби мають високу швидкодію (близько 14 секунд на документ розміром в кілька сторінок), що дозволяє використовувати їх в процесах оперативного управління. Розроблені інструментальні засоби створені в рамках дослідних робіт № 0110U002721, № 0112U007539, № 0113U004981, № 0116U000794, № 017U000005 Інституту телекомунікацій і глобального інформаційного простору та дослідних робіт № 0114U002173, № 0114U002173, № 0115U002523, № 0117U004042 Національного центру «Мала академія наук України». Розроблені засоби впроваджені в наукову та прикладну діяльність: кафедри медичної інформатики Національної медичної академії післядипломної освіти ім. П. Л. Шупика, Інституту модернізації змісту освіти МОН, ПРАТ «ECOMM», ТОВ «Експерт-Центр», Національного музею Тараса Шевченка, Одеського науково-дослідного інституту судових експертиз Мін’юсту України, Інституту водних проблем меліорації НААН України, Комітету з питань будівництва, містобудування і житлово-комунального господарства Верховної ради України.
Description
Citation
Приходнюк В. В. Технологічні засоби трансдисциплінарного представлення геопросторової інформації : дис. ... канд. техн. наук : 05.13.06 / В. В. Приходнюк . – Київ, 2017. – 267 с.