Технологічні засоби трансдисциплінарного представлення геопросторової інформації

dc.contributor.advisorСтрижак Олександр Євгенійович
dc.contributor.authorПриходнюк Віталій Валерійович
dc.date.accessioned2026-01-24T13:18:39Z
dc.date.issued2017
dc.description.abstractПриходнюк В. В. Технологічні засоби трансдисциплінарного представлення геопросторової інформації. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 «Інформаційні технології». – Інститут телекомунікацій і глобального інформаційного простору Національної академії наук України, Київ, 2017. Дисертаційну роботу присвячено вирішенню актуальної науково-технічної проблеми підвищення ефективності роботи користувачів з великими масивами слабо і неструктурованої інформації (зокрема, геопросторової), шляхом розробки та впровадження програмних засобів структуризації та трансдисциплінарного представлення такої інформації. У дисертаційній роботі в першому розділі розглянуто існуючі програні засоби, що можуть застосовуватись для обробки природномовних текстів. Перелік проаналізованих засобів складається із 35 систем та включає такі програмноінформаційні рішення обробки знань, як: Palantir Gotham, Convera Excalibur, Oracle Endeca Information Discovery, General Architecture for Text Engineering (GATE), SAS Text Analytics. Розроблено список критеріїв відповідності, що включає в себе 30 критеріїв, об’єднаних у такі класифікаційні групи: загальні параметри, технічні параметри, можливості системи, когнітивні параметри, спеціалізовані параметри. На основі розроблених критерії проведено оцінку і ранжування розглянутих програмних засобів. Показано, що в даний момент не існує програмних засобів, що повністю відповідали б поставленій задачі, однак найбільш оптимальним програмним засобом, що може використовуватись в якості основи для її розв’язку, є система ТОДОС (Трансдисциплінарні діалоги об’єктно-орієнтованих систем). Також в першому розділі проведено оцінку і ранжування існуючих ГІС (зокрема, програмних продуктів компаній ESRI та Intergraph і ГІС з відкритим кодом GRASS) та дано загальну трактовку трансдисциплінарності. В другому розділі розроблено метод структуризації природномовних (ПМ) текстів на основі їх рекурсивної редукції. Даний метод передбачає виконання перетворення структуризації тексту, і являє собою багатокроковий процес. У рамках даного процесу для певного тексту визначається його первинна структура, яка послідовно перетворюється в тезаурус, таксономію і онтологію. Перший крок даного процесу – лексичний аналіз, в результаті якого текст представляється у вигляді послідовності речень, які складаються з лексем (слів або символів, таких, як розділові знаки). Також у ході аналізу формується множина синтаксичних зв’язків. Отримана в результаті лексичного аналізу первинна структура тексту є вхідною інформацією для власне рекурсивної редукції, що проходить поетапно. В рамках відповідних етапів формуються множина об’єктів, зв’язків і функцій інтерпретації результуючої онтології. Редукція ПМ тексту виконується за допомогою спеціалізованого оператора редукції. Оператор редукції – комбінація кількох операторів, що представляють етапи аналізу ПМ тексту. Кожна з складових оператора редукції є перетворенням, заданим відповідною базою правил виконання даного перетворення. Правило виконання перетворення має уніфіковану для всіх етапів структуру і складається з функції застосовності, що визначає, чи може правило бути застосоване до певного набору вхідної інформації, і функції перетворення, що задає перетворення вхідної інформації. Виконання функції застосовності полягає у перевірці певної умови. Умова складається з предикатів, серед яких є одномісні (предикати ідентифікації лексем, що задають умову, якій повинна відповідати певна лексема з вхідної множини) і двомісні (предикати ідентифікації зв’язків, що визначають, чи міститься між двома заданими лексемами зв’язок заданого типу). Умова застосовності означає існування гомеоморфізму між орієнтованим графом, утвореним вхідною послідовністю лексем (а також синтаксичними зв’язками між ними) і певним еталонним орієнтованим графом, що являє собою обраний користувачем підграф первинного представлення певного тексту – як поточного, так і будь-якого іншого (наприклад, тезауруса ПдО). Також в другому розділі розроблено модель інтерактивного документу, який представлений парою з онтології і натуральної системи виду {дія  результати}. Натуральна система забезпечує інтерактивну взаємодію з наявною в онтології інформацією. На основі моделі інтерактивного документу розроблені моделі онтологічного ГІС-додатку і трансдисциплінарного представлення інформації. Онтологічний ГІС-додаток являє собою інтерактивний документ, натуральна система якого реалізує функціональне представлення афінного простору. Він призначений для представлення геопросторової інформації, що міститься в онтології, у вигляді ГІС. Трансдисциплінарне представлення інформації реалізується спеціалізованою натуральною системою, що використовує функції індексації і повнотекстового пошуку. Трансдисциплінарне представлення дозволяє динамічно формувати зв’язки між об’єктами, описаними в різних документах, що належать єдиному понятійному інформаційно-аналітичному середовищу, і забезпечувати таким чином оперативний доступ до великих обсягів інформації, важливої для виконання поставленої перед користувачем задачі. В третьому розділі розроблено інформаційну та функціонально-компонентну модель системи трансдисциплінарного представлення геопросторової інформації. Інформаційну модель системи представлено сукупністю модулів власне системи трансдисциплінарного представлення геопросторової інформації, що інтегрується з певною підмножиною модулів системи ТОДОС. При цьому реалізується відображення інтеграції функцій окремих програмних модулів системи, що перетворює об’єднання множини функцій кожного з її програмних модулів в узагальнену (цільову) функцію – трансдисциплінарне представлення геопросторової інформації. Функціонально-компонентна модель програмної системи трансдисциплінарної інтеграції геопросторової інформації включає в себе моделі: поведінки системи, структури системи, структури програмних сутностей, компонентів програмної системи а також включає в себе предикат цілісності системи. Дана модель включає в себе множину UML-діаграм варіантів використання, активності та взаємодії. На основі вищенаведених моделей сформовано архітектуру програмної системи трансдисциплінарного представлення інформації. Вона показує склад, структуру та особливості функціонування даної системи. В четвертому розділі представлено технологічні засоби трансдисциплінарного представлення геопросторової інформації. Зокрема, вказано особливості їх функціонування та взаємодії з користувачем. В даному розділі описано приклади роботи розроблених інструментальних засобів, зокрема: 1) Представлення даних про сміттєзвалища, наданих у відкритий доступ Міністерством екології та природних ресурсів України, зі створенням онтологічного ГІС-додатку «Місця видалення відходів» на основі даних сайту «Інтерактивна карта мінприроди». 2) Представлення реєстру дорадників та дорадницьких організацій, а також наявної у відкритому доступі інформації про оренду агротехніки з допомогою онтологічного ГІС-додатку «Агро». 3) Представлення даних про житлово-комунальне господарство м. Біла Церква зі створенням ГІС-додатку «Біла Церква». 4) Обробка документів, присвячених Т. Г. Шевченку (книги обсягом до 500 сторінок) та їх трансдисциплінарне представлення у вигляді інтерактивних документів (зокрема, онтологічного ГІС-додатку). Також в розділі показано результати обчислювальних експериментів, проведених для визначення ефективності роботи розроблених технологічних засобів. З допомогою обчислювальних експериментів показано, що інструментальні засоби можуть обробляти вхідні природномовні тексти з достатньо високою точністю (до 80%). При цьому інструментальні засоби мають високу швидкодію (близько 14 секунд на документ розміром в кілька сторінок), що дозволяє використовувати їх в процесах оперативного управління. Розроблені інструментальні засоби створені в рамках дослідних робіт № 0110U002721, № 0112U007539, № 0113U004981, № 0116U000794, № 017U000005 Інституту телекомунікацій і глобального інформаційного простору та дослідних робіт № 0114U002173, № 0114U002173, № 0115U002523, № 0117U004042 Національного центру «Мала академія наук України». Розроблені засоби впроваджені в наукову та прикладну діяльність: кафедри медичної інформатики Національної медичної академії післядипломної освіти ім. П. Л. Шупика, Інституту модернізації змісту освіти МОН, ПРАТ «ECOMM», ТОВ «Експерт-Центр», Національного музею Тараса Шевченка, Одеського науково-дослідного інституту судових експертиз Мін’юсту України, Інституту водних проблем меліорації НААН України, Комітету з питань будівництва, містобудування і житлово-комунального господарства Верховної ради України.
dc.identifier.citationПриходнюк В. В. Технологічні засоби трансдисциплінарного представлення геопросторової інформації : дис. ... канд. техн. наук : 05.13.06 / В. В. Приходнюк . – Київ, 2017. – 267 с.
dc.identifier.urihttps://repository.itgip.org/handle/123456789/56
dc.language.isouk
dc.publisherІнститут телекомунікацій і глобального інформаційного простору Національної академії наук України
dc.subjectструктуризація документів
dc.subjectобробка природної мови
dc.subjectтрансдисциплінарність
dc.subjectгеоінформаційна система
dc.subjectонтологія предметної області
dc.subjectтаксономія
dc.subjectінформаційна технологія
dc.titleТехнологічні засоби трансдисциплінарного представлення геопросторової інформації
dc.title.alternativeTechnological means of transdisciplinary representation of geospatial information
dc.typeThesis
local.description.abstractenPrykhodniuk Vitalii. Technological means of transdisciplinary representation of geospatial information. Manuscript. Dissertation research for degree of PhDs. by specialty 05.13.06 Information technology. Institute of Telecommunications and Global Information Space of the National Academy of Sciences of Ukraine, Kyiv, 2017. Thesis of dissertation focuses on solving an actual scientific and technical problem of improving efficiency of processing large volumes of semi-structured and non-structured information (including geospatial) by creating applications for structuring and transdisciplinary representation of such information. The first section of the thesis deals with existing tools, that can be used to process natural language texts. The list of analyzed tools consists of 35 systems and includes software for knowledge processing, such as: Palantir Gotham, Convera Excalibur, Oracle Endeca Information Discovery, General Architecture for Text Engineering (GATE), SAS Text Analytics. A list of compliance criteria has been developed, which includes 30 criteria, which are grouped into following classification groups: general parameters, technical parameters, system capabilities, cognitive parameters, specialized parameters. On the basis of the developed criteria, the evaluation and ranking of the selecte software was done. It is shown that at the current moment there are no software that fully complies to the task, but the most suitable tool that can be used as the basis for its solution is the TODOS system (Transdisciplinary dialogues of object-oriented systems). Also, in the first section, the evaluation and ranking of existing GISs (ESRI and Intergraph software products and GRASS open source GIS in particular) were carried out and a general interpretation of transdisciplinarity was given. In the second section a method for structuring natural-language (NL) texts based on their recursive reduction is developed. This method involves performing a structured text conversion, and is a multi-step process. Within this process, for a given text, it's primary structure is determined, which is sequentially transformed into a thesaurus, taxonomy, and ontology. The first step of this process is lexical analysis, in which the text is presented as a sequence of sentences consisting of tokens (words or symbols such as punctuation marks). Also, during the analysis, a set of syntactic relations is formed. Obtained as a result of lexical analysis, the primary structure of the text is the input information for following recursive reduction, which proceeds in stages. Within the corresponding stages, a sets of objects, connections and interpretation functions are formed for the resulting ontology. Reduction of NL text is performed by a specialized reduction operator. The reduction operator is a combination of several operators that represent the stages of the NL text analysis. Each of the components of the reduction operator is the transformation driven by the corresponding set of the rules. A transformation rule has a unified structure for all stages and consists of two functions: applicability function that determines whether a rule can be applied to a certain set of input information, and transformation function that specifies the transformation of the input information. Applying applicability function is equal to verifying a certain condition. The condition consists of predicates, among which are single (predicates of token identification that specify the condition, which must be met by a certain token) and double (predicates of link identification, which determine whether there is a relation between the two given tokens) The condition of applicability means the existence of a homeomorphism between a directed graph formed by an input sequence of tokens (as well as syntactic relations between them) and a certain reference graph, which is a sub-graph, selected by the user from the primary representation of a certain text – current or any other (for example, some thesaurus). Also in the second section a model of an interactive document is presented. Interactive document is represented by a pair: the ontology and the natural system. The natural system provides an interactive access to information from ontology. Based on the model of the interactive document, models of ontological GIS-applications and transdisciplinary information representation have been developed. An ontological GIS application is an interactive document, the natural system of which implements a functional representation of the affine space. It is used for representing of geospatial information, contained in the ontology, in the form of GIS. The transdisciplinary representation of information is conducted by a specialized natural system that uses indexing and full text search functions. Transdisciplinary representation allows dynamically create relations between objects, contained in various documents belonging to a single conceptual information and analytical environment, and thus provide operational access to large volumes of information important for the solving of the current task. In the third section an informational and functional-component model of the system of transdisciplinary representation of geospatial information is developed. The information model of the system is represented by a set of modules of the system of transdisciplinary representation of geospatial information, which is integrated with a certain subset of the TODOS modules. In this case, the integration reflection is realized, which converts sets of functions of individual program modules into a target function – transdisciplinary representation of geospatial information. The functional-component model of the system includes models of: the behavior of the system, the structure of the system, the structure of software entities, components of the software system, and also includes the predicate of the integrity of the system. This model includes a set of UML diagrams: use, activity and interaction. Based on described models, the architecture of the program system of the transdisciplinary representation of information is created. It shows structure and features of the system. The fourth section presents tools of transdisciplinary representation of geospatial information. In particular, specifics of their functioning and interaction with users are described. This section shows examples of work of the developed tools, in particular: 1) The data on landfills provided by the Ministry of Ecology and Natural Resources of Ukraine, with the creation of ontological GIS-application "Waste disposal sites" based on the data from the site "Interactive map of natural resources". 2) Processing of the register of advisers and advisory organizations, as well as available information on the lease of agricultural technics with the help of an ontological GIS-application "Agro". 3) Presentation of data on housing and communal services in the city of Bila Tserkva with the creation of the GIS-application. 4) Processing of documents related to Taras Shevchenko and their transdisciplinary presentation in the form of interactive documents (ontological GIS-application in particular). Also, the section shows the results of computational experiments conducted to determine the effectiveness of the developed technological tools. With the help of computational experiments it is shown that tools can handle incoming NL texts with a sufficiently high accuracy (up to 80%). Also, tools have a high performance (about 14 seconds per document with a size of several pages), which allows them to be used in the processes of operational control. The developed instrumental tools were created within the scope of research works № 0110U002721, № 0112U007539, № 0113U004981, № 0116U000794, № 017U000005 of the Institute of telecommunications and global information space and research works № 0114U002173, № 0114U002173, № 0115U002523, № 0117U004042 of the National center "Minor Academy of Sciences of Ukraine" . The developed tools were used by: the department of medical informatics of the National medical academy of postgraduate Education named after. P. L. Shupyk, Institute for the modernization of the content of education of the Ministry of education and science, private joint-stock company "Expert Center", LLC "ECOMM", National Taras Shevchenko museum, Odessa research institute of forensic expertise of the Ministry of justice of Ukraine, Institute of water problems of melioration National academy of agricultural sciences of Ukraine, Committee on issues of construction, urban development and housing and communal services of the Verkhovna Rada of Ukraine.
local.identifier.udc004.82 + 004.91 + 005.94 + 528.065/.067
local.subject.keywordsendocument structuring
local.subject.keywordsennatural language processing
local.subject.keywordsentransdisciplinarity
local.subject.keywordsengeographic information system
local.subject.keywordsendomain ontology
local.subject.keywordsentaxonomy
local.subject.keywordseninformation technology
local.thesis.defensedate2018
local.thesis.levelCandTechSci
local.thesis.pages267
local.thesis.specialtyold05.13.06 – Інформаційні технології

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
dis-prychodniuk.pdf
Size:
9.49 MB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed to upon submission
Description: