Васильчук Сергей Петрович (serg70p) wrote,
Васильчук Сергей Петрович
serg70p

Categories:

Онтология для инженерных данных


Интеграция данных жизненного цикла изделия — важнейшая задача для проектировщиков сложных инженерных объектов, однако такие данные исключительно разнородны, поэтому необходимы стандарты, в частности, ISO 15926.

Ключевые слова / keywords: Стандарты

Виктор Агроскин, Анатолий Левенчук, Владислав Головков

Раз­но­об­ра­зие раз­лич­ных ин­фор­ма­ци­он­ных си­стем неиз­беж­но при­во­дит к про­бле­ме ор­га­ни­за­ции их вза­и­мо­дей­ствия, ко­то­рая осо­бен­но обост­ря­ет­ся для слу­чая ком­пью­тер­ных си­стем, ис­поль­зу­ю­щих­ся при со­зда­нии и экс­плу­а­та­ции круп­ных про­мыш­лен­ных объ­ек­тов — элек­тро­стан­ций, хи­ми­че­ских про­из­водств, фар­ма­цев­ти­че­ских пред­при­я­тий и др. На всех ста­ди­ях жиз­нен­но­го цикла слож­ных про­мыш­лен­ных про­из­водств за­ня­то мно­же­ство ор­га­ни­за­ций: про­ек­ти­ров­щи­ки, стро­и­те­ли, по­став­щи­ки обо­ру­до­ва­ния, служ­бы экс­плу­а­та­ции и т. д. — каж­дая из ко­то­рых обыч­но ис­поль­зу­ет свой набор си­стем и при­ме­ня­ет раз­ные фор­ма­ты дан­ных. Осо­бые труд­но­сти воз­ни­ка­ют при ра­бо­те с ин­же­нер­ны­ми дан­ны­ми, ко­то­рые, в от­ли­чие от «управ­лен­че­ских» дан­ных, со­дер­жат раз­но­род­ную ин­фор­ма­цию об одних и тех же объектах.

RDF — ин­стру­мент для неструк­ту­ри­ро­ван­ных данных

Ре­ля­ци­он­ная мо­дель, де­ся­ти­ле­ти­я­ми слу­жив­шая ос­но­вой тех­но­ло­гии ра­бо­ты с дан­ны­ми, более не яв­ля­ет­ся гла­вен­ству­ю­щей — на сцену вы­хо­дят новые за­да­чи, тре­бу­ю­щие учета и вы­яв­ле­ния су­ще­ствен­но боль­ше­го ко­ли­че­ства взаимосвязей.

Вла­ди­слав Го­лов­ков, Ан­дрей Порт­нов, Вик­тор Чернов

На­при­мер, набор дан­ных о на­со­се в ин­же­нер­ных ин­фор­ма­ци­он­ных си­сте­мах со­дер­жит све­де­ния из си­стем ERP, EAM (Enterprise Asset Management), PLM (Product Lifecycle Management), САПР, а также ин­фор­ма­цию о его про­ект­ных тех­но­ло­ги­че­ских ре­жи­мах, 3D-ком­по­нов­ке, ис­то­рии за­ме­ров с его дат­чи­ков, ин­тер­ак­тив­ные ру­ко­вод­ства по мон­та­жу и об­слу­жи­ва­нию и мно­гое дру­гое. С одной сто­ро­ны, этот насос клас­си­фи­ци­ру­ет­ся как «ком­плек­ту­ю­щее» на ран­них ста­ди­ях жиз­нен­но­го цикла, и он же для си­сте­мы ERP от­но­сит­ся к ка­те­го­рии «пред­мет снаб­же­ния» в мо­мент его за­ка­за у про­из­во­ди­те­ля и вы­да­чи в мон­таж. Насос имеет функ­ци­о­наль­ный код в про­ект­ной до­ку­мен­та­ции для САПР и при­об­ре­та­ет в EAM се­рий­ный номер, бу­дучи уста­нов­лен­ным. Кроме того, ин­же­нер­ная ин­фор­ма­ция фор­ми­ру­ет­ся в ка­та­ло­ге про­из­во­ди­те­ля, в САПР для теп­ло­тех­ни­че­ских и элек­три­че­ских спе­ци­аль­но­стей, в си­сте­мах про­ект­но­го управ­ле­ния, управ­ле­ния стро­и­тель­ством (так на­зы­ва­е­мое 4D-про­ек­ти­ро­ва­ние, в ко­то­ром для трех­мер­но­го про­ек­ти­ро­ва­ния до­бав­ле­но до­пол­ни­тель­ное из­ме­ре­ние — время) и т. д. Все эти све­де­ния и свя­зан­ные с ними нор­ма­тив­но-спра­воч­ные дан­ные со­би­ра­ют­ся в ин­фор­ма­ци­он­ных си­сте­мах пред­при­я­тий-по­став­щи­ков, каж­дое из ко­то­рых, как пра­ви­ло, хра­нит их в своем фор­ма­те, опре­де­ля­е­мом раз­ра­бот­чи­ком ис­поль­зу­е­мых приложений.

Ясно, что дан­ные о раз­ных узлах и под­си­сте­мах про­мыш­лен­но­го объ­ек­та (тру­бо­про­во­ды, элек­тро­обо­ру­до­ва­ние, стро­и­тель­ные кон­струк­ции и т. п.) будут иметь прин­ци­пи­аль­но раз­лич­ную струк­ту­ру, а в непре­рыв­ном про­из­вод­стве (неф­те­хи­мия, элек­тро­стан­ции и т. д.) су­ще­ству­ют сотни под­си­стем и ты­ся­чи групп обо­ру­до­ва­ния. Если каж­дую из этих сущ­но­стей опи­сы­вать, на­при­мер, ре­ля­ци­он­ной таб­ли­цей, то число таких таб­лиц раз­ной струк­ту­ры со­ста­вит несколь­ко тысяч.

Стан­дарт моделирования

По дан­ным NIST, ре­ше­ние про­блем вза­и­мо­дей­ствия раз­но­род­ных си­стем по­мо­жет ин­ду­стрии круп­ных ка­пи­таль­ных про­ек­тов толь­ко в США эко­но­мить до 16 млрд долл. в год. Неуди­ви­тель­но, что сбор в еди­ную струк­ту­ру для сов­мест­но­го до­сту­па и ана­ли­за пол­ных дан­ных о слож­ном ин­же­нер­ном объ­ек­те на всех ста­ди­ях жиз­нен­но­го цикла стал се­год­ня обя­за­тель­ным усло­ви­ем эф­фек­тив­но­го управ­ле­ния его про­ек­ти­ро­ва­ни­ем и экс­плу­а­та­ци­ей. Эту за­да­чу на­зы­ва­ют по-раз­но­му: со­зда­ние еди­но­го ин­фор­ма­ци­он­но­го про­стран­ства жиз­нен­но­го цикла, со­зда­ние циф­ро­вой мо­де­ли и т. п.

Раз­ра­бот­чи­ки ин­же­нер­ных ин­фор­ма­ци­он­ных си­стем CAD/CAM/CAE/PLM до сих пор в ос­нов­ном ис­поль­зу­ют клас­си­че­ские объ­ект­ные мо­де­ли дан­ных и ре­ля­ци­он­ные хра­ни­ли­ща, од­на­ко по­пыт­ки их объ­еди­не­ния в еди­ной объ­ект­ной мо­де­ли дан­ных для непре­рыв­ных про­из­водств по­тер­пе­ли про­вал. При­чи­ны этого кро­ют­ся в фун­да­мен­таль­ных огра­ни­че­ни­ях клас­си­че­ской («ари­сто­те­ле­вой») тео­рии мо­де­ли­ро­ва­ния дан­ных — жест­кие гра­ни­цы между сущ­но­стя­ми, ат­ри­бу­та­ми и свя­зя­ми, раз­ни­ца в под­хо­дах к опи­са­нию про­стран­ства и опи­са­нию вре­ме­ни, а также тра­ди­ция раз­де­ле­ния мира на так­со­ны (фун­да­мен­таль­ные клас­сы, со­став­ля­ю­щие еди­ную ми­ро­вую иерар­хию). На прак­ти­ке, в свою оче­редь, воз­ни­ка­ют ре­а­ли­за­ци­он­ные про­бле­мы при фор­му­ли­ро­ва­нии об­ще­го за­про­са к несколь­ким базам дан­ных, в ко­то­рых при­ня­ты прин­ци­пи­аль­но раз­ные ре­ше­ния по по­во­ду объ­ек­тов и ат­ри­бу­тов пред­мет­ной об­ла­сти или по по­во­ду от­ра­же­ния из­ме­не­ния объ­ек­тов во вре­ме­ни, что прак­ти­че­ски бло­ки­ру­ет все­об­щую унификацию.

Ре­ше­ние про­блем ин­те­гра­ции ока­за­лось воз­мож­ным в рам­ках ло­ги­че­ско­го (се­ман­ти­че­ско­го) под­хо­да к мо­де­ли­ро­ва­нию дан­ных, опи­ра­ю­ще­го­ся на он­то­ло­ги­че­ское опи­са­ние мира в общих тер­ми­нах тео­рии мно­жеств. Этот под­ход поз­во­лил сфор­му­ли­ро­вать удо­вле­тво­ри­тель­ный ответ на во­прос о том, как со­от­но­сят­ся сущ­ность и ат­ри­бут, — ответ в тер­ми­нах при­над­леж­но­сти объ­ек­та к клас­су объ­ек­тов, об­ла­да­ю­щих дан­ным ат­ри­бу­том. Таким об­ра­зом, су­ще­ствен­ны­ми чер­та­ми мо­де­ли стали отказ от еди­но­го иерар­хи­че­ско­го де­ре­ва и до­пу­ще­ние мно­же­ствен­но­сти клас­си­фи­ка­ций, в том числе рав­но­прав­ных клас­си­фи­ка­ций объ­ек­тов и ат­ри­бу­тов. Ре­и­фи­ка­ция от­но­ше­ний (вы­де­ле­ние от­но­ше­ний как сущ­но­стей пер­во­го уров­ня, спо­соб­ных, в свою оче­редь, быть сто­ро­на­ми в от­но­ше­ни­ях) поз­во­ли­ла рас­про­стра­нить на от­но­ше­ния шаб­ло­ны ра­бо­ты с объ­ек­та­ми. Тео­ре­ти­ко-мно­же­ствен­ный язык ока­зал­ся хо­ро­шо сов­ме­стим с че­ты­рех­мер­ным пред­став­ле­ни­ем о про­стран­стве-вре­ме­ни, поз­во­лив­шим пе­рей­ти к еди­но­об­раз­но­му опи­са­нию про­стран­ствен­но-вре­мен­ных свойств объ­ек­тов, ре­ша­ю­ще­му про­бле­мы мо­де­ли­ро­ва­ния те­че­ния вре­ме­ни и по­лу­чив­ше­му для баз дан­ных на­зва­ние «ше­стая нор­маль­ная форма»).

В целом он­то­ло­ги­че­ское мо­де­ли­ро­ва­ние дан­ных ока­за­лось зна­чи­тель­но эф­фек­тив­нее так­со­но­ми­че­ско­го «клас­си­фи­ка­ци­он­но­го» под­хо­да, и ос­но­ван­ные на этом ин­те­гра­ци­он­ные мо­де­ли были при­ня­ты на во­ору­же­ние раз­лич­ны­ми по­став­щи­ка­ми ин­же­нер­но­го про­грамм­но­го обес­пе­че­ния, оза­бо­чен­ны­ми про­бле­ма­ми ин­те­гри­ро­ва­ния при­ло­же­ний. В то же время для управ­ле­ния дан­ны­ми об ин­же­нер­ных объ­ек­тах раз­ра­ба­ты­ва­лись стан­дар­ты как от­рас­ле­во­го, так и меж­ду­на­род­но­го уров­ня. Но на­сто­я­щий про­рыв про­изо­шел, когда со­вре­мен­ные ре­ше­ния по мо­де­ли­ро­ва­нию дан­ных легли в ос­но­ву со­зда­ния ней­траль­ной по от­но­ше­нию к от­дель­ным ин­же­нер­ным си­сте­мам мо­де­ли дан­ных стан­дар­та ISO 15926 Industrial automation systems and integration. Integration of life-cycle data for process plants including oil and gas production facilities (ГОСТ-Р ИСО 15926 «Про­мыш­лен­ные ав­то­ма­ти­зи­ро­ван­ные си­сте­мы и ин­те­гра­ция. Ин­те­гра­ция дан­ных жиз­нен­но­го цикла для пе­ре­ра­ба­ты­ва­ю­щих пред­при­я­тий, вклю­чая неф­тя­ные и га­зо­вые про­из­вод­ствен­ные пред­при­я­тия»). Дан­ный стан­дарт опре­де­ля­ет ос­нов­ные типы объ­ек­тов и от­но­ше­ний, ис­поль­зу­е­мых при опи­са­нии ин­же­нер­ной ин­фор­ма­ции (за­да­ет он­то­ло­гию), упо­ря­до­чи­ва­ет тер­ми­но­ло­гию, ис­поль­зу­е­мую для ор­га­ни­за­ции ин­же­нер­ной ин­фор­ма­ции, а также опре­де­ля­ет прин­ци­пы рас­ши­ре­ния стан­дарт­ной тер­ми­но­ло­гии через ме­ха­низм фе­де­ра­тив­ных биб­лио­тек спра­воч­ных дан­ных. Се­год­ня на этот стан­дарт уже пе­ре­хо­дят мно­гие круп­ные ком­па­нии: члены Norwegian Oil Industry Association, члены кон­сор­ци­у­ма FIATECH, круп­ней­шие по­став­щи­ки ин­жи­ни­рин­го­во­го про­грамм­но­го обес­пе­че­ния. Рос­сий­ские кор­по­ра­ции, такие как «Ро­са­том» и «Рос­нефть», изу­ча­ют воз­мож­но­сти его использования.

Ре­а­ли­за­ция стан­дар­та ISO 15926 в части пред­став­ле­ния, хра­не­ния и до­сту­па к дан­ным ос­но­ва­на на при­ме­не­нии утвер­жден­ных кон­сор­ци­у­мом W3C се­ман­ти­че­ских стан­дар­тов RDF, OWL и SPARQL. Ис­поль­зо­ва­ние RDF для ин­же­нер­ных дан­ных — весь­ма удач­ное ре­ше­ние, по­сколь­ку гра­фо­вая струк­ту­ра наи­бо­лее удоб­на для пред­став­ле­ния раз­но­род­ной ин­же­нер­ной ин­фор­ма­ции, тре­бу­ю­щей по­сто­ян­но­го раз­ви­тия и услож­не­ния мо­де­ли дан­ных на про­тя­же­нии всего жиз­нен­но­го цикла из­де­лия. Ис­поль­зо­ва­ние он­то­ло­ги­че­ско­го языка OWL поз­во­ля­ет при­ме­нять для об­ра­бот­ки ин­же­нер­ных дан­ных новые тех­но­ло­гии, на­при­мер до­сти­же­ния в об­ла­сти ис­кус­ствен­но­го интеллекта.

Ар­хи­тек­тур­ные решения

Базы дан­ных в Се­ман­ти­че­ской паутине

Пол­но­стью пред­ста­вить себе воз­мож­но­сти Semantic Web се­год­ня, как и воз­мож­но­сти WWW пят­на­дцать-два­дцать лет назад, еще труд­но, од­на­ко из­на­чаль­но в на­уч­ной среде, по­ро­див­шей Па­у­ти­ну, ее ори­ен­ти­ро­ва­ли, в част­но­сти, на вза­и­мо­дей­ствие с программами.

Дмит­рий Левшин

Ра­бо­та с дан­ны­ми ин­же­нер­ных си­стем на базе стан­дар­та ISO 15926 пред­по­ла­га­ет транс­фор­ма­цию дан­ных из при­ме­ня­е­мых в ин­же­нер­ном про­ек­те си­стем и пред­став­ле­ние их в виде три­пле­тов RDF, а язы­ком за­про­сов при об­мене дан­ны­ми дол­жен быть SPARQL. Од­на­ко, при на­ли­чии ста­биль­но функ­ци­о­ни­ру­ю­щих уна­сле­до­ван­ных ре­ля­ци­он­ных хра­ни­лищ и ра­бо­та­ю­щих с ними при­клад­ных си­стем, биз­нес пока ока­зал­ся не готов фи­нан­си­ро­вать гло­баль­ную смену тех­но­ло­гий, что при­ве­ло к по­яв­ле­нию дру­гих ар­хи­тек­тур ре­а­ли­за­ции стан­дар­та ISO 15926. На­при­мер, в про­грамм­ном ком­плек­се iRINGTools ней­траль­ные се­ман­ти­че­ские мо­де­ли дан­ных ис­поль­зу­ют­ся для ав­то­ма­ти­че­ской ге­не­ра­ции отоб­ра­же­ний (mappings) между тра­ди­ци­он­ны­ми объ­ект­ны­ми мо­де­ля­ми дан­ных ин­же­нер­ных при­ло­же­ний. В рам­ках про­ек­та Optique более важ­ной, чем смена фи­зи­че­ско­го спо­со­ба хра­не­ния, была со­чте­на воз­мож­ность со­став­ле­ния за­про­сов на ло­ги­че­ском языке. Общая се­ман­ти­че­ская мо­дель дан­ных поз­во­ля­ет в этом слу­чае по­стро­ить ин­тер­пре­та­тор, «на лету» транс­ли­ру­ю­щий общий для всех за­дей­ство­ван­ных мо­де­лей дан­ных ло­ги­че­ский SPARQL-за­прос в набор за­про­сов SQL для ре­ля­ци­он­ных баз дан­ных и ин­те­гри­ру­е­мых ин­фор­ма­ци­он­ных си­стем и со­би­ра­ю­щий потом ре­зуль­та­ты этих за­про­сов в один ответ.

Таким об­ра­зом, се­год­ня фор­ми­ру­ют­ся два ар­хи­тек­тур­ных под­хо­да: фи­зи­че­ское хра­ни­ли­ще се­ман­ти­че­ских дан­ных и транс­ля­тор ре­ля­ци­он­ных и объ­ект­ных мо­де­лей, ис­поль­зу­ю­щий се­ман­ти­че­ские ме­то­ды для до­сту­па к тра­ди­ци­он­ным хра­ни­ли­щам. Оба под­хо­да тре­бу­ют при­мер­но оди­на­ко­вой ра­бо­ты по под­го­тов­ке ней­траль­ной се­ман­ти­че­ской мо­де­ли дан­ных в ISO 15926, отоб­ра­же­нию на нее баз дан­ных ин­те­гри­ру­е­мых си­стем и могут ис­поль­зо­вать оди­на­ко­вый ин­стру­мен­та­рий мо­де­ли­ро­ва­ния дан­ных. Для ра­бо­ты с ней­траль­ны­ми мо­де­ля­ми дан­ных в се­ман­ти­че­ском фор­ма­те ис­поль­зу­ют­ся такие ин­стру­мен­ты, как бес­плат­ный ре­дак­тор Protege или ком­мер­че­ский про­дукт TopBraid Composer. Среди ин­стру­мен­тов мо­де­ли­ро­ва­ния дан­ных можно на­звать 15926 Editor, раз­ра­бо­тан­ный спе­ци­аль­но для дан­ных стан­дар­та ISO 15926. В этом ре­дак­то­ре ра­бо­та с се­ман­ти­че­ски­ми струк­ту­ра­ми RDF скры­та за спе­ци­а­ли­зи­ро­ван­ны­ми ин­тер­фей­са­ми и язы­ком за­про­сов, ори­ен­ти­ро­ван­ны­ми имен­но на он­то­ло­ги­че­скую мо­дель дан­ных ISO 15926, что поз­во­ля­ет ком­форт­но ра­бо­тать со спра­воч­ны­ми и про­ект­ны­ми дан­ны­ми в рам­ках любой ар­хи­тек­ту­ры ин­те­гра­ции данных.

При ра­бо­те с фи­зи­че­ским хра­ни­ли­щем се­ман­ти­че­ской ин­фор­ма­ции обеспечиваются:


  • пол­ное со­от­вет­ствие стан­дар­ту ISO 15926 — ре­аль­ный сбор дан­ных о всех эта­пах жизни из­де­лия в ней­траль­ном (не за­ви­ся­щем от по­став­щи­ков ин­же­нер­ных си­стем) фор­ма­те, поз­во­ля­ю­щем ор­га­ни­зо­вать хра­не­ние дан­ных от про­ек­ти­ро­ва­ния до вы­во­да из эксплуатации;

  • еди­но­об­раз­ный сбор дан­ных из мно­го­чис­лен­ных раз­но­род­ных ис­точ­ни­ков, вклю­чая базы дан­ных про­из­во­ди­те­лей обо­ру­до­ва­ния (се­ман­ти­че­ские хра­ни­ли­ща дан­ных легко рас­ши­ря­ют­ся при услож­не­нии мо­де­ли данных);

  • воз­мож­ность со­став­ле­ния и об­ра­бот­ки за при­ем­ле­мое время слож­ных за­про­сов к раз­но­род­ным свя­зан­ным объ­ек­там; на слож­ных за­про­сах (тре­бу­ю­щих много опе­ра­ций JOIN в ре­ля­ци­он­ных дан­ных) про­из­во­ди­тель­ность се­ман­ти­че­ских хра­ни­лищ пре­вы­ша­ет про­из­во­ди­тель­ность ре­ля­ци­он­ных хра­ни­лищ, что важно, учи­ты­вая тра­ди­ци­он­но ис­клю­чи­тель­ную слож­ность ин­же­нер­ных данных.

  • Недо­стат­ки фи­зи­че­ско­го хра­не­ния се­ман­ти­че­ской информации:

  • необ­хо­ди­мость син­хро­ни­за­ции дан­ных се­ман­ти­че­ско­го хра­ни­ли­ща с дан­ны­ми уна­сле­до­ван­ных ин­же­нер­ных систем;

  • мед­лен­ная ра­бо­та на про­стых за­про­сах по срав­не­нию с ре­ля­ци­он­ны­ми хра­ни­ли­ща­ми (даже самые про­из­во­ди­тель­ные со­вре­мен­ные хра­ни­ли­ща три­пле­тов, на­при­мер Virtuoso и OWLIM, усту­па­ют в ско­ро­сти за­про­сов ре­ля­ци­он­ным базам дан­ных в 10–20 и более раз);

  • неэф­фек­тив­ность хра­не­ния и об­ра­бот­ки боль­ших объ­е­мов од­но­род­ных чис­ло­вых дан­ных (на­при­мер, вре­мен­ных рядов от­сче­тов дат­чи­ков на ста­дии эксплуатации).

До­сто­ин­ство «транс­ля­ци­он­но­го» ва­ри­ан­та — ак­ту­аль­ность дан­ных в мо­мент об­ра­ще­ния, от­сут­ствие про­бле­мы син­хро­ни­за­ции с дан­ны­ми уна­сле­до­ван­ных ин­же­нер­ных си­стем. Его недо­стат­ки: мед­лен­ная об­ра­бот­ка слож­ных за­про­сов и за­про­сов, тре­бу­ю­щих об­ра­ще­ния к ре­ля­ци­он­ным хра­ни­ли­щам раз­ных систем.

«Транс­ля­ци­он­ный» под­ход по­явил­ся и раз­ви­ва­ет­ся как спо­соб быст­ро­го ре­а­ги­ро­ва­ния на за­про­сы биз­не­са, од­на­ко со­вер­шен­ство­ва­ние ин­стру­мен­тов для се­ман­ти­че­ской ра­бо­ты по­сте­пен­но при­ве­дет к кон­вер­ген­ции двух под­хо­дов — со­об­ще­ство раз­ра­бот­чи­ков на­це­ле­но на устра­не­ние недо­стат­ков «фи­зи­че­ско­го» хра­не­ния дан­ных в виде три­пле­тов. Для син­хро­ни­за­ции се­ман­ти­че­ских дан­ных с ре­ля­ци­он­ны­ми и объ­ект­ны­ми дан­ны­ми уна­сле­до­ван­ных си­стем раз­ра­бот­чи­ки ин­же­нер­ных при­ло­же­ний и сто­рон­ние ком­па­нии со­зда­ют шлюзы, ко­то­рые слу­жат для вза­и­мо­дей­ствия с рас­про­стра­нен­ны­ми си­сте­ма­ми CAD/CAM/PLM/ERP/EAM и тем самым спо­соб­ству­ют под­дер­жа­нию ак­ту­аль­но­сти дан­ных, вы­гру­жа­е­мых во внеш­ние се­ман­ти­че­ские хра­ни­ли­ща. Со вре­ме­нем толь­ко для пол­но­стью уни­каль­ных и за­кры­тых уна­сле­до­ван­ных си­стем может со­хра­нить­ся необ­хо­ди­мость до­сту­па через ин­тер­пре­ти­ру­ю­щие мо­ду­ли. Кроме того, для задач ин­те­гри­ро­ван­но­го ана­ли­за раз­но­род­ных дан­ных жиз­нен­но­го цикла, как пра­ви­ло, не тре­бу­ет­ся до­ступ к из­ме­ня­ю­щим­ся дан­ным в ре­аль­ном вре­ме­ни, ко­то­рый будет и далее осу­ществ­лять­ся для нужд опе­ра­тив­но­го управ­ле­ния в рам­ках спе­ци­а­ли­зи­ро­ван­ных систем.

Невы­со­кая ско­рость ра­бо­ты се­ман­ти­че­ских хра­ни­лищ на про­стых за­про­сах по срав­не­нию с ре­ля­ци­он­ны­ми хра­ни­ли­ща­ми яв­ля­ет­ся одним из глав­ных пре­пят­ствий для рас­про­стра­не­ния се­ман­ти­че­ских тех­но­ло­гий. В дан­ный мо­мент ли­де­ра­ми по про­из­во­ди­тель­но­сти среди хра­ни­лищ яв­ля­ют­ся Virtuoso, AllegroGraph, StarDog и OWLIM, но, по­сколь­ку рынок се­ман­ти­че­ских хра­ни­лищ до­ста­точ­но молод, на нем по­сто­ян­но по­яв­ля­ют­ся новые иг­ро­ки. На­при­мер, RDF-хра­ни­ли­ще NitrosBase не усту­па­ет по про­из­во­ди­тель­но­сти тра­ди­ци­он­ным ре­ля­ци­он­ным и объ­ект­ным базам дан­ных даже на про­стых за­про­сах, а на слож­ных на по­ряд­ки опе­ре­жа­ет по ско­ро­сти ра­бо­ты RDF-хра­ни­ли­ща ли­де­ров рынка. Уве­ли­че­ние про­из­во­ди­тель­но­сти до­сти­га­ет­ся за счет того, что, в от­ли­чие от клас­си­че­ских RDF-хра­ни­лищ, NitrosBase ком­пакт­но хра­нит ин­фор­ма­цию по од­но­му субъ­ек­ту, это сбли­жа­ет его ар­хи­тек­ту­ру с ар­хи­тек­ту­ра­ми объ­ект­ных и ре­ля­ци­он­ных баз и поз­во­ля­ет при­бли­зить NitrosBase по про­из­во­ди­тель­но­сти к ре­ля­ци­он­ным СУБД. Все ра­бо­чие струк­ту­ры NitrosBase, вклю­чая ин­дек­сы, ис­поль­зу­ют внут­рен­ние ад­ре­са вме­сто ссы­лок по URI, а для транс­ля­ции URI во внут­рен­ний адрес при­ме­ня­ет­ся сло­варь. Ис­поль­зо­ва­ние пря­мых внут­рен­них ад­ре­сов вме­сто URI дает воз­мож­ность по­лу­чить весь набор дан­ных о субъ­ек­те за од­но-два об­ра­ще­ния к па­мя­ти (вме­сто мно­гих об­ра­ще­ний при по­ис­ке в B-де­ре­ве) и поз­во­ля­ет до­бить­ся быст­ро­дей­ствия на про­стых за­про­сах, со­по­ста­ви­мо­го с клас­си­че­ски­ми ре­ля­ци­он­ны­ми ба­за­ми дан­ных. Кроме того, спе­ци­аль­ная струк­ту­ра поз­во­ля­ет по­лу­чить спи­сок внут­рен­них иден­ти­фи­ка­то­ров за­пи­сей, на ко­то­рые ссы­ла­ет­ся дан­ная за­пись, что в сотни раз уско­ря­ет об­ра­бот­ку слож­ных за­про­сов (тре­бу­ю­щих мно­же­ства JOIN) по срав­не­нию с ис­поль­зо­ва­ни­ем клас­си­че­ских В-деревьев.

Неэф­фек­тив­ность хра­не­ния и об­ра­бот­ки боль­ших объ­е­мов од­но­род­ных чис­ло­вых дан­ных устра­ня­ет­ся, на­при­мер, в спе­ци­а­ли­зи­ро­ван­ных хра­ни­ли­щах, объ­еди­ня­ю­щих тра­ди­ци­он­ные три­пле­ты и мас­си­вы. Од­на­ко для фор­ми­ро­ва­ния за­про­сов к таким хра­ни­ли­щам тре­бу­ют­ся рас­ши­ре­ния SPARQL, обес­пе­чи­ва­ю­щие воз­мож­ность ра­бо­ты с мас­си­ва­ми, как это сде­ла­но в рас­ши­ре­нии Scientific SPARQL. Дру­гой под­ход раз­ви­ва­ет­ся в рам­ках про­ек­та Simantics (www.​simantics.​org), ком­би­ни­ру­ю­ще­го для задач ин­же­нер­но­го мо­де­ли­ро­ва­ния раз­лич­ные ло­ги­че­ские пред­став­ле­ния ин­же­нер­ных дан­ных, вклю­чая дан­ные вре­мен­ных рядов.

***

Он­то­ло­ги­че­ские под­хо­ды к мо­де­ли­ро­ва­нию дан­ных и се­ман­ти­че­ские тех­но­ло­гии их хра­не­ния и об­ра­бот­ки были со­зда­ны для опе­ра­ций с ква­зи­струк­ту­ри­ро­ван­ны­ми дан­ны­ми, вы­пол­ня­е­мых, на­при­мер, в за­да­чах ана­ли­за тек­стов на есте­ствен­ных язы­ках или дан­ных со­ци­аль­ных сетей. Раз­ви­тие се­ман­ти­че­ских тех­но­ло­гий при­ве­ло к рас­ши­ре­нию сферы их при­ме­не­ния в том числе и для струк­ту­ри­ро­ван­ных дан­ных жиз­нен­но­го цикла слож­ных ин­же­нер­ных объ­ек­тов — имен­но такие под­хо­ды поз­во­ля­ют обес­пе­чи­вать эф­фек­тив­ную ком­му­ни­ка­цию боль­шо­го ко­ли­че­ства людей и ком­пью­те­ров в рам­ках все более слож­ных со­вре­мен­ных ин­же­нер­ных проектов.

Се­год­ня фор­ми­ру­ют­ся две ар­хи­тек­ту­ры для ра­бо­ты с ин­же­нер­ны­ми дан­ны­ми: с хра­не­ни­ем се­ман­ти­че­ских дан­ных и с их транс­ля­ци­ей в се­ман­ти­че­ский фор­мат. Новые раз­ра­бот­ки будут в даль­ней­шем ори­ен­ти­ро­ва­ны либо на кон­ку­рен­цию, либо на кон­вер­ген­цию этих ар­хи­тек­тур, что сле­ду­ет учи­ты­вать спе­ци­а­ли­стам, ра­бо­та­ю­щим с ин­же­нер­ны­ми си­сте­ма­ми (САПР, PLM), а также при­ме­ня­ю­щим се­ман­ти­че­ские тех­но­ло­гии для дру­гих при­клад­ных областей.

Вик­тор Аг­рос­кин (vic5784@​gmail.​com) — пре­зи­дент, Ана­то­лий Ле­вен­чук (ailev@​asmp.​msk.​su) — ви­це-пре­зи­дент по ис­сле­до­ва­ни­ям и раз­ра­бот­кам, ком­па­ния TechInvestLab.​ru (Москва); Вла­ди­слав Го­лов­ков (vgolovkov@​nitrosbase.​com) — глав­ный ар­хи­тек­тор ин­фор­ма­ци­он­ных си­стем, ком­па­ния «Нит­ро­сДэй­та Рус» (Москва).

Tags: it, ОнтоЛог
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments