ИЗПОЛЗВАНЕ НА МНОГОТЕОРЕТИЧНИЯ ПОДХОД ЗА ТЪРСЕНЕ НА НЕОБХОДИМОТО СЪДЪРЖАНИЕ ПО АТРИБУТИ И

При разработването на хардуерния и софтуерен комплекс на музеи и художествени галерии задачата беше да се осъществи оптималният подбор на експонати. Разработеният софтуер трябва да поддържа търсенето на необходимото съдържание по атрибути и ключови думи.

За да се реши този проблем, беше използван теоретично подход.

Теоретичният набор включва анализ на набори от информационни съобщения, обекти и т.н. по отношение на техните количествени характеристики. Няма пълна дисоциация от качеството на изследваните информационни обекти и техните елементи. Напротив, самото изследване на формализирани набори, съобщения (например данни от съдебна статистика и т.н.) постоянно предполага наличието на някакви качествени моменти, признаци, които ни позволяват да говорим за съдържанието на изследваните информационни съобщения. Съдържанието на търсенето на качествения аспект на информацията е да се подберат, проучат и изследват характеристиките на набор от съобщения във връзка с качествените моменти на съставните му части.

Един от начините за решаване на проблема с превръщането на потенциална информация в подходяща информация е използването на най-рационалните средства за кодиране (декодиране) на информация (например дефиниране на информация за предприятие в цифровия код на EDRPOU или изразяване на текста на закон в конвенционални символи на специален език за извличане на информация).

Официално изявление на проблема

Удобно е да се използва теоретично зададеният подход, за да се определи ефективен алгоритъм за намиране на оптималните експонати на изложбения център в отговор на заявката на потребителя. Изследваните обекти ще бъдат представени под формата на набор от техните свойства, които са определени за оценка в процеса на търсене:

където O е обектът, който се изследва; p - свойството, което участва в търсенето.

Приоритетът на свойствата при търсене и оценка на значимостта се показва като набор от коефициенти на тежест, които се определят чрез експертен анализ на изследвания обект (в случая експонат от изложба).

Удобно е да се представи заявка за търсене според теоретично зададения подход като набор от думи. Освен това, за да се подобри ефективността и точността на търсенето, както и да се осигури висока надеждност на резултатите, всички повторения и семантично "слаби" конструкции (например, съюзи и предлози) се премахват от набора от думи на търсенето заявка.

където R е заявка за търсене; w - дума в заявката; Fsem (w) - функция за определяне на семантични съвпадения на дума.

Функцията за определяне на съответствието на свойството на изследвания обект на думата от заявката се дефинира като произведение на съответния коефициент на тежест и индикатора на функцията за оценка на присъствието на думата в стойността на свойството:

Feval (p, w) = kp ∙ Fex (p, w), (4)

където p е свойство на обекта; w - дума в заявката; kp е коефициентът на тежест за имота; Fex - изчислената функция на появата на дума в стойността на свойството.

Очакваната функция на появата на дума зависи от начина на тълкуване на стойността на свойството и целите на търсенето. Например за атрибута „Автор на произведението“ на обекта „Изложба“ функцията за оценка на появата на дума може да бъде определена от следната система:

(пет)

където pauth е свойството "Автор на произведението"; w - думата на заявката за търсене; val (pauth) - набор от стойности за свойството "Автор на произведението" за всеки обект.

Използвайки представяне (1) и функция (4), интегралният индикатор за съответствието на изследвания обект на заявката за търсене (релевантност) се определя като средната аритметична стойност на сумата от показателите на функция (4):

(6)

Резултатите от оценката на релевантността за съответните обекти и самите обекти, които се изследват, са представени като набор, чиито елементи са сортирани в низходящ ред на ниво на релевантност.

1. Дадени набори от свойства на обектите O =

= и набор от теглови коефициенти =, които определят приоритета на свойствата.

2. Въведете заявката R в низа за търсене, който включва думите wi ().

3. Определете съответствието на свойството на изследвания обект на думата от заявката по формулата

Feval (p, w) = kp ∙ Fex (p, w),

където Feval (p, w) = kp ∙ Fex (p, w) е равно на 1, ако думата е включена в свойството, 0 в противен случай.

4. Определете средната аритметична стойност на сумата от показателите на функцията Feval (p, w) = kp ∙ Fex (p, w)

5. Сортирайте обектите в низходящ ред на нивото на уместност, определено в стъпка 4.

6. Изход на обект.

Пример за решаване на проблема с намирането на необходимото съдържание чрез атрибути и ключови думи

Дадена таблица. 1, съдържащ редица експонати.

Зададохме много свойства за оценка по време на търсенето