Координатно индексиране - Великата енциклопедия на нефт и газ, статия, страница 3
Координатно индексиране
Има две основни опции за автоматично индексиране на структурни формули. Първият вариант се свежда до конвенционално индексиране на координати. В този случай допълнителният запис изглежда като набор от числа, например: 17; 56; 105; 264, което означава, че тази структура съдържа 17-и, 56-ти, 105-и и 264-и признаци от речника на структурните характеристики. Във втория вариант не е посочен речник на характеристиките, а правило за генериране на фрагменти от структурна формула. С други думи се уточнява връзката между оригиналната структурна формула и някакъв клас фрагменти. [32]
Азбучният списък с ключови думи, даден вдясно от резюмето, формира изображението за търсене на този резюме. Практическият опит показва, че 8 - 15 ключови думи обикновено са достатъчни за координатно индексиране на един документ. [33]
Очевидно е, че ISS може да бъде ефективен само когато е осигурено еднакво индексиране на документи и заявки за информация със същото съдържание. Необходимостта от такава еднаквост е особено голяма при координатното индексиране, основано на използването на думи и фрази на естествен език, който се характеризира с такива явления като синонимия, омонимия и полисемия. Еднородността на координатното индексиране може да бъде осигурена само чрез установяване на определен контрол върху използването на думи и фрази на естествения език, действащи като ключови думи. [34]
Няма съмнение, че дълбокото разбиране на традиционните библиотечно-научни правила за каталогизиране и систематизиране е възможно само в общия контекст на съвременната концепция за езиците за търсене на информация. В същото време предимствата и ограниченията на езиците за координатно индексиране, разработени в компютърните науки, се разкриват напълно само в сравнението им с езиците на азбучния, систематичния и предметния библиотечен каталог. Както бе споменато по-горе, интеграцията на тези раздели вече се извършва и в двете научни дисциплини - необходимо е тя да се разшири и при преподаването на тези дисциплини. [35]
Контролът върху използването на ключови думи може да бъде от различна степен. С нулев или много слаб контрол селекторът на тема избира ключови думи за координатно индексиране на документ директно от текста на този документ, независимо кои ключови думи са били използвани преди; той не взема предвид (или почти не взема предвид) синонимите на ключови думи и понякога дори не привежда словоформи в нормална форма. С пълен контрол индексирането се извършва съгласно нормализиран списък (речник) с ключови думи, в който синонимията, полисемията и омонимията на ключовите думи са напълно елиминирани и тези думи са свързани помежду си чрез родови и асоциативни връзки. Практическият опит показва, че колкото по-висока е степента на лексикографска обработка на речника на IPL, толкова по-голям контрол изисква такъв IPL при практическото му използване. [36]