Координатно индексиране

Координатно индексиране - Лекция, раздел Информатика, Основи на информатиката Нова технология влезе в търсенето на информация под формата на метод на инвентаризация на координати.

Предимствата на този метод са очевидни. На първо място, информационните работници и потребителите на информация са освободени от строгата рамка на класификационните схеми и списъците с предметни рубрики. Индексирането на новите документи се извършва, без да се отчитат потенциалните и често остарели искания на специалисти, отразени в тях. От друга страна, индексирането е освободено от субективност - ключовите думи се избират официално. Тази работа по принцип може да бъде възложена на машина. В много съвременни системи за извличане на информация операторът въвежда в машината библиографските данни на документа, неговото резюме (анотация, резюме), а понякога и най-информативните части от текста (например първия и последния абзац на статия, съдържаща най-голям брой термини, свързани със съдържанието му). С помощта на „забранителния“ списък с официални и общозначителни думи, въведени­ключовите думи се избират автоматично, които са програмно намалени до нормална форма (унифицирана­съществителни от съществителни и прилагателни, инфинитиви на глаголи). Това е значителна стъпка към автоматизирането на въвеждането на информация в системата за извличане на информация.

При търсене на необходимата информация специалист може да формулира искането си под формата на верига от термини, на пресечната точка на която ще се появят повечето документи, съдържащи необходимата информация. В същото време потребителят може произволно да промени стратегията за търсене в зависимост от оценката на своите междинни резултати. Ако в системата има малко или няма документи за заявката, можете да премахнете всякакви ключови думи от заявката (в горния пример "газ" и "защита"). Тогава системата ще издава документи с по-широко съдържание относно корозията на лопатките на турбините, които все още могат да съдържат необходимата информация. Ако има твърде много документи при поискване, можете да добавите ключови думи, които ограничават търсенето, например, до определен клас турбини или специфични методи за защита на техните лопатки от корозия. Това вече съдържа важен елемент от възможността за диалог със системата, използвайки думи от естествен език.

Основните предимства на този принципно нов подход към разкриването на съдържанието на документите и търсенето на информация са, че той ви позволява да намерите информация за всяка, непредвидена преди това комбинация от функции. Освен това, когато се появят изцяло нови посоки на изследване, е възможно да се търси целия масив от документи, индексирани преди това с помощта на този метод. Традиционните методи не предоставят такива възможности.