Какво е интелигентно търсене На какви критерии трябва да отговаря DesignFire

какви

  1. Като се вземат предвид особеностите на езика (търсене на думи в различни склонения и случаи)
  2. Предлагайте допълнителни резултати (позволява на потребителя да използва сайта, дори ако той няма необходимото съдържание)
  3. Предложение за допълнителни заявки (посочване на търсенето)

Нека започнем с първата точка. Основният проблем при типичните търсения е, че думите се търсят в напълно различна форма (не във формата), в която съществуват на сайта. Да предположим, че потребителят търси „чорапи“, докато сайтът има само „чорап“.

За да разберете по-точно какво иска посетителят, трябва да съхраните основата на сайта в малко по-различна форма. За да направите това, всеки текст на сайта трябва да бъде изтрит. Тези. представете го под формата на стъбла от думи. Например имаше текст „Василий решава математика“, но сега (след делемизация) - „Василий решава математика“. Но всъщност на сайта е организирана база данни с леми (лемата е в основата на една дума), а текстът е представен под формата на числа-връзки към тази основа.

Впоследствие заявката на потребителя също се премахва, т.е. на входа бихме могли да имаме "Цветя на едро", а сайтът ще търси леми "Цвете на едро".

Делемизацията може да се случи по два начина. За първия метод трябва да поставите основата на лема. Можете да вземете базата на Зализняк. След това просто сравнявате думата с основата и получавате връзка към необходимата лема. Подобен процес обаче отнема доста време.

Вторият начин е по-опростен - думата просто се отрязва по определен начин (префиксите и окончанията се отрязват). И тук всичко зависи от правилността на предоставените правила. Обикновено за такъв метод трябва да подготвите няколкостотин окончания и изключения, но въпреки това няма да получите думите „чорап“ и „чорапи“, за да съвпадат, или и двамата ще бъдат отрязани до „нос“, ще корелира с обичайната дума нос.