Всичко, което можете да знаете за Yandex - Търсене в световен мащаб, извличане на текст, големи данни
Петър Темпфли, гост-автор на един от авторите на блога за компютърна лингвистика

Yandex е осмата по големина търсачка в света, въпреки че Русия може би е по-добре да говори за „рускоезичния интернет“ (РУНЕТ), защото се използва в целия рускоезичен свят. Фактът, че побеждава Google на вътрешния - руски език, говори много: Яндекс притежава 64 процента от пазара, докато американската компания има над 21 процента.
Какво знае Яндекс?
На практика всичко, което бихте очаквали от търсачката. Можем да въвеждаме сложни термини за търсене, точно както правим в Google. Кавички, знаци плюс и минус могат да се използват по подобен начин; можете също да посочите символа * (която и да е дума), да зададете точно колко думи се срещат между две думи и да посочите оператора “или”. Тъй като руският е силно конюгативен език, словоформите играят важна роля. По подразбиране той търси всички запазени версии на думи, което означава, че няма значение дали сте посочили „чай“ или „с чай“ на руски език. Ако думата обаче е важна, можем да предпишем удивителен знак и той ще се държи така, сякаш е между времевите знаци. И ако искате да намерите речниковата форма на спрегната форма, можете да инструктирате програмата с два удивителни знака. Между другото, Google също знае как да търси запазени форми, но Яндекс, който е специално заточен на руски, е много по-гъвкав при въвеждане на термини за търсене.
Колкото по-малко, толкова повече?
Другите трикове на Google също са известни на руската търсачка: изображения, видеоклипове, карти, преводи, както и скорошни посещения, термини за автоматично довършване. Yandex прави още няколко оферти и според моята субективна оценка е малко по-точен в смисъл, че предложенията изглеждат „по-руски“. Между другото, резултатите от търсенето на Yandex също изглеждат по-добри понякога, като по-добре картографират рускоезичния интернет. Например Google търси „социална сеть“ (социална мрежа) за практически само информация за филма, а Яндекс първо предоставя най-големия руски сайт за социални мрежи (Vkontakte.ru), след което получаваме статия в Уикипедия, малко информация за филма, и други руски сайтове за социални мрежи също ще се появят в топ 10 на резултатите. Това може да се обясни с факта, че местните сайтове трябва да се конкурират с данни от цял свят в базата данни на Google, докато на „домашно ниво“ сайтове, които не са толкова подходящи в световен мащаб, също могат да се класират на високо място. Според тях по-рядко, може би дори повече? (Трябва също да се добави, че броят на руските страници, индексирани от Яндекс, е в конкуренция с базата данни на Google на руски език)
Търсене на екстри
Добре е и услуга, която също съществува в Google, да включва различни „екстри“ в търсенето, ако е уместно, напр. карта, речник мания валутни курсове. Фондов пазар, време, географски и подобни „обясняващи се“ неща, които Яндекс знае, освен че показва понякога сладки, а понякога полезни други трикове. Например, той разпознава с добра точност, ако стихове търсим и даваме целия текст наведнъж. Ако ожаднем и пожелаем алкохолна напитка, веднага рецепти за коктейлитрябва да побързаме да ни помогнем. Ако напишем „мой айпи“, т.е. „my ai-pím“, ще получим информация за нашия IP адрес и скоростта на връзката ни, ако това е текущото лятно време в нашия град. водни блокажи искаме да знаем нещо, веднага ще получим отговора (последното е много често срещана руска реалност!).