Морфология слов в Яндексе

Как вспомню морфологический разбор в школьные годы, так холодным потом как-то пробивает, как вспомню, сколько всего нужно было вспоминать и учитывать, однако для Яндекса морфологический разбор слов — обыденность. Морфология значительно улучшает поиск. Ведь Яндекс — это всего лишь машина, которая ищет по определенным сочетаниям символов. Без морфологии поиск был бы более еще корявее, чем он сейчас у Яндекса :) Для того, чтобы учитывать морфологию русского языка существует Яndex.Dict — словарный сервер. Этот словарный сервер взаимодействует с самим процессом поиска.

Каждое слово, которое распознаётся, как русское изменяется на все его словоформы, например словосочетание:

Искать слово

Будет также соответсятовать словосочения, как: ищут слово, ищет слова, и т.д.

В том случае если слово не существует в словаре ни как имя нарицательное, ни как собственное, то словарный сервер на основании имеющихся у него морфологических правил строит гипотезы возможной нормализации и словоизменения.

Язык поисковых запросов

Отличительная особенность Яндекса — возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов. Так, например, для операции исключения можно указать область действия:

запрос A ~~ B найдёт документы (страницы), в которых присутствует А, но не присутствует В

запрос А ~ Б — документы, где слово Б не присутствует со словом А в одном предложении.

Аналогично, оператор & ищет сочетания ключевых слов в предложении, а && — во всём документе

Оператор ! позволяет отключить морфологию для конкретного слова, а !! позволяет указать нормальную форму, что позволяет обойти некоторые проблемы связанные с омонимией.

Например запрос !!Иванов будет находить Иванова и Ивановых, но не Ивана.