Дизамбигуация – это инструмент систем поиска, функцией которого является подбор из совокупности омонимов (схожих по написанию слов) значения, наиболее соответствующего запросу пользователя. Применение данного инструмента значительно повышает уровень релевантности выдачи. Его целью является предоставление пользователю данных, которые более всего соответствуют его запросу.
Главными механизмами инструмента дизамбигуации в русских поисковиках являются: снятие омонимии и последующий анализ словоформ, а также изучение контекста, окружающего поисковую фразу.
Примеры дизамбигуации
Слова с одинаковым написанием имеют разное лексическое значение. К примеру, пользователь набирает запрос «график работы театра». Механизмы алгоритма поиска, которые отвечают за устранение неоднозначности, с учетом соответствующего контекста, не допускают к выдаче сайты, содержащие фразы «художник график», «график снижения цен» и прочее.
При устранении неоднозначности алгоритм поиска очищает выдачу от бесполезных данных, что, в свою очередь, значительно улучшает быстроту работы поисковой системы, разгружает ее сервера.
Более сложным примером неоднозначного ввода запроса является введение лишь одного слова – «график». В таком запросе отсутствует контекст, поэтому поисковым системам приходится использовать другие механизмы – к примеру, применение статистических данных, отображающих частоту обращения пользователей к тому или иному контексту запроса.
Поэтому при продвижении интернет-ресурса очень важно проанализировать контент и оптимизировать его под определенные ключи таким образом, чтобы поисковая система наверняка учитывала их в определении релевантности ресурса в отношении того или иного запроса.
«Обучение» поисковых систем
В связи с тем, что мировая компьютерная сеть постоянно развивается и растет и все больше сфер жизни человека с ней перекликаются, поисковые системы постоянно совершенствуются и модернизируются. За этим, естественно, стоят живые люди – специалисты в сфере языкознания и математического моделирования. Именно они занимаются научными разработками и исследованиями, тестированием новых методов модернизации поисковых машин. И именно они «учат» эти машины «понимать» пользователя. Работа этих специалистов требует и математического, и лексического анализа используемых пользователем словоформ и контекста, а также создания лексико-семантической разметки омонимов.
Для создания успешных методов обнаружения омонимов и успешной дизамбигуации используется множество методов анализа. Популярными технологиями сейчас являются WordNet и FrameNet. В результате их внедрения в алгоритм работы поисковых систем генерируется масса информации, которую используют поисковики для улучшения показателей релевантности и скорости выдачи информации.