M001
Ваш город:
Специальное предложение
8 800 500 18 80 Звонок по России бесплатный

Стемминг – ствольная основа поисковых алгоритмов

Поисковые системы неустанно работают над повышением релевантности и качества результатов выдачи по пользовательским запросам. Специальные алгоритмические формулы, анализирующие содержимое веб-страниц, постоянно совершенствуются и модернизируются. Высокой степени тематического соответствия вряд ли удалось бы добиться внедрения в поисковые алгоритмы такого механизма, как стемминг, который вычленяет морфологическую основу из любой словоформы. Сам данный термин, произошедший от английского слова «stem», которое можно перевести, как ствол, наилучшим образом характеризует принцип работы и назначение этого программного инструмента.

Именно благодаря стеммингу пользователю демонстрируются не только документы, содержащие точное вхождение поисковой фразы, но и страницы с различными словоформами, что значительно повышает релевантность выдачи и делает ее гораздо разнообразнее и вариативнее. Кроме того, благодаря этому инструментальному средству в SERP могут быть включены документы, пусть и содержащие заданного запроса, но представляющие потенциальный интерес для пользователя, то есть прямо или косвенно относящиеся к данной тематике. Помимо стемминга для улучшения качества выдачи при анализе веб-страниц используются:

  • Леммитизация;
  • Латентно-семантический анализ текста;

Механизм выделения морфологического корня из различных словоформ также часто применяется при организации системы поиска по сайту с целью улучшения юзабилити и создания более комфортных условий посетителям для использования возможностей ресурса.

Принцип действия стемминга

Проблема выделения корня слова при программно-информационном поиске имеет достаточно давнюю историю. Первая научная работа, посвященная решению этой сложной технической задачи, была опубликована еще 1968 году. Современный стемминг представляет собой одну из фаз автоматической нормализации текстового материала. Сейчас уже разработаны различные алгоритмические формулы, предназначенные для решения данной задачи: от простого поиска флективной формы до автоматической генерации специальных программных таблиц для каждого языка индивидуально. 

X

Политика конфиденциальности

Лицо, указывающее свои персональные данные на сайте m001.ru (включая любые поддомены сайта), (далее по тексту «Клиент») обязуется принять настоящее Соглашение и дает согласие на обработку его персональных данных, на нижеприведённых условиях:

  1. Обработка персональных данных осуществляется с целью представления Клиенту информации об оказываемых услугах, коммерческих предложений, проведения рекламных кампаний и маркетинговых иследований.
  2. Клиент дает согласие на обработку следующих персональных данных:
    • фамилия, имя и отчество физического лица и (или) наименование юридического лица,
    • номера контактных телефонов,
    • адреса электронных почт,
    • адреса сайтов,
    • мест работы и занимаемых должностях,
    • сведения об интересах,
    • сведения об участии в мероприятиях.
  3. Общество осуществляет защиту персональных данных Клиента от неправомерного доступа к ним третьих лиц в соответствии с законодательством Российской Федерации.
  4. При проведении обработки персональных данных Общество вправе применить следующие процедуры: сбор, обезличивание, систематизацию, запись, хранение, обновление, уничтожение.
  5. Общество вправе проводить обработку персональных данных на бумажных носителях и с использованием средств вычислительной техники.
  6. Общество вправе предоставлять доступ к персональной информации третьим лицам в следующих случаях:
    • Клиент дал на то согласие,
    • это предусмотрено законодательством Российской Федерации и (или) иными нормативно-правовыми актами субъектов Российской Федерации,
    • это требуется для предоставления Клиенту запрашиваемых им услуг.
  7. Согласие на обработку персональных данных может быть отозвано Клиентом по средствам направления соответствующего запроса Обществу.