M001
Ваш город:
Специальное предложение
8 800 500 18 80 Звонок по России бесплатный

Стоп-слова: тонкости поискового шума

Как известно, текстовый контент является главным и, возможно, единственным критерием оценки релевантности веб-страницы. Именно на его качестве и оригинальности постоянно делают упор поисковые системы, его они заносят в свое информационное хранилище. Алгоритмы отбора текстов тоже не составляют особого секрета. Однако не все слова поисковыми машинами индексируются. Существуют, так называемые стоп-слова, которые, по мнению поисковых систем, не несут самостоятельной смысловой нагрузки. Такие слова, относящиеся к совершенно разным лексическим категориям, не подвергаются индексации. Делается это с целью ускорения процесса информационного поиска, экономии серверного пространства и производственных ресурсов машины.

При индексации они заменяются специальным маркером. Это имеет практическое значение при формировании семантического ядра сайта и определении круга продвигаемых ключевых фраз. Конечно же, качественный текст невозможен без предлогов, союзов, частиц, местоимений и междометий, которые предназначены для создания из отдельных значимых словосочетаний стройной речевой конструкции. Поэтому для читателей стоп-слова не менее ценны, чем те, которые индексируются машинами и на основании которых определяется релевантность страницы.

Общепринятый перечень стоп-слов

На сегодняшний день полного списка слов этой категории, также называемых поисковым шумом, не существует. В стандартный перечень стоп-слов принято включать:

  • Отдельно стоящие в тексте символы: . , / ? ! ; : ( ) и прочие;
  • Обособленные буквы и цифры;
  • Местоимения, причастия, союзы, предлоги, междометия, частицы, вводные слова, буквосочетания и буквенные сокращения;
  • Различные слова, часто присутствующие на веб-ресурсах: интернет, сайт, поиск, прайс, заказ и пр.;
  • Всевозможные крылатые фразеологизмы, состоящие из шумовых слов. Например, знаменитое гамлетовское восклицание: «быть или не быть».

Что же касается различных образцов «изящной словесности», больше известных как ненормативная лексика, то такие фразы не индексируются, сколь бы содержательными и осмысленными они ни были.

X

Политика конфиденциальности

Лицо, указывающее свои персональные данные на сайте m001.ru (включая любые поддомены сайта), (далее по тексту «Клиент») обязуется принять настоящее Соглашение и дает согласие на обработку его персональных данных, на нижеприведённых условиях:

  1. Обработка персональных данных осуществляется с целью представления Клиенту информации об оказываемых услугах, коммерческих предложений, проведения рекламных кампаний и маркетинговых иследований.
  2. Клиент дает согласие на обработку следующих персональных данных:
    • фамилия, имя и отчество физического лица и (или) наименование юридического лица,
    • номера контактных телефонов,
    • адреса электронных почт,
    • адреса сайтов,
    • мест работы и занимаемых должностях,
    • сведения об интересах,
    • сведения об участии в мероприятиях.
  3. Общество осуществляет защиту персональных данных Клиента от неправомерного доступа к ним третьих лиц в соответствии с законодательством Российской Федерации.
  4. При проведении обработки персональных данных Общество вправе применить следующие процедуры: сбор, обезличивание, систематизацию, запись, хранение, обновление, уничтожение.
  5. Общество вправе проводить обработку персональных данных на бумажных носителях и с использованием средств вычислительной техники.
  6. Общество вправе предоставлять доступ к персональной информации третьим лицам в следующих случаях:
    • Клиент дал на то согласие,
    • это предусмотрено законодательством Российской Федерации и (или) иными нормативно-правовыми актами субъектов Российской Федерации,
    • это требуется для предоставления Клиенту запрашиваемых им услуг.
  7. Согласие на обработку персональных данных может быть отозвано Клиентом по средствам направления соответствующего запроса Обществу.