Первоклассные услуги по продвижению и раскрутке сайтов

Что такое стоп-слова?

Опубликовано: 2016/02/26Рубрика:
Продвижение сайтов
Комментариев: 0
Просмотров: 821

seo_stop_slova

Текстовая информация которая находится в сети интернет на сегодняшний день разрослась до очень больших масштабов, и поисковым системам приходится затрачивать огромное количество серверных мощностей для их анализа. Поэтому, чтобы максимально сократить машинное время на индексацию и хранение данной информации, поисковые системы ввели такое понятие как стоп-слова.

Стоп-слова — это слова, которые не имеют никакой смысловой нагрузки для конкретного текста. При этом поисковые системы анализируют морфологию текста и учитывают множество параметров, основываясь на которых ранжируют документы в выдаче. Один из этих параметров и есть стоп- или шумовые слова, по количеству которых и определяется качество документа в прямой зависимости — чем больше, тем хуже.

Чтобы понимать значение стоп-слов, нужно перечислить, что к ним относится:

  1. Небуквенные знаки: точки, запятые, тире, кавычки, скобки.
  2. Цифры в любых комбинациях.
  3. Союзы, местоимения, предлоги, междометия.
  4. Матерные слова.
  5. Общеупотребляемые слова, которые могут относиться к любой теме. Например: заказать, купить, основа, эксклюзив.

В то же время все ключевые слова подразделяются на две большие группы:

  1. Группа общих стоп-слов, к которым относят первые 4 пункта из предыдущего списка.
  2. Группа частных стоп-слов, к которым относят слова из пятого пункта.

Вторая группа включает слова, которые не могут иметь самостоятельную значимость, но получают ее в связке с другим значимым словом. К примеру, слово «выбирать» является мусорным и не получает веса при морфологическом анализе текста поисковой системой, но если оно формирует значимую фразу в словосочетании » выбрать телевизор», то получает вес и является основой для определения релевантности текста.

Как работать со стоп-словами?

Для улучшения качества текстов и лучшего отношения к ним поисковых систем идеально будет просто исключить все шумовые слова из текста. Но в силу потери читабельности, такое решение не даст нам никакого полезного результата. Поэтому текст стоит создавать с учетом баланса — минимального количества шумовых слов, которые оставят текст максимально привлекательным для пользователя.

Чтобы понимать, к каким цифрам стремиться, стоит отметить, что приемлемым считается вхождение стоп-слов на уровне 30% от общего количества слов в тексте. Но также стоит понимать, что существуют как тексты различных размеров, так и различных тематик. Поэтому всегда стоит делать поправки с учетом того, что:

  • во-первых, чем больше размер текста, тем больше в нем допускается стоп-слов;
  • во-вторых, тематика сильно влияет на количество мусорных вхождений словоформ. Так текст, который является отзывом о путешествии, будет нести 50 и более процентов таких вхождений, а научная статья будет считаться поисковой системой хорошей при вхождениях не более 20%.

Проверка стоп-слов

Для удобства контроля и исключения стоп-слов из текста существует множество бесплатных сервисов. Одним из них является Textus Pro. Это мощный инструмент для копирайтеров, который помогает в работе и имеет множество различных функций. Одна из них — это возможность подсветки стоп-слов цветом. Это поможет перестроить предложения так, чтобы получить максимально качественный текст, как с точки зрения поисковой системы, так и с точки зрения пользователя.

Где взять список стоп-слов?

Списки стоп-слов непостоянны. Они обновляются в зависимости от индексации текстов в интернете поисковыми системами на основе собственных алгоритмов. Каждая поисковая система сама разрабатывает список актуальных стоп-слов, которые подходят для ее алгоритмов ранжирования и, к сожалению, нигде их не публикует для общего доступа. Но мы можем опереться на общие правила правописания и создать ориентировочный список таких слов:

Вот здесь приведен список самых популярных стоп-слов, которые чаще всего можно увидеть в текстах (файл1)

А вот здесь список устоявшихся словосочетаний, которые являются стоп-словами с точки зрения поисковых систем (файл2)

 

Рейтинг статьи:
1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Нет рейтинга)