Программирование: использование пассажей в поиске


Как определяются границы пассажей и учитываются вхождения слов в пассаж? Определение границ по знакам пунктуации и тегам, поиск в Яндексе с учетом разброса ключевых слов по пассажам. SEO-тексты и использование пассажа для их выявления. Пассажи вхождение слов в пассаж.
Определение границы пассажа
Каталог вебсайта
Программирование вебсайтов

Пассажи вхождение слов в пассаж

Что такое ПАССАЖ (passage) с точки зрения проверки текста на уникальность, разобрали в одной из статей: "Алгоритм пассажей: проверка контента пассажами". Там же было упомянуто, что поисковые системы Яндекс и Гугл используют пассажи прежде всего для ранжирования документов в выдаче по запросам пользователей. Давайте рассмотрим, как это происходит, и что полезного можно поиметь с пассажей для поискового продвижения сайтов.

Понятие пассажа для поисковой системы Yandex

Как ни странно, но понимание пассажей сейчас более актуально для продвижения сайта в Яндексе. Дело в том, что при очередных перестановках в результатах выдачи по алгоритмам "Снежинска 1.1" было замечено, что часть страниц сайтов заметно опустилась вниз, и связанно это напрямую с чрезмерной плотностью ключевых фраз именно внутри пассажей, хотя в целом по тексту "тошнота" была в пределах нормы. Под пассажем Яндекс понимает отдельное предложение (как правило), либо его часть длиной до 63 слов (считая предлоги). Иными словами, пассажи - это не пересекающиеся отрезки, на которые Яндекс разбивает контент на странице, в том числе и анкоры ссылок.

Важно понять, что является разделителем для пассажей. В Яндексе определение границ пассажа происходит по немногим знакам пунктуации языка, в частности, точке, восклицательном и вопросительном знаке, ЕСЛИ после них используется пробел. Также граница пассажа устанавливается по HTML-тегам TH, TD, DIV, P, H1...H6, LI, HR, BR и некоторым другим. В силу этого пустая строка также является границей, отделяющей один пассаж от другого. В этом термин "пассаж", который используют лингвисты, заметно отличается от понятия предложения, применяемое на бытовом уровне. Приведем пример: выделенное курсивом - один пассаж.Он смотрится некрасиво, поскольку пропущен пробел после точки.Зато такой пассаж включает три предложения. С другой стороны, фраза вида,
когда часть слов, входящих
в состав предложения, напи-
саны с разделением по строкам -
это четыре пассажа в предложении.

В Гугле определение границы пассажа происходит совсем по-другому, да и сам пассаж используется иначе: там используется метод "плавающего окна" длиной в 10 слов, при этом предлоги, союзы и самые общеупотребительные слова могут не учитываться. К знакам препинания у Гугла также другое отношение: они не разбивают пассаж, но снижают коэффициент связи между словами, находящимися между ними.

Зачем нужно понимание роли пассажей в Яндексе?

От пассажей самым прямым образом зависит, какое место займет страница в поисковой выдаче. Для лучшего понимания будем считать что "слово" и "фраза" (словосочетание) - это одно и то же. Способы искусственно построенных связей между словами называют термином "переколдовка", эти связи обозначают оператором "&". Существует четыре варианта переколдовки:

  • поиск ограничен словами, идущими подряд
  • ищутся фразы внутри одного предложении
  • поиск по фразам, стоящим не очень далеко
  • учитываются слова внутри одной страницы

Под предложениями здесь следует понимать пассажи. В самом общем случае, то есть, по умолчанию, работает третий вариант поиска в Яндексе: ищутся фразы, находящиеся в пределах одного пассажа. Остальные условия гораздо строже, и включаются лишь в частных случаях поисковых запросов (рассмотрим их ниже). Пока же примем к сведению следующие общие положения о вхождении поисковых слов в пассажи:

  1. По пассажам определяется релевантность текста на странице запросу из поиска.
  2. Внутри пассажа определено междусловное расстояние (оператор &/(расстояние)).
  3. Между самими пассажами также определена дистанция (оператор &&/(расстояние)).
  4. Слова внутри одного пассажа могут быть найдены по запросу «фраза1 & фраза2».
  5. Фразы из разных пассажей не могут быть найдены запросом «фраза1 & фраза2».
  6. Только первый пассаж, входящий в анкор ссылки, учитывается Яндексом как текст.

Как Яндекс использует вхождение слов в пассажи?

Приведенные выше постулаты безусловно справедливы и работают в Yandex "по умолчанию". Порядок слов имеет значение: чем точнее он совпадает с запрошенным - тем больше вероятность, что страница покажется высоко. Расстояние между словами прямо влияет на соответствие запросу. На практике эти принципы работают динамически, то есть, изменяются в зависимости от частотности запроса и семантической связи слов в нем.

Цитата из Яндекса: как вид запроса определяет поиск по пассажу?


При выборе варианта «не очень далеко» Яндекс пытается определить, насколько тесно слова запроса связаны между собой. Сильно связанные слова ищутся в пределах одного предложения, менее тесно связанные слова - на расстоянии в несколько предложений и, наконец, не связанным словам достаточно встретиться на одной странице, чтобы она была сочтена соответствующей запросу.

Например, в запросе "скачать бесплатно" слова очень тесно связаны между собой, слова часто употребляемые, а вот порядок не так важен: ведь ищут и так, и "бесплатно скачать". Поэтому бессмысленно ожидать, что Яндексом по нему будет показана страница, где два этих слова разбросаны по разным пассажам. Напротив, по запросу "коллоидные субстракты" можно ожидать, что найдется и та страница, где одно слово есть в начале текста, а другое - в конце, то есть, в далеких друг от друга пассажах. И дело тут вовсе не в конкуренции! При поиске внутри сайта Яндекс даст точно такие же результаты.

Для любознательных практиков: поиск по пассажам

Давайте не будет принимать все утверждения на слово, а на практике проверим использование пассажей в поиске Яндекса. Для этого вспомним, как производится определение границ пассажа и учитывается вхождение слов. Вооружившись теорией, проверим использование пассажей Яндексом: найдем на этой странице разные случаи, когда совершенно любые слова расположены как внутри одного пассажа, так и с разных сторон границы. При поиске применяем переколдовку "слово1 & слово2". Таким образом можно экспериментально проверить, какие символы и HTML-теги определяют границу пассажа для поисковой системы Яндекс.

Пессимизация за чрезмерную плотность ключевиков в пассаже.

В заключении о спаме внутри пассажа. Если вхождение слов в пассаж слишком однообразное, то есть, много морфологических форм и однокоренных слов, а само слово не очень характерно для сайта, то это может быть расценено Яндексом как спам. В самом деле, отчего нам не нравится выражение "масло масляное на масленке"? Лишь оттого, что три однокоренных слова находятся в одном пассаже, да еще идут подряд. Для Яндекса это - тревожный сигнал о неестественном происхождении текста. А вот если раскидать эти "масла" по разным пассажам - то даже самый привередливый читатель ничего неестественного не заметит. К тому же надо помнить, что части текста на странице не равнозначны! Начало и заголовки ценятся выше, но поэтому и жестче карается вся страница, если там обнаружен поисковый спам.

Использование пассажей Яндексом для выявления SEO-текстов.

С учетом сказанного последние изменения алгоритма Яндекса, связанные с учетом плотности вхождения ключевых слов не только в текст целиком, но и в отдельных пассажах, наносят серьезный удар по так называемым SEO-текстам. Ведь как поступали раньше многие оптимизаторы? Они создавали заголовок и один-два абзаца контента, под завязку набитых ключевыми словами, и ставили это в самое начало страницы - там они учитываются наиболее сильно. А затем, чтобы не допустить чрезмерной "тошноты", начинали "лить воду" до тех пор, пока плотность ключевиков не приходила в норму. Разумеется, одного человеческого взгляда на такой заголовок и анонс хватало, чтобы понять: перед посетителем - очередной шедевр SEO-творчества, так называемый "SEO текст". Вхождение слов в пассаж заголовка или предложений сразу выдавало это. Использование Яндексом пассажей для контроля текстов на естественность грозит положить конец такой практике.

Пассажи вхождение слов в пассаж
SEO для вебсайта
Ссылка на страницу: http://com-seo.ru/passage-word-passazhi-vhozhdenie-slov-passazh-poisk.html © 2013 Москва Россия