Стоп-слова в урле донора

Стоп-слова в урле донора Вы покупаете ссылки.
Вы проверяете их на индексацию и покупаете только с таких страниц, которые находятся в индексе.
Вы проверяете ссылки после каждого апдейта и удаляете те, что не индексируются дольше какого-то времени – об этом как-нибудь позже.
Вы удаляете выпавшие страницы, поскольку с них ссылка не работает.

Вот, на этом остановимся.

Во-первых, не факт, что ссылка с выпавшей страницы не работает. Скорее всего, она работает намного хуже, но это спорный момент и об этом пока не будем.
Во-вторых, выпасть страница сайта может из-за глюка и потом вернуться. Об этом тоже вскользь. Замечу лишь, что если какое-то слово у вас в топе, то лучше и легче не лезть чистить ссылки – можете поудалять выпавшие и потом локти кусать. Оставьте все как есть: “работает? не трогай!” – это должно быть вашим основным правилом. Лучшее, как давно известно – враг хорошего, и еще какой враг…

Но если слово не в топе, ссылки на него закупаются, бюджет палится… надо оптимизировать траты, не так ли?

И вот тут мы подходим к вопросу – как ЗАРАНЕЕ покупать ссылки так, чтобы потом меньше удалять?

Я не буду тут выкладывать никаких фильтров закупки, на простом основании: нет универсального фильтра. И про подбор страниц через автофильтры надо писать отдельно.

Здесь я хочу написать про то, что я называю стоп-словами. Такие слова в урле или тайтле страницы, которые могут сигнализировать о бОльшем риске закупки с этой страницы, чем с любой другой.

НЕ СУЩЕСТВУЕТ ЗАПРЕТНОГО СОЧЕТАНИЯ БУКВ В УРЛЕ

Начну с простого утверждения, которое не всем очевидно: яндекс не выбрасывает страницу из поиска за то, что у нее в адресе есть какое-то запретное сочетание букв!

Причины выпадения другие. Если говорить об обоснованных, то это в первую очередь неуникальность текста (чего по нему искать, если есть более интересные дубли), либо тупое отсутствие текста вообще. Либо бредотекст, опять-таки не представляющий интереса для пользователей интернета.

Из этого фундаментального утверждения следуют важные выводы, которые часто используются оптимизаторами даже на интуитивном уровне.

Например, те, кто покупает ссылки вручную и просматривает страницы, предпочитают не брать служебные страницы (регистрация пользователей, форма напоминания пароля, правила форума, список пользователей, профили пользователей – эти еще и под угрозой ежедневного удаления), предпочитают не брать ссылки с досок объявлений – ничего оригинального плюс опять же могут быть удалены пользователем в любой момент, с форумов, чатов, гостевых – часто пустой треп.

Если вы просматриваете страницы вручную, кроме всего прочего настоятельно советую поставить себе какой-нибудь плагин, подсвечивающий ноуиндекс. Вас ждет масса открытий: порою страницы полностью закрыты в ноуиндекс, порою страница просто пестрит кусочками – слова закрыты одно-три через 7-10… В итоге индексирующийся текст представляет собой бред.

В связи с вышеизложенным неверно утверждение, что с форумов ссылки не работают, например. Форум может быть немодерируемым – тогда практически 100%. Но может быть и солидный сайт со структурой форума, с уникальным и полезным контентом – его-то за что выкидывать? Поэтому словосочетание “стоп-слова в урле” не совсем верно. Но я его использую – потому что очень понятно и – потому что когда ссылки покупаешь сотнями ежедневно, то просматривать вручную нереально. И начинает работать закон больших чисел. Лучше пусть щепки хороших форумов летят, чем я повалю лес ключевых слов клиента:)

Поэтому я составляю список типичных для разных движков сочетаний букв, по которым можно понять, что страница содержит бредотекст (немодерируемые комментарии пользователей в первую очередь), неуникальный текст (дубли страниц), пустые страницы (регистрация и т.п.)

Что с этим списком делать? В первую очередь – относиться к нему критично:) Смотрите сами, думайте сами, вносите новые буквосочетания, удаляйте существующие…

Если покупаете через сеопульт – внесите слова в соответствующее поле, запретив системе брать ссылки со страниц, содержащих стоп-слово в урле.

Если покупаете в сапе самостоятельно – не берите ссылки с таких страниц, удаляйте их поиском по странице, если они недавно закуплены автоматикой. Если уже давно – то смотрите по ситуации. Я бы не трогал уже проиндексированные.

Но, удаляя, всегда кидаю такие сайты в BL. Не глобал блэк лист, а в локальный черный список урла. Это гарантирует, что другие, нормальные страницы сайта, будут участвовать в поиске по другим урлам проекта, по другим проектам.

Итак, вот он – выстраданный список:

add, address, adres, archive, asc, board, catalog, detail, desc, download, edit, feedback,flypage, forma, forum, foto, fotos, galery, gallery,guest, katalog, modules, narod, news, PAGEN, pageview, partner, person, photo, press, price, print, prise, productID, profile, search, show, tag, user, viewtopic

Что вам следует ожидать, если вы будете его использовать?

Ужасное на первом этапе: при предварительном отборе страниц отсеивается порядка 50%. Это приводит в шок.

Но очень приятно проверять индексацию страниц после апдейта яндекса: из предварительно просеянных таким образом страниц выпадает 1-2%. Если вы будете просматривать такие страницы вручную, то увидите, что это либо физически отсутствующие страницы, либо те же самые пустые страницы, страницы профилей пользователей, дубли, созданные админками, результаты поиска и прочее, но – с уникализированным адресом страницы, то есть без этих пресловутых стоп-слов. Что не спасает бесполезные страницы перед метлой яндекса:)

P.S. Понравился пост? Порекомендуй его другим.
Не воруй:) Воровство не приносит счастья, а рекомендации – приносят:)

VN:F [1.9.7_1111]
Rating: 9.5/10 (10 votes cast)
VN:F [1.9.7_1111]
Rating: +7 (from 7 votes)
Стоп-слова в урле донора, 9.5 out of 10 based on 10 ratings

2 thoughts on “Стоп-слова в урле донора

  1. positivegrowl

    Опытным путем выявлено также, что смело можно вставить слово map в список стоп-слов. Есть подозрение на слово blog , ибо в сапе рекламу размещают на дико древних и непосещаемых постах. Но это под вопросом=)

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  2. alekzalekzadmin Post author

    Отличное замечание! К тому же, учитывая взаимопересечения, из списка можно было бы удалить, например, [address] – слово входит в [add]… Не буду править, потому что сама заметка не претендует на охват ВСЕХ слов. Правильнее – запустить работу мозга:) Ну, у тех, у кого он есть:)

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)

Leave a Reply

Your email address will not be published.