Google врет о числе проиндексированных страниц

Ой, я такая неуверенная насчет страниц...Начинающие оптимизаторы, работая в ротапост, часто порываются бросать в черный список блоги, в которых гуглом проиндексировано в несколько раз больше страниц, чем яндексом. “НЕТ!” – отвечаю я им:) Rotapost – не Sape!

В чем принципиальная разница? В sape.ru типичный сайт – это псевдосайт компании, с меню страниц текста и каталогом товаров. Для подобного сайта нормально приблизительное совпадение числа страниц, проиндексированных двумя крупнейшими поисковиками.

В rotapost.ru типичный сайт – блог (а вы что думали?), с несколькими способами достичь нужную информацию, практически – несколькими меню: обычное меню категорий, меню постраничное, меню с календаря, меню с тегов.

При этом, что любопытно, яндекс очень бодро реагирует на изменения robots.txt у блогов (вероятно, за счет их постоянной обновляемости), а вот гугл… Сколько уже я закупаю ссылки в ротапост, я вижу одно и то же – гугл игнорирует указание запрета на индексацию определенных урлов. Для него прямо-таки жизненно важно по-плюшкински тянуть в дом всё, лишь бы хоть где-то на страницу стояла ссылка. В том же календаре вордпресса, например.

Что же из этого всего следует?

СОВЕТЫ ПО ПРОВЕРКЕ БЛОГА, НЕ ПОД АГС ЛИ ОН

1. Никогда не отказывать блогеру лишь на том основании, что в гугле у него больше страниц, чем в яндексе. Что касается вордпресс – то как раз наоборот, должно насторожить равенство числа страниц в двух поисковиках, потому что это значит, что с вероятностью 99% от индексации в Яндексе не закрыты все эти pages, tags и календарь.

2. Визуально оценить блог, в частности, посмотрев, сколько меток блогер ставит у каждого поста. Чем меньше меток, тем меньше должна быть разница числа страниц в Яше и Гоше (1 метка может удвоить число страниц). Чем больше меток, тем больше разница – может и в 10 раз, но при этом блог в порядке, не под АГС.

3. И, если уж цена ссылки немаленькая, то можно заморочиться и ручной проверкой.

Делается это очень просто – открываем все страницы в гугл (в плагине page promoter это делается нажатием одной кнопки, а так – пишем в строке поиска гугла [site:follow-up.ru] или ваш домен), и пытаемся найти последнюю проиндексированную страницу. Достаточно быстро упираемся в неожиданный конец поисков с надписью, что все остальные страницы – в дополнительном поиске. Вот цифра, которую гугл при этом покажет, и есть настоящее число страниц в поиске!

Давайте, чтобы не палить адреса продавцов в системе, покажу на примере собственного блога.

сколько в гугле страницШаг 1, проверяем, что там нам говорит гугл о числе страниц. А говорит он, что их 616.

Сколько страниц гугл покажет в поиске. если проиндексировано 616?Шаг 2 – начинаем последовательно нажимать на последнюю справа ссылку в списке страниц, с целью найти последнюю. Поскольку заявлено, что страниц 616, мы очевидно ожидаем, что нажать придется 7 раз. А вот и нет. Уже после второго клика на крайнюю справа ссылку в списке проиндексированных страниц видим запись, свидетельствующую о том, что страниц… 180

616 или 180 страниц?

Так сколько же? Ну, ясно, что 616 – это с кучей дублей, ладно. Значит, 180? Ха! А не смущает, что при указанном числе в 180 ссылок предлагается 15 страниц для просмотра? Ведь на каждой страничке-то только 10 результатов! Шаг 3:

Еще раз нажмите на последнюю цифру, в данном случае – 15:

147, а не 616 страниц видит гугл

Закончу этот пост двумя следующими цифрами: числом страниц в яндексе и на самом деле.

Яндексация блогаЯндекс видит 166 страниц.

А вот всего их, делаю скрин из админки – 164: 159 постов, 4 страницы и 1 сборная, которая выдается как главная.реальное число страниц на блоге

Подытоживаем: всего на сайте 164 страницы, яндекс видит 166, гугл заявляет, что 616. но потом признается, что только 180, а если додавить, то вообще – 147. Можно ли в таких условиях верить яндексу? Можно. Ошибка пренебрежимо мала. Можно ли верить гуглу? Да он сам себе не верит…

__________________________________

P.S. от 24.09.11 Вот же только успел похвалить яндекс, как он испортился:) По прямому запросу показывает 203 страницы в индексе, а начинаешь пробовать эти страницы посмотреть, а оказывается, что всего-то 166. Простыл яндекс:) Теперь и у него Supplemental Results появились…

А по поводу изначальной цели поста – я же пишу о том, что показывает ротапост в характеристике сайтов, что выдает pagepromoter bar – и там и там идет прямой запрос в яндекс, и прямой запрос в гугл… Именно на эти цифры ориентируются оптимизаторы, решая, сколько же на самом деле страниц на сайте видит поисковик.

VN:F [1.9.7_1111]
Rating: 0.0/10 (0 votes cast)
VN:F [1.9.7_1111]
Rating: 0 (from 0 votes)

6 thoughts on “Google врет о числе проиндексированных страниц

  1. Каргин ВикторКаргин Викторvkontakte.ru Виктор Каргин

    Если у сайта примерно совпадает количество страниц – это говорит о том, что сайт хоть немного оптимзировали и позаботились об удалении дублей. 🙂
    По страницам видно только сопли 🙂
    попробуй забить запрос site:follow-up.ru/* (ну или с www если оно основное зеркало) увидишь много интересного 😉
    Ссылки с дублей, кстати, не учитываются, а сами страницы на ура вылетают из индекса. тоже касается соплей и неактивного индекса в гугле 😉

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  2. alekzalekzadmin Post author

    Да нуууу? О как оказывается!

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  3. Каргин ВикторКаргин Викторvkontakte.ru Виктор Каргин

    сарказм неуместен 🙂

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  4. alekzalekzadmin Post author

    Уместен, уместен. Он был призван показать тебе, что ну очень утомляет твое прямолинейное мышление вкупе с чтением по диагонали.

    Если бы ты просто указал на возможность запроса site: follow-up.ru/*, я бы просто сказал спасибо.

    А так… Комментарий начался с изложения аксиомы, поясняющей, зачем оптимизаторы уже несколько лет сравнивают число страниц в яндексе и гугле. Зачем? Типа я этого не знаю? Ты знаешь, что я знаю – вместе работали. Чтобы указать, что я этого не указал? Это уже на блоге есть, между делом – именно потому что аксиома. А главное – вообще пост не об этом – написано о том, что ротапост показывает в статистике число страниц гугла с соплями.

    Далее обещание, что я увижу “много интересного”, если забью этот запрос со своим сайтом? И чего же там интересного? Да еще много? Так написано, словно сам смотрел, хотя тут же признаешься, что не смотрел – ведь даже не знаешь, какое зеркало основное. Ну, глянул я. И нет ничего интересного – только факт, что соплей нет. И хорошо, хотя вообще оптимизация под гугл меня не интересует, просто по привычке закрыл всё.

    Для меня давно уже ясно, что ты приходишь на этот блог не для того, чтобы что-то узнать, а с желанием в очередной раз просмотреть пост по диагонали, найти, к чему зацепиться и выкаргнуть негатив. Это доказывает твой следующий комментарий, который я не собираюсь подтверждать. Потому что там на основе того, что я пишу в своем частном блоге, ты делаешь выводы о компании, в которой я работаю, называя ее сокращенно-уничижительно.

    Ушел со скандалом и бесишься, возвращаешься снова и снова в единственное место, где с тобой согласны общаться, чтобы доказать самому себе, что не зря ушел, что без тебя все плохо.

    Скажешь, не так? К посту “Короче, Яндекс”, где ты тоже ляпнул невпопад, лишь бы против, ты указал, что перешел на пост по ссылке в твиттере. Я заблокировал тебя в твиттере, и не стал там вообще давать анонс поста про SEO и SMO, но ты все равно пришел… Тебе важно быть здесь, спорить со мной, доказывать мне, что я не прав:) Что без тебя всё плохо:)

    Ну, конечно, плохо! Никто ничего не оптимизирует! Позиции падают! Клиенты уходят! Фундамент здания источили крысы и оно рушится на глазах:)

    Почему бы тебе не взять пример с других, кто либо умнее, потому что молча собирает информацию и не лезет на чужую территорию, либо просто занимается своей жизнью. Потому что им нет дела до меня. А мне нет дела до них. Все, дорожки разошлись.

    Мне плевать на то, где ты работаешь, Виктор Каргин, что ты делаешь и что ты думаешь.

    Я долго терпел, потому что я вообще такой – долго терплю.

    Но сейчас мне приходится слишком много времени тратить на твой троллинг, и мне это откровенно скучно. Отвали.

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  5. Каргин ВикторКаргин Викторvkontakte.ru Виктор Каргин

    А давай факты не перевирать. ок? *** я ушел сам, и ушел не один 🙂 Дела прошлые и давно прошедшие 🙂 и можно сказать золотые времена. *** я очень благодарен за то, что дал возможность пополнить свой багаж знаний по seo – а где еще найдешь сотни сайтов для эксперриментов и изучения? Про возможность изучения трудового кодекса умолчу 🙂
    У тебя на блоге я зависаюю перманентно потому, что интерено почитать блог практика, которого знаешь лично, а не тех водовозов, которых в сети пруд пруди. Опять же твой сарказм тут неуместен 🙂
    Ну вот такой я человек, что выкидываю наружу отрицаловку сначала 🙂 это не значит, что положительного не увидел ) Высказываю то, с чем не согласен.
    Карочи зря ты серчаешь – мне твой блог интересен, как площадка для дискусий, не больше не меньше 🙂
    Не надо искать подтекст, там где его нет

    p.s.: Синдром Поиска Глубинного Смысла детектед 🙂

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  6. alekzalekzadmin Post author

    Ок. Поправил свой наезд. Убрал звездочками название компании, ибо неча – это мой блог, а не компании.

    По поводу отрицательных комментариев – в том-то и дело, и я уже писал тебе об этом, что в твоих комментах всегда есть что-то по делу, но и всегда, кроме негатива, есть какие-то недогляды, непонимание вроде как того, что прямо написано – при том, что никогда нигде позитива не было. Это реально утомляет. Это не к тому, что надо хвалить – это к тому, что тон в таком случае ожидается более спокойный.

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)

Leave a Reply

Your email address will not be published.