Короче, Яндекс!

Чем короче, тем лучше! Каждый день перед глазами проходит несколько сайтов, имеющих проблему наличия дублей. Эта тема, вероятно, будет актуально ровно столько, сколько будут актуальны сайты на php.

Задумался я об этом сегодня после вопроса ко мне – а откуда они вообще берутся, дубли эти, кто виноват в их появлении?

И я ответил в таком ключе, что PHP – это зло! PHP – убийца оптимизации:)

Действительно, в то время, когда сайты делались руками, в notepad, то проблемы дублей просто не было. Потому что никому в здравом уме не придет в голову делать копии сайта по адресам http://site.ru и http://www.site.ru Никто не будет делать рядом одинаковые по содержанию странички page.htm и page.html или, того круче, page.html и pa7565ge.html А уж такие копии, как tovar.php и tovar.php?sid=39887443234767 просто невозможно сделать вручную…

Все эти дубли делают “умные админки” на php.

Все эти CMS (СМС, КМС) удобны для введения информации и ее редактирования. А вот уникальность урлов выводимой информации ими проверяется достаточно просто – в пределах правил нумерации страниц в базе данных.

Неоптимизированная админка может выводить запись под номером, скажем, 71, в виде:
http://site.ru/index.php?id=71
http://site.ru/?id=71
http://site.ru/71
не говоря уж о вариантах с www…
не говоря уже о том, что у админки может быть несколько своих, “внутренних” урлов типа
http://site.ru/web/pages/71
При этом, если предусмотрена возможность чпу, то к этим вероятным дублям добавляется дубль с чпу.
При этом, если в нумерации используются только цифры, то может быть возможно игнорирование других символов и страница может совпадать с
http://site.ru/71/
http://site.ru/71abc
http://site.ru/71.html
http://site.ru/71.php
или даже
http://site.ru/7abc1

Отслеживание сессий посетителей может ввести в индекс тысячи дублей одной страницы типа page.php?phpsessid=689789798789909

Сотни сайтов оптимизаторов посвящены советам, как оптимизировать сайт посредством .htaccess и robots.txt, чтобы яндекс правильно выбрал один дубль из нескольких…

Яндекс при этом совершенно однозначно возлагает ответственность за оптимизацию на вебмастеров, имея при этом огромные возможности совершенно просто отрегулировать этот вопрос…

Скажем, ну какая проблема отследить и не пускать в индекс сессии страниц? Они же все идентифицируются тем, что имеют совпадающие вначале урлы, а затем идет вопросительный знак, краткий указатель на то, что используется именно сессия, причем однообразный (phpsessid, s_id, g_id и т.п.), знак равенства и длинный ряд цифр…

И этот же подход – сравнивать урлы и брать в индекс только самый короткий из них в том случае, если содержимое страниц совпадает, а htaccess и роботс молчат, этот подход просто универсален!

Всё! Проблема сессий, добавочных слешей, копий главной страницы с адресом .index.php, дописываемых окончаний и прочая – всё решается на раз!

Короче, Склифо… яндекс!

Можно просто всё сделать короче!

Кстати, объемы хранимой на серверах яндекса информации тоже сократятся немного:) А значит, интернет, хоть на секундочку, а станет быстрее:)

VN:F [1.9.7_1111]
Rating: 10.0/10 (1 vote cast)
VN:F [1.9.7_1111]
Rating: 0 (from 0 votes)
Короче, Яндекс!, 10.0 out of 10 based on 1 rating

4 thoughts on “Короче, Яндекс!

  1. pilot.bbk

    куча негатива и никакой практики в конце!
    где решение? о_0

    VN:F [1.9.7_1111]
    Rating: 5.0/5 (1 vote cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  2. alekzalekzadmin Post author

    Это ты про себя, видимо?

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  3. pilot.bbk

    в псто очень краиво про негативные стороны дублей на сайте.
    отлично хорошо! вступление красивое и подробное.
    но далее выложен негатив в сторону поисковиков, что те не достаточно умны.
    в твите, с котрого я перешел на статью четко было написано “и простом решении этой проблемы со строны поисковика”
    лучше бы рассказал, как дубли искать и как с ними эффективнее бороться, чо впустую веб пытаться сотрясать 🙂

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)
  4. alekzalekzadmin Post author

    Так не негатив же, а как раз простое решение – что можно сравнивать длину урлов страниц, текст которых абсолютно совпадает. Это же обращение к яндексу, а не оптимизаторам… А ты не знаешь, как искать дубли на сайте и как их закрывать?:)

    VN:F [1.9.7_1111]
    Rating: 0.0/5 (0 votes cast)
    VN:F [1.9.7_1111]
    Rating: 0 (from 0 votes)

Leave a Reply

Your email address will not be published.