Архив рубрики: Основы основ

Правильный robots.txt для Bitrix (Битрикс)

Добрый день. Основные проблемы с корректной индексацией сайтов, создаваемых на CMS 1C-Bitrix:

  • Наличие дублей страниц (при некорректно настроенном .htaccess);
  • Наличие большого количества технических виртуальных страниц (преимущественно, фильтры).

Для устранения данных проблем для правильной индексации сайта поисковыми системами и дальнейшего продвижения сайта на Bitrix нужно использовать правильный robots.txt и настроить корректную обработку дублей с помощью файла .htaccess.

Первый вариант правильного robots.txt для CMS 1C-Bitrix:

User-agent: *
Disallow: /*index.php$
Disallow: /bitrix/
Disallow: /auth/
Disallow: /personal/
Disallow: /upload/
Disallow: /search/
Disallow: /*/search/
Disallow: /*/slide_show/
Disallow: /*/gallery/*order=*
Disallow: /*?print=
Disallow: /*&print=
Disallow: /*register=
Disallow: /*forgot_password=
Disallow: /*change_password=
Disallow: /*login=
Disallow: /*logout=
Disallow: /*auth=
Disallow: /*?action=
Disallow: /*action=ADD_TO_COMPARE_LIST
Disallow: /*action=DELETE_FROM_COMPARE_LIST
Disallow: /*action=ADD2BASKET
Disallow: /*action=BUY
Disallow: /*bitrix_*=
Disallow: /*backurl=*
Disallow: /*BACKURL=*
Disallow: /*back_url=*
Disallow: /*BACK_URL=*
Disallow: /*back_url_admin=*
Disallow: /*print_course=Y
Disallow: /*COURSE_ID=
Disallow: /*?COURSE_ID=
Disallow: /*?PAGEN
Disallow: /*PAGEN_1=
Disallow: /*PAGEN_2=
Disallow: /*PAGEN_3=
Disallow: /*PAGEN_4=
Disallow: /*PAGEN_5=
Disallow: /*PAGEN_6=
Disallow: /*PAGEN_7=
Disallow: /*PAGE_NAME=user_post
Disallow: /*PAGE_NAME=detail_slide_show
Disallow: /*PAGE_NAME=search
Disallow: /*PAGE_NAME=user_post
Disallow: /*PAGE_NAME=detail_slide_show
Disallow: /*SHOWALL
Disallow: /*show_all=
Host: sitename.ru
Sitemap: http://www.sitename.ru/sitemap.xml

Путём крайне хитрых манипуляций сокращаем данный код и получаем

Второй вариант правильного роботс для Битрикс:

User-agent: *
Disallow: /*index.php$
Disallow: /bitrix/
Disallow: /auth/
Disallow: /personal/
Disallow: /upload/
Disallow: /search/
Disallow: /*/search/
Disallow: /*/slide_show/
Disallow: /*/gallery/*order=*
Disallow: /*?*
Disallow: /*&print=
Disallow: /*register=
Disallow: /*forgot_password=
Disallow: /*change_password=
Disallow: /*login=
Disallow: /*logout=
Disallow: /*auth=
Disallow: /*action=*
Disallow: /*bitrix_*=
Disallow: /*backurl=*
Disallow: /*BACKURL=*
Disallow: /*back_url=*
Disallow: /*BACK_URL=*
Disallow: /*back_url_admin=*
Disallow: /*print_course=Y
Disallow: /*COURSE_ID=
Disallow: /*PAGEN_*
Disallow: /*PAGE_*
Disallow: /*SHOWALL
Disallow: /*show_all=
Host: sitename.ru
Sitemap: http://www.sitename.ru/sitemap.xml

Дополнительно можно ещё использовать директиву Clean-param:

Например,

Clean-param: print&action&SHOWALL&PAGEN_1&PAGE_NAME&forgot_password&и_так_далее / #для всех страниц

Более подробно и с техническими особенностями описано в соответствующем разделе Справки Яндекса: https://yandex.ru/support/webmaster/controlling-robot/robots-txt.html

За сим прощаюсь. С вами был дедушка-сеошник из Санкт-Петербурга.

Удачного продвижения сайтов на Bitrix с помощью правильного robots.txt.

Правильный robots.txt для OpenCart

Здравствуйте. Настало время предложить вам вариант файла robots.txt для CMS OpenCart, которая последнее время становится достаточно популярной при создании интернет-магазинов. Этот же роботс можно использовать и для ocStore.

Файл robots.txt для CMS Opencart

User-agent: *
Disallow: /*route=account/
Disallow: /*route=affiliate/
Disallow: /*route=checkout/
Disallow: /*route=product/search
Disallow: /index.php?route=product/product*&manufacturer_id=
Disallow: /admin
Disallow: /catalog
Disallow: /download
Disallow: /export
Disallow: /system
Disallow: /*?sort=
Disallow: /*&sort=
Disallow: /*?order=
Disallow: /*&order=
Disallow: /*?limit=
Disallow: /*&limit=
Disallow: /*?filter_name=
Disallow: /*&filter_name=
Disallow: /*?filter_sub_category=
Disallow: /*&filter_sub_category=
Disallow: /*?filter_description=
Disallow: /*&filter_description=
Disallow: /*?tracking=
Disallow: /*&tracking=
Disallow: /*?page=
Disallow: /*&page=
Disallow: /wishlist
Disallow: /login
Disallow: /index.php?route=product/manufacturer
Disallow: /index.php?route=product/compare
Disallow: /index.php?route=product/category
Host: endseo.ru

В ожидании весны…

Правильный robots.txt для Joomla

Всем привет. Продолжаем нашу серию постов, направленных на помощь при первичной оптимизации сайта, а именно — составляем правильные файлы robots.txt для различных CMS. На днях были выложены посты: роботс для MODx и роботс для WordPress.

Сегодня продолжаем и рассмотрим такую систему управления сайтом как Joomla.

Robots.txt для Joomla 1.5

User-agent: *
Crawl-delay: 2
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /component/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Disallow: /index2.php?option=com_content&task=emailform
Disallow: /*?sl*
Disallow: /name.php?action=print
Disallow: /trackback
Disallow: /*rss.html
Disallow: /*atom.html
Disallow: /index*
Host: endseo.ru
Sitemap: https://endseo.ru/sitemap.xml

Robots.txt для Joomla 2.5

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /cli/
Disallow: /components/
Disallow: /component/
Disallow: /includes/
Disallow: /language/
Disallow: /libraries/
Disallow: /logs/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /index*
Host: endseo.ru
Sitemap: https://endseo.ru/sitemap.xml

Robots.txt для Joomla 3.0

User-agent: *
Disallow: /administrator/
Disallow: /cache/
Disallow: /components/
Disallow: /component/
Disallow: /images/
Disallow: /includes/
Disallow: /installation/
Disallow: /language/
Disallow: /libraries/
Disallow: /media/
Disallow: /modules/
Disallow: /plugins/
Disallow: /templates/
Disallow: /tmp/
Disallow: /xmlrpc/
Disallow: /index*
Host: endseo.ru
Sitemap: https://endseo.ru/sitemap.xml

Если есть вопросы, то задавайте. Данные рекомендации позволят убрать самые простейшие дубли страниц, возникающих при работе с Joomla.

Подписывайтесь на блог сеошника.

Правильный robots.txt для WordPress

Всем хорошего понедельника. Сегодня я представлю для вас свой вариант составления файла robots.txt для сайтов, сделанных на основе популярной CMS WordPress.

Содержимое файла robots.txt

User-agent: *
Disallow: /wp-login.php
Disallow: /wp-register.php
Disallow: /webstat/
Disallow: /feed/
Disallow: /trackback
Disallow: */trackback
Disallow: /*/?replytocom=*
Disallow: /*/?replytocom
Disallow: /*?replytocom=*
Disallow: /*?replytocom
Disallow: */comment-page-*
Disallow: */feed
Disallow: */comments
Disallow: /*?*
Disallow: /*?
Disallow: /category/*/*
Disallow: /wp-content/plugins
Disallow: /wp-content/themes
Disallow: /wp-content/cache
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /comments
Host: endseo.ru
Sitemap: endseo.ru/sitemap.xml

Если есть вопросы, то можете их задавать. Комментировать что либо не вижу смысла.

Читайте, подписывайтесь на мой блог.

С вами был дедушка-сеошник.

Правильный robots.txt для MODx CMS

Приветствую вас на своём сайте. С вами снова добрый дед-сеошник.

Сегодня речь пойдёт о том, как составлять правильный файл robots.txt (он же «роботс») для CMS MODx Revo (Revolution) и Evo (Evolution). В этих CMS тоже существует проблема дублей, пусть и не очень существенная; тем более закрыть эти дубли от индексации при помощи robots.txt не составит абсолютно никаких проблем.

Для начала, не забываем включить ЧПУ в настройках сайта.

Составляем robots.txt для MODx Evo

User-agent: *
Disallow: /assets/cache/
Disallow: /assets/docs/
Disallow: /assets/export/
Disallow: /assets/import/
Disallow: /assets/modules/
Disallow: /assets/plugins/
Disallow: /assets/snippets/
Disallow: /install/
Disallow: /manager/
Disallow: /?
Disallow: /*?
Disallow: /index.php
Host: endseo.ru
Sitemap: https://endseo.ru/sitemap.xml

Теперь robots.txt для MODx Revo

User-agent: *
Disallow: /manager/
Disallow: /assets/components/
Disallow: /core/
Disallow: /connectors/
Disallow: /index.php
Disallow: *?
Host: endseo.ru
Sitemap: https://endseo.ru/sitemap.xml

Некоторые советы по поводу составления «роботс» для CMS MODx

  • index.php — это дубль главной страницы сайта
  • с помощью *? мы удаляем дубли для всех страниц
  • Sitemap желательно не указывать в файле robots.txt, потому существуют не очень хорошие боты, которые таким образом парсят ваши сайты, используя эту директиву. Для нормальных поисковых систем карту сайта можно, при желании, загрузить через панель вебмастера. Но и это не так важно.

С вами был дедушка-сеошник, читайте блог и подписывайтесь на обновления.

Влияние хостинга на продвижение сайта

Всем привет. С вами дедушка-сеошник, и сегодня у нас простой вопрос на повестке дня: «Каким же образом может повлияет выбранный хостинг на продвижение вашего сайта?»

И ответ простой: «Напрямую!»

Задача хостинга с точки зрения поддержки и развития сайта — беспрерывно работать, корректно  и максимально быстро обрабатывать запросы и не падать от большого количества посетителей. У поисковых систем существуют санкции, накладываемые на сайты, которые не работают. Пусть даже временно не работают, но словить фильтр и потом ждать несколько обновлений базы в Яндексе не очень хочется.

Поэтому выбор хостинга, на котором предстоит размещать продвигаемый сайт, очень важен. Со своей стороны я могу вам посоветовать тот хостинг, чьими услугами пользуюсь я на протяжении последних пяти лет. Это «SpaceWeb«.

Это отнюдь не реклама, а жизненный опыт. Никакой рефферальной ссылки, только попрошу при регистрации, по возможности, указать промо-код: ecuksizi

За сим разрешите откланяться. Ваш дед-сеошник.

Задавайте вопросы.

Влияние домена на продвижение сайта

Здравствуйте, мои дорогие читатели. Сегодня речь пойдёт о степени влияния домена (доменного имени и его зоны) на продвижение ресурса. В моём блоге уже есть статья про влияние ключевого слова в доменном имени на его продвижение. Сейчас же я расскажу про общие моменты, которые стоит учитывать при выборе домена на этапе его регистрации (ну или покупки).

Влияние доменной зоны на продвижение

Будем рассматривать только те доменные зоны, которые наиболее популярны в России:

.RU — национальный домен Российской Федерации;
.РФ — национальный домен РФ, кириллическая запись;
.SU — домен для территории постсоветского пространства;
.COM.RU — для коммерческих организаций, ведущих свою деятельность на территории Российской Федерации;
.NET.RU — для веб-проектов и организаций, работа которых связанных с сетевыми технологиями, ведущих свою деятельность на территории РФ;
.ORG.RU — для некоммерческих организаций, расположенных на территории РФ;
.MSK.RU, .SPB.RU — геодомены для Москвы и Санкт-Петербурга;
.COM, .BIZ — для коммерческих организаций;
.NET — для проектов, связанных с сетевыми технологиями;
.ORG — для некоммерческих и благотворительных организаций;
.INFO — информационные сайты;
.ME, .NAME — персональные домены.

Правило тут простое — старайтесь соблюдать тематику выбранной зоны. По опыту скажу, что это имеет некоторое влияние, пусть и небольшое. Но поисковое ранжирование — это целый комплекс факторов, и не стоит отказываться от того, что можно с лёгкостью сделать.

Ключевое слова в доменном имени

Эту тематику я раскрыл в соответствующем посте: https://endseo.ru/2013/10/01/nalichie-klyuchevogo-slova-v-domennom-imeni/

Кратко: пока что такие домены позволяют быстрее занять высокие места в поисковой выдаче, но этот фактор далеко не решающий в итоге. Это относится, как к Яндексу, так и к Google.

Влияние возраста сайта на его продвижение

В настоящее время возраст сайта имеет важное влияние на место в выдаче. Но тут есть и один момент. Это влияние больше косвенное. То есть, логично предположить, что чем старше сайт, тем более он обсуждаем и поисковые системы ему с большей вероятностью отдадут предпочтение.

Если же речь идёт о пустом домене с большим сроком регистрации, то сейчас фактор такой существует, но это являет собой временное решение, по моему мнению. Ведь нельзя сказать, что стали хуже делать сайты. Так почему бы им не ставить равные условия наравне со старичками?

Поэтому я позволю себе сделать вывод: влияние возраста сайта на его продвижение в поисковых системах в настоящее время есть, но это носит собой временный характер.

Какой вариант лучше: с WWW или без WWW?

Да, задают даже такие вопросы. И тут ответ один — для поисковых систем без разницы. Выбор только за вами. Бывают и такие ситуации, что с «www» домен смотрится просто привлекательнее. Так почему бы и не использовать приставку.

Заглавные буквы в названии домена в выдаче Яндекса

zaglavnye-bukvy-v-nazvanii-domena

Делается это в Яндекс Вебмастере, раздел «Сайт в результатах поиска» / «Регистр имени сайта». Основная задача: сделать более привлекательный сниппет для поисковой выдачи Яндекса, выделить важные слова в имени домена. На продвижение сайта это оказывает исключительно косвенное влияние, связанное с более высокими поведенческими факторами и кликабельностью сниппета в выдаче.

Основные выводы по вопросам влияния домена на его продвижение в поисковых системах.

  1. Выбор домена носит исключительно личностный характер
  2. Регистрируйте, покупайте и продвигайте тот домен, который носит в себе или название бренда, или являет собой осмысленное название (слово, словосочетание и т.д.)
  3. Хотите быстро подняться в топ — ключевые слова в домене вам в помощь. Пока что это работает.
  4. Основные факторы, влияющие на нахождение сайта в топе выдачи, содержатся на самом сайте, а не в его доменном имени.

За сим разрешите откланяться. Ваш дед-сеошник.

Задавайте вопросы.

Влияние description на продвижение сайта

С вами дед-сеошник. Только что я рассказал о влиянии мета-тега keywords на продвижение, теперь же речь пойдёт о его «собрате» — мета-теге description.

Данный тег предназначен для описания страницы для поисковой системы. Т.е., последовательно обрабатывая теги title, h1–h6 и description, поисковой робот оценивает тематику страницы. И вот этот тег нам очень поможет в продвижении интернет-ресурса.

Пример записи мета-тега дескрипшн:

<meta name="description" content="Поисковое продвижение сайта — залог успешности на рынке. Хорошие позиции и траффик обеспечит вам раскрутка сайта в поисковиках">

Справочник BookHtml.ru: правильная и валидная запись мета-тегов

Во-первых, тег description принимает непосредственное и явное участие в ранжировании документа в поисковой выдаче. Во-вторых, если грамотно составить описание для сайта, то можно получить на сайт дополнительных посетителей, которые увидят яркое, броское, продающее описание сайта в сниппете Яндекса.

Чтобы Яндекс в своём сниппете использовал данные именно из мета-тега дескрипшн, необходимо, чтобы эти предложения являлись самыми релевантными по основным запросам к требуемой странице. На страницах продвигаемых клиентов я обычно в сниппет запихиваю или мета-тег description, или специально составленные 1-2 предложения из начала текста.

Для примера, рассмотрим поисковой запрос «веб студия» к поисковой системе Яндекс:

Пример использование мета-тега description

Как видно на скриншоте, на третьем месте находится один из моих сайтов. Описание в сниппете берётся из мета-тега description, потому что именно он наиболее релевантен данному запросу:

<meta name="description" content="Веб-студия Art for life — искусство разработки и продвижения web-сайтов в городах: Санкт-Петербург, Псков и Великие Луки. Студия Сергея Игнатьева." />

Добиться этого элементарно и не составит особо труда. В CMS для интернет-магазинов, в блогах уже давно существуют плагины, позволяющие формировать описания для страницы в полуавтоматическом режиме. Вы задаёте формат записи, а скрипт подставляет ключевые слова в нужное место.

Маленький совет: «Старайтесь в описании в мета-теге description использовать одно прямое вхождение ключевого слова и дополнительно ещё одно разбавленное, а лучше всего склонение ключевика.»

За сим разрешите откланяться. Ваш дед-сеошник.

Задавайте вопросы.

Влияние keywords на продвижение сайта

На связи дед-сеошник, и сегодня речь пойдёт об использовании мета-тега keywords и его степени влияния на продвижение сайта.

Пример записи мета-тега кейвордс:

<meta name="keywords" content="продвижение сайтов в поисковиках раскрутка и продвижение сайта">

Справочник BookHtml.ru: правильная и валидная запись мета-тегов

Раньше данный тег, несомненно, оказывал непосредственное влияние на позиции продвигаемого сайта. Сейчас же, ввиду возможности лёгкости автоматизации заполнения данного тега с помощью различных скриптов, мета-тег keywords не даст вам практически ничего для продвижения. Этим мета-тегом скорее можно навредить сайту и навлечь санкции со стороны поисковых систем, чем помочь ему достигнуть топовых позиций в выдаче.

Но всё же, если вы решили использовать все доступные ресурсы для продвижения (а мета-тег keywords является одним из них), то вот вам один совет: «Не используйте запятые».

За сим разрешите откланяться. Ваш дед-сеошник.

Задавайте вопросы.

Влияние тега noindex и атрибута «nofollow» на SEO

Здравствуйте, дорогие мои читатели. Сейчас дедушка-сеошник поделится своими мыслями по поводу использования тега <noindex> и атрибута у ссылок rel=nofollow.

Использование тега <noindex>

Пример использования данного контейнера:

<noindex>
<form id="forma" class="justbox" method="get" action="/results.html" name="forma">
... [содержание формы] ...
</form>
</noindex>

Справочник BookHtml.ru: правильная и валидная запись тега noindex

Я вижу смысл данного тега только для того, чтобы показать поисковому роботу один факт: контент, заключённый в данном теге, необходимо считать не информативным для пользователя. Таким образом, я использую тег <noindex> для форм поиска, форм подбора какой-либо услуги (например, форма бронирования столиков на главной странице сайта). Т.е. в этом теге предпочтительно заключать информацию технической направленности. И чтобы не «захламлять» информационную составляющую своего сайта с точки зрения поисковой машину, и используется данный тег.

Поисковые системы (Яндекс и Google) замечательно индексируют и контент, и ссылки, которые находятся внутри контейнера <noindex>. Не стоит бояться покупать ссылки с таких сайтов — ведь намного важнее та ссылка, с которой есть реальные живые переходы, а не только сам факт её индексации.

Атрибут «nofollow» для ссылок

Атрибут «rel» со значением «nofollow» принятно использовать для того, чтобы данная ссылка не передавала вес. Удобно проставлять этот параметр по умолчанию со всех исходящих ссылок в темах и комментариях форума или профилей пользователей. Пример использования атрибута «rel» у ссылок:

<a href="url" rel="nofollow">анкор</a>

Справочник BookHtml.ru: правильная и валидная запись тега <a>

Только что было сказано насчёт ссылок в контейнере <noindex>. Абсолютно то же правило относится и к атрибуту «nofollow». Не надо бояться закупать или проставлять ссылки с данным атрибутом — они работают.

За сим разрешите откланяться. Ваш дед-сеошник.

Задавайте вопросы.