Идентификатор сессии
Это случайная последовательность символов, используемая для идентификации пользователя при его переходах по сайту. Обычно идентификатор делается достаточно длинным, чтобы он не повторялся на протяжении достаточно долгого времени. Например, в php изначально использовались идентификаторы в виде 32-значных шестнадцатиричных чисел. Если идентификация пользователя не связана с реквизитами авторизации (логином и паролем), идентификатор обычно генерируется на основе метки текущего времени (хеш md5, sha1 и т. п.), это обеспечивает его уникальность на много лет.
Идентификатор сессии обычно отсылается браузеру клиента в виде Cookie, но нередко есть вероятность, что браузер его не примет или вообще не получит. Для надежности идентификатор сессии автоматически добавляется ко всем «внутренним» ссылкам на странице в виде параметра с определенным именем (в php по умолчанию PHPSESSID, но это имя можно и переопределить). Такая технология получила название transparent SID («прозрачная» идентификация сессии).
Идентификаторы сессий и поисковые системы
Скрипт, использующий механизм сессий, выдает уникальный идентификатор каждому новому посетителю, не предъявившему его в Cookie и пришедшему по ссылке без идентификатора. Но поисковые боты не поддерживают Cookie. Нетрудно догадаться, что при каждом визите бота по ссылке без идентификатора ему будет выдана страница с новым идентификатором во всех ссылках. Формально ссылка с параметром PHPSESSID и без такого параметра — это две разные ссылки. Следовательно, при каждом обходе сайта бот будет получать новый набор уникальных ссылок на одни и те же страницы. Тупо индексируя эти находки, поисковик будет наполнять свою базу практически неограниченным числом страниц-дубликатов.
Как это отразится на положении сайта в поиске — нетрудно догадаться. Для тех, кто не догадался, подсказка: отразится очень плохо. Обнаружив в индексе большое количество страниц-дубликатов, поисковик оценит качество исполнения сайта как очень низкое, что неминуемо скажется на позициях в поиске. Но это еще не все. Поисковику совсем не нужно тратить свое дисковое пространство на ваши бесконечные дубли, поэтому он рано или поздно начнет чистить базу от этого мусора. Не рассчитывайте на разумный подход к чистке: поисковик — не человек, а тупая машина, думать он не умеет, соображать не обучен и интуиции ему не дано. Поэтому нечего удивляться, если он выметет из своей базы всё старьё (в том числе ссылки без идентификаторов), а оставит самое свежее и актуальное (ссылки с идентификаторами, которые собрал при последнем обходе сайта). Или выкинет страницу без идентификатора, а с идентификатором оставит, потому что Вася Пупкин дал на нее ссылку в своем блоге, а на страницу без идентификатора никаких ссылок нет. Значит, она менее важная.
Как с этим бороться?
Волшебных кнопок на все случаи жизни не бывает. Поэтому пути могут быть разными в зависимости от целей, которые вы ставите. Например, для форума и для интернет-магазина возможны принципиально разные решения.
Запрет идентификаторов
Самый простой выход — вообще запретить механизм «прозрачной идентификации» сессий, оставив идентификацию только через Cookie. Так, например, построена работа форума SEO-board. В php для полного запрета достаточно изменить настройки, прописав в .htaccess вот такое заклинание:
php_value session.use_trans_sid 0 php_value session.use_only_cookies 1
Первая строка предписывает отключить механизм передачи идентификаторов в ссылках, вторая — использовать только Cookie для идентификации сессий.
Метод действенный и надежный, при его применении идентификаторы сессий в URL не появляются и не поддерживаются. Недостаток очевиден — если клиент не отдает Cookie (или не получил, поскольку не прошли через плохо настроенный прокси), то и идентифицировать такого клиента невозможно.
«Не поддерживаешь Cookie? Давай, до свидания». Авторизоваться на вашем сайте такой пользователь не сможет. А если у вас интернет-магазин — возможно, вы потеряли покупателя, поскольку он не сможет оформить заказ. Так что самые простые решения — не всегда самые лучшие.
Канонизация URL
Сравнительно новый метод, поисковиками он поддерживается не так давно. Реализуется программно, в секцию страницы нужно внедрить тег канонизации:
Тем самым сообщить, что истинным адресом этой страницы является тот URI , который указан в содержании тега, а если страница выдается по иному адресу — это технический дубликат и индексировать его не нужно.
Запреты в мета robots
Почти то же самое, что и с канонизацией. В случае, если в запросе клиента указан URI с идентификатором сессии, в секцию вставляется мета-тег robots с запретом индексирования страницы. Например, вот так:
Или так (не рекомендуется):
Разница невелика: второй вариант разрешает боту следовать по ссылкам, обнаруженным на странице, но оба варианта запрещают индексирование страницы. Для защиты от дубликатов с сессиями второй вариант нежелателен: никаких нужных ссылок на этой странице поисковик все равно не найдет — все ссылки будут с идентификатором сессии.
Роботам сессии не открываем
Оба варианта защиты с тегами (канонизация и мета robots) имеют один явный недостаток: чтобы поисковик «узнал», что эту страницу нельзя брать в индекс, он должен сначала ее считать и разобрать. Поскольку обход страниц сайта роботы проводят не сразу, а небольшими порциями в порядке очереди, это отвлекает бота на сканирование и разбор ненужных страниц. А значит, новые попадут в индекс позднее, чем хотелось бы; сначала бот будет обходить ранее запланированные «дубли».
Чтобы избежать обработки в поисковиках страниц с идентификаторами в URL , есть два пути. Там, где сессия сопутствует авторизации пользователя, нужно открывать сессии только после логина. Там, где необходимо идентифицировать любого пользователя, нужно определять ботов (например, по полю User-agent в заголовке запроса) и сессию для них не открывать. А при запросе ботом URL с идентификатором сессии отдавать в заголовке статус «404 Not Found». Это позволяет избежать попадания в очередь на сканирование новых ссылок с идентификаторами, а те дубли, которые поисковик уже успел проиндексировать — удалить из индекса.
идентификатор-сессии.txt · создано: 2012/10/04 16:58 — Spinne · Последние изменения: 2012/10/04 19:47 — Spinne
Идентификатор сессии
Идентификатор сессии — персональный номер, который прибавляется к URL, когда пользователь заходит на страницу с отключенным cookies.
Номер прилагается к адресу для того, чтобы можно было определить пользователя и его действия на странице: сколько и какие просмотрел, какие файлы загрузил и т.д.
Идентификатор сессии прибавляется со всем адресам на сайте, что довольно проблематично для работы поискового бота, который адреса с таким персональным номером считает за новые страницы, из-за этого в поисковой базе собирается много копий страниц, которые являются техническими дублями сайта.
В таких случаях используются особые алгоритмы, которые фиксируют идентификаторы сессий, но происходит это не всегда. Следовательно, устанавливать идентификаторы надо с осторожностью или лучше их вообще отключать.
Что такое Идентификатор сессии (Session ID)
Идентификатор сессии (Session ID): персональный номер, прибавляемый к URL, когда пользователь заходит на страницу при отключенных cookies, который является уникальным для каждого посетителя и присваивается адресу с целью сбора информации и статистических данных о поведении на сайте (сколько и какие страницы просмотрены, какие файлы загружены, какие запросы сделаны и т. д.).
Каждому новому посетителю идентификатор присваивает уникальное число, которое добавляется к адресу сайта, что приводит к многократной индексации одних и тех же страниц. Поэтому рекомендуется не использовать идентификаторы сессий.
Узнайте больше в нашем центре интернет-образования
Практический курс «Таргетированная реклама в социальных сетях» Подробнее
Практический курс «Веб-аналитика: практический курс для бизнеса» Подробнее
Этот сайт использует файлы cookie. Это необходимо для изучения ваших предпочтений, а также для сбора аналитических данных о посещениях сайта. Продолжая использовать наш сайт, вы даете согласие на обработку файлов cookie, в соответствии с Соглашением.
СОГЛАШЕНИЕ ОБ ИСПОЛЬЗОВАНИИ ФАЙЛОВ COOKIE
Сайт www.promowebcom.by использует файлы cookie и схожие технологии, чтобы предоставлять услуги, отвечающие интересам и потребностям пользователей, а также собирать статистическую и маркетинговую информацию для анализа и совершенствования наших услуг. При использовании данного сайта, Вы подтверждаете свое согласие на использование файлов cookie. Если Вы не согласны с тем, чтобы мы использовали данный тип файлов, то Вы должны соответствующим образом установить настройки браузера или не использовать данный сайт.
Обращаем Ваше внимание на то, что при блокировании или удалении файлов cookie, мы не можем гарантировать корректную работу нашего сайта в Вашем браузере. Файлы cookie, которые сохраняются через сайт, не содержат сведений, на основании которых можно Вас идентифицировать.
ОБЩИЕ ПОЛОЖЕНИЯ
Во время просмотра любой страницы сайта на ваш компьютер загружается сама страница, а также может загружаться небольшой текстовый файл под названием cookie, позволяющий определить, был ли конкретный компьютер и/или Пользователь на этом сайте ранее.
Некоторые посещаемые Вами страницы могут также собирать информацию, используя пиксельные тэги и веб-маяки, представляющие собой электронные изображения, называемые одно-пиксельными (1×1) или пустыми GIF-изображениями.
Файлы cookie могут размещаться на Вашем устройстве администрацией сайта (такие файлы называются «собственными»). Некоторые файлы cookie могут размещаться на Вашем устройстве другими операторами. Такие файлы cookie называются файлами «третьих лиц».
Мы используем два вида файлов cookie на сайте: «cookie сессии» и «постоянные cookie». Cookie сессии — это временные файлы, которые остаются на устройстве пока Вы не покинете сайт. Постоянные cookie остаются на устройстве в течение длительного времени или пока Вы вручную не удалите их (как долго cookie останется на вашем устройстве будет зависеть от продолжительности или «времени жизни» конкретного файла и настройки Вашего браузера).
ИСПОЛЬЗУЕМЫЕ ФАЙЛЫ COOKIE
Необходимые. Эти файлы нужны для обеспечения правильной работы сайта, использования его функций. Отключение использования таких файлов приведет к падению производительности сайта, невозможности использовать его компоненты и сервисы.
Файлы cookie, относящиеся к производительности, эффективности и аналитике. Данные файлы позволяют анализировать взаимодействие посетителей с сайтом, оптимизировать содержание сайта, измерять эффективность рекламных кампаний, предоставляя информацию о количестве посетителей сайта, времени его использования, возникающих ошибках.
Функциональные файлы cookie запоминают пользователей, которые уже заходили на наш сайт, их индивидуальные параметры (такие как язык и регион, например) и предпочтения, и помогают индивидуализировать содержание сайта.
Рекламные файлы cookie определяют, какие сайты Вы посещали и как часто, какие ссылки Вы выбирали, что позволяет показывать Вам рекламные объявления, которые заинтересуют именно Вас.
Сторонние веб-сервисы. Иногда на данном сайте мы используем сторонние веб-сервисы. Например, для отображения тех или иных элементов (изображения, видео, презентации и т. п.), организации опросов и т.п.
УПРАВЛЕНИЕ ФАЙЛАМИ COOKIE
Большинство браузеров изначально настроены автоматически принимать файлы cookie. Пользователь может изменить настройки таким образом, чтобы браузер блокировал файлы cookie или предупреждал, когда файлы данного типа будут отправлены на устройство. Есть несколько способов управления файлами cookie. Пожалуйста, обратитесь к инструкции браузера для того, чтобы узнать больше о том, как скорректировать или изменить настройки браузера.
Если Вы настроили свой компьютер на полный запрет приема cookie файлов, Вы по-прежнему можете анонимно посещать сайт до тех пор, пока Вы не пожелаете воспользоваться одной из услуг сайта. При этом необходимо учитывать, что при полном отключении файлов cookie некоторые персональные услуги не могут быть предоставлены Пользователю, а также что Пользователь, выбравший такие настройки, не сможет получить полный доступ ко всем разделам сайта.
ВНЕСЕНИЕ ИЗМЕНЕНИЙ В СОГЛАШЕНИЕ ОБ ИСПОЛЬЗОВАНИИ ФАЙЛОВ COOKIE
Мы можем обновлять настоящее Соглашение об использовании файлов cookie по мере необходимости, например, для отображения в ней изменений, касающихся используемых файлов cookie.
Мы рекомендуем регулярно просматривать положения настоящего Соглашение об использовании файлов cookie, чтобы получать актуальную информацию об используемых файлах cookie и связанных с ними технологий.
Если у Вас возникнут вопросы об использовании файлов cookie или других технологий, Вы можете связаться с нами, используя контакты, размещенные на нашем сайте.
Идентификатор сессии
Идентификатор сессии — это персональный номер, возникающий при посещении сайта пользователем с отключенным cookies и добавляемый к URL. Используется для сбора статической информации о действиях, совершаемых пользователями на сайте.
Фактически, сбор полной статистики — это единственная положительная сторона этой технологии.
В остальном использование идентификаторов сессий приводит к:
- Значительному увеличению дубликатов страниц. Страница с добавленным к ней номером считается отдельной страницей с точки зрения поисковых машин и может индексироваться.
- Увеличению нагрузки на сервер. Собираемая статистика сохраняется даже в том случае, если она не несет в себе никакой ценной информации.
- Повышению уязвимости сайта. Никто не мешает недоброжелателям вручную или с помощью специального скрипта эмулировать действия пользователя с отключенными cookies и уже целенаправленно создавать технические дубли и ненужную статистику.
Современные алгоритмы поисковых систем способны зафиксировать использование идентификаторов сессий и не включать в индекс технические дубли страниц. Но работа этих алгоритмов пока еще неидеальна, поэтому рекомендуется пожертвовать незначительной частью статистической информации в пользу работоспособности сайта.
- Интернет-маркетинг
- Разработка сайтов
- Поисковое продвижение