Продвигайтесь с умом

Материал из Maximedia
Версия от 17:24, 13 января 2016; Admin (обсуждение | вклад) (Индексация)

Перейти к: навигация, поиск

Содержание

Веб-разработка

Поисковое продвижение

Общие принципы

Поисковая система — это в общем виде сайт, помогающий искать информацию на других сайтах. Для начала поиска нужной информации пользователь в специальном поле печатает текст, по его мнению связанный с искомой информацией. Поисковая система в ответ выдаёт ему список сайтов, на которых по мнению этой системы нужная информация может найтись.

Как и в любом списке одни сайты находятся выше других, а значит имеют больше шансов на то, что пользователь на них зайдёт. Поисковая система показывает сайты тем выше, тем больше по мнению поисковой системы они соответствуют тексту, введённому пользователем. Поисковое продвижение — это мероприятия по повышению места сайта в выдаваемом поисковой системой списке сайтов.

Сейчас также существует поиск по изображениям (Яндекс.Картинки, Google Картинки и др.), музыкальным отрывкам (Midomi, AudioTag и др.), наверняка есть и скоро появятся другие сайты, которые с полным основанием можно причислить к поисковым системам. Но здесь я буду говорить лишь о текстовых поисковых системах.

Статистика

Поисковые системы (ПС) на данный момент — наиболее посещаемые сайты Интернета. По некоторым данным до 90% пользователей начинают посещение Интернета с поисковой системы (конечно, большую роль в этом играет то, что она та или иная система стоит в большинстве браузеров по умолчанию, но тем не менее). И немного статистики по ПС:

Эффективность

Эффективность поискового продвижения оценивается по следующим показателям:

  • позиции — теряющий значение из-за персонализации выдачи в поисковых системах (подробнее ниже);
  • трафик — количество переходов на сайт (в основном по низкочастотным запросам);
  • лиды — конкретные действия: регистрации, подписки, заказы, звонки, заказы и пр.

Термины

Поисковые системы

  • Поисковая система — в общем виде состоит из трёх частей:
    • Поисковый робот — переходит по страницам сайтов и заносит информацию о них в базу данных.
    • Поисковый индекс, Индекс — база данных, содержащая информацию о страницах, собранную поисковым роботом.
    • Поисковик — интерфейс, через который пользователь получает доступ к поисковому индексу.
  • Индексация — Indexing — процесс внесения информации в поисковый индекс.
  • Апдейт, Ап (Update — обновление) — обновление поискового индекса. После обновления при определении позиций сайта начинают учитываться новые данные, полученные системой в течение промежутка времени с прошлого обновления. Яндекс обновляет поисковую базу большими фрагментами, его апы заметны, в Google индекс обновляется постоянно небольшими порциями, поэтому как такового апа у него нет. Апдейты Яндекса показываются здесь. Апдейты подразделяются на:
    • текстовые апдейты — обновляют информацию о добавлении, удалении и изменении содержания сайтов;
    • ссылочные апдейты — учитывают ссылки, попавшие в индекс.

Между попаданием в индекс и апдейтом проходит время. На середину 2015 оно составляет порядка недели для Яндекса (основная масса контента, для некоторых видов контента — быстрее).

  • Cерп (SERP — Search Engine Results Page — Страница результатов поиска) — страница поисковика со списком сайтов, выдаваемая поисковой системой в ответ на текст, введённый пользователем для поиска информации.
  • Органическая выдачастраница результатов поиска без рекламных объявлений.
  • Сниппет (Snippet — отрывок) — описание сайта в списке на странице результатов поиска.
  • Ранжирование — Ranking — сортировка сайтов на странице результатов поиска. Является результатом многих факторов, определяемых поисковой системой. Выявление и задействование этих факторов на сайте является большей частью процесса поискового продвижения.

Ключевые фразы

  • Запрос, Ключевая фраза, Ключевое словоKeyword — текст, используемый для поиска информации в поисковой системе. Запросы подразделяются на:
    • информационные — поиск информации;
    • транзакционные (коммерческие) — поиск товара, услуги;
    • навигационные — поиск товаров и услуг на конкретных сайтах или конкретных брендов.
  • Частотность запроса — общее количество запросов за заданный промежуток времени (по умолчанию месяц). Подразделяются на высокочастотные, среднечастотные и низкочастотные.
  • Конкурентность запроса — количество конкурентов по запросу. Подразделяются на высококонкурентные, среднеконкурентные и низкоконкурентные.
  • Релевантность — Relevance — адекватность страницы выдаваемой поисковой системой в ответ на запрос пользователя. Предполагается, что чем выше релевантность страницы запросу, тем выше сайт в списке на странице результатов поиска.
  • Семантическое ядро — набор запросов, их морфологических форм и словосочетаний, которые наиболее точно характеризуют вид деятельности, товар или услугу, предлагаемые сайтом.
  • Спектр запросов, Синонимы — набор запросов, связанных с ключевой фразой географически, семантически, статистически и другими способами.

Ссылки

  • Урл (URL — Uniform Resource Locator — Единый указатель ресурсов) — адрес сайта или конкретной страницы сайта, или файла на сайте.
  • Ссылка, ГиперссылкаHyperlink — часть документа или файла, содержащая урл, на который можно перейти.
  • Анкор (Anchor — тех. анкер, железная связь) — текст ссылки.
  • Безанкорная ссылкассылка, анкор которой совпадает с её урлом.
  • Редирект (Redirect — переадресовывать) — автоматическое перенаправление пользователя с одного урла на другой.

Вес

  • Вес страницы — возник как ответ поисковых систем на обмен ссылками в целях повышения ранжирования. Суть в том, что каждая страница имеет вес и, ссылаясь на другую страницу, передаёт ей часть своего веса, подробнее здесь. Чем выше вес страницы, тем выше её релевантность. Скачать программу для расчёта веса страниц, исходя из данных по внутренней перелинковке, можно здесь.
    Исходя из этих предпосылок, можно сделать следующие выводы:
    • чем больше ссылок ссылается на страницу, тем больше её вес;
    • чем выше вес страницы, тем больший вес имеет ссылка с этой страницы.
  • Статический вес — вес, распределённый между страницами с помощью ссылок.
  • Динамический вес — дополнительный вес за анкоры ссылок и др. повышающие и снижающие вес страницы коэффициенты.
  • Сквозные ссылки — одинаковые ссылки, присутствующие на всех страницах, считаются одной ссылкой, передающей усреднённый вес всех ссылок.
  • Сайты-доноры — сайты, ссылающиеся на данный сайт, называются его сайтами-донорами.
  • Зеркало сайта — частичная или полная копия сайта. Сайты, которые поисковая система считает зеркалами, склеиваются и в выдаче показывается только главное зеркало. Описание зеркал от Яндекса.

Перелинковка

  • Перелинковка — связывание сайтов и страниц ссылками.
  • Внутренняя перелинковка — передача веса страницы с помощью ссылок внутри сайта.
  • Внешняя перелинковка — передача веса страницы с помощью ссылок между сайтами. Внешняя перелинковка явилась основой для покупки и продажи ссылок (т.н. коммерческих ссылок). Постепенно и Яндекс, и Google научились определять коммерческие ссылки и искусственно занижать их вес (подробнее в разделе Фильтры). С обзором ссылочных бирж можно ознакомиться здесь.
  • Анкорный лист, Анкор-лист — перечень анкоров внешних ссылок с указанием частотности.
  • Неразбавленные анкоры — это анкоры с точным (прямым) или морфологическим (склоненным) вхождением поискового запроса без каких-либо дополнительных слов. Использовать в больших количествах нельзя, иначе они будут склеены и их вес станет очень низким.
  • Разбавленные анкорыанкоры, которые помимо поискового запроса содержат дополнительный текст. В этом случае динамический вес снижается, но использование разбавленных анкоров позволяет разнообразить анкор-лист.

Элементы выдачи

  • Поле поиска — поле, в которое пользователь вносит ключевую фразу. В некоторых браузерах поле поиска совпадает с адресной строкой.
  • Ранжированный список — список результатов поиска по ключевой фразе, список ссылок на сайты с кратким описанием этих сайтов. Ссылки ранжированы по релевантности ключевой фразе. Соответственно, прямой задачей поискового продвижения является повышение релевантности страниц и сайта определённым (им и бизнесом) ключевым фразам.
  • Фавикон — небольшая картинка рядом с каждой позицией списка. Не является обязательным элементом.
  • Ссылка — заголовок каждого элемента списка. Совпадающие ключевые слова, а также ключевые слова из спектра выделяются в заголовке полужирным шрифтом.
  • Сниппет — описание сайта. Подбирается поисковой системой автоматически — берётся из мета-тега Description или непосредственно из содержания страницы.
  • Дополнительные элементы — являются либо расширениями, либо элементами поисковой системы, и будут описаны ниже.

Ранжирование

Комплексы факторов ранжирования, влияющих на положение сайта в списке результатов поиска.

  • Релевантность — как правило, употребляется по отношению к странице — степень соответствия страницы поисковому запросу.
  • Цитируемость, Авторитетность — общий вес сайта, состоящий из динамических весов страниц сайта.
  • Трастовость, Траст (Trust — доверие) — гипотетический фактор ранжирования. Предполагается, что высокое доверие повышает ранжируемость, а ссылки с сайтов с высоким доверием имеют больший вес, чем с сайтом с низким. Более того, обратные ссылки с сайтов с низкой трастовостью могут навредить ресурсу. Существуют различные методики расчёта траста, и использующие их онлайн-сервисы: XTool для Яндекса, SB Up (с множеством других полезных сервисов), Majestic (нужна регистрация), Mozcheck (нужна регистрация). Каждый из этих сервисов по разному рассчитывает траст сайта, поэтому их практическая польза не очевидна. В основном они используются для оценки сайта-донора при покупке ссылок.

Факторы ранжирования

Keyword-факторы

  1. Релевантность контента — соответствие текста ключевому слову. Пока единственный сервис, дающий общую оценку — MegaIndex (требуется регистрация). PR_CY показывает общую статистику по странице, из которой можно сделать самостоятельные выводы о релевантности контента.
  2. Плотность ключевой фразы — частота использования ключевой фразы в тексте должна быть не ниже значений, показывающих её несвязанность с общим смыслом текста. Одновременно она должна быть не выше значений, показывающих, что частота её использования усилена искусственно.
    • довольно давно используется параметр веса слова, связанный с общей употребимостью слова; статистическая мера, используемая основными поисковыми системами для определения веса ключевой фразы на странице — TF-IDF и её вариации; большой вес в TF-IDF получат ключевые фразы с высокой частотой в пределах конкретного документа и с низкой частотой употреблений в других документах
    • по неподтверждённым данным (по крайней мере Google приобрёл соответствующий патент), сейчас начинает использоваться латентно-семантический анализ (подробнее на английском здесь), поэтому помимо ключевых слов нужно использовать на странице синонимы ключевых фраз (подробности ниже); то же относится к названию страницы, заголовкам, описанию страницы, урлу и доменному имени;
    • по неподтверждённым данным ключевая фраза среди первых 100 слов контента увеличивает его релевантность данной фразе.
    Методика расчёта плотности связана с анализом плотности ключевой фразы и синонимов во второй десятке выдачи и более подробно описана здесь. Раньше, когда ссылочная масса имела большее значение, чем сейчас, рекомендовалось анализировать вторую страницу выдачи из-за более "естественных" результатов.
  3. Порядок слов в ключевой фразе — по неподтверждённым данным точное совпадение слов в ключевой фразе более релевантно.
  4. Словоформы ключевых фраз — желательно использовать в тексте различные варианты написания ключевых фраз с изменением числа и падежа, а также спряжения — для глаголов. По непроверенной информации глагол в этом случае равнозначен причастию, а прилагательное — деепричастию.
    Сюда же можно отнести ситуацию, когда в ключевую фразу вставлено одно или несколько слов, создавая разнесённую ключевую фразу.
  5. Синонимы ключевых фраз — поисковые системы используют алгоритмы, позволяющие определить не только ключевую фразу, но и связанное с ней облако понятий. Использование слов и фраз из этого облака помогает увеличить релевантность текста, так как вероятность того, что он отвечает запросу пользователя, выше. Узнать, какие ключевые фразы есть в облаке понятий можно с помощью инструментов контекстной рекламы, так как, похоже, они используют один и тот же движок. Для Google это Планировщик ключевых слов (Войти в AdWords → Поиск новых ключевых слов по фразе, сайту или категории). Для Яндекса это может быть и Wordstat (фразы в правом списке), и Прогноз бюджета (фразы в правом окошке, их выбор шире, чем в Wordstat). По непроверенным данным:
    • ключевые фразы из облака понятий имеют тем больший вес, чем ближе находятся к ключевой фразе;
    • HTML-элементы способны сократить семантическую дистанцию между понятиями, просто разместив их близко друг к другу (например, термины, находящиеся в списке, могут рассматриваться как находящиеся на одинаковом расстоянии друг от друга, а заголовок текста может рассматриваться так, будто он находится на близком расстоянии к любому термину в документе);
    • усиление плотности ключевых фраз в начале текста даёт больший эффект, чем их равномерное распределение по тексту; то же относится к ключевым фразам в доменном имени, названии страницы и заголовках;
  6. Ключевые фразы в названии страницы (тег TITLE) — повышают релевантность страницы. Общие рекомендации (не подтверждены):
    • длина названия 60-80 символов;
    • без ключевых фраз в заголовке страница будет ранжироваться по этим словам гораздо хуже;
    • чем ближе ключевые фразы к началу заголовка, тем больше влияют на ранжирование;
    • крайне желательно, чтобы заголовок был уникальным для сайта; для интернета в целом — желательно;
    • в названии страницы лучше использовать непрямые вхождения ключевых фраз;
    • расстояние между одинаковыми ключевыми фразами влияет на ранжирование (слишком близком, слишком далеко, слишком часто — плохо);
    • нежелательно использовать некоторые знаки ( = / \ ! ? * » : < > | + _ ) в качестве разделителей;
    • чем короче заголовок, тем больший вес имеет каждое слово (и, соответственно, ключевая фраза).
  7. Ключевые фразы в заголовках — повышают релевантность. Общие рекомендации (не подтверждены):
    • H1 желательно использовать один раз на странице;
    • иерархичность использования заголовков (H1 → H2 → H3 и т.д.) желательна;
    • нежелательно использовать теги внутри заголовков;
    • есть высокая вероятность того, что поисковые системы оценивают наличие текста под заголовками, и соответствие ключевых слов в заголовке и в тексте под ним; возможно, выделение ключевых фраз в тексте под заголовком придаёт ему больший вес, если эти фразы присутствуют в заголовке.
    По непроверенным данным:
    • H1 должен быть набран шрифтом самого крупного размера;
    • прямые вхождения ключевых фраз повышают релевантность;
    • близость ключевой фразы к началу заголовка повышает релевантность;
    • чем ближе заголовок к началу текста, тем выше релевантность ключевых фраз в нём;
    • уникальность заголовка на странице, сайте, в интернете повышает релевантность его ключевых фраз;
    • высокая плотность ключевых фраз в заголовке снижает релевантность — их желательно разбавлять другими словами;
    • грамматические ошибки в заголовке снижают его релевантность.
  8. Выделение ключевых фраз тегами — увеличивает релевантность контента данным ключевым фразам. Теги strong, em, u. Теги strong и em рекомендуется использовать вместо тегов b и i, соответственно.
  9. Сегментация страницы — это разделение страницы поисковыми системами на сегменты с разной значимостью. Чем выше значимость сегмента, тем больший вес приобретают размещённые в нём ключевые фразы. Размещение ключевых фраз в сегментах с высокой значимостью повышает релевантность страницы. Наибольший вес, как правило, имеет сегмент с содержанием, находящийся в центре страницы.
  10. Ключевые фразы в перечне ключевых фраз (мета-тег Keywords) — могут учитываться Яндексом при определении соответствия страницы поисковым запросам. Общие рекомендации (не подтверждены):
    • длина не более 100 символов;
    • соответствие ключевым фразам страницы;
    • уникальный перечень для каждой страницы сайта;
  11. Ключевые фразы в описании страницы (мета-тег Description) — из описания часто берётся сниппет и совпадающие ключевые фразы в этом случае выделяются поисковой системой (подробнее об этом в факторах страницы). Общие рекомендации (не подтверждены):
    • длина не более 200 символов;
    • крайне желательно, чтобы описание было уникальным для сайта и для интернета в целом.
  12. Ключевые фразы в урле — повышают релевантность страницы. Вопрос об использовании кириллицы и латиницы в урле остаётся открытым. Предполагается, что Яндекс лучше относится к транслиту, а Google к англоязычному переводу. Для перевода названия в транслит можно использовать таблицу транслитерации от NIC.RU. Использование человекопонятных урлов позволяет указывать ключевую фразу не только в названии страницы, но и в названиях страниц, которые выше в иерархии.
  13. Ключевые фразы в доменном имени — содержание ключевой фразы в имени домена или поддомена повышает релевантность сайта данной фразе. По непроверенным данным в длинном доменном имени, как и в длинном заголовке, вес ключевой фразы снижается. Возможно, домены, начинающиеся с ключевой фразы, более релевантны этой фразе чем те, где эта фраза стоит в середине или в конце. Возможно, те же принципы, хотя и в меньшей степени, можно отнести к имени поддомена. Особое внимание следует обратить на домены, имя которых совпадает с ключевой фразой (EMD — exact match domain — домены прямого вхождения), есть вероятность, что Google применяет к ним фильтр.
  14. Теги в Wordpress — по неподтверждённым данным являются сигналом релевантности.

Факторы содержания

  1. Уникальность контента — повышает доверие к сайту.
  2. Соответствие содержания заголовку — значительно повышает релевантность страницы.
  3. Канонические ссылки — должны использоваться в тех случаях, когда у одной и той же страницы есть несколько урлов (такую ситуацию могут создавать некоторые системы управления содержанием). В этом случае каноническая ссылка даёт понять поисковой системе, какая из страниц является основной, и убирает штрафы за дублирование контента. Подробнее о канонических ссылках от Google.
  4. Копии контента на других сайтах — по неподтверждённым данным увеличивают трастовость сайта. По неподтверждённым данным увеличение трастовости происходит даже при отсутствии ссылки на первоисточник.
  5. Количество контента — по непроверенным данным: от 500 до 3 000 знаков, но если есть такая возможность, то лучше ориентироваться на количество контента на сайтах-конкурентах в верхней части выдачи. Предположительно разное количество знаков в статьях на сайте увеличивает доверие к сайту. Подсчёт знаков можно производить в Word или на онлайн-сервисах.
  6. Наличие и уникальность изображений — повышает релевантность текста. Рекомендуется:
    • помещать изображение как можно ближе к тексту, либо окружать изображения текстом;
    • размещать подписи с ключевыми фразами под изображением;
    • информировать посетителя сайта о содержимом изображения текстовым сообщением в том случае, если в браузере пользователя отключено отображение картинок или при загрузке изображения произошла ошибка — для этого используется атрибут ALT; кроме того, этот атрибут влияет на ранжирование в Яндекс.Картинках и Картинках Google (при поиске изображений по ключевым фразам); по непроверенным данным желательно не превышать длину описания содержимого более чем на 50-60 символов;
    • сообщать дополнительную информацию об изображении с помощью атрибута TITLE; рекомендуется делать дополнительную информацию отличной от описания в атрибуте ALT;
    • упоминать в названии файла изображения ключевые фразы;
    • брать изображения с бесплатных фотостоков (Flickr, Kavewall, Bigfoto, Stockvault, Unsplash), либо покупать их.
  7. Наличие роликов с Youtube — по непроверенным данным влияет на ранжирование сайта, особенно в Google, являющимся владельцем этого видеохостинга. Кроме того, это увеличивает время нахождения на сайте (поведенческий фактор).
  8. Наличие и уникальность мультимедиа — по непроверенным данным повышает доверие к сайту.
  9. Жалобы по авторскому праву — по непроверенным данным Google снижает трастовость сайтов, имеющих такие жалобы.
  10. Грамотность текстов — по непроверенным данным повышает доверие к сайту. Проверку можно производить как на онлайн-сервисах, так и в MS Word.
  11. Списки, таблицы — по непроверенным данным наличие списков и таблиц повышает релевантность страницы.
  12. Обновление старого контента — по непроверенным данным повышает релевантность сайта, также возможно релевантность повышается при увеличении частоты обновлений старого контента.

Факторы страницы

  1. Pagerank, PR — вес страницы в Google. Оказывает значительное влияние на ранжирование страницы на странице результатов поиска. Рассчитывается для каждой страницы отдельно. Описание от Google. Посмотреть Pagerank можно на PR-CY.
  2. Скорость загрузки — влияет на ранжирование страницы в поисковой выдаче. В основном отслеживается Google, но можно предположить, что этот фактор имеет значение и для Яндекса. Сервис оценки скорости от Google (обратите внимание, что сервис в том числе предлагает скачать элементы, увеличивающие скорость загрузки). Для оценки скорость загрузки Google может использовать как анализ кода, так и данные пользователей браузера Google Chrome, отправляемые в Google автоматически.
  3. Отображение на мобильных телефонах — имеет особенное значение для Google, и имеет смысл предположить, что ценность этого параметра для Яндекса так же будет повышаться. Основные ошибки можно увидеть в том же Сервисе оценки скорости от Google
  4. Внутренняя перелинковка — взаимосвязанная система внутренних ссылок между страницами сайта; эффективная перелинковка заключается в наращивании веса страниц с помощью внутренних ссылок — соответственно частотности запросов, по которым эти страницы продвигаются.
  5. Валидность HTML-кода — предположительно влияет на траст страницы. Проверить код страницы можно на сайте W3C.
  6. Возраст страницы — чем старше страница, тем, предположительно, больше её трастовость. По другим данным, Google даёт дополнительный вес новому контенту.
    Возраст страницы считается с даты её индексации поисковой системой. Чтобы узнать дату индексации Яндексом нужно ввести в поиск site:урл нужного сайта или url:нужный урл (не забудьте www перед урлом), а после получения результата добавить в конец адресной строки &how=tm (на последних страницах немного глючит, почему-то у меня через Тор глючит меньше). В Google проще: ввод тех же данных, но чтобы посмотреть даты, нужно лишь нажать на кнопку Инструменты поиска под полем поиска и выбрать интересующий промежуток времени.
  7. Описание страницы — напрямую на ранжирование не влияет, но используется поисковыми системами наравне с содержанием в описании сайта на странице результатов поиска. Качественное описание страницы увеличивает CTR страницы, повышая таким образом её релевантность через поведенческие факторы. Описание сайта размещается с помощью тега meta-description. Советы по мета-описаниям от Яндекса, и от Google.
  8. Использование микроразметки — повышает доверие к сайту, как за счёт кликабельности сайта в выдаче, так и, предположительно, по факту использования. Информация и помощники: Что особенно приятно, разметку можно добавлять и в блоге, и в других движках непосредственно в HTML-код.
  9. Уровень вложенности — по неподтверждённым данным чем глубже вложенность страницы в логической структуре сайта, тем меньше её вес, чем ближе — тем вес больше.
  10. Длина урла — по неподтверждённым данным влияет на доверие страницы. Предположительно оптимальная длина не должна превышать 5-6 слов и 60-70 знаков.

Ссылочные факторы

  1. Редиректы — ставятся на несуществующие страницы, оказывают значительное влияние на доверие к сайту:
    • 301 редирект передаёт вес страницы другому урлу (способы задать 301 редирект здесь), 301 редирект используется для постоянного перенаправления; по неподтверждённым данным, ссылки, идущие с редиректа 301 значительно теряют в весе, а по другим данным — вес таких ссылок отличается от прямых незначительно;
    • 302 редирект используется для временного перенаправления (например, страница на стадии редизайна);
    • 404 редирект используется для редиректа с несуществующего урла на заданную страницу; рекомендуется создавать эту страницу отдельно и оформлять её таким образом, чтобы удержать пользователя (и дать ссылок поисковому роботу); не рекомендуется перенаправлять пользователя на стартовую страницу сайта — поисковая система станет считать эту страницу дублем для многих адресов и снизит её вес;
    • цепочки из редиректов — нежелательны;
    • по неподтверждённым данным большое количество редиректов (в процентном соотношении с количеством страниц) снижает трастовость сайта.
  2. Исходящие ссылки — снижают вес страницы, поэтому желательно закрывать их от индексирования, присваивая им атрибут rel=nofollow, либо закрывать ссылки тегом noindex) (речь не идёт о т.н. сквозных ссылках — элементах навигации, присутствующих на всех страницах сайта). По неподтверждённым данным большое количество ссылок, закрытых тегом noindex, снижает доверие к сайту. Кроме того, Google Webmaster Guidelines не рекомендует размещать на странице слишком много ссылок.
    Исходящие ссылки страницы можно посмотреть на PR-CY и др. бесплатных сервисах.
  3. Входящие ссылки (обратные) — увеличивают вес страницы, поэтому чем больше качественных обратных ссылок на сайт, тем лучше (с мая 2015 Яндексом введён фильтр Минусинск, снижающий доверие за большое количество некачественных ссылок — подробнее в разделе Фильтры).
    Входящие ссылки на свой сайт можно смотреть с помощью бесплатных сервисов статистики Яндекс.Метрика и Google Analytics (после установки счётчика). Входящие ссылки на чужие сайты — с помощью платных и условно-бесплатных сервисов Majestic SEO, Ahrefs.com и др.
  4. Вес ссылки зависит:
    • в значительной мере от веса страницы, поэтому все Факторы страницы, перечисленные выше, влияют на вес ссылки;
    • от индекса цитирования сайта (тИЦ/PR) — высокий индекс повышает вес, низкий может снизить вплоть до нуля; очень хорошие ссылки — dmoz.org для Google и yaca.yandex.ru для Яндекса; возможно, хорошей ссылкой является ссылка с Каталога Yahoo!; хорошими обратными ссылками считаются ссылки с крупных тематических каталогов;
    • от естественности ссылки — поисковые системы умеют отличать естественные ссылки от SEO-ссылок (Минусинск — подробнее в разделе Фильтры); естественные ссылки весят больше, SEO-ссылки не только имеют нулевой вес, но и могут влиять на вес страницы/сайта;
    • от количества других исходящих ссылок на странице — чем больше ссылок, тем меньше вес каждой из них.
    По неподтверждённым данным вес страницы также зависит:
    • от траста сайта/страницы; возможно, ссылки с сайтов с высоким трастом учитываются даже будучи закрытыми атрибутом nofollow; возможно, ссылки с низкой трастововостью имеют меньший вес и индексируются медленнее;
    • от места размещения ссылки на странице;
    • от количества переходов по ссылке;
    • от возраста ссылки;
    • от наличия атрибута TITLE;
    также есть мнения, что:
    • исходящие ссылки на авторитетные ресурсы (например, Википедию)увеличивают траст страницы/сайта (хотя и уменьшают её вес), а исходящие ссылки на ресурсы с низким доверием уменьшают доверие к сайту; есть предположения, что авторитетность ресурса по-прежнему связана с его тИЦ/PR;
    • большое количество исходящих ссылок может дать поисковым системам основания заподозрить сайт в продаже ссылок и применить к нему штрафные санкции (см. Фильтры);
    • ссылки из комментариев имеют меньший вес, чем контекстные ссылки на той же странице;
    • слова в анкоре или околоанкорном тексте, указывающие на её неестественность ("партнёр", "спонсор" и пр.) могут снизить вес ссылки.
  5. Околоанкорный текст влияет на вес ссылки:
    • ссылки, размещённые внутри контекста имеют больший вес, чем ссылки вне контекста;
    • поисковые системы умеют определять тематику контекста, внутри которого находится ссылка, и соответственно этому увеличивать/уменьшать вес ссылки;
    • по неподтверждённым данным наличие ключевых слов на странице повышает вес ссылки;
    • по неподтверждённым данным ссылки в начале текста имеют больший вес, чем ссылки в конце.
  6. Количество страниц с обратными ссылками — влияет на вес страницы, даже если по неподтверждённым данным это страницы одного сайта.
  7. Динамика роста ссылочной массы — по неподтверждённым данным поисковые системы хранят историю роста ссылочной массы, в том числе о ссылочных взрывах.
  8. Тематическая близость сайтов и доменных зон — по неподтверждённым данным ссылки с сайтов-конкурентов по семантическому ядру и сайтов с близкими тематиками имеют больший вес. Ссылки с сайтов в тематических доменных зон имеют больший вес для страниц тех же тематик (перечень доменных имён). Предположительно ссылки из одинаковых региональных доменных зон имеют больший вес, чем из разных.
  9. Естественный анкор-лист — содержит разнообразные анкоры с разными включениями ключевых слов, без ключевых слов и без анкоров. Переспамленный анкор-лист демонстрирует высокую частотность одного или нескольких анкоров с одинаковым включением ключевой фразы, что, предположительно, влечёт за собой склейку одинаковых анкоров и следовательно снижение веса всех ссылок с одинаковым анкором. Анализ анкор-листа возможен в основном на условно-бесплатных сервисах типа Majestic.
  10. Ссылочное разнообразие — по неподтверждённым данным подчёркивает естественность ссылочного профиля, и поэтому доверие к таким ссылкам выше (а значит, выше их вес). Включает в себя:
    • количество ссылок с разных IP;
    • количество ссылок с разных страниц одного сайта;
    • количество видов ссылок: текстовые, безанкорные, короткие, изображения, из видео и пр.;
    • в то же время значительное количество ссылок только из одного источника (например, только форумы) может снизить их вес.
  11. Карта сайта — может быть полезна для крупных сайтов (описание от Яндекса, от Google). Возможно, иерархия страниц в карте сайта влияет на распределение веса между страницами сайта.

Факторы сайта

  1. Наличие счётчиков Яндекс.Метрики и Google Analytics — одно из необходимых условий эффективного продвижения, так как позволяет поисковым системам отслеживать множество факторов ранжирования, включая поведение пользователей на сайте.
  2. Тематический индекс цитирования, тИЦ — индекс, оценивающий количество и качество ссылок на сайт. Оказывает значительное влияние на ранжирование сайта в результатах поиска. Рассчитывается для всего сайта целиком. Описание от Яндекса. Посмотреть можно на PR-CY.
  3. Наличие контактной информации — повышает доверие к сайту. По неподтверждённым данным совпадение контактной информации с данными Whois положительно влияет на доверие к сайту. Возможно, на доверие положительно влияет выделение отдельного раздела Контакты.
  4. Интеграция сайта с Яндекс.Островами — предположительно увеличивает вес сайта в Яндексе. Описание для разработчика от куратора проекта и более подробное англоязычное описание от Яндекса.
  5. Структура сайта — важный фактор, влияющий на ранжирование сайта в поисковой выдаче. Для создания правильной структуры сайта желательно:
    • делать навигацию вложенной — от более общих материалов к более конкретным;
    • использовать карту сайта;
    • ограничивать индексирование служебной информации с помощью файла robots.txt.
    Обратите внимание на Рекомендации от Яндекса. Перспективным является использование Silo-структуры.
  6. Частота обновления — чем больше частота обновлений, тем выше ранжируется сайт в поисковой выдаче, что подтверждает Мэтт Каттс — руководитель команды Google по борьбе с веб-спамом. По неподтверждённым данным:
    • постоянная частота ценится выше, чем изменяющаяся;
    • объём обновлённого контента положительно влияет на ранжирование.
    Для определения частоты обновлений можно использовать Google, у него есть оператор daterange. Синтаксис оператора: Урл daterange Дата1-Дата2. Дата1 и Дата2 определяют временной промежуток, за который считаются обновления. Даты записываются в юлианском формате, для конверсии используйте данный конвертер.
  7. Сертификат SSL — увеличивает доверие к интернет-магазинам: комментарии от Яндекса, от Google. Возможно, что в ближайшем будущем его значение для остальных сайтов будет увеличиваться. Получение и особенности сертификатов описаны здесь.
  8. Битые ссылки — это ссылки с несуществующим урлом. Чем больше на сайте таких ссылок, тем меньше доверие к сайту. Проверить наличие битых на своих сайтах ссылок можно в Яндекс.Вебмастер (Индексирование сайтаИсключённые страницы) и Google Search Console (СканированиеОшибки сканирования) — после установки счётчиков на свои сайты. BrokenLinkLookUp производит поиск по любым сайтам, найденные битые ссылки скачиваются файлом.
  9. Методы рекламы, мешающие пользователю просматривать основной контент сайта — негативно влияют на ранжирование сайта в поисковых системах (Яндекс: о popunder-баннерах, о системах clickunder, о шокирующей рекламе, и о рекламе в контексте удобства сайта).
  10. Навигационные цепочки — предположительно повышают траст к сайту, предположительно за счёт улучшения юзабилити. Это косвенно подтверждается тем факом, что Яндекс умеет их распознавать и отображать в сниппетах сложных сайтов. Возможно, разделы навигационной цепочки влияют на присвоение тематики страницам/сайту.
  11. Тематика сайта — по непроверенным данным Яндекс присваивает тематику всему сайту, а Google присваивает тематику каждой странице. Узнать присвоенную тематику в Яндексе нельзя без прямой регистрации в Яндекс.Каталоге (платная регистрация, бесплатная регистрация), возможно для Google эту функцию выполняет DMOZ (для регистрации нужно выбрать тематику и перейти по ссылке suggest URL / предложить URL).
  12. Количество страниц с уникальным контентом — по непроверенным данным положительно влияет на трастовость сайта.
  13. Уникальность дизайна — по непроверенным данным поисковые системы оценивают шаблонность дизайна через анализ уникальности HTML-кода и CSS — и доверие к шаблонным сайтам ниже.
  14. Уникальность CMS — по непроверенным данным поисковые системы оценивают сайты на редких/индивидуальных CMS, либо без таковых — выше, чем сайты на стандартных CMS. По другим данным поисковые системы повышают вес сайтов, сделанных на CMS Wordpress.
  15. Условия и конфиденциальность — по неподтверждённым данным сайты с условиями и политикой конфиденциальности повышают трастовость сайта.

Факторы домена и хостинга

Влияют на ранжирование сайтов через степень доверия к сайту. Все описанные ниже факторы не подтверждены, если не указывается обратное.

  1. Припаркованные домены — не функционирующие полностью домены, сайты в стадии разработки, без содержания или почти без содержания. Google по большей части запрещает рекламировать припаркованные домены. Возможно, вес таких сайтов также снижен.
  2. Доменная зона — доменная зона указывает на определённый регион. В этом регионе сайт, расположенный на данном домене будет котироваться выше. При этом в других регионах. Общие доменные зоны (COM, ORG, NET, INFO и пр.) не имеют ни бонусов, ни штрафов при показе в зонах.
  3. Уровень домена — релевантность домена 3го уровня много ниже релевантности домена 2го уровня. Этим плохи бесплатные домены.
  4. Хостинг — влияет на доступность сайта. Продолжительное время недоступности сайта негативно сказывается на степени доверия к нему. Также на степень доверия влияет скорость загрузки сайта, она частично зависит от хостинга.
  5. География хостинга — по неподтверждённым данным местонахождение сервера может влиять на ранжирование при поиске с географической компонентой.
  6. Возраст домена — чем больше возраст домена, тем выше его релевантность. Возраст домена можно проверить практически в любом регистраторе доменных имён, например здесь.
  7. Длительность регистрации домена — чем больше длительность, тем выше доверие. Домены в зоне RU не арендуются на срок более 1 года, так что к ним этот фактор не относится.
  8. История домена — если у домена часто менялись владельцы или он длительное время не выкупался, то степень доверия к нему снижается к нулевой. Историю домена можно посмотреть здесь.
  9. Санкции — санкции, применённые к нескольким доменам владельца могут влиять на доверие к остальным сайтам этого же владельца. Владелец домена определяется в том числе через данные Whois.
  10. Сервер — если соседями по серверу являются спамеры, фишинговые сайты, сайты, распространяющих вредоносное программное обеспечение и т.д., это негативно влияет на доверие к сайту. Посмотреть IP своего сайта можно здесь, увидеть часть сайтов, расположенных на этом же IP-адресе (сервере) — здесь (кстати, по этому адресу можно получить много других интересных данных).
  11. Данные Whois — по неподтверждённым данным скрытые данные Whois котируются ниже открытых. Обратите внимание, что по умолчанию домены в зоне RU регистрируются с закрытыми данными Whois.

Поведенческие факторы

Поведенческие факторы влияют на уровень доверия к сайту.

  1. Установка счётчиковЯндекс.Метрика и Google Analytics необходима для ранжирования сайта, так как по показаниям этих счётчиков поисковые системы оценивают сайт по большинству перечисленных выше факторов.
  2. Кликабельность сайта, CTR — отношение количества переходов по ссылке из выдачи к количеству кликов по ссылке. Количество переходов можно оценить через сервис статистики (Яндекс.Метрика, Google Analytics, LiveInternet), установив соответствующий счётчик. Оценивается не только CTR сайта, но и CTR каждой страницы в отдельности.
    Посмотреть CTR своего сайта в Яндексе можно в Яндекс.Вебмастере:
    Поисковые запросыПопулярные запросы или
    Поисковые запросыМои запросыСтатистика (для этого нужно добавить запросы в соседнем подразделе Настройка).
    Посмотреть CTR своего сайта в Google можно в Поисковой панели Google:
    Поисковый трафикАнализ поисковых запросов.
    Оценить количество показов, учитывая наличие персонализации поиска для чужих сайтов не представляется возможным.
    Кликабельность сайта, CTR зависит от следующих факторов:
    • Положение сайта на странице выдачи — как описывалось выше, фактор неоцениваемый из-за персонализации поиска, но чтобы произвести примерную оценку можно использовать Яндекс.Вебмастер и Поисковую панель Google, LiveInternet для своих сайтов, сторонние ресурсы для оценки чужих позиций (таких сервисов много), а также анонимный браузер Тор.
    • Фавиконка — маленькая картинка слева от заголовка. Качественная фавиконка помогает выделить сайт.
    • Заголовок сниппета — в общем случае берётся из TITLE страницы, но если он отсутствует или по мнению Яндекса плохо описывает документ, будет выбран более информативный заголовок, содержащийся в теле документа (из заголовков H1, H2-H6, выделенных фраз. Также могут быть использованы данные, размеченные по стандарту Open Graph, если поисковые алгоритмы сочтут их наиболее информативными. Для выделения заголовка в общей выдаче можно использовать специальные символы (например, ☺ ★ ◸). Всё вышеописанное относится и к Google.
    • Описание сайта — в общем случае берётся из мета-тега <meta name="Description" content="..."/>, но если отсутствует или плохо описывает документ, то поисковая система выберет кусок текста, содержащий ключевую фразу.
    • Урл — человеческий-понятный урл (ЧПУ) помогает пользователю увидеть структуру сайта и название раздела в этой структуре.
    • Быстрые ссылки — дополнительные ссылки в сниппете. Могут быть как короткими (анкоры ссылок), так и расширенным. Рекомендации от Яндекса, от Google.
    • Расширенный сниппет — автоматически добавляемые данные из других сервисов поисковой системы. Перечень данных от Яндекса, от Google.
  3. Показатель отказов — количество выходов со страницы без каких-либо действий. Отрицательно влияет на доверие к сайту, так как показывает незаинтересованность пользователя сайтом. Показатель отказов для Яндекса и для Google незначительно отличаются. Показывается на главных страницах Метрики и Analytics.
  4. Глубина просмотра — положительно влияет на доверие к сайту, так как показывает интерес пользователя. Показывается на главных страницах Метрики и Analytics.
  5. Время на сайте и на конкретной странице — положительно влияет на доверие к сайту. Показывается на главных страницах Метрики и Analytics. Показатель отказов, глубина просмотра и время на сайте зависит от юзабилити сайта.
  6. Прямые заходы — положительно влияют на доверие к сайту, так как означают, что контент интересен, так как пользователь запомнил ссылку или перешёл из закладок.
    Метрика: на главной странице или ОтчётыСтандартные отчётыИсточникиИсточники, сводка.
    Analytics: Источники трафика Обзор → (Direct — это прямые заходы).
  7. Повторные заходы — положительно влияют на доверие к сайту, так как означают, что контент интересен.
    Метрика: на главной странице как разница между Посетители и Новые посетители, либо через Фильтры.
    Analytics: ПоведениеНовые и вернувшиеся.
  8. Комментарии — положительно влияют на доверие к сайту. Добавляйте возможность комментирования, мотивируйте оставлять комментарии. Здесь важно понимать, что большое количество негативных отзывов, наоборот, могут привлечь внимание поисковых систем и вызвать ручные санкции.
  9. Цитируемость в социальных сетях — положительно влияет на доверие к сайту. Ставьте кнопки, мотивируйте ставить лайки и подписываться.
    Метрика: ОтчётыСтандартные отчётыСодержаниеКнопка "Поделиться — социальные сервисы.
    Analytics: Источники трафикаСоцфункцииАктивность в социальных сетях.
  10. Закладки — в Яндекс.Браузере для Яндекса и Google Chrome для Google. Частично эту информацию можно оценить по количеству прямых заходов, точную информацию получить невозможно.
  11. Характер движения курсора и схема движения по сайту — анализируется поисковыми системами для выделения программ, имитирующих поведение пользователя. Выявление таких программ отрицательно влияет на рейтинг сайта.

Социальные сигналы

Поисковые системы не раскрывают социальные сигналы, поэтому всё нижеописанные является предположениями. Социальные сигналы увеличивают доверие (трастовость) страницы и — в меньшей степени — сайта.

  1. Лайки социальных сетей, твиты (Twitter), пины (Pinterest) — увеличивает доверие к понравившейся странице. Возможно, поисковые системы также определяют вес пользователя (через количество друзей, обратных лайков, активность и другие показатели) и вес пользователя влияет на вес лайка. Возможно, поисковые системы определяют и релевантность пользователя тому контенту, который он лайкнул (через анализ его ленты). Возможно, также имеют значение сигналы Reddit, StumbleUpon, Digg.
  2. Подтверждённое авторство в Google — увеличивает доверие к ресурсам, принадлежащим проверенному автору, и размещаемым им ссылкам (как подтвердить авторство в Google можно прочитать здесь).
  3. Наличие в Google+ — Google увеличивает трастовость сайтов, добавленных в их собственную социальную сеть.
  4. Обратные ссылки на сайт в социальных сетях — увеличивают доверие к странице/сайту, увеличивают скорость индексации страницы (ссылки в поисковых системах индексируются быстрее). Возможно, вес обратных ссылок зависит от веса и релевантности пользователя. Возможно на вес также влияет наличие репостов.
  5. Группы в социальных сетях — похоже, что влияет не столько само наличие группы, сколько динамика её роста, активность участников группы, количество и качество лайков/фолловеров группы внутри социальной сети.
  6. RSS-подписчики — подписчики, читающие обновления вашего в виде RSS-ленты. повышают доверие к сайту. Здесь описание того, как создать RSS-ленту.
  7. Возможность комментирования на странице — позитивный сигнал, однако с ним нужно быть осторожнее, так как негативные комментарии могут снизить трастовость страницы.

Брендовые факторы

Эта группа факторов не подтверждается поисковыми система и является предположительной. Под брендом понимается уникальное название компании/сайта. Суть использования факторов в увеличении доверия к бренду, используя те же принципы, что и в увеличении доверия к странице/сайту. По ключевым фразам с названием бренда в выдаче может быть несколько результатов с одного сайта.

  1. Ссылки с брендом — ссылки с названием бренда в анкоре повышают доверие к бренду.
  2. Цитируемость бренда — ссылки с названием бренда в анкоре повышают доверие к бренду. Но доверие к бренду повышают и простые упоминания бренда — без ссылки.
  3. Физический адрес — наличие адреса на Яндекс.Картах (добавляется через Яндекс.Справочник) и в Google Картах (добавляется через Google Мой бизнес) увеличивает доверие к бренду.
  4. Номер телефона — повышает доверие к бренду. По неподтверждённым данным номера с кодом города ценятся выше, чем с кодом мобильных операторов, а код 800 ценится выше, чем код города.
  5. Количество запросов бренда в поисковой системе — количество запросов названия организации влияет на определение этой компании как бренда, и увеличивает доверие к бренду.
  6. Представительство в социальной сети — активные профили, группы и пр. увеличивают доверие к бренду. Также увеличивают доверие участники группы/профиля и фолловеры, указывающие, что они сотрудники компании-бренда. Социальные сети, возможно, положительно влияющие на доверие к бренду: Facebook, Вконтакте, Twitter, Google+, Pinterest, Linkedin, Reddit, StumbleUpon, Digg.
  7. Реклама в сообществах социальных сетей положительно влияет на доверие к бренду.
  8. Организация конкурсов в сообществах социальных сетей — положительно влияет на доверие к бренду.
  9. Информационная поддержка, другие виды поддержки, спонсорство — положительно влияют на доверие к бренду.
  10. Упоминание бренда на новостных сайтах — помимо просто увеличения количества переходов с Яндекс.Новости и Google News, повышает и доверие к нему.

Коммерческие факторы

Относятся к сфере электронной коммерции, не подтверждены.

  1. Соответствие цен средним по рынку — увеличивает доверие к магазину, а более низкие цены влияют на ранжирование (слишком низкие цены снизят доверие).
  2. Ассортимент, наличие товара в интернет-магазине — влияет на ранжирование в выдаче.
  3. Карточка товара детализация и полнота информации о товаре влияет на ранжирование (впрочем, это может быть следствием общего увеличения веса страницы ввиду увеличения количества и качества контента, плотности ключевой фразы и пр.).
  4. Информация о доставке — увеличивает доверие к магазину.
  5. Онлайн-консультант — увеличивает доверие к магазину.
  6. Скидки, акции — увеличивают доверие к магазину. Также возможно, увеличение доверия от наличия скидок на купонных сайтах.
  7. Google Покупки — Google иногда показывает Google Покупки (описание в Вики) в органической выдаче.

Алгоритмы и фильтры

Алгоритмы Яндекса

Без названия
Города
Острова
23/09/97 Алгоритмы морфологического разбора, основанные на грамматическом словаре, умеют нормализовать слова, то есть находить их начальную форму. Для неизвестных Яndex'у слов строится гипотетическая словарная статья, позволяющая обрабатывать (анализировать и синтезировать) такие слова аналогично известным.
Найденные документы отсортированы по релевантности, которая учитывает не только «контрастность» слова, то есть его относительную частоту для данного документа, но и расстояние между словами, и положение слова в документе.
Пресс-релизы
05/04/00 Индекс цитирования — мера популярности Web-ресурса среди авторов и хозяев других ресурсов (среди "писателей"). Этим он принципиально отличается от счетчиков посещений, которые измеряют популярность ресурса у пользователей (среди "читателей"). Пресс-релизы
06/06/00 Теперь поиск осуществляется не только по веб-страницам, но и по специализированным массивам данных.
Уже 2 года запрос на естественном языке поисковой системы Yandex учитывает морфологию русского языка и использует механизм нечеткого поиска. В новой версии в него встроен синтаксический анализ. Между словами запроса устанавливаются синтаксические зависимости которые используются для внутреннего преобразования запроса и дальнейшего отбора документов и ранжирования.
Пресс-релизы
23/05/01 Новая версия поиска максимально использует дополнительную информацию, извлекаемую из самой гипертекстовой природы интернета. А именно, теперь при каждом поиске и для каждой найденной страницы анализируется кто, как часто и какими словами на нее ссылается. Пресс-релизы
26/03/04 Новый алгоритм учитывает социальную структуру интернета. Он умеет отличать мнение людей от технической, вспомогательной и рекламной информации, то есть лучше распознавать, какой ресурс является авторитетным в своей области.
Также введена дополнительная очистка результатов поиска от дубликатов. Теперь пользователь избавлен от повторения в списке найденного почти одинаковой информации.
Пресс-релизы
25/09/05 Документы, посвященные именно теме запроса, а не более широким или более узким темам, теперь в результатах поиска показываются выше, а по названиям компаний наверху чаще встречаются сайты этих компаний, а не их партнеров или магазинов. Яндекс.Блог
02/07/07 Сегодня ночью на поиске в одном из дата-центров Яндекса обновится алгоритм ранжирования. В течение нескольких дней по одному и тому же запросу результаты у разных пользователей могут заметно отличаться, это нормально. Как только во всех дата-центрах будет работать одинаковый поиск, разница станет незначительной. Садовский
Алгоритм стал запросозависимым — для однословных и многословных запросов стали применяться разные формулы ранжирования. ? SiteClinic
07/08/07
Родео
Сегодня ночью на поиске Яндекса обновлен алгоритм ранжирования по однословным запросам. В результате изменений выросло число учитываемых по таким запросам компонент релевантности и перенастроена формула в целом. Садовский
Приоритет по однословникам в выдаче получили главные страницы («морды»). ? SiteClinic
17/01/08
Восьмёрка SP1
? Блог для вебмастеров
Меняется отношение к внешним ссылкам. Снижение веса ссылок с «морд». Вебмастера массово переходят на покупку ссылок с внутренних страниц доноров. ? SiteClinic
18/03/08 Ссылки с главных страниц теряют вес. Массовая просадка сайтов, которые держались в топах за счет ссылок с морд. Ссылки с внутренних страниц продолжают работать. ? SiteClinic
14/04/08
Магадан
Мы увеличили число факторов ранжирования вдвое и улучшили некоторые внедренные ранее. Добавили классификаторы, позволяющих лучше понять тип страницы и тип ссылок. Начали глубже понимать текст страницы и его качество. Изменили технологию поиска так, что мы можем быстро выбрать наиболее релевантные документы в первую очередь и не ждать поиска по остальным страницам. Мы смягчили фильтрацию отбора документов для ранжирования, что привело к улучшению ранжирования по запросам, для которых релевантные документы содержат слова запроса далеко друг от друга. Мы научились обрабатывать при поиске аббревиатуры и написания транслитом. Наиболее заметных улучшений мы смогли достичь в обработке многословных запросов. Блог для вебмастеров
16/05/08
Магадан
Удвоено количество факторов ранжирования.
Поиск Яндекса понимает аббревиатуры и слова, написанные «транслитом».
Пресс-релизы
В новую поисковую программу добавлено множество улучшений, например:
  • немного умнее определяется, что такое слово,
  • в писке, кроме слов из текста страницы, участвуют перевод и транслитерация частей URL,
  • увеличена обучающая выборка для статистического морфологического анализатора, что повысило точность распознавания фамилий и географических названий.
Блог для вебмастеров
В формулу ранжирования, которая определяет релевантность страниц, входит множество факторов, как зависящих от запроса, так и статических по отношению к нему (они характеризут страницу или сайт, а не пару "страница-запрос"). На стадии прюнинга на основе всех статических факторов для каждого документа оценивается вероятность того, что он окажется релевантным запросу. Если вероятность низкая, документ дальше не анализируется. Блог для вебмастеров
Теперь поиск Яндекса (версия «Магадан») еще учитывает следующие отношения:
  • некоторые типы переходов из одной части речи в другую;
  • транслитерация;
  • аббревиатуры.
Блог для вебмастеров
Выдача по информационным запросам. ? SiteClinic
02/07/08
Магадан 2.0
С сегодняшнего дня на www.yandex.ru работает поисковая программа "Магадан 2.0". В ней сделано много улучшений в алгоритме ранжирования, например, добавлены новые факторы, учитывающие уникальность контента, классификатор порнографии, геоклассификатор запроса, классификатор коммерциализированности, и многие другие. Блог для вебмастеров
Большой вес получил фактор уникальности текстов. Яндекс научился определять и по-другому ранжировать коммерческие запросы. Значение возраста сайта понижено. ? SiteClinic
09/07/08
Находка
Основные изменения в программе связаны с новым подходом к машинному обучению и, как следствие, отличиями в способе учета факторов ранжирования в формуле. Блог для вебмастеров
28/08/08 Нововведение коснулось сайтов, которые накручивали тИЦ по специальным схемам. У около 15% сайтов тИЦ снизился до 0-10. ? SiteClinic
11/09/08
Находка
Основные изменения связаны с отличиями в способе учета стоп-слов (выросло качество ранжирования по запросам со стоп-словами) и новым подходом к машинному обучению. Заметно расширен тезаурус путем автоматического анализа проиндексированного корпуса текстов. Блог для вебмастеров
Также было замечено, что по некоторым запросам в поисковой выдаче Яндекса стали появляться старые информационные сайты, в частности, Википедия. В связи с чем оптимизаторами сделаны выводы, что возраст домена и сайта играют роль в продвижении. ? WebEffector
Повышение веса внутренних страниц – в выдаче по СЧ и некоторым ВЧ параллельно с мордами появились внутряки.

Морфологические изменения, отличия в выдаче по запросу в единственном и множественном числах.

Подмешивание информационных сайтов в выдачу по коммерческим запросам. Википедия в выдаче.
? SiteClinic
10/04/09
Арзамас
Регион пользователя учитывается при ответах на запросы, которые касаются местных реалий.
Регион, в котором находится пользователь, Яндекс определяет автоматически, как и регион того или иного сайта.
Блог для вебмастеров
Теперь поиск Яндекса учитывает регион пользователя. Начиная с "Арзамаса", результаты поиска по одному и тому же запросу могут быть разными в разных регионах.

В ранжировании стали учитываться факторы, позволяющие понять, что данная страница важна пользователям именно "своего" региона.

Для ряда регионов мы используем специально настроенную формулу ранжирования.
Блог для вебмастеров
Яндекс начал показывать картинки над результатами веб-поиска. Блог для вебмастеров
При ранжировании по запросам с неоднозначным смыслом стала учитываться история уточняющих запросов. ? SiteClinic
17/06/09
Арзамас 1.1
Улучшена формула ранжирования для регионов России, исключая Москву и Санкт-Петербург. Повысилась значимость возраста домена. В выдаче замечены страницы с портянками текста и малым количеством бэклинков. ? SiteClinic
Изменилась формула ранжирования, которая будет определять результаты поиска для пользователей из России, исключая Москву, Санкт-Петербург и Екатеринбург. Блог для вебмастеров
17/07/09
Арзамас 1.2
В новой версии поисковой программы мы улучшили классификатор гео-зависимости запросов.
Очевидно, что не для каждого запроса важно учитывать регион пользователя и сайта, во многих случаях более значимы другие признаки: авторитетность, качество контента и т.п.
Блог для вебмастеров
20/08/09
Арзамас 1.2
В поисковой программе, работающей на www.yandex.ru, обновлен классификатор гео-зависимости запросов. Блог для вебмастеров
Разделение запросов на геозависимые и геонезависимые. Приоритет старых трастовых сайтов в выдаче по ГНЗ. В топах по ГНЗ показываются преимущественно морды. ? SiteClinic
23/09/09
Арзамас 1.5
Улучшена общая формула ранжирования. Она определяет порядок результатов поиска по гео-независимым запросам и запросам из городов, где нет локализованного ранжирования. Блог для вебмастеров
28/09/09
Арзамас 1.5 SP1
Выложена обновленная версия поисковой программы Арзамас 1.5, в которой к новой общей формуле ранжирования добавлена улучшенная региональная. Блог для вебмастеров
12/10/09
Арзамас 1.5 SP1
Яндекс научился еще лучше понимать русский язык, разрешая неоднозначности слов в запросах.

Мы реализовали алгоритм снятия омонимии, позволяющий во многих случаях определить, какое слово имеется в виду, и предлагаем в ответ только документы с формами нужного слова.

Алгоритм снятия омонимии основан на анализе данных запросов наших пользователей, учитывает частоту слов в Интернете и их сочетаемость, а также опирается на лексическую статистику слов из Национального корпуса русского языка — академического проекта, разрабатываемого при поддержке Яндекса. При анализе неоднозначного запроса мы выбираем наиболее частотную модель.
Пресс-релизы
17/11/09
Снежинск
Нам удалось создать более точную и гораздо более сложную математическую модель, которая привела к существенному приросту в качестве поиска. Благодаря переработке архитектуры ранжирования (англ., pdf) в поиске удалось реализовать учет нескольких тысяч поисковых параметров для одного документа.
Продолжая хорошую традицию, мы внедрили в "Снежинске" дополнительные региональные факторы, основанные на интересе пользователей к документам. Они позволят повысить точность поиска в 19 городах с локальным ранжированием.
Блог для вебмастеров
В этой версии мы впервые применили наш новый алгоритм машинного обучения Матрикснет, который позволил в разы увеличить количество учитываемых при ранжировании параметров. Блог для вебмастеров
Поменялся принцип ранжирования коммерческих запросов. Качество сайта в целом стало играть бОльшую роль, чем релевантность отдельной страницы.
Яндекс научился отличать коммерческие ссылки от некоммерческих на основании анализа анкоров (Мадридский доклад).
? SiteClinic
22/12/09
Снежинск-Конаково
Работает новая версия поисковой поисковой программы "Снежинск". В ней еще шире используются возможности нашего нового алгоритма MatrixNet. В обновленной версии, которая в честь родного города одного из разработчиков команды поиска получила неофициальное название "Конаково", локальное ранжирование теперь работает не только для 19 крупнейших регионов, как это было в программе "Арзамас", но также и для 1250 городов по всей России. Блог для вебмастеров
10/03/10
Снежинск 1.1
Улучшена общая формула ранжирования для пользователей из России. Она определяет порядок результатов поиска по гео-независимым запросам. Клуб Яндекс.Поиск
Обновление формулы ранжирования по НГЗ запросам. Приоритет в выдаче получили сайты некоммерческой направленности — энциклопедии, обзоры.
НГЗ запросы — негеозависимые запросы.
? SiteClinic
06/08/10
Обнинск
Улучшено ранжирование по гео-независимым запросам пользователей из России. Блог для вебмастеров
Сложность формулы ранжирования выросла почти в два с половиной раза, и теперь объем формулы составляет 280 Мбайт. Клуб Яндекс.Поиск
Улучшено определение региональности сайтов. В выдаче по ГНЗ запросам преимущество получили сайты без привязки к региону. Изменилось отношение к коммерческим ссылкам. Наложение «фильтра времени» на коммерческие ссылки – донор начинает передавать вес акцептору только через 2-4 месяца от момента появления ссылки. ? SiteClinic
02/11/10 Изменения алгоритма определения авторства документа. ? SiteClinic
17/12/10
Краснодар
Сегодня была запущена новая поисковая программа "Краснодар", в основу которой легла технология Спектр. Блог для вебмастеров
Со вчерашнего дня результаты поиска по ним ранжируются с помощью формулы с обновленным набором региональных факторов.
Местных сайтов в выдаче по региональным запросам стало существенно больше. Изменения заметны во всех 1250 городах, для которых существует региональное ранжирование, но особенно в небольших — где не очень много локального контента.
Блог для вебмастеров
Отличительной чертой данной технологии стало т.н. «разбавление выдачи» по общим запросам (всего порядка 60 категорий запросов   города, товары и т.п.). 60 категорий было на момент релиза, было запланировано увеличить их количество.

Если пользователь не достаточно конкретизировал свой запрос, то Яндекс постарается выводить ему сайты в соответствии с этими категориями.

А также начал индексацию социальной сети Вконтакте и научился показывать в результатах своей выдачи профили пользователей из ВК.
? WebEffector
Разделение сайтов на 60 смысловых категорий. Принцип квоты для сайтов из разных категорий в выдаче по запросам общего характера. Результаты поиска по ВЧ стали более разнообразными — в Топ 10 по общему ВЧ можно было встретить интернет-магазин, энциклопедию и форум.
Приоритет поведенческих факторов (действия пользователя на странице результатов выдачи).
? SiteClinic
В каждом регионе привилегию получили сайты с привязкой к этому региону. Продвигать один сайт в нескольких регионах стало проблематично. ? SiteClinic
17/08/11
Рейкьявик
Теперь люди, которые чаще ищут англоязычные ресурсы, будут видеть в результатах поиска больше ссылок на них, и наоборот. Это первый шаг Яндекса в направлении персонализации поиска. Пресс-релизы
Алгоритмы «Рейкьявика» самообучаемые — если пользователь освоит английский и начнёт выбирать сайты на этом языке, то и система переобучится. Яндекс.Блог
Построение результатов выдачи на базе языковых предпочтений пользователя. Первый шаг к персонализации выдачи на уровне конкретного посетителя. ? SiteClinic
14/09/11 Мы подобрали новую формулу ранжирования. При подборе использовались новые оценки асессоров и новые факторы. Основные изменения в ранжировании касаются коммерческих сайтов московского региона. Блог для вебмастеров
хх/09/11 Недавно мы разработали новый алгоритм, с помощью которого можно точнее предполагать, что предоставление нескольких релевантных ответов с одного сайта лучше, чем ответ разными источниками. Блог для вебмастеров
23/11/11 Для Яндекса важно, чтобы пользователь, перейдя на сайт из результатов поиска, быстро и удобно решил стоящую перед ним задачу. Какими свойствами для этого должен обладать сайт и, что не менее важно, стоящий за ним бизнес?
  • Узнаваемый бренд, максимально полная контактная информация, отзывы реальных покупателей, портфолио.
  • Качественные описания и фотографии товара, удобный поиск и возможность сравнения по различным параметрам, рейтинги, обзоры, рекомендации для разных групп покупателей. Процесс заказа должен быть максимально простым и понятным — без заполнения огромных форм с большим количеством параметров.
  • Широкий ассортимент.
  • Цена товара должна быть адекватной.
  • Пользователю должен предоставляться широкий выбор способов оплаты и доставки товара — большая сеть филиалов и пунктов самовывоза, быстрая и недорогая доставка.

В новой версии формулы ранжирования коммерческих запросов для Московского региона мы начали учитывать перечисленные характеристики качества сайтов и будем развивать это направление.



Блог для вебмастеров
Формула ранжирования пополнилась коммерческими факторами: удобство сайта, ассортимент продукции, цены, сервис и т.д. Изначально релиз был запущен для московской выдачи, со временем распространился на другие регионы. Яндекс.Блог
12/12/12
Калининград
Калининградский персональный поиск учитывает при ответе поведение каждого конкретного пользователя, его предпочтения. Яндекс.Блог
В основе персонального поиска лежит анализ поискового поведения. Анализируя вопросы и переходы пользователя, Яндекс делает вывод о том, что ему сейчас важно и интересно. Эти данные учитываются как при выборе подсказок, так и при поиске персонального ответа на вопрос. Технологии
В начале декабря 2012 года появился алгоритм «Калининград», который ввёл глобальную персонализацию поиска. Теперь результаты поиска подстраиваются под интересы пользователя.

Данные интересы Яндекс изучает по ранним запросам пользователя в поиске, а также по поведению пользователя на сайтах, статистика которых ему известна.

Информацию об интересах пользователей Яндекс пополняет раз в сутки и делит эти интересы на долговременные и кратковременные.
? WebEffector
Попытка подстроить Топ-10 и поисковые подсказки под каждого пользователя, основываясь на истории его запросов и поведения на странице выдачи. Согласно исследованию платформы «Калининград», объемы трафика у старых трастовых сайтов выросли. А вот продвигать молодые ресурсы в персональном поиске привычными методами стало сложнее. ? SiteClinic
16/05/13
Острова
«Острова» позволяют по-новому представить сайты в поиске Яндекса — в виде интерактивных ответов. С их помощью пользователи смогут начать взаимодействовать с ресурсом прямо в результатах поиска.
С помощью новой платформы любой владелец сайта может создать на Яндексе свой интерактивный блок — остров. Он может разместить на нем кнопки или формы своего сайта, которые могут пригодиться пользователю.
Яндекс.Блог
Яндекс научился учитывать эти сиюминутные интересы на основе недавней поисковой истории пользователя и сразу же адаптировать под них результаты поиска.
Учёт сиюминутных интересов начинает влиять на результаты поиска уже через несколько секунд, даже если человек впервые зашел на Яндекс и задал всего пару вопросов.
Яндекс.Блог
Теперь мы делаем важный шаг: веб-мастера смогут сделать свои сайты более заметными и доступными в поиске, а пользователи станут ближе к цели.
Ответы на популярные вопросы об Островах.
Блог для вебмастеров
30/05/13
Дублин
Персональный поиск умеет учитывать личные интересы и предпочтения пользователя и выбирать наиболее подходящий для него ответ.
В основе персонального поиска лежит анализ поискового поведения — например, какие запросы задает человек, на какие сайты переходит, на каком языке общается с поисковой системой. Анализируя вопросы и переходы пользователя, Яндекс делает вывод о том, что ему сейчас важно и интересно.
Яндекс.Блог
Яндекс обновил персональный поиск. Теперь он умеет учитывать не только постоянные интересы пользователя, но и сиюминутные. Технологии
Яндекс обновил персональный поиск. Теперь он умеет учитывать не только постоянные интересы пользователя, но и сиюминутные. ? WebEffector
26/07/13
Острова
Базовая идея: ответ — это нечто большее, чем фрагмент найденного в интернете документа, это некий умный виджет, который помогает вам решить задачу. Яндекс.Блог
Бета-версия Блог для вебмастеров
хх/10/13
Острова
Запуск модерации. Блог для вебмастеров
хх/11/13
Острова
Основные ошибки вебмастеров. Блог для вебмастеров
06/12/13 В следующем году мы перестанем учитывать ссылки в ранжировании по коммерческим запросам. Блог для вебмастеров
14/01/14
Острова
Мы анонсировали взаимодействие островов с сайтом в реальном времени и возможность завершения задачи на странице результатов поиска. Мы усердно работали над развитием этих идей и у нас уже есть что вам показать. Блог для вебмастеров
12/03/14 Сегодня мы перестаем учитывать ссылки в ранжировании по коммерческим запросам. Блог для вебмастеров
Обновление формулы ссылочного ранжирования для коммерческих запросов (Москва) в тематиках «Недвижимость», «Туризм», «Электроника и бытовая техника». ? SiteClinic
10/04/14
Острова
До сих пор попасть на beta.yandex.ru могли только острова сайтов с тИЦ больше 200. Сегодня мы снимаем это ограничение. Блог для вебмастеров
хх/06/14 Изменение формулы текстового ранжирования по коммерческим запросам. Расширение списка тематик с отключенным ссылочным ранжированием. Изменение классификатора поисковых запросов. ? SiteClinic
09/07/14
Острова
Сегодня мы делаем следующий шаг и запускаем эксперимент на yandex.ru. Блог для вебмастеров
14/09/15 В течение последних трех месяцев на части запросов Яндекс тестировал новый подход к определению релевантности документов.

Традиционный подход заключается в использовании заранее имеющейся информации о факторах, извлекаемых непосредственно после индексации документа, а также последующей "корректировке" релевантного топа с учетом пользовательского поведения на сайте.
Мы применяем комбинацию так называемого эксплуатирующего подхода, основанного исключительно на априорной релевантности документа, и экспериментирующего, — целью которого является сбор максимума информации о документах.

Блог для вебмастеров

Фильтры Яндекса

Спам-фильтры [SPAM]
Ссылочные фильтры [ANC]
Рекламные фильтры, опасный контент [ADV]
01/06/99 [SPAM] Спам — это заголовки и ключевые слова, сдобренные большим количеством самых популярных запросов, большие массивы текста, "написанные" на странице цветом фона или очень мелким шрифтом, а также многие другие уловки с целью привлечения пользователя на свои страницы обманом. Яndex отслеживает такие ненормальные изменения и снижает место документа на странице результатов. Пресс-релизы
хх/хх/05 [ANC] Внешние ссылки с сайтов, занимающихся активной линкоторговлей, перестали передавать вес. Оптимизаторы начинают использовать метки в анкорах, чтобы идентифицировать занепоченные площадки. ? SiteClinic
хх/хх/06 [ANC] Симптом фильтра — в выдаче остается от 1 до 10 страниц сайта. Первый релиз коснулся в основном автоматически наполняемых ресурсов и сайтов с неуникальным контентом. Первое официальное упоминание — 28 сентября 2009. ? SiteClinic
хх/хх/07 [SPAM] Мы стараемся не индексировать или не ранжировать высоко группы сайтов одного владельца/компании, предоставляющие пользователю одни и те же товары или услуги, созданные с целью заполнения нескольких позиций в результатах поиска и сбора трафика. Яндекс.Помощь
[SPAM] Действие фильтра заключается в выдаче одного из аффилиатов, при этом остальные поисковая система блокирует. WebEffector
08/03/07 [SPAM] Фильтр предназначен для улучшения поисковой выдачи при помощи снижения ранжирования страниц, не представляющих ценной информации для пользователя. WebEffector
[SPAM] Первое упоминание, обсуждение. SearchEngines
20/12/07 [ANC] Мы начали учитывать много новых факторов, характеризующих страницу, ссылки на страницу, сайт в целом; лучше понимать тип запроса. Алгоритм стал более придирчиво относиться к качеству ссылок на страницу, научившись различать некоторые виды ссылочных накруток. Блог для вебмастеров
05/02/08
Непот в тумане
Ссылки с сайтов, находящихся под непотом, получили минимальный вес (близкий к нулю). С этого момента стало невозможным определять «занепоченные» площадки с помощью меток в анкорах. ? SiteClinic
18/03/08 [ANC] В настоящий момент мы приняли меры для уменьшения влияния SEO-ссылок с наиболее популярных сайтов Рунета.
При этом мы не гарантируем, что ранг сайтов, продающих ссылки, не понизится.
Блог для вебмастеров
28/08/08 [ANC] Мы внесли изменения в алгоритм расчета тематического индекса цитирования, который многими пользователями рассматривается как уровень авторитетности сайта в своей теме. Они носят технический характер и связаны с более корректным учетом (или неучетом) SEO-ссылок.
Это не означает санкций по отношению к их сайтам, а говорит о том, что на их сайт есть много SEO-ссылок, которые мы перестанем учитывать.
Блог для вебмастеров
28/10/08 [ANC] Некоторые сайты при переходе на них с поисковых систем осуществляют редирект в родительском окне на посторонние ресурсы.
Мы считаем, что такое поведение вводит в заблуждение пользователей, и будем исключать из поиска сайты, осуществляющие редирект в родительском окне, независимо от ценности контента и авторитетности ресурса.
Блог для вебмастеров
30/04/09 [ADV] Яндекс начал отслеживать наличие баннеров, реагирующих на "закрытие" открытием окна, и сайты, размещающие их на своих страницах, будут располагаться в поисковой выдаче ниже, чем сайты, перейдя на которые пользователь сможет быстро найти ответ на свой вопрос, не получив "в нагрузку" нежданных окон с рекламой. Блог для вебмастеров
18/12/09 [ANC] Во второй половине 2009 года количество исключаемых из индекса некачественных сайтов стало расти, и мы решили официально объявить о существовании алгоритма АГС-17, предназначенного для их фильтрации в результатах поиска.

Новый алгоритм, основанный примерно на ста факторах, стал значительно умнее, быстрее и полнее старого, при этом его точность продолжает оставаться очень высокой. Новый алгоритм получил название АГС-30.

АГС — АнтиГовноСайт.
Блог для вебмастеров
18/12/09 [SPAM] Расширилось число факторов, влияющих на решение алгоритма исключить сайт из индекса. С этого момента под фильтры начали попадать и псевдоСДЛ — сайты с технически уникальным, но не интересным для пользователей контентом.

Фильтр мог накладываться как вручную, так и автоматически.

СДЛ — сайты для людей.
? SiteClinic
20/01/10
Переспам, он же: -20, портяночный
[SPAM] Санкции за длинные тексты («портянки»), переспамленные ключевыми словами. Фильтр накладывался на отдельные страницы и лечился сокращением текста в несколько раз (при этом плотность ключевиков могла оставаться на том же уровне). Другой источник. ? SiteClinic
01/06/10 [ADV] Недавно мы значительно улучшили точность и полноту алгоритма классификации "взрослости" документов.
Существенный вклад в качество фильтрации внес алгоритм обнаружения баннерной рекламы порнографического содержания: документы, содержащие такую рекламу, мы также удаляем из результатов "семейного поиска".
Блог для вебмастеров
23/09/10 [ADV] За последний месяц был произведен ряд изменений в поисковом алгоритме, чтобы существенно ограничить влияние SEO-ссылок на ранжирование. В первую очередь это относится к SEO-ссылкам с сайтов, содержащих некачественный контент, и к недавно появившимся SEO-ссылкам. Блог для вебмастеров
02/11/10 [SPAM] Благодаря сегодняшнему обновлению страницы, содержащие авторский контент, стали ранжироваться лучше. Блог для вебмастеров
23/05/11 [SPAM] В последнее время мы видим попытки повлиять на поисковую систему путем эмуляции действий пользователей. Чаще всего это происходит с помощью программ, которые задают запросы в поисковую систему и потом переходят на определенные сайты, но известны и другие способы.
Яндекс настоятельно рекомендует владельцам сайтов, веб-мастерам и компаниям, предоставляющим услуги в области SEO, воздержаться от использования этого и других методов псевдооптимизации. Они бесперспективны и могут привести к потере вашим сайтом репутации и позиций в результатах поиска.
Блог для вебмастеров
[SPAM] Были понижены позиции известных SEO-компаний и их клиентов. ? SiteClinic
13/09/11 [SPAM] На следующей неделе начнет работу новый поисковый алгоритм, влияющий на ранжирование страниц, содержащих чрезмерно оптимизированные тексты. Этот алгоритм анализирует контент на проиндексированных страницах и оценивает, является ли он полезным и удобным для посетителей сайта. Если алгоритм определит, что контент создан для влияния на поисковую систему и повышения релевантности, позиции этого документа в выдаче могут ухудшиться. Блог для вебмастеров
[SPAM] Санкции за переспамленные тексты. Первый фильтр Яндекса, учитывающий ПФ (понижались только те спамные тексты, которые имели низкие поведенческие показатели). Изначально фильтр был запросозависимым и накладывался на отдельные страницы. ? SiteClinic
05/10/11 [ADV] Основные проблемы юзабилити сайтов — это отсутствие хорошей навигации, сложная или запутанная структура, неудачное расположение элементов сайта, неуместное использование рекламы. Чтобы пользователи поиска могли легко получить ответ на свой вопрос, мы начинаем учитывать при ранжировании сайтов их удобство.
В качестве первого шага мы научили поиск определять, мешает ли пользователям реклама на сайте или, наоборот, дополняет его содержание. Формула ранжирования пополнилась ещё несколькими факторами. Теперь она учитывает, например, затрудняет ли реклама доступ к основному контенту, перекрывает ли она текст, остаётся ли сайт с такой рекламой популярным. И ресурсы, на которых реклама используется уместно, оказываются в результатах поиска выше, чем сайты, на которых реклама мешает пользователям.
Блог для вебмастеров
[ADV] С этого момента в выдаче автоматически понижаются перенасыщенные рекламой сайты, а ресурсы с неудобной навигацией начинают испытывать проблемы при продвижении. ? SiteClinic
15/05/12 [ADV] Мы не хотим высоко ранжировать сайты, которые содержат «уведомления», обманывающие пользователей, маскируясь под то, чем на самом деле не являются. Блог для вебмастеров
[ADV] Сайты со всплывающими окнами, заточенными под системные уведомления или сообщения социальных систем, стали понижаться в выдаче автоматически. ? SiteClinic
06/11/13 [ANC] Мы обновили алгоритм, чтобы он больше соответствовал современному состоянию рунета. Основной принцип при этом остался неизменным: новый классификатор также ориентирован на малополезные сайты, создаваемые, как правило, для продажи ссылок. Блог для вебмастеров
[ANC] Обновился набор показателей низкого качества контента. Основной причиной наложения фильтра стало отсутствие добавочной ценности сайта. Фильтр затронул в основном МФА-сайты и ресурсы, созданные под монетизацию на партнерских программах, и стал полностью автоматизированным. Подробнее о фильтре. ? SiteClinic
23/12/13 [SPAM] За последнее время мы встретили, например, такие спам-методы:
  • создание ботнета, эмулирующего действия тысяч пользователей в течение длительного времени;
  • распространение программ, эмулирующих действия пользователей;
  • привлечение заинтересованных пользователей для выполнения определенных действий в поисковой системе с помощью специально созданного либо уже существующего публичного сервиса.

Подобные методы мы рассматриваем как спам и предпринимаем соответствующие меры в отношении сайтов, которые их используют.

Мы видим, что многие сайты, использовавшие такие спам-технологии, отказались от них. Через некоторое время они займут адекватные позиции, соответствующие своей релевантности.
Блог для вебмастеров
28/01/14 [ADV] В Поиске будет постепенно внедряться механизм, который отдает предпочтение страницам, не содержащим шокирующей рекламы. Блог для вебмастеров
20/03/14 [ADV] Сегодня мы внедрили первые изменения, в результате которых страницы без такой рекламы будут ранжироваться выше при прочих равных условиях.
Предвосхищая многочисленные вопросы, хотим отметить, что алгоритм не ориентирован на какие-то конкретные рекламные сети, а проверяет объявления на страницах сайта независимо от их источника.
Блог для вебмастеров
[ADV] Сайты, размещающие тизерную и другую отвлекающую рекламу, стали понижаться в выдаче. Под раздачу попали ресурсы, которые монетизировались за счет рекламных блоков с эротическими картинками, кадрами из фильмов ужасов, изображением частей тела с избыточным весом и другой неприятной рекламой. ? SiteClinic
15/04/14 [SPAM] Мы считаем целесообразным внести изменения и в работу алгоритма АГС. Принципы работы классификатора не меняются, но теперь вместо исключения страниц таких сайтов из поиска им будет аннулироваться тИЦ. Это изменение распространяется также на все сайты, которые были обнаружены алгоритмом АГС ранее. Ссылки с таких сайтов по-прежнему не будут учитываться в ранжировании, а сами сайты могут ранжироваться ниже. Блог для вебмастеров
[ANC] С этого момента при попадании сайта под АГС число его страниц в индексе не уменьшается. Признаком АГС теперь является обнуление тИЦ. ? SiteClinic
13/05/14 [SPAM] Мы неоднократно заявляли о бесперспективности и опасности использования некорректных методов продвижения сайтов, к которым, в частности, относится эмуляция действий пользователей.
К сожалению, некоторые веб-мастера и оптимизаторы продолжают рисковать репутацией своих сайтов и сайтов своих клиентов, пытаясь обмануть поисковую систему с помощью вышеуказанных методов. Недавно очередная группа сайтов, для «оптимизации» которых были использованы сервисы эмуляции действий пользователей, потеряла позиции в поисковой выдаче.
Блог для вебмастеров
06-08/14 [SPAM] "Новый текстовый" фильтр Яндекса, проверка. Novichkoff.ru
14/09/14 [SPAM] Ужесточение алгоритма для некоммерческих ресурсов. Очередная волна понижения видимости инфоресурсов за отсутствие добавочной ценности контента. ? SiteClinic
22/09/14 [ADV] Мы усовершенствовали алгоритмы, направленные на обнаружение назойливой рекламы. Страницы с назойливой рекламой, как и раньше, будут ранжироваться ниже. Блог для вебмастеров
[ADV] Ужесточение санкций по отношению к сайтам с отвлекающей рекламой. Релиз вышел с погрешностью — было пессимизировано большое количество белых сайтов, где нормальные рекламные блоки с помощью браузерных вирусов подменялись на агрессивные. Позже эта погрешность была устранена. ? SiteClinic
01/12/14 [SPAM] Понижены тысячи сайтов, которые накручивали переходы из результатов выдачи. Также впервые были пессимизированы ресурсы, использовавшие так называемое "усиление ссылочного" — накликивание покупных ссылок с целью улучшить передачу ссылочного веса. ? SiteClinic
30/12/14 [SPAM] Очередная волна пессимизации за накрутку ПФ.
Кроме накрутчиков, под раздачу попали сайты так называемого "Живого Щита" — ресурсы, которым поведенческие факторы накручивались без ведома их владельцев, с целью сбить с толку алгоритмы Яндекса.
? SiteClinic
15/04/15 [ANC] С 15 мая сайты, для продвижения которых используются SEO-ссылки, могут ранжироваться ниже. Блог для вебмастеров
30/04/15 [ADV] В последнее время к нам приходит много жалоб от пользователей мобильного интернета, которые при переходе на сайты из результатов поиска не могут получить найденную для них информацию. Это происходит из-за того, что некоторые сайты не показывают таким пользователям тот контент, который был проиндексирован поисковым роботом. А часто просто перенаправляют посетителей на страницы с подпиской на платные контент-услуги мобильных операторов. Для этого могут использоваться разные методы: от автоматических редиректов до агрессивной рекламы, которая затрудняет доступ к контенту или вовсе вводит в заблуждение.
В ближайший месяц будет внедрен алгоритм, ранжирующий ниже сайты, использующие подобные недобросовестные методы.
Блог для вебмастеров
15/05/15 [ANC] Cегодня мы запустили алгоритм Минусинск, направленный на борьбу со ссылочным спамом.
Теперь сайты, использующие для продвижения SEO-ссылки, могут ранжироваться ниже.
Блог для вебмастеров
22/05/15 [ANC] 15 апреля этого года на конференции Неделя Байнета в Минске Александр Садовский анонсировал запуск нового алгоритма Минусинск, основной задачей которого является мотивировать вебмастеров отказаться от использования SEO-ссылок для продвижения. Блог для вебмастеров
[ANC] Мы решили ограничивать в ранжировании сайты, которые занимаются закупкой фальшивых ссылок. Как только сайт попадает под ограничение, он сразу теряет свои позиции в поиске по основной части запросов до тех пор, пока не откажется от закупки ссылок. Садовский
08/09/15 [ANC] Сегодня мы делаем очередной шаг для борьбы со ссылочным спамом: теперь ограничения в ранжировании могут быть применены к сайту, злоупотребляющему размещением SEO-ссылок, независимо от его качества. Как и в случае с обычным АГС, ограничения сопровождаются аннулированием ТИЦ. Блог для вебмастеров
[ANC] Нацелен на ограничение в ранжировании сайтов, злоупотребляющих размещением SEO-ссылок, вне зависимости от качества. ? SiteClinic
02/10/15 [ADV] В ближайшее время будет запущена новая версия алгоритма ранжирования, в которой будет учтено, представляет ли сайт опасность для компьютера пользователя. Такие страницы не будут удалены из поиска, но могут ранжироваться ниже. Сниппеты этих страниц, как и раньше, будут содержать предупреждение об опасности. Блог для вебмастеров
Непот-фильтр

В настоящее время функции фильтра распределены между другими фильтрами.

  • Зачем нужен фильтр?
    Борется с неестественными ссылками.
    • Непот (2005 год) — первая версия фильтра.
    • Непот в тумане (5 февраля 2008 года) — усовершенствованная первая версия, которая обладает улучшенным механизмом распознавания неестественных ссылок на основании анализа ряда факторов:
    • отличие тематики ссылок от тематики остального контента;
    • отсутствие околоанкорного текста, разделительных знаков между ссылками;
    • отделённость блока со ссылками от основного содержания;
    • отличие цвета и размера шрифта ссылок;
    • большое количество ссылок в блоке;
    • различные тематики в блоке со ссылками;
    • частота изменения ссылок в блоке со ссылками;
    • и другие.
  • Как действует фильтр?
    Сначала обнулялся вес ссылки, затем вес ссылки стал снижаться до минимальных значений.
  • Как определить, что сайт под фильтром?
    • произвести поиск по анкору ссылки;
    • проверить в выдаче наличие сайта-донора и сайта-акцептора — если оба сайта найдены, фильтра, скорее всего, нет; если найдена только одна ссылка или ссылок не найдена, то ссылка, скорее всего, под непот-фильтром (или другим фильтром).
Для исключения случайных совпадений можно использовать произвольную последовательность символов в анкоре.
  • Как вывести сайт из-под фильтра?
    • тематика ссылок должна быть близка тематике сайта/страницы и другим ссылкам в блоке;
    • наличие околоанкорного текста, разделительных знаков между ссылками;
    • одинаковый цвет и размер шрифта для ссылок и контента;
    • небольшое количество ссылок в одном блоке (2-5);
    • максимальная интеграция блока со ссылками в контент страницы.
АГС
  • Зачем нужен фильтр?
    Борется с сайтами, торгующими ссылками.
    • АГС-17 (2006) — первая версия фильтра, борьба с контентом низкого качества, факторы риска:
      • автоматически генерируемый контент;
      • не уникальный контент.
    • АГС-30 (18 декабря 2009) — вторая версия, увеличение количества факторов, факторы риска (не менее 4х одновременно):
      • молодой домен;
      • бесплатный движок (WP, Joomla, Drupal, DLE);
      • бесплатный хостинг;
      • большое количество внутренних дублей страниц;
      • злоупотребление внутренней перелинковкой;
      • отсутствие посещаемости;
      • наличие внешних ссылок на разных страницах сайта;
      • отсутствие или низкое качество ссылочной массы на домен;
      • наличие низкопробной рекламы (тизеры, попандеры, кликандеры и т.д.);
      • наличие немодерируемых разделов (форум, блог, доска объявлений).
    • АГС-40 (6 ноября 2013) — третья версия, отсутствие добавочной ценности в качестве основного фактора риска:
      • основная часть контента — это информационные разделы;
      • сайт имеет размытую тематику;
      • темы большинства статей популярны, подробно раскрыты на других сайтах;
      • все статьи написаны по одному шаблону, контент не форматирован;
      • большинство статей написаны под конкретные поисковые запросы, без синонимов этой тематики;
      • контент на страницах сайта не соответствует поисковым запросам тематики сайта и содержимого тега TITLE;
      • сайт не содержит уникального функционала;
      • наличие большого числа рекламных блоков, партнёрских программ;
      • плохие поведенческие факторы (большой показатель отказов, маленький повторных визитов, глубины просмотров).
    • АГС-- (8 сентября 2015) — четвёртая версия, теперь аннулирование ТИЦ возможно даже для качественных сайтов, понижены в основном лидеры отрасли.
    Существование фильтра подтверждается Яндексом с 18 декабря 2009 года.
    Подробнее от Елены Камской.
  • Как действует фильтр?
    Исключает из индекса страницы.
  • Как определить, что сайт под фильтром?
    • в индексе осталось малое количество страниц (1-10), проверить можно:
      • через Вебмастер → Индексирование сайта → Страницы в поиске;
      • через поисковый запрос site:maximfilimonov.ru в поиске Яндекса, поставив вместо моего сайта свой;
    • с 21.04.2014 АГС 40 не удаляет сайты из выдачи, а обнуляет ТИЦ, аналогично с 08.10.2015 действует и АГС 2015, проверить можно:
  • Как вывести сайт из-под фильтра? Сделать его менее похожим на говносайт — например:
    • закрыть индексацию малопосещаемых и технических разделов (robots.txt);
    • убрать дубли, либо закрыть их каноническими ссылками;
    • улучшить качество ответа на запрос на страницах, оптимизированных под этот запрос;;
    • добавить возможность комментирования и лайков, увеличить их количество естественным путём;
    • улучшить содержательность, уникальность и оформление текстов; даже если ваш контент авторский, убедитесь, что его не скопировали без ссылки на вас; уникальность по сайту: Copyscape, уникальность текстов: Text.ru, PR-CY, Content Watch;
    • обратить пристальное внимание на исходящие ссылки: ссылки на порно, варез, а также на сайты, не соответствующие тематике вашего сайта;
    • добавить контактную информацию.
Аффилиат-фильтр
  • Зачем нужен фильтр?
    (2007) Борется с похожими сайтами в выдаче. Если сайты продвигаются по одинаковым запросам и похожи по одному или нескольким признакам, это может стать причиной наложения данного фильтра. По неподтверждённым данным похожесть сайтов определяется по следующим признакам (чем больше признаков, тем выше шанс попадания под фильтр):
    • авторизация через единые аккаунты в Яндекс.Метрике, Яндекс.Директе и панели веб-мастера Яндекс;
    • совпадения по семантическому ядру;
    • совпадения по каталогу товаров, прайс-листу;
    • совпадения структуры сайта, TITLE, HTML-кода, таблиц CSS, CMS;
    • одинаковые телефонные номера, переадресация телефонного звонка с разных номеров на одну организацию (при ручной проверке);
    • одинаковая контактная информация — особенно адрес организации;
    • совпадения в названиях организаций, доменных именах;
    • дизайн — особенно это относится к шаблонам;
    • содержание сайта — причём методы обычного рерайта работают всё хуже;
    • одинаковый владелец доменного имени — определяется через данные who is (например, здесь), если они открыты;
    • одинаковый хостинг, сервер, IP сервера, NS-серверы;
  • Как действует фильтр?
    Не показывает в выдаче страницы по совпадающим с другим сайтом запросам.
  • Как определить, что сайт под фильтром?
    Сайт перестает показываться по части запросов. Для проверки нужно ввести в поле поиска ключевая фраза ~~ site:maximfilimonov.ru, где ключевая фраза — это запрос, по которому перестал показываться сайт, а maximfilimonov.ru — адрес проверяемого сайта. Если до проверки сайт не показывался по этому запросу, а после проверки стал показываться — значит сайт под аффилиат-фильтром.
  • Как вывести сайт из-под фильтра?
    • закрыть сайты-аффилиаты от индексации или сделать их неосновными зеркалами продвигаемого ресурса;
    • изменить один из аффилиатов так, чтобы сайты относились к разным направлениям деятельности, продвигались по разным запросам.
    Возможны ситуации, когда за аффилиаты принимаются сайты разных организаций. В этом случае рекомендуется:
    • проверить телефонные номера в поиске — возможно, ранее их использовала другая организация;
    • добавить свою организацию в сервис Яндекс.Адреса;
    • разместить полные реквизиты организации в разделе Контакты;
    • разместить адрес и карту проезда; при аренде офиса в бизнес-центре с похожими организациями — написать письмо в службу поддержки Яндекса с доказательствами того, что организации разные.
Ты последний

В настоящее время функции фильтра распределены между другими фильтрами.

  • Зачем нужен фильтр?
    (8 марта 2007) Борется с не уникальным контентом.
  • Как действует фильтр?
    Значительно понижает в выдаче страницы.
  • Как определить, что сайт под фильтром?
    Сайт находится на последнем месте в выдаче при показе в режиме Все без исключения (режим Все без исключения срабатывает при добавлении в адресную строку браузера в дополнение к поисковому урлу символов &rd=0. В дальнейшем этот метод работать перестал. Сейчас признаком является то, что сайт не находится в топе при поиске по уникальным кускам текста с сайта.
  • Как вывести сайт из-под фильтра?
    Уникализировать контент.
Редирект-фильтр
  • Зачем нужен фильтр?
    (28 октября 2008) Борется с сайтами, автоматически перенаправляющими посетителя на другой сайт.
  • Как действует фильтр?
    Сайт исключается из индекса.
  • Как определить, что сайт под фильтром?
    Сайта нет в индексе, сайт использует редиректы.
  • Как вывести сайт из-под фильтра?
    • Убрать редиректы :)
Текстовые фильтры
  • Зачем нужен фильтр?
    Борется с содержанием, созданным для поисковых систем, а не для пользователя. Подробнее здесь.
    • Переспам, он же: -20, портяночный (20 января 2010) — факторы риска:
      • объём более 5 000 знаков;
      • без заголовков, без разделения на параграфы;
      • без списков, таблиц;
      • без изображений, видеороликов;
      • без контекстных ссылок.
    • Переоптимизация (13 сентября 2011) — факторы риска:
      • высокая тошнота (плотность ключевых фраз) текста;
      • высокое количество точных вхождений ключевых фраз в анкор-листе.
ПЕРЕСПАМ ПЕРЕОПТИМИЗАЦИЯ
Переспам накладывается на одну (иногда 2-3) продвигаемых фразы. То есть: это запросозависимый и документозависимый фильтр. Санкция снимается при слабой модификации запроса. Переоптимизация накладывается на документ целиком и не является запросозависимой санкцией.
Штраф (падение позиции) при прочих равных более существенен (15-35 пунктов). Штраф (падение позиции) при прочих равных менее существенен (ряд запросов может даже остаться в ТОП-10).
  • Как действует фильтр?
скорее всего, это ПЕРЕСПАМ скорее всего, это ПЕРЕОПТИМИЗАЦИЯ
Резко просел один продвигаемый запрос (часто более конкурентный) на 15-35 позиций. Возможно, произошла смена релевантной страницы в выдаче, но старая страница по-прежнему находиться в индексе. Резко просела вся группа поисковых запросов, продвигаемых на один документ. Падение составило от 5 до 20 пунктов. По ряду запросов, могла смениться наиболее релевантная страница в выдаче, но сама страница находится в индексе.
Позиция сайта резко улучшается при небольшой модификации продвигаемого запроса: с базового [продвижение сайтов самостоятельно] на [продвижение сайта самостоятельно] или на [сайтов продвижение самостоятельно]. Позиции продвигаемого сайта не сильно изменяются при модификации запросов (скажем, изменении окончания), которые ведут на один и тот же документ.
Документ был и продолжает оставаться на приемлемых позициях по некоторым запросам, ведущим на него. На него продолжает поступать нормальный трафик из выдачи Яндекса, но позиция по основному запросу существенно ухудшилась в один текстовый АП. Документ существенно потерял во входящем на него трафике. Просел вниз первой или на 2-3 страницу выдачи из ТОП-10 (в зависимости от начальной позиции).
  • Как определить, что сайт под фильтром?
    • Определяем переспам:
      • Так как фильтр накладывается на один или малую группу запросов, а не на весь документ целиком, то достаточно произвести модификацию запроса и проследить за изменением позиции в выдаче — см. ниже.
      • Ранее, удавалось снять фильтр, используя модификацию запроса вида: [поисковый запрос/] или [поисковый запрос ~~ любаяабракадабра23446ggt] и позиция документа резко улучшалась. Но сейчас данные способы не помогают в его определении.
    • Определяем переоптимизацию:
      При использовании расширенного поиска — переоптимизация снимается. Это значит, что вам надо сравнить в выдаче по релевантности два сайта: свой и сайт, который выше вас в общей выдаче на 1-3 позиций. Сделать это можно либо с помощью документированного языка поисковых запросов Яндекса. Если в общей выдаче ваш проект, ниже конкурента по продвигаемому запросу, а при использовании расширенного поиска документы с него оказываются более релевантным, то с большой долей вероятности мы имеем дело именно с переоптимизацией.
  • Как вывести сайт из-под фильтра?
ПЕРЕСПАМ ПЕРЕОПТИМИЗАЦИЯ
В первую очередь требуется убрать избыточное количество чистых вхождений запроса на странице. В ряде случаев помогает просто изменить окончание в тексте. Было: «срочная [перевозка грузов в Москве] и области», сделать: «срочную [перевозку груза по Москве] и области». Требуется взглянуть на текст по новому. Переработать его. Скорее всего, простым изменением окончаний не обойтись. Иногда проще заказать полный рерайт.
Требуется уменьшить объем текста на странице (отсюда второе название фильтра «портяночный»). В ряде случаев помогает скрыть нижнюю часть текста тегом noindex. Требуется устранить избыточные выделения и акценты на ключевых фразах в тексте. В частности не усугубляйте тегами: b, strong, em, i. Снизьте процент вхождения ключевой фразы в текстовые заголовки страницы h1-h6. Проверьте текст на грамотность. Устраните все орфографические и большинство пунктуационных ошибок.
Изучите внешние входящие ссылки. Постарайтесь снять те ссылки, которые являются откровенно спамными и содержат запрос в чистом виде. Постарайтесь получить некоторое количество ссылок с разбавочными анкорами и/или безанкорных. Постарайтесь сбалансировать контент по проценту вхождений ключевых фраз (ориентируясь на конкурентов). Используйте синонимы и простые и понятные фразы и предложения.
Разбавьте сухой текст на странице: добавьте картинки (желательно уникальные), списки перечисления. Таблицы и видео. Продумайте идею текста, он должен быть чему-то посвящен. Содержание страницы должно быстро доносить основную идею до читателя. Используйте иллюстрации для повышения наглядности.
Минусинск
  • Зачем нужен фильтр?
    (15 мая 2015) Борется с повышением сайтами своего ТИЦ путём покупки ссылок (коммерческих ссылок, SEO-ссылок). Учитывается:
    • общее количество ссылок (по неподтверждённым данным их должно быть больше тысячи для попадания под фильтр);
    • процент естественных ссылок в общей ссылочной массе (чем он выше, тем меньше шанс попасть под фильтр);
    • если сайт имеет поддомены, то ссылки, ведущие на них, суммируют и увеличивают вероятность попадания под фильтр и домена, и поддоменов.
    Исследование Минусинска от Сергея Кокшарова, подробное исследование от Алексея Куракова.
    Маркеры SEO-ссылок:
    • блоковое размещение в неосновном контенте;
    • значительная доля коммерческих анкоров — ссылок, содержащих поисковый запрос (пользователи редко размещают подобные ссылки);
    • исходящий ссылочный профиль сайта-донора — если SEO-ссылок много, то высока вероятность того, что новая ссылка также является SEO-ссылкой;
    • поведенческие факторы, связанные со ссылкой — переходы/непереходы по этой ссылке могут иметь значение.
    Более подробно о SEO-ссылках.
  • Как действует фильтр?
    Значительно понижает в выдаче сайты по всем запросам.
  • Как определить, что сайт под фильтром?
    Сейчас работает такой способ: если при вводе витального запроса (с названием организации, сайта) сайт находится не на первых позициях, значит он под фильтром.
  • Как вывести сайт из-под фильтра?
    • если у сайта отсутствует траффик с Гугла и сайт попал под Минусинск в Яндексе, то ссылки удалять сразу можно;
    • если трафик с Гугла высокий и у сайта есть задача выйти из-под Минусинска, то ссылки лучше удалять плавно, замещая снятые крауд-маркетингом и получением естественных ссылок (заметим, что вечные ссылки в статьях лучше подходят на эту роль нежели арендные ссылки);
    • если высокий трафик есть как с Яндекса, так и с Гугла, то рисковать и снимать все ссылки не стоит; чтобы снизить вероятность Минусинска лучше постепенно отказываться от арендных ссылок.
    Более общие рекомендации:
    • увеличение доли естественных ссылок — похоже, что не менее 1/3 от общего количества;
    • разумное количество SEO-ccылок — похоже, что не менее 1 000, особенно, если доля естественных ссылок незначительна;
    • продвижение вечными ссылками — вечные SEO-ссылки в контексте слабо определяются поисковыми системами;
    • сбалансированный анкор-лист — доля коммерческих анкоров должна быть не более 60%, остальные ссылки должны быть безанкорными, содержащими название организации/сайта и некоммерческими (тут, здесь, источник и пр.).

Подробнее о фильтрах: здесь.

Google

https://www.youtube.com/watch?v=4SAPUx4Beh8&feature=youtu.be&t=41s

Мэтт Каттс (Google, программный инженер) заявляет:

"Ссылки в nofollow не передают PageRank и в итоге (при назначении ссылке атрибута nofollow) часть PageRank испаряется, а не полностью перераспределяется по другим ссылкам".

Это было сделано для того, чтобы сео-оптимизаторы не использовали nofollow в качестве инструмента для перераспределения PR на страницах сайта.


домены прямого вхождения -- EMD

гугл кофеин

Пингвин, Колибри, Кофеин

Калининград, Дублин

АГС

что такое пассажи?

http://seoprofy.ua/blog/prodvizhenie-sajtov/penguin-recovery-infographic вывод из-под Пингвина


  • фильтр за переоптимизацию;
  • АГС;
  • аффилирование;
  • adult-фильтр (пессимизация за "взрослый" контент);
  • фильтр на одинаковые сниппеты и др.

Подробнее: http://siteclinic.ru/services/filtry/



Факторы контентного спама

Попытки обмануть посетителей или поисковые системы рано или поздно негативно скажутся на рейтинге сайта. Если вы сомневаетесь в том, что вы умнее всех сотрудников Google или Яндекс — делайте все честно и не пытайтесь «накрутить» своему сайту что-либо. А чтобы случайно не попасть под санкции, вот вам список факторов контентного СПАМа которые могут сильно испортить жизнь:

114. Ссылки на «нехорошие» сайты показывают, кто ваши друзья. Аналогично ссылкам на авторитетные сайты, ссылаясь на «плохие» сайты, вы получаете часть их репутации себе.

115. Подмена содержимого страниц на сайте, например для людей и для роботов, карается в соответствии с тяжестью нарушения. Нельзя подменять контент на сайте.

116. Скрытые редиректы. Переадресация посетителей на другие сайты карается штрафами и даже исключение из индекса. Не балуйтесь!

117. Текст цвета фона незаметен для посетителей, но прекрасно виден поисковикам. Попытка обмануть посетителей может дорого обойтись вашему сайту.

118. Скрытый контент индексируется поисковыми системами, но, как правило, поисковые системы не совершают действий на странице и считают, что весь контент должен быть виден и доступен посетителю сразу, без необходимости на что-то нажать или навести. Не скрывайте контент от посетителей. В лучшем случае, контент не будет учтен, а в худшем — получите штраф.

119. Навязчивая реклама и всплывающие окна отвлекают посетителя от пользования сайтом, что является показателем низкого качества сайта.

120. Чрезмерная оптимизация сайта показывает попытку «накрутки» контактных факторов. Еще одно подтверждение тому, что в погоне за отдельными факторами, вы упускаете влияние комплекса факторов.

121. Чрезмерная оптимизация отдельных страниц сайта может повлиять на их рейтинг. Подобными вещами занимается «Пингвин» Google.

122. Реклама под контентом выведена в отдельный фактор, так как, например, Google имеет специальный алгоритм сравнения размещения рекламы и контента на странице. Если реклама размещается более выгодно, чем контент, то «Page Layout Algorithm» непременно это заметит и покарает вас.

123. Однообразные сайта или партнерские сети представляют меньше пользы, чем уникальные сайты с оригинальной информацией, а потому могут ранжироваться хуже.

124. Несколько сайтов одного владельца могут быть «слиты» по пересекающимся ключевым запросам, если поисковая система решит, что это аффилированные сайты. «Расклеить» сайты может быть очень сложно.

125. Генерация контента. Любая автоматизация имеет свои слабые стороны, которые мощные алгоритмы поисковых систем распознают на раз. Не пытайтесь обмануть мощнейшие в мире системы анализа контента. За машинную генерацию контента можно вылететь из индекса.

Запомните! Поисковые системы оставляют за собой право выкинуть ваш сайт без объяснения причин в любой момент и не несут никакой ответственности за ваши потери в результате. Мы играем на чужом поле по чужим правилам и за обман придется расплачиваться. Соблюдайте правила, если хотите побеждать.

Факторы ссылочного спама Факторы ссылочного спама

Ссылочный СПАМ — любимая игра «SEO-оптимизаторов», благодаря которой биржи ссылок прокачали через себя астрономические деньги. В итоге феерия абсурда достигла такого масштаба, что ценность ссылочной массы потеряла всякий смысл. Да, это не «убило» внешние ссылки, они будут всегда, так как интернет — это и есть ссылки, и не оценивать их невозможно. Просто приходят новые, более совершенные алгоритмы анализа, новые фильтры ссылочного СПАМа и факторы ранжирования:

126. Резкий приток внешних ссылок. Естественность развития всех аспектов сайта — залог успеха. Внезапные скачки показателей — верный признак «накрутки».

127. Ссылки с одного IP могут указывать на неестественность ссылочной массы.

128. Низкокачественные ссылки в больших количествах могут быть восприняты как попытка накрутки ссылочных факторов.

129. Несоответствие тематики входящих ссылок существенно снижает их ценность и увеличивает шансы прихода «Пингвина».

130. Продажа ссылок с сайта может негативно сказаться на видимости сайта в поиске.


8. Множественное выделение одного ключевого слова Не стоит выделять в кучу разных тегов ключевые слова, поскольку это может помешать Яндексу правильно определить значимость этих слов на странице. Например, слова - может быть воспринято как поисковый спам.

  • Тип сайта — по непроверенным данным поисковые системы разделяют сайты на коммерческие и некоммерческие. Предположительно для них предусмотрены разные фильтры: http://www.welcomseo.ru/blog/pochemu-sayty-popadayut-pod-filtry-yandeksa-i-kak-etogo-izbezhat.htm
  • https://yandex.ru/support/webmaster/yandex-indexing/webmaster-advice.xml

    Факторы спама на сайте Фильтр Panda Сайты с низкочастотным контентом (фермы контента) менее видимы в поиске, после фильтра Panda.

    Ссылки на плохие сайты

    Ссылки на "нетрастовые" сайты вроде "кредитов наличными" и "алкоголя оптом" могут навредить видимости в поиске.

    Редитекты

    Скрытые редиректы — это очень плохо. Сайт может быть не только оштрафован, но и выброшен из индекса.

    Всплывающая или отвлекающая реклама

    Официальный Google Rater Guidelines Document сообщает, что всплывающие окна и отвлекающая реклама — знак низкокачественного сайта.

    Чрезмерная оптимизация сайта

    Сайты, набитые ключевиками, тегами заголовков и другими факторами оптимизации, скорее всего низкокачественны.

    Чрезмерная оптимизация страницы

    Многие сообщают, что в отличии от Panda, Penguin нацелен на единичные страницы по определённым ключевикам.

    Реклама перед контентом Специальный "Page Layout Algorithm" штрафует сайты, на которых рекламы больше (или она расположена лучше), чем контента.

    Скрытие партнёрских ссылок

    Пытаясь скрыть партнёрские ссылки, можно получить штраф.

    Партнёрские сайты

    Google не очень любит партнёрку. Многие считают, что сайты, зарабатывающие на партнёрских ссылках, оцениваются хуже.

    Сгенерированный контент

    Google не любит машинную генерацию контента. Если они посчитают, что ваш является его источником — можно получить штраф или вылететь из индекса.

    Чрезмерная подстройка PageRank

    Слишком большое внимание к PageRank, настройка большинства ссылок на nofollow — может считаться попыткой обмануть систему.

    IP адрес указан как спаммерский

    Если с IP вашего сервера в списке спаммеров, все сайты на этом сервере пострадают.

    Спам в мета-тегах

    В мета-теги тоже можно затолкать много ключевиков. Если Google решит, что вы специально добавили много ключевых слов в мета-теги — сайт пострадает.

    Факторы спама на сайте

    Факторы спама вне сайта

    Нереальный приток ссылок Внезапный и быстрый приток ссылок — явный признак их нелегитимности.

    Штраф Penguin

    Сайты, попавшие под Google Penguin, гораздо менее видимы в поиске.

    Ссылки с того же IP

    Слишком много ссылок с сайтов, находящихся на том же сервере указывают на сомнительность этих ссылок.

    Ссылочный профиль с большим процентом низкокачественных ссылок

    Много ссылок из источников, используемых обычно Чёрным СЕО (комментарии на блогах и форумах) могут быть признаком обмана системы.

    Релевантность ссылающегося домена

    В известном анализе MicroSiteMasters.com показано, что сайты с нереально большим количеством ссылок с нерелевантных сайтов, более подвержен алгоритму Penguin.

    Предупреждение о сомнительных ссылках

    Google выслал тысячи сообщений "Google Webmaster Tools notice of detected unnatural links". Обычно — это предвестник падения в рейтинге, хотя и не в 100% случаев.

    "Ядовитые анкоры

    Имея «ядовитые» анкоры (например — ключевики букмекерских контор и кредитов наличными), направляющие на ваш сайт, вы рискуете потерять в ранжировании. Google может подумать, что сайт взломан или является спаммерским.

    Ручной штраф

    Google может штрафовать сайты вручную, как вышло с известной Interflora.

    Google Sandbox

    Фильтр Sandbox искусственно занижает позиции только-что созданных сайтов, чтобы спаммеров было проще определить.

    Google Dance

    Google Dance временно «встряхивает» позиции, чтобы определить, пытается ли сайт обмануть алгоритм.

    Продажа ссылок

    Продажа и покупка ссылок явно негативно повлияет на PageRank и ударит по видимости в поисковике.

    Disavow Tool

    Использование Disavow Tool позволяет снять штрафы с сайтов, ставших жертвами плохого СЕО.

    Факторы спама вне сайта

    Заблокированные сайты

    Один раз заблокированный сайт будет трудно разблокировать и ещё трудней — поднять в топ выдачи. Повторная блокировка ещё больше снизит эти шансы.

    Алгоритм работ

    Базовый анализ

    Результатом базового анализа являются:

    1. информация по поисковому продвижению и сайту;
    2. доступы для анализа и работ по сайту;
    3. ресурсы для работ по сайту.
    Анализ сайта
    История продвижения
    • доступы к инструментам Яндекса (Метрика и Вебмастер), Google (Analytics, Search Console) — для анализа аудитории и посещаемости сайта; если данных нет, нужно установить счётчики и зарегистрировать сайт в поисковых системах;
    • лог-файлы сервера — посещение страниц роботами; о местонахождении лог-файлов точно знает компания, предоставляющие услуги хостинга для сайта;
    • доступы к ссылочным биржам или выгрузка из них — для анализа ссылочной массы сайта;
    • существующее семантическое ядро;
    • результаты предыдущих аудитов;
    • отчёты по изменениям на сайте за 2 года;
    • отчёты по поисковому продвижению за 2 года;
    • аффилиаты и зеркала сайта.
    Хронологический анализ

    Построение хронологической таблица, включающей в себя:

    • хронологию изменений алгоритмов поисковых систем;
    • динамику поискового продвижения (источники: сервисы поисковых систем, сторонние сервисы);
    • изменения на сайте (источники: отчёты по поисковому продвижению, отчёты по изменениям на сайте, история изменений);
    • историю покупок ссылок (источники: история на ссылочных биржах, отчёты по поисковому продвижению);
    • историю попаданий под фильтры и выходов из-под них (источники: отчёты по поисковому продвижению, переписка с Платоном Щукиным);
    • наличие и содержание рекомендаций по сайту и контрольных аудитов;
    • смену владельца, если они имели место.
    Анализ ресурсов
    • возможности по внесению изменений на сайт (контента, мета-тегов, разделов/подразделов, элементов шаблона), наличие FTP- и MySQL-доступов;
    • план развития проекта в ближней и средней перспективе;
    • планируемые результаты, планируемые сроки;
    • человеческий ресурс;
    • финансовый ресурс.

    Анализ тематики

    Результатом анализа тематики являются:

    1. заключение по поводу перспективности тематики для продвижения;
    2. список предлагаемых модулей;
    3. список предлагаемых площадок для рекламы.
    Выбор сайтов для анализа
    Ограничения тематики

    Политики ПС (Я, G), условия использования ПС (Я, G), законодательные ограничения.

    Список модулей
    • контентные модули: список контентных модулей конкурентов и оценка потенциального трафика по контентным модулям (wordstat.yandex.ru);
    • SEO-модули — помогающие поисковому продвижению сайта;
    • функциональные модули — выполняющие функции;
    • совмещение списка модулей с планом развития сайта.
    Тематические площадки

    Площадки для размещения ссылок и статей:

    • тематические порталы;
    • тематические СМИ;
    • тематические каталоги и агрегаторы;
    • региональные площадки;
    • площадки с упоминаниями конкурентов.
    Потенциальный трафик
    • сезонность трафика тематики и трафика сайта;
    • динамика трафика тематики и трафика сайта по годам;
    • совмещение трафика тематики, сайта и хронологического анализа;
    • соотношение между поисковыми системами в тематике (LiveInternet.ru → выбор тематики → статистика группы → из поисковых систем).

    Технический анализ

    Результатом технического анализа является при необходимости:

    1. отчёт по ошибкам, список работ по исправлению;
    2. список рекомендаций:
      • по повышению устойчивости сервера;
      • скорости загрузки;
      • уменьшению веса страниц.
    Редиректы

    Возможные ошибки:

    • редирект на другой сайт в родительском окне — сайт исключается из индекса редирект-фильтром Яндекса; увидеть можно в отчёте Xenu (скачать);
    • неверное использование редиректов (см. коды редиректов) — разные редиректы передают вес по-разному (ответ 301 от 80 до 99%, остальные намного меньше); редиректы показываются в отчёте программы Xenu;
    • редирект на нерелевантные или несуществующие страницы — чем менее релевантна страница перехода, тем меньший вес она получает от редиректа; релевантность страниц редиректа можно проверить только вручную, несуществующие страницы можно увидеть через этот сервис, вбив список редиректов из отчёта Xenu (в результатах обратить внимание на страницы с кодом, отличным от 200);
    • массовые 301 редиректы на одну страницу — помимо сильного снижения веса из-за нерелевантности, могут быть восприняты поисковой системой в качестве ошибки 404 (чтобы не допустить накрутки веса конечной страницы);
    • ссылки на страницы с редиректами — теряется вес; проверка через Xenu;
    • редирект вместо канонической ссылки — рекомендации по каноническим ссылкам от Яндекса, от Google; определяется через поиск дублей и проверку их работы (подробнее поиск дублей будет описан ниже);
    • цепь редиректов — во-первых, при каждом редиректе теряется вес, во-вторых, у поискового робота существует лимит редиректов, по которым он будет переходить (по неподтверждённым данным 6 у Яндекса и 5 у Google); определить цепи редиректов можно, взяв редиректы из отчёта Xenu, и проверив их через этот сервис.

    О редиректах в целом: Яндекс, Google.

    Ответ 404

    Возможные ошибки:

    • нет страницы 404 — потеря трафика; для проверки нужно вбить несуществующий адрес;
    • со страницы 404 нельзя вернуться, перейти в другие разделы — потеря трафика;
    • страница 404 выполнена не в дизайне сайта — рекомендации от Яндекса, от Google;
    • ответ 404 при существующей странице — потеря трафика; конкретные адреса можно проверить в Яндекс.Вебмастере и Google Search Console;
    • 404 вместо 410 — ответ 410 должен быть, если документ удалён окончательно, а если документ планируется вернуть, то лучше использовать ответ 404;
    • редирект вместо 404 ошибки — во-первых, плохо с точки зрения юзабилити, во-вторых, по неподтверждённым данным для ранжирования лучше использовать код 404; проверить ошибки 404 можно в отчёте Xenu.
    Отказоустойчивость

    Проверка на устойчивость при больших нагрузках: LoadImpact.

    Скорость загрузки

    Сервисы: от Google, список сервисов.

    Размеры страниц

    Этот и другие сервисы.

    Индексация

    • Проверка индексации всех страниц
    • Индексация важных страниц
      • отделение важных страниц (продвигаемые, с контентом, функционалом) от технических (дубликаты, ошибки, пустые) — попадание в индекс мусорных страниц отнимает статический вес у важных страниц, тем самым снижая позиции в ПС и трафик;
      • просмотр посещений роботом — чтобы узнать, какие из непроиндексированных страниц посещены роботом соответствующей ПС, а какие нет; наличие в индексе легче всего посмотреть через логи сервера (открыть их в текстовом редакторе), также можно посмотреть в Вебмастере (→ Идексация → Проверка URL) и в Search Console (→ Сканирование → Посмотреть как Googlebot → Сканировать и отобразить);
      • добавление непроиндексированных роботом важных страниц в индекс (Google — тот же Googlebot, но кнопка Сканировать, затем Добавить в индекс; Яндекс — через Twitter-аккаунт); страницы вне индекса, которые робот посещал, имеют проблемы: дублирование, статический вес, фильтр и пр.;
    • Проверка индексации по условиям:
      • наличие Flash/AJAX — проверка по матрице сайта текстовых копий всех шаблонов сайта; если текстовые копии есть, значит, они проиндексированы;
      • проверка возможности индексации важных страниц при текущих настройках robots.txt — сервис Яндекса;
    • Проверка тегов и атрибутов:
      • теги NOINDEX (рекомендация роботам не переходить по ссылке) — добавление закрывающих тегов;
      • атрибуты NOFOLLOW (вес по данным ссылкам обнуляется): списки внутренних и внешних ссылок (для расчёта веса в дальнейшем);
      • мета-тег ROBOTS со значениями NOINDEX (не индексировать эту страницу) и NOFOLLOW (не следовать по ссылкам с этой страницы, вес по ссылкам с этой страницы обнуляется) — важные страницы не должны быть закрыты от индексирования, ссылки на важные страницы должны передавать вес;

    Дублирование, аффилиаты, ошибки

    Региональность

    Спам и уязвимости

    Факторы авторитетности

    URL-факторы

    Семантическое ядро и трафик

    Структура сайта

    HTML

    Юзабилити

    Сниппеты

    Ссылочная масса

    Внутренние ссылки

    Статический вес

    Анкоры

    Естественные ссылки

    Текстовые факторы

    Анализ эффективности продвижения

    Бизнес-аналитика

    Сводная таблица

    (блог Платона Щукина)

    Подробнее

    Роботы и robots.txt

    Общая для всех поисковых систем программа, переходит по ссылкам на страницах и заносит эти страницы в поисковый индекс. Различают пауков и дятлов: пауки индексируют страницы, дятлы время от времени проверяют доступность страниц индекса.

    Рекомендации для поисковых роботов содержатся в текстовом файле robots.txt. Замечательный хелп от Яндекса, менее подробно от Google. Файл сохраняется в корневой папке. Например, для сайта maximfilimonov.ru, файл robots.txt будет находиться по адресу maximfilimonov.ru/robots.txt.

    • Синтаксис — <поле>:<пробел><значение><пробел>.
    • Рекомендации (директивы) для роботов
      • User-agent — указывает роботов, для которых должна выполняться нижеследующая директива.
      • Disallow — указывает страницы и пулы страниц, которые индексировать не нужно.
      • Allow — указывает страницы и пулы страниц, которые индексировать нужно. Используется в сочетании с Disallow (без него — бессмыслен), при сочетании сортируются по длине префикса URL (от меньшего к большему) и применяются последовательно.
      • Host — при наличии зеркал позволяет указать главное зеркало (данная рекомендация имеет высокую значимость для поисковых систем).
    • Спецсимволы
      • * — любая, в том числе и пустая, последовательность символов.
      • $ — частично отменяет значение *.
    • Часто повторяющиеся ошибки по наполнению файла robots.txt собраны здесь.
    • SEOLib — различные виды анализа, поиск релевантных посадочных страниц, диагностика санкций.

    MegaIndex:

    Ссылка для регистрации: http://goo.gl/AYxSEB

    Прямая cсылка на сервис после регистрации https://www.megaindex.ru/?tab=siteAnalyze

    Коды редиректов

    • 300
    • 301
    • 302
    • 303
    • 304
    • 305
    • 306
    • 307

    http://redirekt.info/article/305-redirekt-ispolzujj-proksi.html

    Коды ответов

    Анализ сайта

    Проверка на редиректы, проверка на дубли. Работа с дублями -- 301 редирект (если не нужны пользователю), рел каноникал (если нужны пользователю), если есть структура, то можно по шаблону закрыть в роботс.тхт

    Индексация

    Вебмастер и Панель.. Первые результаты после индексации видны.. месяца 3-4

    Операторы поиска


    https://yandex.ru/support/webmaster/search-results/site-region.xml -- регион сайта

    https://yandex.ru/support/webmaster/yandex-indexing/validator.xml -- валидатор микроразметки, семантической разметки

    https://yandex.ru/support/webmaster/schema-org/what-is-schema-org.xml -- Schema.org

    https://yandex.ru/support/webmaster/open-graph/intro-open-graph.xml -- Open Graph для фейсбука

    https://yandex.ru/support/webmaster/hcard/yandex.xml -- микроформаты: hCard и пр.

    Контекстная реклама

    Общие принципы

    Тип интернет-рекламы, при котором рекламное объявление показывается в соответствии с содержанием, контекстом интернет-страницы (лат. contextus — соединение, связь). Рекламным носителем может быть:

    • текстовое объявление;
    • текстово-графическое объявление;
    • графический баннер;
    • видеоролик.

    Алгоритм работы

    1. Пользователь вбивает запрос в поисковой системе (статистика на 2015 показывает, что 90% пользователей начинают работу в интернете с поисковой системы).
    2. Система сверяет запрос со списком ключевых слов рекламодателей, выбирает соответствующие рекламные объявления, ранжирует их и показывает пользователю.
    3. Пользователь кликает на понравившееся рекламное объявление (в этот момент со счёта рекламодателя списывается цена за клик).
    4. Система отправляет пользователя на страницу, определённую рекламодателем в качестве целевой.
    5. Происходит анализ поведения пользователя на сайте (если установлена соответствующая система аналитики — Google Analytics для Google и Яндекс.Метрика для Яндекса).

    Принцип работы

    Основной принцип работы — "включение в запрос".

    Например, есть запрос "тренинг личностного роста". Например, есть рекламодатели со следующими запросами "тренинг", "личностный рост" и "пройти тренинг". Система смотрит на трёх рекламодателей. Первый рекламодатель говорит системе, что хочет показываться в ответ на все запросы со словом "тренинг" — он будет показан на запрос "тренинг личностного роста". Второй рекламодатель говорит, что хочет показываться в ответ на все запросы со словами "личностный рост" — он будет показан. Третий рекламодатель говорит, что хочет показываться в ответ на запросы со словами "пройти" и "тренинг", и так как в запросе "тренинг личностного роста" нет слова "пройти", то этот рекламодатель показываться по этому запросу не будет.

    Остальные разделы

    Социальные сети

    Таргетированная реклама

    Другие ссылки

    Мобильная реклама