LSI — тема в целом старая, но последние лет 5, в связи с последними тенденциями в изменениях алгоритмов ранжирования поисковых систем, она особенно актуальна и важна.
Каждый, кто связан с продвижением сайтов, создает свой сайт любого типа, оказывает услуги по написанию текстов, должен в обязательном порядке изучить эту тему «от и до» и применять.
Еще в 2010 году на Хабрахабре писали:
«Сегодня я расскажу об одном из подходов, которым активно пользуются поисковые гиганты и который звучит чем-то вроде мантры для SEO aka поисковых оптимизаторов. Этот подход называет латентно-семантический анализ (LSA), он же латентно-семантическое индексирование (LSI)«.
Началось все с изменением алгоритмов Гугла, потом подтянулся Яндекс и про LSI заговорили все.
Содержание статьи:
Какие преимущества в плане SEO дает LSI
Как пишется LSI-текст. Как нужно давать ТЗ копирайтеру
Как формировать LSI-ядро для текста
Что такое LSI
LSI — это добавление в текст сопутствующих, релевантных терминов и тематических слов по вашему ключевому запросу.
То есть обязательное добавление в текст всей совокупности самых важных слов, которые формируют данную тему.
Это когда вы пишете текст на тему «продвижение сайтов» и добавляете такие слова, как «SEO», «ссылочное продвижение» «линкбилдинг», «поисковая оптимизация», «поисковые системы», «фильтры», «ранжирование», «раскрутка», «контент» и прочие релевантные слова.
Это не обязательно длинный текст. И один абзац можно сделать насыщенным и полезным. Но обычно под LSI-текстом подразумевается «лонгрид», который вмещает в себя всю полезную информацию по данному вопросу.
Сейчас, когда в SEO говорят «качественный LSI-текст», то имеют в виду текст компетентный, большой и полезный, насыщенный словами и терминами из данной тематики, структурированный и хорошо оформленный.
Зачем это нужно — чтобы и поисковая система, и человек сразу понимали, о чем идет речь.
Сейчас термин LSI-текст противопоставляется SEO-тексту, который пишется с определенным количеством знаков и вхождений нужных ключевых слов из заданного в ТЗ списка.
«LSI тексты — это контент, релевантный намерению пользователя, а не ключевым словам. Он состоит из однородных контент-единиц (абзацев, разделов, статей или глав), широко раскрывающих как основную так и смежные темы.»
«Говоря простым языком, LSI – это способ определения тематики текста по содержащимся в нем словам.
Например, если в документе встречаются слова «зимняя», «протектор», «шипы» – то, вероятнее всего, это текст про шины.
А если – «сковорода», «запекать», «соус» – то это что-то, относящееся к кулинарии.»
«В «бытовом» смысле, или применительно к SEO LSI — это использование тематических слов при написании текстов.»
Что такое LSI. Объяснение Алексея Чекушина на видео на 25 секунд )
Какие приеимущества в плане SEO дает LSI
1) Улучшение ранжирования в поиске
Ваш сайт получит более высокие позиции. Особенно это касается сложных конкурентных ключевых запросов, когда уже задействованы многие факторы, а движения вверх дальше не происходит. Но и для любых других запросов LSI тоже работает.
2) «Подушка безопасности» от фильтров поисковых систем
LSI-тексты гораздо реже попадают под спам-санкции поисковых систем, это отмечают многие SEO-специалисты.
Как говорит Алексей Чекушин, «в спам-алгоритмах LSI имеет куда более значительный вес, чем в ранжировании. И если ваш сайт уже попал под санкции – переписывание текстов при помощи «Акварели» или аналогичных LSI-инструментов позволяет выйти из под санкций. А изначальное их написание с использованием LSI – не дает под них попасть.»
Речь про Баден-Баден и другие.
3) Расширение семантики
Кроме вклада в фактор ранжирования, LSI-тексты самостоятельно привлекают трафик по дополнительным ключевым и тематическим словам, которые вы употребите в тексте.
А также вы в ходе большого исследования конкурентов и популярных в тематике слов, получаете массу идей для отдельных, новых материалов.
Например, если вы собираете LSI-слова для коммерческой страницы сайта услуг, можете получить много тем как для новых подобных страниц, так и информационных ключей для статей.
4) Другие сопутствующие бонусы в ранжировании
— улучшение поведенческих факторов
— рост количества соцсигналов, ссылок
И через это все опосредованно — опять же повышение позиций в поисковых системах.
Вашим читателям будет приятнее и удобнее читать полезный и обстоятельный текст, компетентный и хорошо оформленный. Такой чаще лайкают шерят, ставят ссылки на подробный полезный материал, дольше задерживаются на нем, хотят почитать что-нибудь еще на таком сайте — растут хостовые факторы, поведенческие факторы, растет общий авторитет сайта в глазах поисковых систем.
Я писала на эту тему «Большое руководство по Супер-контенту».
Помните, что поезд неумолимо движется в конечную точку, хотите вы этого или нет.
Алгоритмы поисковых систем уже существенно заточены и дорабатываются именно в пользу полезных и естественных текстов. Если не хотите словить штрафы поисковиков, если хотите лучше ранжироваться — дорабатывайте и меняйте тексты сейчас!
Если у вас уже есть хорошие тексты на странице, проверьте, какие LSI-слова к ним подходят, и уточните их наличие, допишите тексты.
Как пишется LSI-текст? Как нужно давать ТЗ копирайтеру
Если вы наняли действительно нормального копирайтера, то, глубоко изучив вашу тему, конкурентов, он И ТАК напишет полезный текст, со всеми нужными дополнительными тематическими словами.
Потому что сам принцип написания LSI-текста и анализа темы для этой цели практически ничем не отличается от анализа темы для написания просто действительно качественного текста.
Самый большой минус этого всего — дороговизна обращения к хорошим копирайтерам. Да и сам текст, в котором тема полностью раскрыта обычно гораздо больше «стандартных» 2-3 тыс. знаков SEO-текстов.
Но оно того стоит и потому что трафика на такие статьи привлекается гораздо больше, и безопасность от фильтров, и увеличение доверия к вашим текстам, а если они находятся на корпоративном сайте — то и к товарам, услугам. И остальные факторы, про которые писалось выше.
В идеале, чтобы самые главные тексты писал не копирайтер, а тот, кто имеет самый большой опыт в вашей компании или проекте, наилучшим образом осведомлен о всех практических нюансах.
Если это невозможно, то организовать, чтобы такой человек дал что-то вроде интервью или сам набросал, написал самые важные моменты, какие-то узкие, практические, которые он знает на своем опыте, а в интернете, возможно, о таких вообще еще не писали. Да, это совершенно реально, личный опыт ценится больше всего, а в сети написано еще пока далеко не про все.
А копирайтер чтобы расширил текст и привел все в порядок.
Так что же с ТЗ?
Многие SEO-специалисты сейчас предпочитают не давать ТЗ своим копирайтерам на основе LSI-инструментов, а перепроверять качество текста и работы копирайтера, уже ПОСЛЕ того, как он напишет этот текст, при помощи тех слов, которые выдали сервисы.
Я тоже считаю, что так — правильнее всего.
Потому что иначе, если дать копирайтеру список слов, он будет зациклен на том, чтобы вставить эти слова и написать к ним какой-то контекст, а не на том, изучать тему глубоко и делать лучшую статью в ТОПе.
Как выглядит LSI-текст? Сравним 2 таких абзаца, которые я быстро написала:
1й текст
LSI-тексты — это важнейший сегодня момент в продвижении сайтов. Если вы их не используете, то вы существенно проигрываете по сравнению с другими сайтами. Это самый важный тренд этого года и об этом стоит помнить.
2й текст
LSI — всего лишь один из сотен текстовых факторов ранжирования поисковых систем. Но, учитывая активное развитие Гугла, а за ним и Яндекса в эту сторону, стоит обязательно включить LSI-копирайтинг в зону приоритетного внимания и освоить хотя бы несколько основных инструментов для добывания подсветок, подсказок, синонимов и других дополнительных ключевых и тематических слов.
В первый текст можно вставить любой термин вместо LSI — хоть «крауд-маркетинг», и ничего не изменится. Вода, никакой пользы человеку нет. Единственные слова, более-менее связанные с тематикой — «продвижение сайтов», «сайт» — они достаточно общего характера.
Во-втором тексте тоже мало пользы, конечно. Но сюда сложно подставить какой-то еще термин и пользователю (а также поисковой системе) гораздо понятнее, о чем идет речь. Здесь идет и расширение семантики, и LSI — много слов по узкой теме данного вопроса. Второй текст написан с большим «знанием дела», чем первый. Он гораздо более релевантен нужному запросу и довольно большому количеству сопутствующих.
Вообще, наверное, лучшая статья по LSI — от Dr.Max, там написано все то, что нет смысла тут перепечатывать другими словами. Читайте у него на сайте, подписывайтесь в конце статьи на его рассылки, я этого автора давно знаю и очень рекомендую. Но кусок из этой его статьи ниже все-таки приведу:
Как он пишет в этой статье, «секрет и страшная военная тайна LSI-текстов», состоит в следующем:
«Главным критерием является восприятие текста ребенком 13-14 лет. (В комментарии к своей статье, по ссылке выше, он объясняет этот момент подробнее).
Любой, даже академической сложности текст, например, посвященный квантовой физике, должен быть изложен языком, понятным этому ребенку. Хорошим примером тут могут быть книги Перельмана, все его знаменитые «Увлекательная Физика», «Увлекательная математика» и пр.
Они четко отвечают всем критериям LSI-контента:
— Короткие, рубленые предложения, без деепричастных оборотов и прочих синтаксических выкрутасов;
— Длинные предложения чередуются с короткими;
— Четкое выделение абзацев;
— Полнота и широта изложения материалов;
— Наличие иллюстраций;
— Сочетание теории и практики (или по другому, выборки и конкретики).
Все это обусловлено недостаточной развитостью алгоритмов поисковых систем, когда корпус для обучения выбирается ограниченным числом экспертов. В дальнейшем, критерии будут усложняться.
Помимо прочего, контент должен обладать следующими параметрами:
— Безошибочность текста;
— Экспертный уровень текста (не нужно заказывать контент у горе копирайтеров по $1 за 1000 символов. Человек, как минимум, должен быть «в теме»);
— Выборка материала — это подборка теоретических данных по проблематике, широко раскрывающая тематику;
— Конкретика материала — это практический опыт, полезные сведения, сравнения.
Применение этих методов написания неизбежно влечет за собой рост размера контента, иначе говоря, получаются огромные текстовые портянки, разбавленные медиаматериалами. »
«На маултолке мне решили уточнить, что LSI — это царство синонимов. Что нужно использовать как можно больше фраз, построенных именно на синонимах. Но это не так.
К синонимам, правильные LSI тексты имеют отдаленное отношение. В текстах, для подтверждения релевантности используются квазисинонимы. Они определяются их наличием в тексте рядом с исходным ключевым словом. Чем ближе в контент-единице (предложение, абзац, глава и т.д.) стоит эта фраза, чем чаще она встречается в разных текстах всего корпуса, тем более релевантным фраза будет исходному ключевому слову.
Наличие нескольких таких «релевантных» слов в тексте подтверждает как тематику, так и (что самое главное), исходную ключевую фразу.
Давайте приведем эксперимент.
Я загадал слово «солнце». По моим прикидкам словами подтверждениями будут «желтый», «огненный», «шар», «небо». Если мы сложим вектора этих слов, то получим исходное ключевое слово «солнце».
Вычисление синонимов
Как мы видим, с вероятностью 0,658 «солнце» находится на пересечение векторов слов «желтый», «огненный», «шар», «небо». Таким образом, если в тексте встретятся эти слова в контент-единице, то с достаточной уверенностью мы будем утверждать, что контент-единица рассказывает нам именно о «солнце».
Именно на этом и базируются LSI алгоритмы.
Если мы хотим повысить релевантность всей статьи, то нужно использовать наиболее правильные релевантные термины. И использовать достаточное число опорных фраз — подтверждений.»
Как формировать LSI-ядро для текста?
Это не только использование существующих онлайн LSI-инструментов, которые в основном парсят подсветки, подсказки, «что еще смотрят с этим».
Это в первую очередь — изучение темы «на глаз». А также фиксирование идей, как можно сделать лучше, чем у конкурентов.
Это еще:
— анализ основных запросов в Яндекс вордстат.
— просмотр ТОПа, сниппетов.
— просмотр сайтов конкурентов и схожих тематических проектов, форумов, youtube-каналов, тематических соцсетей, соцсетей лидеров мнений и так далее.
— анализ статистики вашей контекстной рекламы, запросов, по которым дают контекстную рекламу конкуренты (через тот же Спайвордс или Семраш).
Когда мало времени на исследование, я люблю просто глянуть Яндекс вордстат, Топ — заголовки и описания сниппетов, и подсказки, «что еще ищут» по нескольким самым важным запросам страницы и сразу становится ясно, какие важные слова я упустила.
Вот данные одного только Яндекса:
Анализ ТОПа:
«Что еще ищут»:
Подсказки Яндекса:
Яндекс вордстат — https://wordstat.yandex.ru :
Яндекс вордстат «похожие запросы»:
Это все я быстро глянула вручную, но, конечно, можно воспользоваться инструментами автоматизации.
С одной стороны, в ТОПе сайты часто держатся за счет других факторов (не за счет употребления релевантных слов), но с другой стороны, если приложить голову — то это все равно отличный источник для поиска дополнительных ключевых и тематических слов и терминов.
LSI-инструменты
Я приведу тут самые популярные, которых вполне достаточно:
1) Яндекс Вордстат Можно парсить Киколлектором, например.
Можно использовать удобный и быстрый онлайн-сервис Моаб, который сочетает парсинг и Вордстата, и подсказок, чистит и объединяет это в одно.
Результат:
Есть пара хороших статей с описанием инструментов:
Dr.Max в своей статье подробнейшим опытом описывает стратегию поиска LSI-слов при помощи Semrush.
Есть сервис Алексея Чекушина «Акварель-генератор» (в рамках Just-Magic.org)
У этого SEO-инструмента минусом обычно называют его дороговизну.
В этой статье Алексей Чекушин подробно описывает свой подход к сбору LSI-слов.
«Несмотря на явные плюсы, подобный метод имеет и свои минусы. Во-первых, он очень ресурсоемок: на проверку одного слова тратится 3 XML-запроса; а на составление списка при помощи «Акварель-генератора» уходит в среднем 2300 XML-запросов.
В итоге проверка таким способом получается значительно дороже остальных, которые сегодня доступны практически бесплатно.»
Еще статьи, видео
Еще несколько хороших статей по LSI:
«LSI в SEO: раскладываем по полочкам. Как использовать тематические слова эффективно» — Алексей Трудов
«LSI – оптимизация без ключевых слов» — Алексей Чекушин
«Латентно-семантический анализ» на Хабрахабре
И посмотрите вебинар Сергея Кокшарова (Деваки) на 40 минут:
Запись вебинара «LSI тексты: Как улучшить ваши тексты с помощью LSI»