Дата: 30.05.2016, обновлено: 06.12.2017
Описание и инструкции
к анализатору анкор листов, заголовков и строк из прочих тегов
Общая информация
Анализатор (далее - сервис) раскладывает поданный пользователем список строк во всех возможных последовательностях и составах, показывая информацию о количестве этих фрагментов строк, а также о том, на каких они страницах, какие слова рядом и других характеристиках, позволяя провести детальный анализ семантики таких списков данных, как:
- анкоры ссылочной массы;
- заголовки;
- содержимое любых тегов одного типа;
- строки с указанием кол-ва её упоминаний;
- любых других текстов.
Ключевая особенность сервиса состоит в том, что он показывает не просто частоту слов, а делает это на уровне шинглов для поданной на анализ коллекции, что обеспечивает поиск разнообразных стойких словосочетаний и слов-спутников, которые учитывает ПС по средствам латентно-семантического анализа (LSI). Алгоритм анализатора более близкок к тому, что используют для анализа текстов все поисковые системы и позволяет получить более подробную информацию, нежели классическая частотность по словам (плотность слов), однако в отличии от LSI адаптирована под человека, что задает качественно новый уровень анализа текстовых данных.
За счет сгенерированных на основе вашей выгрузки данных можно:
- Указать в ТЗ копирайтеру количество ключевых слов, словосочетаний и набора релятивных слов на основе LSI анализа текстов конкурентов.
- получить представление о семантике сайта;
- проверять и корректировать распределение анкорного веса по сайту;
- правильно прокачать динамический и статический вес ссылочной массы, усилив важные страницы;
- оценивать частотность (плотность), разбавленность или перегретость слов и словосочетаний за счет их повторения в шинглах на странице и сайте в целом, а также сравнивать эти показатели с соседями в выдаче;
- узнавать на основе тегов (ссылок, заголовков и тому подобное) какие и как на сайте усилены фразы;
- составить собственный анкор-лист за счет исследования других сайтов или скорректировать уже существующий ссылочный портфель, например, загрузив в одной выгрузке анкор-листы нескольких эталонных сайтов;
- подкорректировать содержимое страниц под сложившийся динамический вес, повысив их релятивность ссылочной массе;
- проанализировать список анкоров из истории запросов;
- узнать обратные ссылки и их количество для лидеров из TOP выдачи ПС, получить разнообразные данные при творческом подходе;
- узнать отключено ли ссылочное ранжирование, проанализировав отсутствие анкорного веса у лидеров по запросу с помощью выгрузки LinkPad;
- вычислить количество синтетических анкоров (т.е. когда один многословный продвигаемый анкор раздроблен по словам в нескольких ссылках, при этом, по этим парам всё равно идет частичная склейка, поэтому важно знать соотношение фрагментов этого словосочетания, усилив проседающее слово синтезируемой фразы) подробнее;
- узнать слабые места в распределении динамического веса на сайте конкурента, например: сравнив картину по заголовкам сайта и по анкорам LinkPad, и глубже: заголовки доноров LinkPad и анкоров LinkPad оценив релятивность ссылочной массы;
- благодаря поддержке программы Screaming Frog SEO Spider оценивать любые другие данные, например, узнать количество внутренних ссылок ведущих на изучаемые страницы конкурента и силу анкорного веса, а также получать средние результаты на основе загрузки в одном файле данных множества сайтов;
- с помощью группировщика - переколдовщика слов собрать в единое значение разные слова, отдельные словоформы или группы качеств для исследования их связанности с другими словами или просто для оптимизации показаний таблицы;
- и многое другое при творческом подходе к универсальности сервиса, например, найти пересекающиеся домены доноров или подсчитать количество воды (или даже словестных конструкций нарушающих информационный стиль) на основе пользовательского набора слов в Группировщике - переколдовщике слов.
Конфиденциальность
Данный
бесплатный онлайн сервис работает на основе технологий HTML 5 API и не отправляет информации о ваших выгрузках на сервер т.к. обработка информации и сохранение настроек происходит прямо в браузере.
Принцип работы сервиса
Каждая фраза, представляющая собой пассаж текста, анкор или содержимое другого тега раскладывается на слова, у этих слов удаляются (стеммируются) алгоритмом Портера окончания и выводятся в столбик по частоте упоминания, затем, в следующую колонку записываются все слова из фраз, содержащие это слово во всех словоформах из предыдущей колонки. При этом каждое слово фразы подставляется в первую колонку, а в последующих колонках во всех возможных последовательностях записываются другие слова этого
шингла (набора слов без учета расстояния и последовательности слов). Иначе говоря, в каждом следующем столбце добавляется новое слово из исконных текстовых данных. Это позволяет, выбрав интересующую ветвь, полностью исследовать ее семантический состав не пропустив не одного слова и его словоформы.
Упрощенный пример (без значений) для фразы «лучшие сайты мира»:
Генератор плодит очень много вариаций, поэтому можно активировать функцию «Оставить один ряд для уникальных наборов слов» (далее в примерах включена), тогда, если какую-либо ветвь создала одна уникальная фраза и фрагментов других фраз в колонке нет, начиная со второго уровня, ветви таких фраз обрезаются по первой строке, не плодя вариаций с перетасовкой, что уменьшает таблицы, в среднем, на 30 и более процентов. Вот так это выглядит для предыдущего примера:
Интерпретация значений
Рассмотрим пример с иллюстрацией для списка фраз:
- лучший сайт мира
- сайт про лучшие сайты мира
На изображении с примером приоткрыты только две колонки (тип выгрузки пока что без адресов страниц).
Расшифровка:
- Под полем раздела «∑» (сумма по выгрузке) и полем стеммированного слова находится строка
«а:»
(анкор), первые два значения - это количество фраз (строк=пассажей=шинглов) с данным стеммированным набором слов в виде процента (по отношению к количеству фраз в данной колонке) и точном количестве. Эти цифры позволяют просмотреть соотношение слов в анкор-листе в целом для сайта и на каждом этапе разбиения фразы. Цифра с количеством строк «а:»
в колонке раздела кликабельна и позволяет просмотреть кол-во оригинальных пассажей в целом для раздела. Кроме того, в первой колонке, при наведении, также доступна всплывающая подсказка с общим количеством слов в разделе и (кроме выгрузки sape) длиной текста с и без пробелов (теги и двойные пробелы не считаются).
Значение кол-ва в столбце со стеммированным словом, начиная со второго столбца таблицы, может быть выделено жирным, это означает, что есть повторы слов текущего набора в пределах фразы (при наведении курсора можно узнать их кол-во и словоформы, они также доступны в их ячейках на следующих подуровнях таблицы). Эти повторы не учитываются в видимом значении, т.к. это повтор внутри фразы, а не количество фраз с данным стеммированнием слова, что следует учитывать при оценке частотности слов в первом столбике со стеммами, которая без прибавления данных повторов, является частотой пассажей с вхождением. Для четвертого подуровня повторов нет, т.к. там выдается весь остаток слов и не остается слов вне набора.
- Далее в строке
«а:»
идет значение в скобках, показывающее среднюю длину анкора/фразы округленных до ближайшего целого. Информация о длине анкора в последующих колонках таблицы дана только для подпадающих под нее фраз, таким образом, для каждой фразы, в любом месте таблицы, можно узнать уровень ее разбавления. Кроме того, нажав на показатель можно просмотреть таблицу с точным отображением количества фраз с определенной длиной (без учета стоп-слов пустышек из опционального текстового поля «Удаляемые при анализе служебные части речи»).
- Как уже было написано выше, все фразы лишаются окончаний в процессе выделения основы слов стеммингом. Поэтому, по следующему за скобками значению
можно узнать сколько словоформ скрывается за общей стеммированной основой. Более подробную и разнообразную информацию о словоформах можно получить нажав на показатель и вызвав окно вьювера, который описывается далее в соответствующем разделе.
При наличии повторов слов в строке в уникальной словоформе значение количества словоформ в подуровнях 1-3 будет выделено жирным, а число этих повторов и плодимых ими вариаций словоформ прибавлено к значению, т.к. в отличии от повторов слов, которые не учитываются в ячейке в его видимом значении, уникальные словоформы (уникальные сочетания слов) из повтора прибавляются к видимому значению являясь альтернативным набором. Количество этих повторов можно посмотреть во всплывающей подсказке, а сами повторы при нажатии на значение - в окне вьювера.
- Дополнительным значением после кол-ва словоформ может быть вспомогательный символ средней точки «·», означающий, что одна из словоформ идентична стемму.
- Для изучения оставшихся значений откроем нажатиями на символ ⇔ все уровни для стеммированного значения
«лучш»
:
Важно заметить, что фразы раскладываются во всех возможных комбинациях и последовательностях на фрагменты до трех слов, остальные слова для данной ветви показываются в виде остатка в последнем столбце таблицы, но, так или иначе, все слова из остатка присутствуют в предыдущих колонках.
Примечание: если включена опция «Обрезать N подуровень таблицы» остаток набора слов в последней колонке не показывается, поэтому, чтобы увидеть состав уникальной фразы осмотром последней колонки, необходимо отключить в настройках опцию «Оставить один ряд для уникальных фраз».
Обратите внимание, что в подуровнях 2-3 перед показателем количества словоформ может быть символ кавычки «"», означающий, что какое-то количество словоформ данного словосочетания не просто в одном шингле, а находятся рядом. Точное количество можно узнать в окне вьювера.
Следующие за показателем количества словоформ – показатели красного цвета - это количество фраз, которые больше не имеют дополнительных слов, т.е. точно соответствуют текущему для колонки набору стеммированных слов. Значение выводится в фактическом и процентном соотношении и позволяет оценить уровень разбавления фразы на текущем этапе. Блок показывается только при наличии точных совпадений, кроме того, в выгрузке с арендными ссылками Sape.ru, цифры могут быть также голубого цвета, что означает что данная строка является ссылкой с анкором из списка «Учет околоссылочного текста для ссылок в виде:» у которого учитывается околоссылочный вес и в последующих за ним значениях идет уже не часть текста ссылки, а значения околоссылочного текста (подробнее в дополнительном описании для Sape.ru).
Важный момент: поскольку фразы раскладываются во всех возможных комбинациях, узнать сколько фраз на уровне (в данной колонке) можно из ячейки родителя в предыдущем столбце минус точное совпадение (красное значение) в данном же родителе! Это красное значение также отнимает свой процент в подсчете процента в последующем столбике (являясь как бы равноправным вариантом фразы, но без продолжения). Все это отчетливо видно на предыдущей иллюстрации. Информация о количестве фраз той или иной длины (начиная с текущего уровня) доступна также во всплывающем окне «длины анкоров».
Таким образом, заглянув в таблицу, можно узнать, какие слова, в каком количестве и какой длины содержатся на каждом этапе разбиения фразы.
Вьювер словоформ
Как уже было упомянуто в предыдущем разделе, в основной таблице мы видим стеммированную основы слов, а также количество этих словоформ встречающихся на любом расстоянии в пределах строки (шингла), сами же словоформы можно посмотреть нажав на цифру показывающую кол-во словоформ, тем самым вызвав
вьювер словоформ, который покажет текущий набор слов (слов из этой ячейки и из предыдущих колонок).
Иллюстрация:
! Последовательность слов сброшена в целях группировки идентичных по составу фраз (впрочем, как и везде в данных) и совпадает лишь случайно.
! Обратите внимание, что верхний угол
вьювера всегда указывает на показатель по которому производился клик.
Для каждого набора словоформ доступны такие значения как:
- количество строк для каждого набора словоформ,
- количество фраз (будут отмечены красным цветом как в основной таблице), которые больше не имеют дополнительных слов, т.е. точно соответствуют текущему для колонки набору стеммированных слов,
! Удаляемые в таблице части речи игнорируются и здесь тоже.
- для подуровней 2 и 3 (биграмм и триграмм) - количество фрагментов-пассажей, в которых данные слова в точной словоформе находятся рядом, а не просто в одной строке, при этом слова могут быть в любой последовательности, особенно это важно понимать при просмотре значений для трехсловных словоформ (триграмм), т.к. каждое слово может быть по середине, а другие больше не быть рядом, однако состав слов для фрагмента будет таким же.
Пример: 1 2 3 , будут найдены 1 2 3, 1 3 2, 2 1 3, 2 3 1, 3 1 2, 3 2 1.
! Удаляемые в таблице части речи игнорируются и здесь тоже.
! Слова, разделенные .?!… + пробелом + одним из этих слов с большой буквы не будут посчитаны как рядом расположенные, т.к. это признак разделения строки на отдельные пассажи.
- под набором конкретной словоформы также могут присутствовать повторы слов текущего набора в строке в любой словоформе с указанием их количества и того, образуют ли они альтернативный набор из нескольких слов подряд.
Жирным будут отмечены повторы, которые представляют собой уникальные словоформы, создающие уникальный альтернативный набор словоформ (именно они делают показатель кол-ва словоформ в основной таблице жирным).
В самой словоформе может не быть слов рядом, потому что генератор берет первые слова в строке, но они могут быть в повторах.
Помните, что в повторах также могут содержаться словоформы, которые выступают в других фразах как основные.
Из-за повторов может возникнуть ситуация, когда не ясно, сколько строк данной словоформы с повторами имеет строк рядом (когда рядом есть в самой словоформе и в повторе, и не ясно, одновременно или в разных строках). Такие затруднения с подсчетами кол-ва строк со словами рядом для определенных словоформ возникают редко и только при наличии повторов, в этом случае необходимо более внимательно осмотреть таблицу, чтобы сделать правильные выводы.
- под таблицей также присутствует суммарный показатель «Всего строк с наборами слов рядом». Для того чтобы узнать процент слов рядом для текущего стеммированного набора, используйте этот процентный показатель (при наведении доступны точные цифры).
Под списком информации о словоформах в окне вьювера также находится таблица с результатами глобального поиска словоформ по вашей выгрузке.
Это очень полезный инструмент, который помогает разрешить непонятные ситуации, например, когда обнаруживаются какие-то слова в основной таблице там, где их не должно быть и нужно посмотреть список оригинальных фраз с вхождениями текущего набора словоформ чтобы прояснить ситуацию.
Глобальный поиск показывает следующие данные:
Заголовок с веб-адресом (при наличии и выборе выгрузок с указанием URL или пользовательским признаками общности) и сколько строк на этой странице (а:) с найденным набором словоформ, а также, для выгрузок со списком арендных ссылок Sape.ru - сколько левых и правых околоссылочных текстов (л:, п:).
- Оригинальная фраза (строка) и количество ее повторов в пределах данного URL / признака общности.
! В глобальном поиске выводятся все совпадения наборов, независимо от исследуемой страницы или сайта (если их несколько в выгрузке).
! Слова строк совпавших по набору словоформ подсвечены в глобальном поиске салатовым цветом.
Для дополнительной подсветки в вьювере можно использовать стандартное средство поиска в браузере: выделите интересующую словоформу и используйте комбинацию клавиш Ctrl+C, Ctrl+F и Сtrl+V для быстрого копирования и вставки текста.
При увеличении масштаба страницы более чем на 10%, вьювер может выйти за боковые границы окна. Уменьшите масштаб в случае возникновения данной проблемы.
Дополнительные значения для данных с URL
Если выбран тип выгрузки с указанием адресов страниц исследуемого сайта-акцептора, а именно:
- выгрузка арендных ссылок Sape.ru,
- выгрузка Screaming Frog SEO Spider,
- пользовательский .сsv c текстовым полем и URL страницы-акцептора
...то в этом случае появляются дополнительные значения:
- В первом столбике, помимо раздела ∑ (сумма по сайту) появляются строки для всех страниц с количеством ссылок на каждой странице в точном количестве и процентном соотношении относительно суммы по сайту и длине анкоров (кликабельное значение в скобках).
! При творческом подходе, вместо URL может быть любой пользовательский признак общности (в первую очередь это касается выгрузок программы Screaming Frog SEO Spider).
- Также, если есть ошибки и расхождения в написании урла, в плане наличия или отсутствия слешей, протоколов http, https и www, а также артефактов в конце URL строки типа «&» или «?» название страницы в первом столбике разложится на эти виды написания с указанием количества упоминания каждого из них, при этом количество менее популярных форм написания url адреса страницы будут обозначены красным цветом. Адреса страниц с протоколами кликабельны, что позволяет проверить валидно ли происходят редирект на основную форму написания URL. Ссылки без указания протоколов не могут работать правильно, и, если такой лаконичный вариант их написания не задуман изначально - ошибочны.
-
И, конечно, самое важное:
в каждой ячейке со стеммированными словами появятся значения, указывающие на то, сколько на других страницах и в целом по сайту есть аналогичных фрагментов фраз
(но без процентов):
- для раздела «∑»
(сумма по сайту)
блоки «г:»
(главная) и «д:»
(все другие),
- для главной - «∑»
и «д:»
,
- для остальных страниц это: «∑»
, «г:»
, «д:»
.
- В добавок к выше сказанному, если в одном файле выгрузки несколько доменов (или других признаков общности), данные из них будут показываться в отдельных таблицах, отсортированных по количеству строк.
Дополнительные поля для выгрузки Sape.ru (арендные ссылки)
Для выгрузок на основе синтаксиса арендных ссылок Sape.ru, на ряду со значениями URL, дополнительно доступны расчеты по части анкоров у которых поисковыми системами учитывается околоссылочный текст (тут, здесь и тому подобные). Список этих анкоров представлен в текстовом поле сервиса «Учет околоссылочного текста для ссылок в виде:» (текст строки за пределами #a#...#/a#
для иных анкоров не будет учтен).
Околоссылочный текст для слов из списка по сути такой же анкор, но он может быть как левым «л:»
по отношению к анкору, так и правым «п:»
. Какая именно сторона будет взята (если околоссылочный текст слева и справа) установить сложно, поэтому данные строки присоединяются к ячейкам в виде строк «л:»
и/или «п:»
, а сортировка по количеству в основной таблице идет за счет прибавления максимального числа повторов одного из них. Также информация об околоссылочном тексте доступна после анкора (у которого, как уже было написано выше – точное вхождение голубого цвета).
! В строке «а:»
подсчитаны также и сами безанкорные «анкоры».
Строки «л:»
и «п:»
аналогичны по составу и функционалу со строкой «а:»
.
При работе с Sape.ru не забывайте, что нужно выгружать ссылки только в статусе «OK».
Анализ полноценных текстов,
работа с HTML кодом.
По умолчанию сервис разделяет данные на пассажи по строкам/границам ячеек, однако можно указать дополнительные разделители шинглов (слова разделяются автоматически) и условия для очистки данных от мусора на основе метода replace (JavaScript) c условиями в виде регулярных выражений RegExp. Соответствующие поля уже заполнены стандартными вариантами, их активация и редактирование доступны при выборе вкладки с типом данных "пользовательский CSV", "данные в текстовых файлах" и "текстовое поле".
Всего доступно три поля для ввода регулярных выражений, каждый из которых по умолчанию выполняет свои функции:
раскрыть
-
/[.?!…](?:<[^>]+>)*?\s+?(?:(?:<[^>]+>|\s))*?([А-ЯA-Z0-9№])/g
Данное выражение означает, что если за символами из набора [.?…!]
идут пробельные символы (минимум один) \s+
а также, возможно, теги в различных конфигурациях
(?:<[^>]+>)*?
и после идет Заглавная буква или цифра или № ([А-ЯA-Z0-9№])
, то в этом месте пассаж будет разделен и образует отдельный шингл.
Иными словами, каждое новое предложение в поданном на обработку тексте будет распознано как отдельный пассаж.
В фрагменте выражения ([А-ЯA-Z0-9№])
внутри скобок отсутствует ?:
, это значит, что скобка является запоминающей, поэтому найденный в данных скобках символ вернется в результат (при подсчете длины текста посчитается как 1 символ и 1 пробел). Не используйте как разделитель просто пробел, будет подсчитана частотность по словам, при этом собъется показатель длины текста.
! В данном выражении должна быть одна запоминающая скобка, не больше и не меньше!
! В последующих полях запоминающие скобки не работают.
В конце этого выражения отсутствует флаг i
, что делает выражение регистрозависимым и позволяет искать заглавные буквы.
Для работы данного выражения необходимо наличие пробела после точки и заглавной буквы и оно предназначено для текста нормального вида, а условия с тегами добавлены лишь для большей совместимости, поэтому для ситуаций, когда в загружаемых данных имеются теги, необходима совместная работа с еще одним регулярным выражением, которое заменит общепризнанные теги-разделители пассажей:
/<\/*(?:p|div|table|td|li|hr|h[1-6])>/ig
Данное выражение разделяет текст на пассажи по тегам. Регистр букв уже не важен (флаг i
), как не важно и наличие пробелов.
Обратите внимание, что отсутствует тег br, который внутри пассажа не является сам по себе разделителем и служит для целей разрыва текста при верстке.
Фрагменты в этом и следующем выражении заменяются на пустое значение и не будут учтены при расчете длины текста.
/<script[\s\S]*?\/script>|<style[\s\S]*?\/style>/ig
Выражение удаляет из входных данных фрагменты JS и CSS кода, является разделителем пассажа.
Здесь могут быть любые пользовательские условия для поиска и удаления любых других совпадений.
Не забывайте оставить отмеченным хотя бы один из разделителей для режима «Границы пассажей», если деактивировать все разделители, сервис будет считать что в тексте один пассаж и будет пытаться его обработать как единый шингл.
Считать число в конце строки отделенное Tab количеством строк
Данная опция доступна во вкладке "Данные в текстовых файлах" и "Текстовое поле для быстрой вставки строк", она позволяет подать на анализ список строк с количеством упоминаний каждой из них, которое указанно в конце соответствующей строки и отделено от текста Tab (длинным пробелом). Чаще всего такими данными являются данные Wordstat и других метрик, включая запросы из сервиса Яндекс.Метрика. Однако наиболее ценным преимуществом, дорогу к которому открывает данная возможность - это исследование семантики поисковых фраз с максимальным количеством отказов. С помощью указания количества можно без искажений узнать количество упоминаний тех или иных слов и словосочетаний, а также их спутников, обеспечивая наиболее четкое соотношение для просмотра таблицы LSI.
Обратите внимание, что строки без Tab c нулем или без числа будут преобразованы в 1. Числа с пробелами будут учтены. При любом количестве Tab в строке - первый участок берется как текст, фрагмент после последнего Tab – как количество (если число) или игнорируются. Все значения между - игнорируются, что особо удобно при копировании из таблиц с промежуточными значениями. Все числа преобразуются в целые, с отсечением дробной части.
Группировщик - переколдовщик слов
В новой версии сервиса появилась возможность присваивать различным словам и фрагментам фраз общее значение в таблице. Это может быть нужно, чтобы разделить стеммированные алгоритмом Портера в одну ячейку разные слова или наоборот, переколдовать различные понятия, характеризующие какие-то качества, в одно значение с подсчетом показателей в ячеке, как если бы оно было одним словом.
Слова и фразы группируются по правилам макроса, заданного в опциональном текстовом поле «Группировщик - переколдовщик слов»:
раскрыть
Синтаксис строки макроса состоит из двух частей:
- итоговое значение, которое будет видно в таблице в
{
фигурных скобках}
,
- слова с их словоформами перечисленные через запятую, которые будут заменяться.
Результат и условия разделены знаком равно:
{видимое после обработки значение}=слово,слова
! Количество всех исходных словоформ (и слов) по-прежнему будет отображаться в соответствующем значении таблицы, а сами словоформы можно посмотреть в вьювере.
Обратите внимание, что необходимо указать слова во всех нужных словоформах, иначе упущенная словоформа будет показана в таблице по ее обычному стеммированному слову. Быстро получить все словоформы слова можно в сервисе dic.academic.ru/contents.nsf/dic_forms. Чтобы удалить повторы словоформ и прочий мусор используйте наш чистильщик словарных списков словоформ с настройками по умолчанию.
В значении внутри фигурных скобок допускается использование HTML5 тегов (кроме <u>
и <div>
) для выделения значения, например такого как <span style=color:цвет></span>
.
Переколдовка многословных фрагментов.
С помощью указания слов через пробел можно заменить фрагмент исходной строки, при этом, такие знаки пунктуации в исходной строке как «:;,.?!»
являются разделителями (при наличии пробела после них в оригинальной строке), т.е. если между словами будут какие-то препятствия, они не будут заменены в единое значение.
{видимое после обработки значение}=словосочетание один,словосочетание два
Слова из опционального списка «Удаляемые при анализе служебные части речи» также учитываются.
Многословный переколдованный фрагмент в списке со словоформами в вьювере будет с «₊»
вместо пробелов.
Когда необходимо сгруппировать несколько слов и не важно, чем они разделены, где в строке находятся и будут ли найдены все в строке или только один из них, используйте простое перечисление слов и их словоформ через запятую.
Если близость слов все же важна, необходимо перетасовать все словоформы этих слов между собой и местами, для этого используйте пару сервисов Генератор предложений и уже упомянутый чистильщик словарных списков словоформ. Строки выходят достаточно длинными, поэтому не следует использовать слишком много подобных переколдовок (тысячи).
! Если во фразе несколько совпадений, то сначала заменяются фрагменты с большим числом слов. После того как словам назначена группа, исходные слова больше не доступны далее в макросе.
! Переколдовщик лишь объединяет показания нескольких слов и не влияет на общие расчеты.
Другие опции
Реакция оптимизатора на значения в таблице
Дальнейшие действия seo-оптимизаторов и линк-менеджеров, в частности, в плане изменения соотношения и степени разбавления анкоров, их длины и распределения по сайту, диктуются исключительно личным опытом и актуальными знаниями, которые можно найти на сайтах SEO тематики.
При работе с анализатором не стоит перегружать себя: обычно достаточно осмотреть важные области таблицы и сделать пару заметок по критически важным направлениям, не пытаясь охватить всю семантику сразу.
Что нового
Дата: 06.12.2017
v.2.2
- Для вкладок "Данные в текстовых файлах" и "Текстовое поле для быстрой вставки строк" добавлена опция "Считать число в конце строки отделенное Tab количеством строк" и описание к ней;
- расширен словарь группировщика-переколдовщика слов.
Дата: 28.03.2017
v.2.1
- Появились настройки для обработки полноценных текстов и HTML кода с разбивкой на пассажи при помощи RegExp условий для произвольных входных данных;
- также теперь можно увидеть длину текста в словах и символах с пробелом и без;
- прямо в таблице теперь можно увидеть в уровнях 2-4 что эти слова рядом, а не только в пределах пассажа;
- добавлена возможность отключать не только 4-й подуровень таблицы, но и третий, для еще большей экономии памяти.
Дата: 07.07.2016
v.2.0
Большой пакет обновлений:
- В одном файле выгрузки теперь может быть несколько сайтов, данные различных доменов будут показываться в отдельных таблицах, сортированных по количеству строк;
- добавлена возможность сохранения настроек в браузере по технологии localStorage;
- добавлен опциональное текстовое поле со списком слов, которые не будут стеммироваться;
- добавлен группировщик - переколдовщик слов - поле макросов для объединения различных слов в одно групповое значение или наоборот разделения склеенных в одну ячейку алгоритмом Портера разных слов, также реализована возможность замены (переколдовки) словосочетаний;
- для группировщика - переколдовщика слов создан удалятор ударений, повторов и прочего мусора из списков словоформ взятых из внешних словарей;
- вместо простого просмотра словоформ по подсказке добавлен всплывающий вьювер с показом списка словоформ, повторов внутри фраз, а для подуровней 2 и 3 - количество слов, которые рядом;
- к вьюверу словоформ добавлен глобальный просмотр оригинальных строк с подсветкой совпадений.
- теперь при показе кол-ва словоформ учитываются словоформы повторов внутри фраз если они уникальны;
- добавлена опция отсечения 4-го подуровня в таблице.
- множество мелких дополнений (касаемые видимых данных - добавлены в инструкцию).
Дата: 30.05.2016
v.1.0