Тематический потолок = Ру*7,1

advertisement
Определение тематического потолка украинской аудитории.
Тематический потолок аудитории – это максимально возможный трафик с поисковиков на
группу сайтов определенной тематики, т.е. все те пользователи, которые ищут
определенную услугу или информацию через поисковые машины.
Определение тематического потолка очень полезно при прогнозировании ожидаемой
посещаемости сайта еще на стадии разработки и последующей оценке его реальной
посещаемости, охвата аудитории и т.п. Казалось бы, куда проще просто оценить
аудиторию определенного сектора по данным систем статистики, в нашем случае
БигМира. Действительно, если сайт относится к туристической тематике – оцениваешь
аудиторию раздела «Путешествия» или просто ориентируешься на показатели сайтовлидеров, что еще проще. Но подобные прикидки иногда ничего не дают по ряду причин.
Причина первая. Несовершенство рубрикации. В тех же «Путешествиях» собраны сайты
прогнозов погоды, сайты турпутевок, сайты гостиниц, региональные сайты, посвященные
отдельным городам, сайты печатных изданий и т.д. И иначе быть не может, это
объективные противоречия. Вычленить именно свою аудиторию иногда бывает очень
сложной задачей. Например, сайт собирается продавать путевки только на определенный
курорт, не будем оригинальными, назовем Шарм аль Шейх, и его интересует только
аудитория по Египту. Как правило, получить подобную статистику уже гораздо сложнее.
Причина вторая. Подобные методы ничего не дадут, если продвигается новая услуга.
Например, туры не в Египет, а в Монголию. Ни одного сайта, посвященного турам в
Монголию в рейтинге еще нет, ориентироваться не на кого. Сделать сайт только для того,
чтобы убедиться, что туры в Монголию спросом не пользуются – это слишком затратный
путь. Я намеренно утрирую, но вот менее несбыточные туристические примеры: зеленый
туризм, велосипедные туры, birds watching tours, достаточно популярные на Западе.
Попробуйте оценить привлекательность этих тематик для Украины, исходя из данных
существующих рейтингов. Скорее всего не получится.
Третья причина. Накрутки. Пока рейтинги являются не только системами статистики, но и
источником трафика, многие проекты пытаются завышать свою посещаемость. Оставим в
стороне технические приемы накрутки, если они попадают в поле зрения модераторов
рейтингов, сайты как правило исключаются. Простое же привлечение нецелевой
аудитории просто не противоречит правилам рейтинга, и процент ее может быть
достаточно высоким и искажать данные статистики по тематическому сектору в целом.
Причина четвертая. Большинство проектов в конкурентных тематиках закрывают свою
статистику, и, например, учесть географию посетителей, уже становится невозможным.
Во многих случаях нецелевая для нас Российская аудитория может составлять большую
часть аудитории сайта. К этому добавить еще то, что ни один рейтинг не охватывает всего
украинского сегмента, и есть тематические сектора, где счетчики на сайт ставить просто
не принято.
В любом случае, ориентируясь на данные рейтингов и систем статистики, мы в большей
мере исследуем предложение, а не спрос на те или иные услуги. Исследование статистики
запросов в различные поисковые системы может дать не ментше ценной информации для
анализа именно с точки зрения спроса на определенную информацию, услуги или товары.
Задача определения тематического потолка аудитории сайта для Рунета рассматривалась
еще на первой конференции по оптимизации в 2002 году.
Исходили из того, что мы знаем распределение долей поискового трафика между
поисковиками Рунета, на тот момент основными игроками были Яндекс, Рамблер и
Апорт, и можем, следовательно, прогнозировать общий трафик на сайт по данным одного
поисковика. На тот момент уже существовал Яндекс-Директ, дававший данные о
статистике запросов и Спайлог с большей или меньшей регулярностью публиковал
отчеты о глобальной статистике Рунета, где были данные по долям поисковиков. Оставим
за скобками все дискуссии о корректности этих данных. Других все равно не было.
Тогда доли распределялись следующим образом:
Яндекс 49%
Рамблер 28%
Гугл 12%
Апорт 7%
Прочие 4%
Следовательно, умножив частоту запроса в Яндексе на 2,04, мы могли оценить потолок
аудитории по конкретному запросу по Рунету. Такая вот простая и полезная формула.
Попытки посчитать потолок для украинской аудитории значительно усложнялись.
Географического таргетинга по запросам еще не было. Приходилось исходить из того, что
Украина составляла около 6% аудитории Яндекса в целом, что не давало хорошей
точности, так как по многим запросам реальные данные сильно отличались от «средней
температуры по палате». Понятно, что из-за шести процентов никто особо напрягаться не
хотел, только появление географического таргетинга на Рамблере заставило Яндекс
вспомнить об Украине в ряду прочих регионов.
Добавим сюда языковой аспект, поддержка украинского языка запросов тоже не являлась
приоритетом для российских поисковиков, и даже если была, то периодически
«отваливалась» и приходилось просить «вернуть на место». Между тем, в некоторых
тематических секторах украинский очень важен. Желающих отправляю на рейтинг
поисковых запросов БигМира, где «реферати» популярнее, чем «рефераты».
Но главным препятствием было вовсе не это, а то, что мы не знали реальной структуры
поискового трафика для украинского сегмента Сети. Потому что Российские счетчики по
тем же причинам не обращали внимания на наши региональные поисковые машины, даже
оценить необходимость или наоборот – ненужность продвижения в Мете было
проблематичным.
И вот, практически одновременно (октябрь-ноябрь 2004) подобный сервис запустили
Топпинг и БигМир, за что им огромное человеческое спасибо. Т.е. данные были
перепроверены различными системами статистики и практически совпали. Они
кардинально отличаются от российских. Достаточно сказать, что практически монополист
на российском рынке – Яндекс – в Украинском трафике составляет 16,1%. А Гугл, –
наоборот намного более значим, чем для россиян – 38,9% (данные за полгода). Причем
доля Гугл имеет тенденцию к росту.
Итак, теперь у нас появилась возможность записать свою формулу определения
тематического потолка. Для преобразований использовались данные за март 2005
По украинской
аудитории
google.com
yandex.ru
rambler.ru
meta.ua
bigmir.net
msn.com
mail.ru
aport.ru
yahoo.com
search.com.ua
%
3673729
1407948
1321330
1241943
767255
292105
119262
103634
45876
16115
40,9
15,7
14,1
13,8
8,5
3,2
1,3
1,1
0,5
0,2
Итак,
Тематический потолок = 2,44Gу = 6,37Яу = 7,1Ру = 7,25М = 11,76Б (1)
Где Gу – частота запроса по Google с таргетингом на Украину
Яу – частота запроса по Яндексу с таргетингом на Украину
Ру - частота запроса по Рамблеру с таргетингом на Украину
М – частота запроса по Мете
Б – частота запроса по БигМиру
Однако, если мы попробуем проверить эту расчудесную «формулу абсолютного топлива»,
окажется, что результаты, полученные при подсчете через разные поисковики
значительно отличаются. Т.е. вопрос, на чьи данные следует ориентироваться на
украинском рынке, остается открытым.
Сложность момента состоит в том, что данные лидера рынка от нас закрыты, Google дает
статистику запросов, но не дает числовых значений частоты, просто располагает
поисковые фразы в порядке убывания. Можно купить контекстные показы, чтобы эти
числовые значения получить, но если потолок считается для сайта, который только
проектируется, рекламировать пока нечего. И ждать результатов придется по крайней
мере месяц.
Из других участников рынка по количественным показателям также сложно выбрать
«точку отсчета», три поисковика обрабатывают практически равные доли поискового
трафика, БигМир, у которого, надеемся, еще все впереди, также не далеко от них отстал.
Статистика Яндекса, Рамблера, Меты и БигМира открыта с различными оговорками,
обсчитав ее всю, мы получим долю 52,1 %, что достаточно для каких-либо выводов, и
сможем посчитать погрешность измерений по каждому из сервисов, чтобы выбрать
оптимальный вариант.
По ходу мы попытаемся также характеризовать достоинства и недостатки каждого из
сервисов: особенности сбора статистики запросов, интерфейса, возможностей и т.п.
Удобство использования также может повлиять на наш выбор.
Для того, чтобы работа имела практический смысл, был взят сайт реального клиента,
который сейчас находится в разработке. Тематика сайта – лабораторная диагностика и
медицинские консультации.
По этой тематике было составлено семантическое ядро запросов. Правильное составление
ядра требует отдельного доклада, т.к. имеются различные подходы к его составлению.
Усилий рядового оптимизатора, как правило, недостаточно, нужен также эксперт в данной
области (в терминах структурной лингвистики – «информант») или оптимизатор, который
уже раньше работал в этой теме. Есть еще вариант с филологом, умеющим составлять
частотные терминологические словари, но это уже экзотика, почти никому недоступная.
Мы обошлись оптимизатором, ранее продвигавшим медицинское издание более широкой
тематики.
Мы решили также не ограничивать себя высокочастотными запросами, чтобы получить
как можно более точную картину. Таким образом, в ядро попало 172 запроса, включая
опечатки, неправильные написания и т.п.
Итак, начинаем проверять весь список, попутно тестируя удобство, предлагаемых
поисковиками сервисов.
1. БигМир
Достоинства:
- Открытость статистики
- Возможность обработать все слова единым списком.
- Украинская аудитория поиска
- Возможность детализации по каждой фразе (простатит, лечение простатита,
хронический простатит и т.п.)
- Суммирует общее количество запросов
- Дает общее количество всех запросов к поиску БигМир за месяц
Недостатки:
- Сравнительно небольшой объем базы запросов (многие низкочастотные запросы –
нулевая частота)
- Не указывает месяц, за который собиралась статистика.
- Нет ассоциаций
Особенности:
- Приводит запросы к единой словоформе
2. МЕТА
Недостатки:
- Закрытость статистики
Достоинства:
- Отзывчивые работники отдела рекламы (Ирина Бирюкова)
- Украинская аудитория
Особенности:
- ищет по точной словоформе при использовании операторов
3. Рамблер
Достоинства:
- Можно вводить список запросов
- Дает частоты для первой страницы результатов поиска и общее число показов на
всех страницах
- Дает данные по географии запросов, в том числе Украина
- Ищет по точной словоформе
- Дает частоты по всем словоформам парадигмы
- Дает историю, т.е. данные за предыдущие месяцы
- Дает детализацию запросов
- Дает ассоциации по запросам
- Суммирует общее количество запросов
Недостатки:
- Список запросов не должен превышать 25
4. Яндекс
Достоинства:
- Наиболее частые обновления базы
- Указание точной даты обновления базы
- География запросов по Украине с точностью до некоторых городов (Киев,
Харьков, Одесса, Днепропетровск, Донецк, Крым, Львов, Запорожье, Хмельницкий
Сумы, Луганск, Полтава, Херсон, Чернигов, Винница, Николаев, прочее )
- Введена «региональная популярность запроса» в %
- Введена история запроса по месяцам, начиная с июля 2004
- Популярность по месяцам можно посмотреть как в абсолютных значениях
(отследить рост или падение), так и в относительных (отследить сезонную
популярность без учета прироста аудитории)
Недостатки:
- Невозможность поиска по точной словоформе и с другими операторами поиска
- Отсутствие прямых указаний на то, что данные – количество показов на всех
страницах и методики подсчета количества показов на первой странице,
необходимость пересчета
- Невозможность обработки запросов списком
Итак, придется, наверное, описать методы преодоления трудностей, связанных с
недостатками указанных систем. Как видим из приведенного скриншота, «анализы» и
«анализ» - это не одно и то же. Нас ничуть не интересует «анализ рынка», «системный
анализ», «SWOT-анализ», однако запрос «анализы» для нас самый что ни на есть целевой.
И без отделения одного от другого цифры получаются просто фантастические,
непригодные к использованию. Яндекс же сводит все к одной, наиболее частотной форме.
Раньше в Яндексе действовали операторы, позволяющие уточнить запрос или искать по
точной словоформе. После очередного «улучшения» продукта, как иногда бывает,
предоставляемые им возможности уменьшились.
Мы предположили, что на таких больших числах данные Рамблера об употреблении в
запросах различных падежей статистически достоверны, и пересчитали наиболее
очевидные запросы («анализ»-«анализы», «почка»-«почки» и т.д.) для нужного нам
падежа. Такие же манипуляции были проведены с показаниями БигМира, который тоже
сводит все запросы к одной форме.
Кроме того, данные Яндекса делились на озвученный сотрудниками Яндекса на форуме
коэффициент 1,5, чтобы получить показы первой страницы, т.е. количество запросов.
Коэффициент проверялся по данным Рамблера и подтвердился.
В итоге получилась результирующая таблица:
Запрос
анализы
медицинский центр
эко
простатит
зачатие
цистит
анализ крови
почки
бесплодие
мочи
базальная температура
гемоглобин
группа крови
уреаплазма
биохимия
анемия
урология
диагностический
диета по группе крови
медицинский справочник
…………….
всего 172 запроса
Рамблер У Мета
211
123
162
438
460
276
562
294
326
134
282
61
373
158
693
358
268
208
309
121
232
17
268
52
394
119
127
112
506
66
231
231
192
417
120
332
232
42
179
87
10037
6498
Яндекс У
82
292
184
196
89
41
105
509
139
81
11
35
79
75
44
154
278
221
28
58
БигМир
20
116
77
74
41
22
32
62
43
21
19
19
92
35
20
19
76
71
34
30
17530
1640
Итак, по логике вещей, эта сумма – 35705 запросов в месяц - всех этих запросов должна
составлять долю в 52,1% от всего поискового трафика. Тогда тематический потолок (весь
трафик) составит 68532 запроса.
Пересчитаем тематический потолок по формуле (1) по данным каждого из поисковиков, и
определим относительную ошибку, как (Δа/а)*100
Данные сведены в таблицу 2
Поисковик
Рамблер У
Мета
Яндекс У
БигМир
всего из указанных
Тематический потолок
Запросов
10037
6498
17530
1640
35705
68532
Доля, %
Расчетный Ошибка, %
71262,7
47110,5
111666,1
19286,4
-3,98
31,26
-62,94
71,86
52,1
100
Итак, для целей нашего исследования наиболее точным инструментом оказался Рамблер
(относительная ошибка 3,98%).
Для оценки трафика в украинском сегменте мы предлагаем использовать частоту
запросов Рамблера по Украине, умноженную на семь.
Тематический потолок = Ру*7,1
Можно ли распространять эти выводы на другие тематические сектора, и корректны ли
наши манипуляции со словоформами, будет ли коэффициент меняться с течением
времени – другой вопрос. Мы пытались провести это исследование при тех возможностях,
которые предоставляют нам статистика поисковых машин в настоящее время.
Нужно при этом помнить, что тематический потолок – это вся аудитория, ищущая
информацию по данной тематике. Как ее достичь – поисковая оптимизация, баннерная
реклама, контекстная реклама, рассылки, вирусный маркетинг, другие виды рекламы. –
дело интернет-маркетолога, а не оптимизатора. Если ориентироваться на средние данные
озвученные Спайлогом в конце 2004, т.е. типичный корпоративный сайт, не входящий в
первую тысячу сайтов, то поисковый трафик сейчас составляет 55% от всей посещаемости
сайта. И мы можем уже оценивать всю возможную аудиторию сайта, не только поисковый
трафик. Вопрос зависимости этого процента от тематического сектора пока не решен.
Понятно, что тут существуют кардинальные отличия между секторами.
Тематический потолок может также служить отправной точкой для расчета поискового
трафика на конкретный сайт по конкретным запросам с учетом CTR результатов поиска. В
последнее время появилось несколько работ, освещающих подобные методики. По
просьбе Андрея Иванова Спайлогом был проведен эксперимент по выборке сайтов для
определения количества переходов в зависимости от места сайта в поисковой выдаче, его
данные косвенно подтвердил также счетчик LiveInternet. Т.е. теоретически уже можно
считать ожидаемый трафик при условии хороших позиций сайта по ключевым запросам.
Что в свою очередь является недостижимым идеалом в условиях конкуренции.
Другой подход к этой проблеме рассмотрен в статье Сергея Петренко и Виталия
Шаповала «Покупаем оптимизацию – аспект медиапланирования».
Мне вообще нравятся подобные тенденции в Рунете, когда системы статистики и
оптимизаторы сотрудничают. Хотелось бы призвать украинские поисковики и системы
статистики превзойти в этом россиян.
Download