Определение тематического потолка украинской аудитории. Тематический потолок аудитории – это максимально возможный трафик с поисковиков на группу сайтов определенной тематики, т.е. все те пользователи, которые ищут определенную услугу или информацию через поисковые машины. Определение тематического потолка очень полезно при прогнозировании ожидаемой посещаемости сайта еще на стадии разработки и последующей оценке его реальной посещаемости, охвата аудитории и т.п. Казалось бы, куда проще просто оценить аудиторию определенного сектора по данным систем статистики, в нашем случае БигМира. Действительно, если сайт относится к туристической тематике – оцениваешь аудиторию раздела «Путешествия» или просто ориентируешься на показатели сайтовлидеров, что еще проще. Но подобные прикидки иногда ничего не дают по ряду причин. Причина первая. Несовершенство рубрикации. В тех же «Путешествиях» собраны сайты прогнозов погоды, сайты турпутевок, сайты гостиниц, региональные сайты, посвященные отдельным городам, сайты печатных изданий и т.д. И иначе быть не может, это объективные противоречия. Вычленить именно свою аудиторию иногда бывает очень сложной задачей. Например, сайт собирается продавать путевки только на определенный курорт, не будем оригинальными, назовем Шарм аль Шейх, и его интересует только аудитория по Египту. Как правило, получить подобную статистику уже гораздо сложнее. Причина вторая. Подобные методы ничего не дадут, если продвигается новая услуга. Например, туры не в Египет, а в Монголию. Ни одного сайта, посвященного турам в Монголию в рейтинге еще нет, ориентироваться не на кого. Сделать сайт только для того, чтобы убедиться, что туры в Монголию спросом не пользуются – это слишком затратный путь. Я намеренно утрирую, но вот менее несбыточные туристические примеры: зеленый туризм, велосипедные туры, birds watching tours, достаточно популярные на Западе. Попробуйте оценить привлекательность этих тематик для Украины, исходя из данных существующих рейтингов. Скорее всего не получится. Третья причина. Накрутки. Пока рейтинги являются не только системами статистики, но и источником трафика, многие проекты пытаются завышать свою посещаемость. Оставим в стороне технические приемы накрутки, если они попадают в поле зрения модераторов рейтингов, сайты как правило исключаются. Простое же привлечение нецелевой аудитории просто не противоречит правилам рейтинга, и процент ее может быть достаточно высоким и искажать данные статистики по тематическому сектору в целом. Причина четвертая. Большинство проектов в конкурентных тематиках закрывают свою статистику, и, например, учесть географию посетителей, уже становится невозможным. Во многих случаях нецелевая для нас Российская аудитория может составлять большую часть аудитории сайта. К этому добавить еще то, что ни один рейтинг не охватывает всего украинского сегмента, и есть тематические сектора, где счетчики на сайт ставить просто не принято. В любом случае, ориентируясь на данные рейтингов и систем статистики, мы в большей мере исследуем предложение, а не спрос на те или иные услуги. Исследование статистики запросов в различные поисковые системы может дать не ментше ценной информации для анализа именно с точки зрения спроса на определенную информацию, услуги или товары. Задача определения тематического потолка аудитории сайта для Рунета рассматривалась еще на первой конференции по оптимизации в 2002 году. Исходили из того, что мы знаем распределение долей поискового трафика между поисковиками Рунета, на тот момент основными игроками были Яндекс, Рамблер и Апорт, и можем, следовательно, прогнозировать общий трафик на сайт по данным одного поисковика. На тот момент уже существовал Яндекс-Директ, дававший данные о статистике запросов и Спайлог с большей или меньшей регулярностью публиковал отчеты о глобальной статистике Рунета, где были данные по долям поисковиков. Оставим за скобками все дискуссии о корректности этих данных. Других все равно не было. Тогда доли распределялись следующим образом: Яндекс 49% Рамблер 28% Гугл 12% Апорт 7% Прочие 4% Следовательно, умножив частоту запроса в Яндексе на 2,04, мы могли оценить потолок аудитории по конкретному запросу по Рунету. Такая вот простая и полезная формула. Попытки посчитать потолок для украинской аудитории значительно усложнялись. Географического таргетинга по запросам еще не было. Приходилось исходить из того, что Украина составляла около 6% аудитории Яндекса в целом, что не давало хорошей точности, так как по многим запросам реальные данные сильно отличались от «средней температуры по палате». Понятно, что из-за шести процентов никто особо напрягаться не хотел, только появление географического таргетинга на Рамблере заставило Яндекс вспомнить об Украине в ряду прочих регионов. Добавим сюда языковой аспект, поддержка украинского языка запросов тоже не являлась приоритетом для российских поисковиков, и даже если была, то периодически «отваливалась» и приходилось просить «вернуть на место». Между тем, в некоторых тематических секторах украинский очень важен. Желающих отправляю на рейтинг поисковых запросов БигМира, где «реферати» популярнее, чем «рефераты». Но главным препятствием было вовсе не это, а то, что мы не знали реальной структуры поискового трафика для украинского сегмента Сети. Потому что Российские счетчики по тем же причинам не обращали внимания на наши региональные поисковые машины, даже оценить необходимость или наоборот – ненужность продвижения в Мете было проблематичным. И вот, практически одновременно (октябрь-ноябрь 2004) подобный сервис запустили Топпинг и БигМир, за что им огромное человеческое спасибо. Т.е. данные были перепроверены различными системами статистики и практически совпали. Они кардинально отличаются от российских. Достаточно сказать, что практически монополист на российском рынке – Яндекс – в Украинском трафике составляет 16,1%. А Гугл, – наоборот намного более значим, чем для россиян – 38,9% (данные за полгода). Причем доля Гугл имеет тенденцию к росту. Итак, теперь у нас появилась возможность записать свою формулу определения тематического потолка. Для преобразований использовались данные за март 2005 По украинской аудитории google.com yandex.ru rambler.ru meta.ua bigmir.net msn.com mail.ru aport.ru yahoo.com search.com.ua % 3673729 1407948 1321330 1241943 767255 292105 119262 103634 45876 16115 40,9 15,7 14,1 13,8 8,5 3,2 1,3 1,1 0,5 0,2 Итак, Тематический потолок = 2,44Gу = 6,37Яу = 7,1Ру = 7,25М = 11,76Б (1) Где Gу – частота запроса по Google с таргетингом на Украину Яу – частота запроса по Яндексу с таргетингом на Украину Ру - частота запроса по Рамблеру с таргетингом на Украину М – частота запроса по Мете Б – частота запроса по БигМиру Однако, если мы попробуем проверить эту расчудесную «формулу абсолютного топлива», окажется, что результаты, полученные при подсчете через разные поисковики значительно отличаются. Т.е. вопрос, на чьи данные следует ориентироваться на украинском рынке, остается открытым. Сложность момента состоит в том, что данные лидера рынка от нас закрыты, Google дает статистику запросов, но не дает числовых значений частоты, просто располагает поисковые фразы в порядке убывания. Можно купить контекстные показы, чтобы эти числовые значения получить, но если потолок считается для сайта, который только проектируется, рекламировать пока нечего. И ждать результатов придется по крайней мере месяц. Из других участников рынка по количественным показателям также сложно выбрать «точку отсчета», три поисковика обрабатывают практически равные доли поискового трафика, БигМир, у которого, надеемся, еще все впереди, также не далеко от них отстал. Статистика Яндекса, Рамблера, Меты и БигМира открыта с различными оговорками, обсчитав ее всю, мы получим долю 52,1 %, что достаточно для каких-либо выводов, и сможем посчитать погрешность измерений по каждому из сервисов, чтобы выбрать оптимальный вариант. По ходу мы попытаемся также характеризовать достоинства и недостатки каждого из сервисов: особенности сбора статистики запросов, интерфейса, возможностей и т.п. Удобство использования также может повлиять на наш выбор. Для того, чтобы работа имела практический смысл, был взят сайт реального клиента, который сейчас находится в разработке. Тематика сайта – лабораторная диагностика и медицинские консультации. По этой тематике было составлено семантическое ядро запросов. Правильное составление ядра требует отдельного доклада, т.к. имеются различные подходы к его составлению. Усилий рядового оптимизатора, как правило, недостаточно, нужен также эксперт в данной области (в терминах структурной лингвистики – «информант») или оптимизатор, который уже раньше работал в этой теме. Есть еще вариант с филологом, умеющим составлять частотные терминологические словари, но это уже экзотика, почти никому недоступная. Мы обошлись оптимизатором, ранее продвигавшим медицинское издание более широкой тематики. Мы решили также не ограничивать себя высокочастотными запросами, чтобы получить как можно более точную картину. Таким образом, в ядро попало 172 запроса, включая опечатки, неправильные написания и т.п. Итак, начинаем проверять весь список, попутно тестируя удобство, предлагаемых поисковиками сервисов. 1. БигМир Достоинства: - Открытость статистики - Возможность обработать все слова единым списком. - Украинская аудитория поиска - Возможность детализации по каждой фразе (простатит, лечение простатита, хронический простатит и т.п.) - Суммирует общее количество запросов - Дает общее количество всех запросов к поиску БигМир за месяц Недостатки: - Сравнительно небольшой объем базы запросов (многие низкочастотные запросы – нулевая частота) - Не указывает месяц, за который собиралась статистика. - Нет ассоциаций Особенности: - Приводит запросы к единой словоформе 2. МЕТА Недостатки: - Закрытость статистики Достоинства: - Отзывчивые работники отдела рекламы (Ирина Бирюкова) - Украинская аудитория Особенности: - ищет по точной словоформе при использовании операторов 3. Рамблер Достоинства: - Можно вводить список запросов - Дает частоты для первой страницы результатов поиска и общее число показов на всех страницах - Дает данные по географии запросов, в том числе Украина - Ищет по точной словоформе - Дает частоты по всем словоформам парадигмы - Дает историю, т.е. данные за предыдущие месяцы - Дает детализацию запросов - Дает ассоциации по запросам - Суммирует общее количество запросов Недостатки: - Список запросов не должен превышать 25 4. Яндекс Достоинства: - Наиболее частые обновления базы - Указание точной даты обновления базы - География запросов по Украине с точностью до некоторых городов (Киев, Харьков, Одесса, Днепропетровск, Донецк, Крым, Львов, Запорожье, Хмельницкий Сумы, Луганск, Полтава, Херсон, Чернигов, Винница, Николаев, прочее ) - Введена «региональная популярность запроса» в % - Введена история запроса по месяцам, начиная с июля 2004 - Популярность по месяцам можно посмотреть как в абсолютных значениях (отследить рост или падение), так и в относительных (отследить сезонную популярность без учета прироста аудитории) Недостатки: - Невозможность поиска по точной словоформе и с другими операторами поиска - Отсутствие прямых указаний на то, что данные – количество показов на всех страницах и методики подсчета количества показов на первой странице, необходимость пересчета - Невозможность обработки запросов списком Итак, придется, наверное, описать методы преодоления трудностей, связанных с недостатками указанных систем. Как видим из приведенного скриншота, «анализы» и «анализ» - это не одно и то же. Нас ничуть не интересует «анализ рынка», «системный анализ», «SWOT-анализ», однако запрос «анализы» для нас самый что ни на есть целевой. И без отделения одного от другого цифры получаются просто фантастические, непригодные к использованию. Яндекс же сводит все к одной, наиболее частотной форме. Раньше в Яндексе действовали операторы, позволяющие уточнить запрос или искать по точной словоформе. После очередного «улучшения» продукта, как иногда бывает, предоставляемые им возможности уменьшились. Мы предположили, что на таких больших числах данные Рамблера об употреблении в запросах различных падежей статистически достоверны, и пересчитали наиболее очевидные запросы («анализ»-«анализы», «почка»-«почки» и т.д.) для нужного нам падежа. Такие же манипуляции были проведены с показаниями БигМира, который тоже сводит все запросы к одной форме. Кроме того, данные Яндекса делились на озвученный сотрудниками Яндекса на форуме коэффициент 1,5, чтобы получить показы первой страницы, т.е. количество запросов. Коэффициент проверялся по данным Рамблера и подтвердился. В итоге получилась результирующая таблица: Запрос анализы медицинский центр эко простатит зачатие цистит анализ крови почки бесплодие мочи базальная температура гемоглобин группа крови уреаплазма биохимия анемия урология диагностический диета по группе крови медицинский справочник ……………. всего 172 запроса Рамблер У Мета 211 123 162 438 460 276 562 294 326 134 282 61 373 158 693 358 268 208 309 121 232 17 268 52 394 119 127 112 506 66 231 231 192 417 120 332 232 42 179 87 10037 6498 Яндекс У 82 292 184 196 89 41 105 509 139 81 11 35 79 75 44 154 278 221 28 58 БигМир 20 116 77 74 41 22 32 62 43 21 19 19 92 35 20 19 76 71 34 30 17530 1640 Итак, по логике вещей, эта сумма – 35705 запросов в месяц - всех этих запросов должна составлять долю в 52,1% от всего поискового трафика. Тогда тематический потолок (весь трафик) составит 68532 запроса. Пересчитаем тематический потолок по формуле (1) по данным каждого из поисковиков, и определим относительную ошибку, как (Δа/а)*100 Данные сведены в таблицу 2 Поисковик Рамблер У Мета Яндекс У БигМир всего из указанных Тематический потолок Запросов 10037 6498 17530 1640 35705 68532 Доля, % Расчетный Ошибка, % 71262,7 47110,5 111666,1 19286,4 -3,98 31,26 -62,94 71,86 52,1 100 Итак, для целей нашего исследования наиболее точным инструментом оказался Рамблер (относительная ошибка 3,98%). Для оценки трафика в украинском сегменте мы предлагаем использовать частоту запросов Рамблера по Украине, умноженную на семь. Тематический потолок = Ру*7,1 Можно ли распространять эти выводы на другие тематические сектора, и корректны ли наши манипуляции со словоформами, будет ли коэффициент меняться с течением времени – другой вопрос. Мы пытались провести это исследование при тех возможностях, которые предоставляют нам статистика поисковых машин в настоящее время. Нужно при этом помнить, что тематический потолок – это вся аудитория, ищущая информацию по данной тематике. Как ее достичь – поисковая оптимизация, баннерная реклама, контекстная реклама, рассылки, вирусный маркетинг, другие виды рекламы. – дело интернет-маркетолога, а не оптимизатора. Если ориентироваться на средние данные озвученные Спайлогом в конце 2004, т.е. типичный корпоративный сайт, не входящий в первую тысячу сайтов, то поисковый трафик сейчас составляет 55% от всей посещаемости сайта. И мы можем уже оценивать всю возможную аудиторию сайта, не только поисковый трафик. Вопрос зависимости этого процента от тематического сектора пока не решен. Понятно, что тут существуют кардинальные отличия между секторами. Тематический потолок может также служить отправной точкой для расчета поискового трафика на конкретный сайт по конкретным запросам с учетом CTR результатов поиска. В последнее время появилось несколько работ, освещающих подобные методики. По просьбе Андрея Иванова Спайлогом был проведен эксперимент по выборке сайтов для определения количества переходов в зависимости от места сайта в поисковой выдаче, его данные косвенно подтвердил также счетчик LiveInternet. Т.е. теоретически уже можно считать ожидаемый трафик при условии хороших позиций сайта по ключевым запросам. Что в свою очередь является недостижимым идеалом в условиях конкуренции. Другой подход к этой проблеме рассмотрен в статье Сергея Петренко и Виталия Шаповала «Покупаем оптимизацию – аспект медиапланирования». Мне вообще нравятся подобные тенденции в Рунете, когда системы статистики и оптимизаторы сотрудничают. Хотелось бы призвать украинские поисковики и системы статистики превзойти в этом россиян.