Математические методы количественной оценки характеристик полезности You Tube канала
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ
ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ»
Факультет прикладной математики и информатики
Кафедра прикладной математики и экономико-математических методов
ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА
На тему «Математические методы количественной оценки характеристик полезности YouTube канала»
Введение
Данная работа посвящена исследованию особенностей работы и взаимодействия YouTube каналов с частными партнерскими сетями.
Актуальность исследования заключается в том, что на текущий момент не существует сервисов, методов или моделей прогнозирования роста аудитории YouTube каналов, поскольку значительная часть данных необходимых для проведения подобной работы является закрытой и может быть получена только с согласия владельца YouTube канала, либо требует длительных наблюдений.
Не проводилось исследований доказывающих при помощи математических методов влияния качественных характеристик YouTube канала, на его полезность, которая выражается в объеме его аудитории. Следует отметить, что и сам перечень этих характеристик не выделен и не обоснован. На данный момент существуют сервисы, использующие лишь два параметра - это время работы канала и число подписчиков канала.
Цель выпускной квалификационной работы состоит в выявлении списка качественных характеристик YouTube каналов, относящихся к конкретным категориям, для оценки их вклада в общую полезность деятельности каналов, которая заключается в потенциальном росте аудитории каналов. А также в создании алгоритма позволяющего на основе математических методов оценивать перспективность YouTube каналов при принятии управленческого решения о подключении конкретных каналов к партнерской сети. Поскольку на текущий момент, из-за отсутствия инструментов менеджеры вынуждены полагаться исключительно на свой опыт.
Объектом исследования выступит взаимодействие частных партнерских сетей с владельцами YouTube каналов.
Предметом исследования является инструмент оценки роста аудитории YouTube каналов различных категорий.
Практическая значимость работы заключается в применении созданного инструмента оценки роста аудитории конкретной партнерской сетью для принятия решения.
В задачи исследования входит:
.Ознакомление с соответствующей литературой и существующими методами решения.
.Выбор метода исследования.
.Составление списка качественных характеристик YouTube канала.
.Оценка вклада выявленных характеристик в общую полезность деятельности канала.
.Составление рекомендаций для принятия управленческого решения о подключении канала к партнерской сети;
. Метод совместного анализа для оценки полезности качественных характеристик youtube каналов
.1 Характеристика развития YouTube каналов и партнерских сетей
.1.1 История сервиса YouTube
История YouTube началась более десяти лет назад. В 2005 году был запущен домен Youtube.com. На сегодняшний день YouTube является самым популярным сервисом видиохостинга. Создателями этого феномена современного интернета стали Chad Harley (Чад Хёрли) Steve Chen (Стив Чен) Jawed Karim (Джавед Карим). Ранее они являлись сотрудниками и разработчиками не менее известного проекта - PayPal.
С самого начала был только домен и идея работы нового сервиса. Для привлечения пользователей необходимо было придумать удачный маркетинговый ход. Поэтому появилась лотерея, в которой каждый день одному случайному посетителю сайта дарили iPod.
Как и ожидалось, все возрастающая активность вокруг молодого проекта привлекла внимание инвесторов. Крупнейшим партнером YouTube стал фонд Sequia Capital. В период с ноября 2005 по апрель 2006 он инвестировал в проект около 11,5 миллионов долларов.
Популярность YouTube росла с геометрической прогрессией, и уже к июлю 2006 сайт добился 65000 загруженных видео и 100 миллионов просмотров в день. Такая популярность объясняется тем, что в существующем медийном пространстве YouTube стал культурным и социальным феноменом. Если раньше основным источником видеотрансляции было телевидение, то с появлением видеохостинга генерировать и просматривать контент может каждый индивидуум, причем не ограниченное количество раз. Этот подход произвел революцию в сфере медиа и стал отправной точкой в создании абсолютно нового подхода к трансляции контента в широкие массы.
В октябре 2006 года, Google начинает процесс приобретения сервиса. Цена сделки составила 1.65 миллиардов долларов, причем часть из этих денег была выплачена акциями, которые со временем сделали основателей сайта весьма состоятельными людьми. В ноябре того же года сервис полностью перешел под контроль корпорации Google.
Таким образом, можно выделить следующие ключевые даты на начальном этапе становления видиохостинга YouTube:
.14-го февраля 2005г. - активирован домен YouTube.
.23-го апреля 2005г. - на сервисе появился первый ролик длительностью 15 секунд. Это Джавед Карим снял видео, где некто Яков Лапитски стоит на фоне клетки со слонами.
.Май 2005г. - начало периода бета-тестирования.
.Ноябрь 2005г. - публичное открытие сервиса.
.Октябрь 2006 - выкуп компанией Google.
.1.2 Монетизация YouTube
Предполагается, что YouTube никак не монетизировался до выкупа Google, и осуществлял свою деятельность исключительно на инвестиции, полученные от фонда Sequia Capital и других инвесторов.
Уже в 2005 году вопрос монетизации интернет-пространства стоял достаточно остро. Мало кто понимал, сколько нужно платить за рекламу в интернете. Компания Google решила вопрос достаточно простым образом, создав единую платформу монетизации всех своих сервисов, в том числе поисковика. AdSense и AdWords стали одним из первых масштабных проектов интеграции рекламы во все сервисы Google.
Google автоматически размещает наиболее подходящую данному пользователю рекламу на сайте-партнере, подключенному к программе AdSense. Такой тип размещения рекламы получил название контекстная реклама. AdSense был запущен в 2003 году, а начале 2011 года доля доходов программы AdSense составляла 28% от общих доходов Google или 2.43 миллиарда долларов США. Начисление средств, происходит за счет переходов по рекламным ссылкам (кликов) и количества просмотренных рекламных роликов (например, в начале ролика на YouTube). Тем не менее, в случае просмотра рекламы перед видео начисление происходит только в том случае, если ролик был досмотрен до конца.
.1.3 Частные партнерские сети: преимущества, особенности функционирования
Почему вообще появились частные партнерские сети?
Во многом из-за недостатков системы AdSense.AdSense перечисляет деньги раз в месяц, но только при накоплении минимум ста долларов на счете. И накопить эти сто долларов достаточно сложно, особенно для небольших сайтов или youtube-каналов, ввиду достаточно скромных заработков партнеров за показ рекламы.
Достаточно быстро, появились частные партнерские сети, задача которых состояла, как и у Google AdSense, выступать посредником между рекламодателями и площадками для размещения рекламы.
Основное их преимущество для авторов YouTube каналов заключается в низком пороге вхождения. По сути, любой начинающий канал, собрав немного подписчиков и просмотров не нарушая правил сервиса, может подключиться к любой действующей партнерской сети и начать получать некоторый доход за свою деятельность.
Подключение к партнерской сети дает следующие преимущества:
.Высокий заработок и прямая монетизация. Крупные компании предлагают партнерам размещать прямую рекламу на своих каналах, это дает больший заработок, чем обычная программа AdSense
.Планирование стратегии. В штате партнерских сетей работают опытные и сертифицированные специалисты, которые анализируют каналы и предлагают планы развития. Другие опытные партнеры и профессионалы YouTube проводят мастер-классы и обучающие вебинары.
.Удобные платежи и система выплат. Партнерские сети работают со всеми основными платежными системами, или находят индивидуальный подход к каждому партнеру.
.Техническая поддержка. Каждый партнер имеет право обратиться за помощью в решении любой проблемы связанной с его каналом.
.Оптимизация канала и SEO-продвижение. Партнерские сети располагают наборами инструментов, которые доступны всем партнерам, для оптимизации, продвижения и управления контентом.
.Защита авторских прав и борьба с пиратством. Партнерские сети работают напрямую с YouTube, помогают разобраться с системой Content ID, избавиться от ложных претензий в нарушении чужих авторских прав, монетизировать каждый просмотр видео партнера на чужом канале или удалить его оттуда.
.Коллаборация с другими каналами. Помощь во взаимном продвижении канала-партнера при помощи других каналов, подключенных к этой сети, для привлечения аудитории.
.Участие в мероприятиях. Партнеры имеют права на получение помощи в посещении различных тематических мероприятиях.
.Студии для записи видео и аудио. Партнеры имеют право воспользоваться студиями в различных городах, для создания своего контента.
.Перевод, дубляж и субтитры. Партнерам предлагаются услуги в переводе своих видео-роликов на другие языки.
.Реферальная программа. Партнерам дается возможность подключать другие каналы к партнерской сети и получать с этого доход.
Несмотря на то, что партнерская сеть забирает себе часть дохода с канала, в качестве платы за предоставляемые услуги, в большинстве случаев наблюдается рост дохода партнеров при подключении к сети вместо работы с AdSense.
Однако предоставление этих услуг, в особенности технической поддержки, организации мероприятий, помощи в продвижении канала требует затрат людских ресурсов, а партнерская сеть не может одобрять все заявки на подключение, если среди них окажутся не эффективные каналы. Поскольку такие каналы не окупают затраты этих ресурсов.
Так же существует ограничение со стороны компании Google, которое заключается в правилах функционирования партнерской сети, например, жалоба на нарушение авторских прав т.н. «страйк», придет не только на канал, но и в адрес партнерской сети, к которой этот канал подключен. И если сеть накопит критическое количество таких жалоб, и не сможет своевременно их разрешать компания Google в одностороннем порядке имеет право закрыть эту партнерскую сеть.
Эти два ограничения являются существенными при принятии решения о подключении.
Понятно, что автору видео и партнерской сети хотелось бы знать долю коммерческих просмотров на канале в будущем, однако в количественном выражении выручка всегда будет увеличиваться, с ростом числа подписчиков и соответственно просмотров.
Проблема заключается в трудностях принятия решения о подключении канала к партнерской сети и ответа на вопрос - «будет ли расти аудитория этого канала, как следствие будет ли расти выручка партнерской сети?» менеджерам хотелось бы иметь критерии оценки, позволяющие сделать более конкретные выводы. Исследование направленно на создание инструмента для прогнозирования роста аудитории канала для принятия решения его подключения к партнерской сети.
Цель данного исследования формулируется как: выявление списка качественных характеристик YouTube канала, работающего в конкретной категории, для оценки их вклада в общую полезность деятельности канала, как выражение потенциального роста аудитории этого канала.
Задачи исследования:
.Ознакомление с соответствующей литературой и уже существующими методами решения подобной проблемы;
.Выбор метода исследования;
.Составление списка качественных характеристик YouTube канала;
.Составление списка рекомендаций для помощи принятия управленческого решения о подключении канала к партнерской сети;
На данный момент решение о подключении к партнерской сети принимается исключительно на основании личного опыта менеджера по подключению, а также с использованием минимальных требований для подключения к партнерской сети, определенных этой партнерской сетью и правилами работы AdSense.
Эти ограничения следующие:
.Общее количество просмотров на роликах должно быть не менее 10000.
.Общее количество просмотров на роликах, опубликованных за последние 30 дней, должно быть не менее 3000.
.Количество подписчиков канала должно быть не менее 500.
.Не менее 5-7 роликов на канале
.Канал существует более одного месяца
.Канал имеет положительную репутацию на YouTube (отсутствие нарушений правил сообщества YouTube).
.Видео на канале должно быть авторским и не нарушать авторских прав других лиц. Это касается как видео - так и аудио материалов.
.Владелец канала должен быть старше 14 лет (выплаты возможны для лиц старше 18 лет, в случае если партнер не достиг возраста 18 лет, соглашение оформляется на родителей или опекунов).
Очевидно, что данные критерии оценки не позволяют оценивать перспективность этого канала, иначе говоря, не понятно, сколько денег он принесет в будущем - поскольку партнерской сети важно понимание перспектив роста аудитории, ведь с ростом аудитории будет расти и доля коммерческих просмотров, а значит и выручка партнерской сети.
Конечно, можно запросить более подробную статистику от автора, например, о количестве подписчиков, просмотров и их росте за период времени, получить временной ряд и попытаться построить простейшие прогнозные модели.
Однако, подобные действия ввиду не самого удобного способа сбора подобной информации, ее предоставления в начальном виде, а также последующая формализация этой информации и создание неких программных алгоритмов являются достаточно трудоемкой задачей.
Таким образом, объектом исследования, выступит взаимодействие партнерских сетей с владельцами каналов, а предметом исследования будет инструмент оценки роста (перспективности) аудитории YouTube каналов различных категорий.
.2. Описание метода совместного анализа
.2.1 Обоснование выбора метода
Методом получения ответа на вопрос о предполагаемом росте аудитории канала могла быть регрессионная модель. Однако реализация подобного метода связана с большим количеством трудностей.
Первая и самая главная проблема связана с получением данных для построения временных рядов. Поскольку вся статистическая информация предоставляемая сервисом YouTube Analytics является закрытой, то есть доступной только владельцу канала, то эти данные (в том числе количество подписчиков) значение которых должно было стать зависимой переменной в предполагаемой модели, можно получить только с личного согласия владельца канала.
Данные Analytics предоставляются в динамическом виде, то есть существует возможность узнать конкретное значение интересуемого параметра в любой момент времени с момента создания канала. Но крайне неудобный формат предоставления этих данных, а также закрытый доступ к информации затрудняет возможность перевода показателей во временные ряды.
И даже те данные, которые могут находиться в открытом доступе (например, количество просмотров) доступны только на текущий момент, что вызвало бы необходимость длительных наблюдений для получения информации и невозможность углубится в прошлое. Это является еще одним препятствием для построения регрессионной модели.
С сокрытием данных, со стороны владельца канала, связано множество трудностей, поскольку автор может ограничить доступ, практически ко всему, например, к комментариям, или оценкам нравится, не нравится, помимо числа подписчиков. Тем самым, возможность частично или полностью скрывать информацию о канале и видеозаписях затрудняет сбор данных.
Так же встал вопрос об определении предикторов, т.е. независимых переменных. Какие именно характеристики могут влиять на предполагаемый рост, стагнацию или убывание аудитории канала, а также численное выражение этих характеристик в формате временного ряда. Перевод иных характеристик (например, количество положительных или отрицательных комментариев) имеющих субъективный характер во все те же временные ряды выглядит трудоемкой задачей. То есть если мы имеем ситуацию, когда комментирующий прямо пишет - «это видео мне понравилось» или «это видео мне не понравилось» оценить характер данного замечания не составляет труда. Однако часто можно встретить ситуацию, когда наполнение комментария может быть неверно истолковано исследователем. Это прямо повлияет на точность проводимого анализа. Другими словами, неявное выражение предпочтений пользователем, оставившим комментарий, должно быть проигнорировано для составления потенциальной оценки.
Однако, существуют сервисы способные работать с данными находящимися в открытом доступе.
Первый такой сервис называется «SocialBlade».
Этот сервис работает по принципу «трекера». Поскольку сервис не запрашивает никаких данных и не требует авторизации Google аккаунта, для работы с API YouTube Analytics, то данные собираются следующим образом: после первого обращения, любым пользователем, к конкретному каналу, сервис начинает собирать данные о канале. Сервис снимает текущие значения количества подписчиков, просмотров видео и загруженных видео, то есть работает с открытыми данными, однако, как уже было сказано, эти данные могут быть и не доступны для общего пользования. Так же на основании внутренних алгоритмов делается вывод о предполагаемых доходах этого канала. Как именно делается вывод о доходах, не раскрывается, однако можно предположить, что существуют некоторые средние константы, на которые умножается число просмотров, всех за время существования канала или за период, обычно это месяц. После первого обращения канал появляется в базе данных сервиса, и записывает данные о канале каждый день, по сути, проделывая формальное наблюдение.
Так же сервис предоставляет услугу построения прогнозных значений о росте числа подписчиков, так же, не раскрывая работу внутренних алгоритмов и методов построения этих прогнозов. Однако на основании представленных данных о сборе информации можно сделать предположение, что из собранных данных, о числе подписчиков, выстраивается временной ряд, а прогнозные значения строятся методом линейного тренда.
Это лишь предположения о работе сервиса, построенное с учетом явной линейности предоставляемых прогнозных значений.
Однако этот сервис не является решением проблемы, поскольку ему присущи все вышеизложенные недостатки:
.Данные о канале начинают собираться, только с момента первого обращения к этому каналу при помощи данного сервиса.
.Явная простота и линейность вычислений прогнозных значений, которые, скорее всего, не будут соответствовать действительности, поскольку динамика роста аудитории YouTube канала далеко не всегда подчиняется линейным законам.
Второй сервис называется «vidIQ».
Этот сервис работает с внутренними данными канала, требуя авторизации Google аккаунта, и работает с API YouTube Analytics. Однако результат обработки этих данных доступны только владельцу канала, но у этого сервиса существует приложения для веб-браузера Google Chrome, которое показывает дополнительную информацию о канале, на его веб-странице, или конкретном видео. Скорее всего, менеджера партнерской сети будет интересовать всего несколько разделов этой информации, а именно:
.Средний прирост количества подписчиков в день.
2.Просмотры и подписчики за последний месяц. По мимо абсолютных значений, приводятся и относительные показатели.
3.Среднее количество просмотров в день.
Проанализировав данные предоставляемые двумя сервисами с личным опытом, возможно, менеджер сможет сделать какие-то выводы, однако этой информации недостаточно для принятия аргументированного решения о подключении канала.
.2.2 Процедура совместного анализа
Процедура совместного (conjoint) анализа позволяет получить количественную оценку качественных характеристик того или иного объекта.
Важно то, что респонденту предлагается оценить с точки зрения бытовых и личных предпочтений некий объект, состоящий из независимых между собой характеристик.
Оценивается именно отношение респондентов к качественным характеристикам объекта и на основании этого принимается решение о выпуске конечного продукта, обладающего именно такими качествами, которые более значимы для конечного потребителя.
Совместный анализ - это особая форма представления, сбора и анализа данных, как правило, используемая в маркетинговых исследованиях.
Каждый продукт, товар или услуга, обладает некоторым количеством составных характеристик. Процедура совместного анализа предполагает выявление наиболее важных и значимых характеристик для потребителя, а также относительную привлекательность для конечного потребителя продукта, обладающего разными наборами этих характеристик.
При помощи этой процедуры определяется значимая для потребителей конфигурация из этих параметров продукта - товара или услуги, из уже существующих в производстве моделей или предполагаемых новых видов продукции.
Важность метода для этой работы, заключается в оценке значимости вклада характеристик в деятельность YouTube канала, поскольку целью работы является именно выявление значимости каждой отдельной характеристики для дальнейшей оценки менеджером партнерской сети в момент принятия решения о подключении его к партнерской сети.
Проведение совместного анализа состоит из нескольких пунктов:
.Определить перечень составных характеристик и их уровни. Необходимо понять какие характеристики объекта нуждаются в изучении, и определить уровни этих характеристик, какие градации они могут принимать;
.Подготовить информацию для опроса. В совместном анализе выводы строятся именно на обработке данных опроса потенциальных пользователей. Опрос будет состоять из «карточек», иначе говоря, объектов, обладающих выявленными характеристиками, представляющими важность. Поскольку число сочетаний из возможных вариантов может быть слишком велико для восприятия опрашиваемыми, так же необходимо составить ортогональный план опроса;
.Проведение опроса, в котором респонденты ранжируют предложенные каналы исходя из личных предпочтений;
.Обработка результатов опроса.
.Подведение итогов исследования и формулировка выводов.
.2.3. Математическое представление метода
С точки зрения математики процедура оценки полезности в рамках совместного анализа выглядит следующим образом.
Модель объекта, в данном случае YouTube канала, задана в виде набора характеристик и их значений. Они и их значения нумеруются как - число характеристик и {1,2, … k} - множество характеристик;j - количество значений характеристик с номером j, j=1,..k; {1,2,… Nj} - ряд значений характеристики с номером j, j=1,..k. Величину
называют длинной общего ряда значений характеристик.
Подобный способ нумерации позволяет записывать профиль объекта как набор значений (l1, l2,…,lk), где lj ∈ {1,2,…, Nj}, j=1,…,k.
Это дает возможность сформировать список объектов, которые различаются значениями характеристик. Этот список включает в себя все возможные варианты, называется полным набором профилей. Если к модели добавить новую характеристику, число вариантов объекта возрастет во столько раз, сколько значений может принимать эта характеристика. Если модель объекта содержит k характеристик, а характеристика j может принимать Nj различных значений j = 1,…k, то полный набор профилей включает K профилей, где
Если профилей много, то респондентам трудно оценивать полезность каждого предложенного им варианта, и вместо полного набора, используют сокращенный набор профилей, иначе называемый ортогональным планом объема K* < K.
Набор профилей, в любом удобном виде, предлагается респондентам для оценивания, структура данных «на входе» модели совместного анализа, т.е оценки полезности профилей, полученных от респондентов показаны в таблице 1.
Таблица 1. Структура результатов опроса (оценки полезности профилей).
РеспондентВарианты объекта123…K*1U11U12U13…U1K*2U21U22U23…U2K*……………nUn1Un1Un1…UnK*
Где n - количество опрошенных,
K* - ортогональный(сокращенный) план профилей,
Uil - полезность конкретного объекта с номером l для респондента i. Величину полезности Uil определяет респондент.
Затем, на основе этих оценок, производится оценка полезности рядов значений характеристик - частных полезностей. Декомпозиция полезности объекта на полезность значений характеристик производится отдельно, как для каждого респондента, так и для всей совокупности опрошенных. Для этого используется модель вида:
где U(l1,l2,…,lk) - полезность товара, со значением характеристик l1,l2,..,lk, lj∈{1,2,…,Nj}, j = 1,…,k;
- полезность значения lk атрибута с номером k, k = 1,…,k; (?)
f - функциональная зависимость, между полезностью товара и полезностью значений характеристики.
Рассматривается простая аддитивная модель:
где b(0) - константа.
полезности значений 1, …, N1 атрибута 1;
полезности значений 1, …, N2 атрибута 2;
полезности значений 1, …, Nk атрибута k;
константа.
Для совокупности респондентов в целом, определяют аналогичные величины, без индекса i.
Для оценки величин полезности характеристик объекта, по величинам полезности объекта, с точки зрения респондента с номером i, i = 1,…n; строится еще одна система описания вариантов объекта. Для каждой характеристики j для которой предполагается дискретная функция полезности, вводятся Nj -1 переменных , x1(j), x2(j), …, xNj-1(j), которым для каждого профиля приписывают значения по следующим правилам:
.Если атрибут j принимает значение lj и в ряду возможных значений указанного атрибута значение lj не является последним, значение новой переменной с верхним индексом j и нижним индексом lj полагают равным единице, а значения всех остальных новых переменных с верхним индексом j полагают равными нулю: если s = lj, если s ≠ lj; s = 1, …,Nj - 1;
.Если атрибут j принимает последнее возможное значение в ряду, т. е, значение lj=Nj, все новые переменные с верхним индексом j принимают значение (-1): s = 1, …, Nj - 1
Для каждой характеристики с линейной функцией полезности, в новой системе описания вводится одна переменная, значения которой совпадают со значением характеристики из описываемого профиля, так же в эту систему описания объекта вводится константа x(0) = 1.
Для i-го респондента строится и оценивается регрессионная модель вида:
Уравнения строятся для всех вариантов объекта (D - число характеристик с дискретной моделью полезности). Параметры модели (величины ,,…, ,) оцениваются на основе метода наименьших квадратов, с применением либо специализированного программного обеспечения, либо иных программ с возможностями статистических вычислений. Полезность значений характеристики j с дискретной функцией полезности для i-го респондента, находят по правилу:
(здесь s = 1, …,Nj; j = 1, …, D; i = 1, …, n).
Полезность значений атрибута j с линейной функцией полезности, для респондента с номером i находят по правилу:
(здесь j = D + 1, …, k; i = 1,…n, а x - значение характеристики).
Структура данных «на выходе» модели совместного анализа показана в таблице 2.
Таблица 2. Структура оцененной модели полезности.
РеспондентАтрибут 1Атрибут 2…Атрибут kКонстанта1N11N2…1Nk1…………………………n…Все…
Здесь n - количество респондентов, k - количество характеристик, Nj - количество значений характеристики с номером j. В i-ой строке указаны величины:
- полезность значения s атрибута j для респондента i, i = 1, …, n; s = 1, …, Nj; j = 1, …, k; - константа модели для респондента с номером i, i = 1,…,n.
В маргинальной строке таблицы те же величины указаны без индексов i и характеризуют совокупность опрошенных респондентов в целом.
Поскольку модель (1) является регрессионной, то таблица 2, полученная на основе таблицы 1, исходные оценки можно переоценить. А именно объекту с номером l, характеристики которого имеют значения l1,l2,…, lk, lj ∈ {1,2,…,Nj}, j = 1,…,k, и респонденту с номером i, i = 1,…,n, ставится в соответствие новая величина вычисляемая на основе (1):
Величина называется предсказанной полезностью объекта l для респондента i, l=1,…,K; i = 1,…,n. Кроме указанных величин, модель (1) позволяет оценить величину
которая называется предсказанной полезностью товара l для всей совокупности опрошенных, l = 1,…,K. На основе (5) и (6) формируется таблица 3, аналогичная таблице 1.
Таблица 3. Представление предсказанных значений полезности.
Варианты объектовРеспондент123…K1…2…………………N…Все…
Абсолютным вкладом характеристики j в полезность объекта называют величину Cj:
Для того чтобы вычислить значение Cj, j = 1,…,k, нужно рассмотреть ряд полезности значений характеристики j и вычислить разность его максимального и минимального элементов.
Совместным вкладом в полезность объекта называют величину C:
Относительным вкладом (важностью) характеристики j в полезность объекта называют величину RCj:
Для того, чтобы доказать, достаточно взять пару объектов L и M, которые отличаются только значением первой характеристики. Значения характеристик объекта L записываются как: (L, l2,…,lk), где Значения характеристик объекта M записываются как: (M, l2,…,lk), где Тогда в силу (1) полезность объектов L и M отличается настолько, насколько отличаются полезности соответствующих значений первой характеристики:
Предположим, что объект M по первой характеристике является максимально полезным, а объект L - минимально. Тогда полезность объектов L и М отличается на величину
которая совпадает с величиной C1. Таким образом, величина C1 показывает, насколько можно изменить полезность всего объекта, меняя только первую характеристику, без изменения остальных.
Справедливо, что для любой величины Cj определенной формулой (7), изменение j-ой характеристики, покажет насколько можно изменить полезность всего объекта, меняя только одну характеристику.
Далее рассмотрим пару объектов, один из которых по всем характеристикам имеет наиболее полезные значения, а другой наименее. В соответствии с (1) разность полезности двух объектов:
Таким образом, величина C, определяемая формулой (8), показывает, насколько можно изменить полезность объекта, меняя значение всех его характеристик. Использование относительных величин RCj, j = 1,…,k, придает сравнению атрибутов большую наглядность.
2. Количественные оценки характеристик полезности youtube каналов
.1 Формирование информационной базы исследования
Процедура совместного анализа накладывает некоторые ограничения на исходную информацию, поэтому было необходимо собрать и структурировать данные о принадлежности к конкретной категории каналов, подключенных к конкретной партнерской сети. Были получены данные, обо всех подключенных к этой сети каналах, за последний год от момента запроса данных.
В первичном виде данные выглядели как Google Таблица, в которой содержалась информация об имени владельца канала, дате подключения, кодовом значении принадлежности канала к конкретной категории, числе подписчиков и URL ссылка на канал с прямым идентификатором.
Эти данные были перенесены в более удобное средство просмотра и редактирования информации - таблицу Microsoft Excel.
Затем был применен инструмент «фильтр», для разделения данных по кодовым обозначениям категорий, (Приложение Б) чтобы потом перевести все данные о каналах, принадлежащих к одной категории, в отдельные листы таблицы Excel, для проведения дальнейшей выборки. Так же количество каналов в каждой категории было посчитано и их распределение было приведено в гистограмме (Рис.2.1).
Охватить все категории в данном исследовании не представилось возможным, поскольку всего категорий было 16 это:
.«Pets/Animals» - 24 канала;
.«How to/Style» - 433 канала;
.«Film/Animation» - 194 канала;
.«Autos/Vehicles» -167 каналов;
.