Разработка метода оценки будущего спроса на артиста

  • Вид работы:
    Дипломная (ВКР)
  • Предмет:
    Эктеория
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    359,39 Кб
  • Опубликовано:
    2016-11-30
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Разработка метода оценки будущего спроса на артиста

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

Глава 1. Современная музыкальная индустрия

1.1 Музыкальная индустрия в эру цифровых технологий

.2 Методы повышения прибыли компаний в сфере музыкальной индустрии

.3 Next Big Sound -инновационная аналитическая компания в сфере музыкальной индустрии

Глава 2. Использование Больших данных в принятии эффективных решений. Описание модели кластерного анализа Franco M. Battagello (2010)

2.1 Большие данные

.2 Методы оценки Больших данных

.3 Модель кластерного анализа Franco M. Battagello (2010)

Глава 3. Использование модели кластерного анализа с целью прогнозирования инвестиций в сфере музыкальной индустрии

3.1 Адаптация модели кластерного анализа

.2 Работа с данными для проведения кластерного анализа, используя адаптированную модель

.3 Тестирование модели на примере музыкальной индустрии

ЗАКЛЮЧЕНИЕ

СПИСОК ЛИТЕРАТУРЫ

ПРИЛОЖЕНИЯ

ВВЕДЕНИЕ

Музыкальная индустрия является одной из самых грандиозных и потребляемых индустрий в мире. Продукты данной индустрии окружают нас повсюду. Самым простым и показательным примером близких отношений музыки и человечества является использование мелодии на сигнал будильника. Большинство людей начинает свой день с этого продукта, который был разработан специальным отделом для осуществления музыкального сопровождения различных функций современной техники. Плоды работы музыкальной индустрии сопровождают людей повсюду: фоновая музыка в торговых центрах и ресторанах, музыкальное сопровождение компьютерных игр. С развитием интернета человечество открыло для себя новые возможности. Используя в качестве каналов просторы интернета, звукозаписывающие компании получили лёгкий способ распространения музыки, а продюсерские компании - дешёвую и эффективную рекламу. Для слушателей век цифровой музыки стал возможностью хранить огромный массив музыкальных композиций на карманных носителях. Однако, вместе и с положительными аспектами использования цифрового формата музыки, появился и ряд отрицательных сторон. С освоением интернета всё больше развивались и навыки его использования. Человечество научилось получать максимальное количество выгод от продуктов электронного мира бесплатно. Доступность и непрекращающийся поток актуальной информации породил "файл-шеринг" или файловый обмен, который позволил потребителям музыки скачивать треки абсолютно бесплатно. Данный факт стал причиной потери прибыли огромного количества звукозаписывающих компаний.

Кроме того, с развитием интернета, появилось большое число исполнителей, которые не прибегают к услугам популярных звукозаписывающих лейбло, но обзаводятся качественной техникой и используют социальные сети для рекламы и продвижения треков. Цифровой век - стал губительным для музыкальной индустрии. Порядка десяти лет ведется борьба с естественным ходом событий. Индустрия не готова смириться с результатами цифровой революции и использует устаревшую модель построения бизнеса. Компании прибегают к традиционной оценке спроса потребителя, стратегии развития и продвижения. Вот почему они сталкиваются с потерей прибыли и вынуждены покинуть рынок.

В данной работе, особое внимание будет уделено оценке спроса на артиста. Данный выбор имеет четкое обоснование. Во-первых, как было описано выше, по причине нелегального файл-шеринга, звукозаписывающие компании теряют существенное количество прибыли и практически теряют смысл своего существования. Во-вторых, появилось большое число талантливых и креативных исполнителей в интернете, которые могут стать «золотой жилой» для продюсеров. В-третьих, традиционно, подбором артистов в сфере музыкальной индустрии занимается «отдел поиска талантов», выбор которых основан на собственном мнении и чутье. На данный момент нет ни одной математической модели, которая могла бы точно предсказать уровень успеха исполнителя, тем самым позволить продюсерам инвестировать средства эффективно.

Возможность прогнозировать будущее артиста всегда считалось утопией, так как критерии оценки успеха сводились к удаче. Вот почему, данная тема, а именно разработка инновационного метода оценки будущего спроса в сфере музыкальной индустрии, является актуальной и бесспорно, в условиях упадка музыкальной индустрии в целом, данная модель станет интересна продюсерским и инвестиционным компаниям.

Цель данной работы - предложить конкретный метод оценки будущего спроса на артиста. Задачами исследования являются:

.        Изучение имеющейся научной литературы о современном состоянии музыкальной индустрии и о методах борьбы с её упадком;

.        Изучение математических моделей и выбор подходящей для оценки будущего спроса;

.        Описание и адаптация выбранной модели;

.        Сбор данных и проверка работы модели.

В процессе написания дипломной работы были использованы математические и статистические методы исследования, которые применялись во время обработки данных для установления зависимости между ними и для установления количественных зависимостей между изучаемыми явлениями. Из методов экспериментально-теоретического уровня использовались такие методы как анализ и моделирование. Они помогли не только собирать данные и факты, но также проверять, систематизировать и выявлять зависимости. Также, во время тестирования рассматриваемой модели проводились математические расчёты и анализ данных. Теоретическую базу составляют научные статьи по выбранной теме. В основе исследовательской работы лежит итальянская модель оценки Больших данных. Данная модель описана профессорами Franco M.Bottagelo, Michele Grimaldi и Levio Chritelli. Название статьи на русском языке звучит следующим образом: «Рациональный подход к определению и кластеризации нематериальных активов».

Данная дипломная работа состоит из трёх частей:

.        теоретическую часть, которая описывает ситуация на рынке музыкальной индустрии и существующие методы борьбы с проблемой падения прибыли звукозаписывающих лейблов и продюсерских компаний;

.        аналитическая часть включает в себя описание метода анализа большого массива данных Big Data и описание итальянской модели оценки больших данных, созданная профессорами Franco M.Bottagelo, Michele Grimaldi и Levio Chritelli;

.        практическая часть, которая состоит из описания процесса адаптации модели к сфере музыкальной индустрии, используемых для анализа модели данных и описание результатов вычислений данной модели.

Глава 1. Проблемы современной музыкальной индустрии

.1 Музыкальная индустрия в эру цифровых технологий

Прежде чем начать вести разговор о Музыкальной индустрии, следует дать ей определение. Интересно то, что данная отрасль не имеет чёткого перечня её составляющих. В разных странах к её категории относят различные виды организаций, связанные с музыкой: от производителей музыкальных инструментов до музыкальной журналистики. В данной работе речь пойдёт о двух основных видах бизнеса, которые определяют её состояние:

.        продюсерские музыкальные компании;

.        лейблы звукозаписи.

Вот почему для обозначения смысла «музыкальной индустрии» было выбрано определение, сформированное в 2008 году компанией Sony Corporation. Согласно данному определению, музыкальная индустрия - это компании и индивидуальные предприниматели, которые получают прибыль от создания и продажи музыкальных записей, видео и песен.

С развитием интернета и освоением свободного файл-шеринга, копирование и непрерывный обмен музыкальными треками стало обычным делом. Такой вид нелегального распространения копированной музыки называют «пиратством».

Оно является нарушением авторских прав и влечет за собой ответственность:

.        гражданско-правовую (статья 49 Закона Российской Федерации "Об авторском праве и смежных правах");

.        административную (статья 7.12 Кодекса Российской Федерации об Административных правонарушениях "Нарушение авторских и смежных прав, изобретательских и патентных прав");

.        уголовную (статья 146 Уголовного кодекса Российской Федерации "Нарушение авторских и смежных прав") ответственность.

Несмотря на это, согласно данным IFPI - международная федерация производителей фонограмм и видеограмм - в 2010 году количество незаконно скаченных треков достигло 95%. Безусловно, такой процент пиратства в интернете оказал негативное влияние на всю музыкальную индустрию.

Огромное количество малых, так называемых независимых лейблов звукозаписи, обанкротилось и ушло с рынка. Крупные игроки музыкальной индустрии, а именно "Большая четверка лейблов звукозаписи", в которую входят Universal music group, Sony music Entertainment, EMI Group и Warner Music Group, по сей день терпят убытки.

На данный момент в процессе десятилетней борьбы с пиратской деятельность в интернете, больше десяти лет, индустрия пробует разработать методы борьбы с незаконным файл-шерингом. Компании пытаются призвать органы власти к сотрудничеству и помочь в борьбе за права звёзд и звукозаписывающих компаний. Председатель IFPI - международная федерация производителей фонограмм и видеограмм - Placido Domingo в годовом отчете компании 2014 года утверждает, что авторские права составляют основу цифровой музыкальной индустрии. Он считает, что она способна в скором времени угаснуть, если правительство во всем мире не приложит усилия, чтобы сократить уровень нелегального файл-шеринга.

Однако, в противовес данному мнению, существует другая точка зрения. Согласно статье автора Sudara Williams, изданной в 2012 году, «пиратство - не проблема, а отговорка». Автор считает, что музыкальная индустрия вот уже десять лет пытается бороться с результатами развития цифрового мира и не желает идти в ногу со временем. Sudara Williams утверждает, что компаниям следует трансформировать привычную бизнес модель и сформировать новую, современную стратегию развития, основываясь на конкретных данных о спросе и потребителях цифровой музыки. Данная работа содержит информацию, развивающую мысль Sudara Williams . Исследование базируется на мнении, что важной ступенью для музыкальной индустрии к развитию бизнеса является его адаптация к эре цифрового формата музыки. Необходимо приложить усилия не к борьбе с потребителями, а к новым методам их завоевания.

В процессе изучения литературы, было замечено, что в базах научных исследований и академических работ, число всех, посвященных решению проблеме музыкальной индустрии, вызванной развитием цифровых технологий, сводится к паре сотен. И почти все работы делятся на 2 типа:

.        Изучение потребителя;

.        Изменение бизнес-модели компаний.

.2 Методы повышения прибыли компаний в сфере музыкальной индустрии

В данном параграфе будут описаны примеры существующих методов борьбы с проблемой упадка прибыли компаний, работающих с сфере музыкальной индустрии, а именно звукозаписывающих лейблов и продюсерских компаний.

В первую очередь хотелось бы остановиться на научных работах, посвященных методам исследования потребителей цифровой музыки.

Бразильские учёные João Paulo Capelli Martin и Luiz Antonio Slongo для решения сложившейся в музыкальной индустрии ситуации предлагают в первую очередь изучить поведение пользователей цифровой музыки. В своей статье учёные доказывают путём эмпирических исследований, количественной и качественной оценки интервью, что всех пользователей можно разделить на несколько типов.

Классификация базируется на субъективной оценке потребителя стоимости трека. Согласно классификации было выявлено 2 типа потребителей:

)        Пользователи интернета, которые считают, что песня стоит необоснованно дорого, и предпочитают скачивать треки в интернете бесплатно;

)        Слушатели, которые полагают, что стоимость песни оправданна, так как для её создания были потрачены силы артиста, мастеров звукозаписи и производственные мощности звукозаписывающей студии, и поэтому готовы купить песню на официальных порталах.

Учёные João Paulo Capelli Martin и Luiz Antonio Slongo приводят результаты опросов в своей статье. Приведенные данные показывают, что подавляющее большинство предпочитают не платить за музыку, а пользоваться услугами «пиратской деятельности».

Кроме того, авторы статьи заметили интересную закономерность: в отличие от молодежи, люди в более сознательном возрасте гораздо чаще готовы купить песню, чем искать способы скачать её бесплатно. Данный факт объясняется следующим образом:

.        взрослые состоятельные люди ценят время и качество, а получить композицию высокого уровня за считанные минуты можно лишь на официальных порталах и в приложениях;

.        молодежь же не имеет достаточное количество финансовых средств, чтобы покупать музыку, поэтому они готовы потратить время на поиск трека неплохого качества.

Авторы другой статьи, поддерживают данную точку зрения. В своей работе авторы Bert Weijters, Frank Goedertier и Sofie Verstreken рекомендуют сформировать свою целевую аудиторию, следуя трём основным шагам:

)        выявить пользователей, которые используют электронные возможности интернета;

)        выяснить причины, по которым слушатели используют именно электронный формат;

)        следует разграничить случаи, когда пользователь готов и не готов заплатить за песню;

)        попытаться установить связь между выбором слушать электронный формат музыки и готовностью за неё платить.

Примером связи является следующая ситуация: потребители, предпочитающие электронный формат, удобный для хранения большого массива аудиофайлов, зачастую не готовы платить за каждый скаченный трек, потому что это для них слишком дорого. С другой стороны, слушатели, предпочитающие качественную и эксклюзивную музыку готовы заплатить огромные деньги за одну виниловую пластинку.

В процессе формирования маркетинговой стратегии, важно не только сформировать свою целевую аудиторию, но и понять мотив их поведения. Это поможет выявить реальные потребности и разработать методы их удовлетворения.

В 2014 году учёные Athina Dilmperi, Tamira King и Charles Dennis провели исследования, результатом которых должен был стать список характеристик, определяющих поведение потребителя музыки. Помимо возрастных различий, авторы оценили влияние пола и уровня заработка на выбор купить или скачать бесплатно музыкальную композицию. Однако авторы пришли к выводу, что перечисленные демографические факторы имеют слабое влияние. Однако, было установлено, что большую роль могут сыграть нормы морали. Авторы получили поразительные результаты:

.        одни пользователи, не имеющие финансовой возможности купить трек, не скачивают его бесплатно, так как считают данный поступок аморальным;

.        другие потребители имеют возможность платить, но не считают преступным воспользоваться бесплатными ресурсами время от времени.

Среди всех классификаций аудитории интересным исследованием показалась работа учёных Gary Sinclair и Todd Green. Авторы координально иным способом подошли к разделению разделили потребителей:

)        «активные пираты»;

)        «бывшие пираты»;

)        «смешенные пользователи»;

)        «старая школа».

«Активные пираты» это пользователи, которых использующие исключительно бесплатные ресурсы для скачивания треков. К «бывшим пиратам» относятся потребители, осознавшие плюсы официально купленных музыкальных композиций и составляют основную массу легальных потребителей музыкальных продуктов, так называемая целевая аудитория. «Смешанные пользователи» являются потенциальными потребителями, так как необходимо предпринять усилия, выявить и удовлетворить их нужды, с целью завоевания. «Старая школа» предпочитает особый формат музыки, так например, виниловые пластинки. Они составляют специфическую, но стабильную целевую аудиторию.

Изучение потребителя, его оценка и выявление потребностей - это первый и самый важный этап на пути «спасения» продюсерских компаний и лейблов звукозаписи. Следующим этапом является трансформация бизнес модели компании, адаптируя её работу под мир цифровых технологий, в условиях высокой пиратской деятельности.

Польские учёные Patryc Galuszka и Katarzyna M.Wyrzykowska в 2013 году написали статью, изюминка которой является фокусировка не на потребителе, а на самой компании. Авторы предлагают методы изменения работы бизнеса в сфере музыкальной индустрии. Эта работа стала первой в своем роде, описывающая конкретные решения для разного рода продюсерских компаний и лейблом звукозаписи, которые помогут избежать банкротства.

В своей статье авторы Patryc Galuszka и Katarzyna M.Wyrzykowska пишут, что до второй половины 20 века деятельность звукозаписывающих компаний укладывалась в пять функций.

Они соответствовали мировому ритму и решали основные задачи музыкальной индустрии. В традиционные времена, данные функции позволяли обеспечивать вознаграждения исполнителю и получать прибыть от создания треков. Ниже перечислены пять основных функций традиционной организации бизнеса:

)        организация и финансирование процесса записи и выпуска альбома;

)        осуществление распространения записи;

)        организация продвижения записи в радиоэфирах, выпуск музыкальных видео;

)        контроль авторских прав, лицензирование записи на использование в кино и рекламных роликах;

)        забота о развитии таланта, то есть работа с артистом, наем мастеров, которые помогают усовершенствовать навыки артиста.

С развитием цифрового формата аудио и возможностей интернета, данная традиционная форма ведения бизнеса в музыкальной индустрии стала не актуальной. По словам авторов статьи Patryc Galuszka и Katarzyna M.Wyrzykowska, потребители больше не готовы платить за треки. Вот почему музыкальной индустрии требуется новый формат работы. Необходимы разработки совершенно новых способов повышения прибыли и снижения издержек. Авторы статьи предлагают четыре подхода в борьбе с кризисной ситуацией, которая возникла вследствие развития цифрового формата музыки.

)        «360° deals and the move towards ‘a music company’»

Смысл данного подхода заключается в том, что звукозаписывающие лейблы должны сосредоточиться не на качестве, но на количестве исполнителей. 360 градусов означает максимальное количество сделок с окружающими артистами. Такой способ повысит вероятность заполучить успешного исполнителя, кроме того, компания будет иметь процент с продаж и выступлений каждого артиста. Доля компании от заработка исполнителя, а именно сборов с концертов, может достигать и до 90% . Авторы утверждают, что чем больше артистов находится «под лейблом» компании, тем больше эта компания зарабатывает.

2)      «‘Artists’ brand name as the main asset» (aka «sell what can’t be downloaded»)

Иными словами этот подход можно описать, как продажа чего угодно, помимо трека. Подход опирается на использовании популярности артиста, чтобы организовать новый бизнес. Популярность и образ артиста эксплуатируется, используется в качестве рекламы, чтобы продвинуть новый товар или марку. Так, например, звезда поп-музыки Рианна рекламирует спортивную марку Пума, а также выпускает свою линейку парфюма Ри-Ри. Согласно статье Patryc Galuszka и Katarzyna M.Wyrzykowska, такой подход гарантирует увеличение дохода уже имеющимся фирмам и легкий стартап новым бизнесам. По мнению авторов модель является отличной альтернативой заработка для музыкальных лейблов.

3)      «Artificial scarcity, international markets and independence»

Идея данного подхода - это интернационализация или дифференциация продаж. Подход предусматривает продажу альбомов на международном рынке, при условии, что артист имеет на нём популярность. С другой стороны, подход позволяет дифференцировать свои продажи, фокусируясь на отдельном сегменте покупателей. Так, например, выпускать виниловые пластинки для специфической аудитории, потребителей так продукта Old school.

)        «Survival»

Последний подход не такой оптимистичный, как три предыдущие. Его смысл заключается не в увеличении продаж, а во избежание банкротства. Учёные считают, что если компания не в силах осуществлять финансовую поддержку своему исполнителю, следует отдать артиста другим участникам рынка, чтобы позволить ему выжить. Есть и вовсе печальный вариант развития событий - продажа лейбла.

1.3 Next Bid Sound - инновационная компания в сфере музыкальной индустрии

Анализируя академическую литературу и научные исследования на тему о разрешении сложившейся ситуации в сфере музыкальной индустрии, был сделан вывод, что учёные не предлагают в открытом доступе чёткой аналитической модели, которая позволила бы проанализировать, каковы будущие результат вложений в проект. В век цифровых технологий, когда индустрия не получает достаточной прибыли от продажи треков для поддержания своего существования, возможность информационно обеспечить принятие решения - это возможность сделать их эффективными и получить ожидаемый результат. К размышлениям об использовании модели оценки большого массива информации подтолкнула идея компании под названием «Next Big Sound». Next Big Sound - это инновационная компания, которая занимание анализом данных цифровой музыки в интернете: популярность в социальных сетях, услуги потоковой передачи треков и трансляция на радиостанциях. Компания изучает предпочтения пользователей интернета и предоставляет информацию своим клиентам.

Полученную в результате анализа информацию компания публикует в виде чартов. За такие данные продюсеры готовы заплатить немалые деньги, так как представленные топ листы популярности исполнителей позволяют не только отслеживать позицию своих артистов, но и принимать решения об инвестициях в последующее развитие данного проекта. Компания Next Big Sound была создана в 2009 году студентами северо-западного университета: Samir Rayani (технический директор), Alex White (генеральный директор), Jason Sosnovsky (покинул компанию) и David Hoffman (CPO). По мнению журнала Billboard Magazine в 2010 году, компания является одним из лучших стартапов в сфере музыкальной индустрии за всю историю её существования. Компания Next Big Sound получила премию «Грэмми» за прорыв в сфере музыкальной индустрии. В 2015 году Next Big Sound выкупила компания Pandore Radio. Коспания Pandora Radio - это сервис беспрерывного воспроизведения музыки в Интернете, предложения которой строятся на рекомендательной системе «Music Genome Project». Смысл системы заключается в предложениях музыкальных композиций на основе предпочтений слушателя. Учитываются такие характеристики как ритм, жанр, исполнитель и прочее. Такая система способна подстроится под нужды потребителя, следовательно, предложить всегда актуальный продукт.

Кроме того, компания Next Big Sound является партнером Billboard - американский журнал, который выпускает каждую неделю свежие новости о мире индустрии. Базируясь на результаты анализа Next Big Sound, журнал предлагает ТОП 100 популярных песен, который называется Hot 100, и ТОП 200 популярных альбомов, под названием Billboard 200, за промежуток времени равный семи дням. На данный момент штаб квартира располагается в городе Нью-Йорк, США. В интервью, взятом для журнала Forbes в 2013 году, генеральный директор Alex White признался, что используя метод оценки Больших данных, компания может предсказать успех артиста или трека. Для анализа используются данные со всего интернета, о количестве скачивания, прослушивания, покупки музыкальных композиций, данные о популярности с просторов социальных сетей и видеохостинга YouTube. Однако, информация о том, какой метод, алгоритм анализа Больших данных используются в процессе оценки, компания умалчивает.

Вот почему важной частью дипломной работы стало изучение аналитических методов оценки Больших данных, которые могут быть адаптированы, использованы в данной отрасли.

Анализируя большой массив данных и использование результатов для принятия эффективных решений, позволит музыкальной индустрии предсказывать будущее музыкальных исполнителей, что поможет избежать гибели и развить новые возможности, инвестируя в успешные проекты.

Глава 2. Использование больших данных в принятии эффективных решений. Интеллектуальный капитал и Большие данные в оценке стоимости компании

.1 Большие данные

Современное управление бизнесом непосредственно связано с эффективной выработкой и принятием управленческого решения. В наше время существует огромное количество различных методов принятия управленческого решения, основанных на использовании информации о внутреннем состоянии компании и внешних условиях. Информация - является ключом в осуществлении анализа, планирования и прогнозирования.

С развитием информационных технологий меняется как вид анализа данных, так и их число, а роль использования результатов оценки данных растёт с каждым днем. Прежде чем приступить к описанию методов оценки данных, необходимо дать определение термину.

Согласно Современному экономическому словарю, авторы Райзберг Б. А., Лозовский Л. Ш. и Стародубцева Е. Б., данные - это факты и характеризующие их числовые, количественные показатели: имена, даты событий, сведения о процессах в сфере экономики, местах действия. Это сведения, обработанные специальным образом для принятия решений, информация.

Данные являются составляющей информации и определяют способ её получения.

В свою очередь, согласно Большому экономическому словарю, автор Борисов А.Б., информация - это сведения, данные, значения экономических показателей, являющиеся объектами хранения, обработки и передачи и используемые в процессе анализа и выработки экономических решений в управлении. Также информацию можно определить как один из видов ресурсов, используемых в экономических процессах, получение которого требует затрат времени и других видов ресурсов, в связи с чем эти затраты следует включать в издержки производства и обращения.

Информацию характеризуется по следующим показателям:

1.По объекту - по показателям качества товара, по ресурсоемкости параметрам инфраструктуры рынка, по уровню производства.

.По форме передачи - вербальная или невербальная

.По изменчивости во времени - условно постоянная или условно - переменная.

.По способу передачи - электронная, телефонная, письменная.

.По назначению - информация бывает экономической, технической, социальной и организационной.

.По отношению объекта управления к субъекту - между внешней средой и компанией, между разными отделами внутри организации по горизонтали и вертикали.

Суммируя вышесказанное, можно сделать вывод, что в процессе принятия решения, компания собирает массив актуальных данных, результатом анализа которых является информация. Данную информацию компания использует при выборе управленческого решения для получения эффективного результата.

С развитием и скоростью роста объёма числа данных и информации, учёные отошли от простых терминов «данные» и «информация», заменив их термином «Большие данные».

 Согласно авторам книги «Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим» Майер-Шенбергер, В., Кеннет, К. термин «Большие данные» является определением процесса анализа огромных массивов данных. Он является инновационным способом увеличения производительности и развития конкурентной способности. Большие данные (Big data) - это вся информация, которую практически невозможно обрабатывать и анализировать обычными традиционными способами. Соответственно, для работы с такими масштабами информации необходимы новые методы и инструменты работы. Очень часто компании имеют доступ к огромному объему данных, необходимых для успешного функционирования компании, но не имеют методов, инструментов и готовых моделей для осознания и установления полной взаимосвязи между всеми данными. Также важно принимать во внимание тот факт, что информация обновляется каждую секунду и увеличивается в объеме, вот почему и традиционные методы анализа данных не могут быть применимы к ним. В случае если компания обладает необходимыми инструменты для анализа такого массива данных, она имеет особое преимущество не только грамотно сделать выводы о текущем состоянии, но спрогнозировать будущие результаты своих решений.

Основная концепция Big data была создана в 17 веке Блез Паскалем. Это был важнейший основатель математического анализа и теории вероятности. В своей работе, Блез Паскаль описывал броски игральных костей. Основной вопрос для учёного состоял в следующем: как принимать эффективные решения, используя анализ бесконечных событий и фактов.

После Блез Паскаля мысль о способах принятия эффективных решений развил известный английский ученый статистик генетик Рональд Эйлмер Фишер. Он создал идеи корреляции данных на основе точечных и интервальных статистических оценок. Учёным была введена методика планирования экспериментов. Его работа имела неоценимый вклад в создание современной теории статистической проверку гипотез.

Впервые термин «Большие данные» появился в 2008 году в контексте влияния на будущее новой науки технологии, которая открывает новые возможности в работе с большим потоком информации. Значимость данных в науках еще в 18 веке тревожила сознание ученых. Так, известный английский астроном Томас Симпсон писал в своих трудах о преимуществах использования чисел в астрономических наблюдениях. Однако новая волна интереса к большим данным захлестнула умы учёных лишь в конце прошлого столетия. С развитием вычислительных систем и компьютерных технологий учёные решили разработать новые методы оценки большого массива данных, которые могут оказаться полезными во всех областях науки.

Компания Gartner описала три основных свойства больших данных:

1.       Volume (объем). Огромное скопление данных из абсолютно различных ресурсов в компаниях происходит ввиду понижения издержек при сохранении данных;

2.       Variety (многообразие). Вся информация из ресурсов представлена в абсолютно разных формах. Она может быть в виде таблиц, текстов, видео- и аудио контента.

3.       Velocity (скорость развития роста). Многие организации связанные непосредственно с электронной коммерцией каждое мгновение получают неиссякаемый поток новой информации.

Прорывом в области развития Больших данных стало внедрение технологии обработки в оперативной памяти огромного массива информации, составляющего несколько сотен гигабайтов. С созданием и внедрением на рынок платформы Hadoop - проекта фонда Apache Software Foundation, который подразумевает свободное распространение и включает в себя фрейм ворки, библиотеки и различные утилиты. Платформа Hadoop активно используется для осуществления поисковых и контекстных механизмов на просторах популярных сайтов, с высокой информационной загруженностью. Проект был создан под эгидой MapReduce - известной модели распределенных вычислений, реализованные компанией Google. Модель MapReduce активно применяется в процессе параллельных вычислений информации, размер которой превышает несколько петабайт.

На фоне быстрого роста вычислительной мощности и развития технологий хранения, анализ Big data все чаще представляется возможным в практике среднего и малого бизнеса. В большей части это является следствием развития облачной модели вычисления. На сегодняшний день наблюдается новый этап развития аналитики Больших данных параллельно с развитием двухуровневой модели обработки. Первый уровень заключает в себе традиционную аналитику Больших данных (вся информация анализируется не в онлайн). Второй уровень предполагает предоставление возможности анализа касаемо огромных массивов данных онлайн, благодаря технологиям аналитики в памяти. Также, важно отметить, что последний уровень будет представлять собой синтез новых и старых способов использования озер данных для самой быстрой аналитики для того, чтобы оказывать воздействия на события в момент их происхождения. Все эти новые технологии открывают безграничные, ранее невиданные возможности для компаний в абсолютно новых масштабах.

Внимание к большим данным обосновывается следующими фактами: в современном мире появилось огромное количество источников, их формирующих. К ним можно отнести все данные, получаемые в сетях Интернета, поисковые системы и интернет торговлю, сенсоры и индикаторы, измеряющиеся в реальном времени. Вся информация, полученная из приведенных источников, в условиях грамотного анализа может способствовать выявлению определённых закономерностей, которые невозможно выявить обычным анализом.

Big data глубоко проникли во все области экономики: это как финансовые услуги, маркетинг, секторы технологий и производства, так и здравоохранение. Согласно многим исследованиям, проведенным в 2014 году, около 89% компаний твердо верят, что отсутствие применения новейших методик в бизнес аналитике и построении стратегий значительно снижают конкурентную способность бизнеса, в конечном итоге, компании рискуют потерять свою долю на рынке.

Анализируя потребителей технологий big data, в первую очередь необходимо упомянуть бизнес компании. Именно они формируют и получают огромный объем информации и на основе анализа могут принимать решения, которые влияют на эффективность работы бизнеса. Благодаря получению уникальной информации, компании формируют выводы, которые помогают принять эффективное решение. Однако важно заметить, что необходимость в инструментах анализа данных весьма часто исходит от интереса IT отдела, а не от собственной нужды компании.

Основной задачей, которую решают в бизнесе, управляя большими данными, является изучение предпочтений потребителей и усилия понять их будущее поведение. На сегодняшний день существует ряд отраслей, которые нуждаются в анализе большого массива данных. В первую очередь, это крупные компании на рынках В2С, потому как данные компании имеют высокую конкуренцию.

«Большие данные» открывают новые возможности развития инновационных методов и способов анализа информации в компании. Важно принимать во внимание все свойства больших данных. В наши дни Большие данные все больше находят свое применение в перечне самых разных сфер деятельности: финансы, онлайн торговля, медицина и другие.

В следующей главе будут рассмотрены методы и способы обработки Больших данных, которые являются основным руководством в принятии эффективных решений.

2.2 Методы оценки Больших данных


В век информационных технологий применяются различные способы анализа массивов данных, в основе которых лежат инструменты, применяемые в математике, статистике и информатике. Часть методик успешно находить применение в работе не только с огромными массивами данных, но и с небольшим объемом информации. Известно, что чем больше объем информации, тем точнее данные получатся в результате их анализа.

Основные методики оценки Big data:

. А/В testing. (A/B тестирование) один из самых эффективных инструментов, применяемый в маркетинге, который увеличивает эффективность работы интернет ресурса и оценивает успешность веб-страницы. Согласно работе Д. Шепелявому о «Больших данных», благодаря A/B тестированию компании открывают для себя новые возможности в процессе выбора наилучших вариантов заголовков объявлений в интернет сетях и конверсии целевых страниц. Этот метод также позволяет измерять предпочтения аудитории и оказывать воздействие на основные индикаторы эффективности сайта, сравнивать и оценивать количественные показатели нескольких страниц.

Главная практическая суть применения данного метода состоит в эффективном поиске и внедрении составных частей страниц, которые способны увеличить ее оперативность.

. Data Mining - это процесс определения скрытых закономерностей, обнаружения в сырых данных ранее неизвестных, которые просты в интерпретации и имеют полезное практическое применение в принятии решений практически во всех сферах жизнедеятельности людей. Этот метод помогает определить закономерность в огромном массиве данных информации. Данные закономерности было бы невозможно определить, используя традиционные способы. Статистика, теория баз данных, теория информации, визуализация являются основополагающими дисциплинами для создания процесса Дата Майнинг.

Выделяют 6 основных задач Дата Майнинга:

1)      Классификация - выделение конкретных параметров у объектов, которые позволяют определить их в некий сегмент;

)        Кластеризация - процесс, группирующий объекты без начального существования классов, и который имеет дело с интеллектуальным анализом и является продолжением описанной ранее задачи;

)        Ассоциация - нахождение определенных связей и закономерностей между событиями;

)        Последовательность - определение закономерностей между событиями, которые взаимодействуют во временных рамках;

)        Прогнозирование - нахождение взаимосвязи окончательных данных от переменных входных данных;

)        Визуализация - графическое конструирование обрабатываемых данных.

3.Краудсорсинг (crowdsourcing) - активация ресурсов большого количества людей используют современные информационные технологи для решения ряда задач, которые стоят перед компаниями, страной и обществом. На данный момент в мире существует множество способов применения, которые дифференцируются по тематике и виду конченых данных. Краудсорсинг разделяют на 2 категории:

1)      Учитывая сферу жизни (производство, политика, общественная составляющие);

)        Учитывая типологию поставленных задач (изобретение нового продукта, нахождение решений, определенных людей, тестирование, голосование и краудфандинг).

4. Смешение и интеграция данных - комплекс методов, которые направлены на интеграцию разного рода данных из разнообразных источников с целью проведения глубинного анализа.

. Машинное обучение (Machine Learning) - большая часть искусственного интеллекта, которая исследует способы создания алгоритмов, которые потенциально готовы обучаться.

Существует 2 типа Машинного обучения:

1)      Обучение по прецедентам (базируется на определении закономерностей в данных;

)        Обучение на основе дедукции (выявление знаний экспертов и их перемещение в форме базы данных в компьютер).

6. Пространственный анализ - очень важный способ представления и обработки информации, который используется в основном в геоинформатике. Этот анализ заключается в обеспечении анализа размещения, взаимосвязей и других пространственных отношений. Также, в него входит анализ сетей и цифровых моделей рельефа.

. Визуализация аналитических данных. Интерпретация информации в виде, способствующем более ясной интерпретации и четкому анализу. Использование визуализации данных находит свое место во многих научных и статистических исследованиях, в процессе бизнес анализа, обучения, а также в условиях повседневной жизни, к примеру, в масс медиа. Определение визуализации неразрывно связано с информационной и статистической графикой.

Согласно работе Н. Копылова «Базы данных - революционная эволюция», визуализация очень эффективна в случае, при необходимости раскрыть сущность алгоритма или структуру объект, открыть взаимосвязь предметов или данных, отразить тенденции разного рода и грамотно раскрыть сущность данных в большом объеме.

Важно понимать, что разные методы используются в разных отраслях деятельности. При грамотном применении рассмотренных выше методик, пользователи открывают для себя новые возможности.

.3 Алгоритмы модели кластерного анализа данных

В данном разделе исследования будут описаны в более подробной форме этапы метода кластеризации данных.

В первую очередь нужно разобраться, что такое кластеризация. Кластеризация или кластерный анализ относится к категории Data Mining - метод анализа Больших данных. Data mining является совокупным названием всех методов идентификации новой и практически полезной информации. Использование полученного результата в ходе проведения анализа Data Mining позволяющей принять эффективные решения. Базу анализа Data Mining составляет классификация, моделирование и прогнозирование, которые строятся на различных методах, одним из которых является кластерный анализ. Кластеризация или кластерный анализ - это разделение множества данных на группы, которые можно обозначить кластерами. В состав каждого кластера входят объекты, которые являются близкими друг к другу согласно определённым характеристикам. Между собой кластеры должны иметь максимальное количество различий. Для сравнения с методом классификации необходимо обозначить основное отличительное качество: группы в методе кластеризации не задаются изначально, а формируются в процессе работы с алгоритмом.

Традиционно, кластерный анализ состоит из пяти шагов:

)Сбор данных для анализа;

)Определение характеристик, по которым будут оцениваться объекты;

)Вычисление значений меры;

)Применение метода кластерного анализа для создания групп из близких по характеристикам объектов;

)Представление результатов анализа.

Однако рассмотрим усовершенствованный метод кластеризации, предложенный в 2001 году испанским учёным Franco M. Battagello.

0.       Подготовительная фаза: стратегии оценки. (Preliminary phase: strategy assessment). Принимая во внимание то, что смысл идеи устройства оценки разделяет концепцию «оценки» на более простые компоненты, то подготовительная стратегия внешнего аудита является подходящей. Данный шаг важен и смысл его состоит в том, чтобы оценить отношения между стоимостью создания и регулирования стратегии компании, которая относится к модели бизнеса. Целью этой фазы является идентификация области создания дополнительной стоимости вместе с организацией и оценкой их структуры. Завершив подготовительный этап, становится возможным последовательное распределение кластеров нематериальных объектов.

.        Фаза 1. Дерево взаимосвязей. (Phase-1: Value Tree branching)

Основной идеей первой фазы является зарисовка образа, снимка схемы базовых блоков оценочной структуры вместе с бизнес моделью. Для того чтобы четко определить их вид и количество, необходимо кластеризировать подкатегории, в которых отображается принцип «от общего к частному». От наиболее общих понятий и данных связи стремятся к подкатегориям, которые заключают в себе, свою очередь, другие подкатегории. Данная фаза раскрывает ценностную структуру организации независимо от уровня её сложности её структуры.

 

Схема 1: схема дерева распределений. [30, c.817]

Таким образом, чтобы осуществить первую фазу, необходимо выполнить следующие шаги:

1)      Сортировать всю бизнес модель на ценностные области (Value domains), разделяющиеся на данные доминирующие и их подпункты. Такое их использование позволит понять создание стоимости для стейкхолдеров, что приводит к конкурентоспособности.

)        Следующий под-шаг состоит из рассмотрения value domains для того, чтобы идентифицировать ценностные компоненты (Value components). Value domains являются характеризующими элементами компании. Количество уровней компонентов оценки не предопределено. Количество определенных уровней зависит от того на сколько детально необходимо описать структуру оценки. Как результат, для каждого «n»- уровня оценочного компонента может быть «1+n» уровень подкомпонента.

)        Завершение фазы характеризует окончанием построения всех базовых блоков оценочной системы. Value objects раскрыты и не подразумевают дополнительной спецификации.

Схема 2: дерево оценки, которое определяет базовые ресурсы будущей оценки стоимости. [30, 824].

2.       Фаза 2: Оценка существующих взаимодействий. (Phase-2: appraisal of existing interactions - raw clustering). На этом этапе проходит качественный анализ существующих взаимодействий между базовыми объектами, которые были выделены на предыдущем этапе модели. Фаза подразумевает проведение аналитика взаимодействий между VOs. Этап проходит через несколько дополнительных ступеней: построение матрицы взаимодействия среди VOs; подсчет соответствующей матрицы близости (Proximity Matrix) для оценки их отношений и влияний; идентификация потенциальных нематериальных активов (Candidate Intangible Assets) через оценки пороговой ценности.

2.1 Матрица взаимодействий. (Interaction Matrix) Получив VOs, настоящий под шаг фокусируется на оценке связей всех отношений, которые соединяют каждый VO с качественной стороны. Результирующая картинка этих связей отображает реальную динамику среди её точек взаимодействия. Эта цель может быть достигнута благодаря построению матрицы взаимодействий (Схема 3). Значения, которые будут заполнять данную матрицу и будут оценены посредством полученных взаимодействий среди изучаемых объектов, где - значение каждой aij позиции вместе с матрицей (“m × n”, где “m=n”) - следующее: на сколько VO соответствует к «ith» позиции подвержено влиянию VO, которые соответствуют «jth» позиции.

Схема 3: Матрица взаимодействий [30, c. 818].

Наполнение ячеик матрицы выполняется, используя собранные данные, посредством интервьюированию людей, которые связны с исследуемыми объектами, например, менеджерами компании.

Схема 4. Матрица взаимодействий (Interaction Matrix)

Матрица близости (Proximity matrix). Второй под шаг состоит из подсчета соответствующих матриц близости, являющейся продолжением матрицы взаимодействий, целью которых является подсчет веса отношений среди VOs. Этот шаг приводит измерение силы связей среди всей сети, рассчитывая сопоставленных попарно влияний среди всех элементов матрицы взаимодействия, где

bij = aij + aji

Схема 5. Матрица близости [30, c. 819]

где ценность каждой “bij” позиции вместе с результирующей матрицей рассчитаны как сумма взаимно соответствующих ценностей из матрицы взаимодействия.

 

Схема 6. Матрица близости (Proximity Matrix) [30, c.824]

2.3     Установка порога. (Threshold setting) - это завершающий под шаг в описываемой фазе. Он нацелен на определение собрания первичных активов. Периметр принадлежности таких систем устанавливается через оценку пороговой стоимости. (Threshold Value). Логика этого критерия такова: среди всех оценок связей существует среднее значение независимости среди точек связей, которые могут быть измерены. Данные значения являются отображением пороговой стоимости. Если среди ряда параметров этих точек взаимосвязи есть определенная ценность - превышающая порог - то тогда интенсивность их взаимосвязей обнаруживается. Вследствие чего выявляется более сильная связь, на которую необходимо базироваться. Таким образом, аналитик имеет возможность определить границы: каждый дополнительный VO, который не достигает порогового значения, удаляется из системы. Пороговая стоимость определяется следующим образом:

Threshold Value = Arithmetic Mean + k

Где «k» определено как регулирующий параметр.

Каждый CIAm состоит только из элементов, которые удовлетворяют неравенство:  bij > Threshold Value

Схема 7. CIA composition Roster [30, c.825]

С помощью формулы, подсчитываются все базовые единицы, которое существуют в нашей матрице.

Схема 8. Подтверждение оценки матрицы близости через пороговую оценку. [30, c. 825]

2.4     Аналитическая фаза, критический анализ. Иногда, аналитика может быть применена к вычислениям результирующих значений, из описанных ранее матриц. Подсчет всех взаимосвязей для каждых VOs заполняет ранжированный список данных объектов.

Каждое значение составляет комбинацию двух приходящих и уходящих потоков. Чем более чувствителен VO, тем больше должен быть принят во внимание критический элемент оценки связей. Для каждой VOx критически расположенные данные подсчитываются через критическую оценку по следующему уравнению:

(1)

Следующий этап заключается в отдельном определении входящих и исходящих отношений среди VOs. Это ведет к определению двух различных серий оценки для каждого VO. Результат представлен на декартовском критическом графе для наглядного представления сложившейся ситуации. Индекс критического баланса (Criticality Balance Index, CBI) может быть построен и применён к каждому VOx . Учитывая критерии стоимости, он показывает меру на сколько каждый VO сопоставляется с полученным и отданным влиянием.

(2)

Схема 9: критический анализ в графическом виде. [30, c. 825].

Фаза 3. Усовершенствование кластеров. (cluster refining)

Для грамотной кластеризации совокупности VOs , необходимо прежде всего проверить потенциал обособленного существования каждой единицы данных нематериальных ресурсов, которые мы изначально определили.

1.1     Проведения теста показателя срочной ликвидности для определения критерия и групповая проверка. (Acid-test run for criteria-matching and parent-grouping check). Для того, чтобы проверить потенциал обособленного существования каждого CIA, необходимо провести следующий тест, который направлен на выделение наборов VOs с определенными критериями, которые гарантирует, что группировка может быть рассмотрена как верный нематериальный актив.

Каждый выделенный объект должен быть:

1.       R1 - объект инвестиционных потоков, который приносит пользу в определённой перспективе

2.       R2 - независимо переносимый

3.       R3 - измеримый в рамках стоимости

Этот тест поможет избежать распространения эффекта «русской матрешки», понижая количество CIAs.

3.2     Проверка переполнения и наплыва. (Redundancy and overlapping check.) В условиях с настоящей концепцией, все VOs сгруппированы на основе определённой критерии. Но некоторые границы единиц нематериального актива остаются трудными для понимания, так как они зависят от стороны и подхода предстоящего анализа. В этой ситуации подходит определение deus ex machina. Однако использование их в данной ситуации сопутствует возникновению рисков отсутствия внутренней связи. Не предопределено, где проходит линия между каждым нематериальным активом, что становится необходимо во время составления элементов. Важно учитывать, и то, что составные элементы VOs не должны быть пересчитаны несколько раз, иначе аналитик подвергает опасности получить результаты общей оценки.

3.3     membership redundancy grid строится для того, чтобы проверить переполнение и наплыв среди выявленных в процессе анализа кластеров CIAs.

Схема 10. Membership redundancy grid [30, c.826].

3.4 Направление не сгруппированных и несвязанных объектов (Routing of ungrouped and unlinked entities). Данный объект предполагает выявление объектов оценки, связи которых не достигли порога, и поэтому не могут быть включены в какие либо другие CIA или пройти Acid-test, автоматически не включаются в белый список нематериальных активов.

Фаза 4. Финальная группировка совокупности нематериальных активов. (final grouping of aggregated IAs). Завершающая фаза рассматриваемого метода посвящена финальному представлению подтверждения CIAs в соответствии с наиболее походящей структурой. После сортирования силы связей соединений среди всех VOs, различные оценки фиксируются с каждым подтвержденным кластером. Данная фаза нацелена на поддержку системы для верной детализации. Сгруппированные результаты представляются в завершенную систему нематериальных активов, выделенных в графе близости, которая состоит из итогов фазы 1 и фазы 2. Такой результат получен посредством группировки, основанной на близости, во избежание наплыва различных кластеров. Матрица близости используется непосредственно с этой целью. Так, благодаря накопленной оценке, между VOs можно сделать заключение: чем выше оценка между двумя VOs, тем ближе они будут располагаться на графе и наоборот.

Схема 11: соседство сгруппированных графов. [23, c. 827]

.1 Аналитическая фаза. Анализ связи кластеров. (Phase-analytics: cluster cohesion analysis.) Аналитика может быть применена к финальному списку нематериальных активов, который формируется исходя из группировки.

Для каждого нематериального актива, факторы индекса связи являются арифметическим значением (μ) взаимодействий с каждым кластером. Данное значение является результирующим матрицы связи, которая может быть сравнена с пороговой оценкой. Это необходимо делать для того, чтобы определить уровень силы внутренних взаимодействий с установленными кластерами. Результаты определяются в соответствии с приведенной ниже формулой:

(3)

Написание данной модели имела ряд предпосылок, основной из которых является неспособность использовать традиционные методы кластеризации при оценке интеллектуальных ресурсов компании для их эффективного использования и группировки. Однако именно они составляют базу для возможности использования результатов в принятии эффективных решений, в том числе инвестиционных.

Глава 3. Модель кластеризации. Использование модели с целью прогнозирования инвестиций в сфере музыкальной индустрии

.1 Адаптация модели кластерного анализа Franco M. Battagello (2010)

Для проведения кластерного анализа, используя метод, предложенный ученым Franco M. Battagello в 2010 году, необходимо адаптировать её таким образом, чтобы можно были использовать в сфере музыкальной индустрии.

В первую очередь важно понять цель проведения данного анализа. В условиях эры цифрового формата песен и альбомов, музыкальная индустрия не только получила способы развития и продвижения продукта, но и столкнулась с негативными последствиями. Подробно о них было описано в первой главе предложенной исследовательской работы. Огромное количество нелегально скаченных треков с простора интернета губительным образом повлияло на бизнес структуры индустрии. Катастрофически снизились продажи альбомов, и как следствие, упала прибыль лейблов звукозаписи и продюсерских компаний. Вот почему в наше время, необходимы эффективные решения для поддержания и улучшения ситуации отрасли мировой значимости «музыкальная индустрия».

Как было описано выше, компании нуждаются в трансформации своего бизнеса, ориентируясь на потребителя, который готов платить за интересующий его продукт.

Компания Next Big Sound уже научилась предсказывать успех исполнителя, анализируя большой массив данных из интернета, предлагать похожий товар, основываясь на текущих предпочтениях потребителя. Продуктом компании является чарты - список песен и альбомов, которые оказываются на пике популярности. Журнал Billboard, который находится в тесном сотрудничестве в компанией Next Big Sound, публикует полученные данные в двух разных чартах:

.Hot 100 - топ ста самых популярных песен, которые имеют самое высокое количество прослушиваний, скачиваний и покупок;

.Billboard 200 - топ двух ста самых покупаемых и прослушиваемых альбомов.

В данной исследовательской работе, за основу характеристик, которая определяет успешность, был взят чарт самых продаваемых альбомов Billboard 200. Объясняется это тем, что в любом бизнесе успех обусловлен финансовой прибылью. Вот почему, продажа альбомов артиста определяет и его успех, тем более в условиях повышенной пиратской деятельности - нелегального файл шеринга - нашего времени, количество проданных альбомов говорит о преданных фанатах, которые оценивают творчество исполнителя и готовы платить за продукт, несмотря на то, что есть возможность получить его бесплатно, используя возможности интернета.

Кроме того, важно уяснить, что именно будет подвергаться анализу. Если в случае с описанной выше моделью объектом оценки служила компания, а предметом - её интеллектуальные ресурсы, то в случае с музыкальной индустрией будет проводиться оценка исполнителей посредством идентификации и кластеризации его характеристик. Ведь по сути, что является уникальными ресурсами артиста: его демографические, личные качества, а также объекты взаимодействия в процессе организации своей карьерной деятельности.

В первую очередь для использования модели кластерного анализа будет необходимо выполнить следующие этапы:

. определить список самых популярных исполнителей на данный момент;

. идентифицировать данные, которые возможно имеют прямое или косвенное влияние на успех исполнителя;

. собрать эти данные;

. проанализировать собранные данные, используя метод регрессии;

. выявить связь между характеристиками;

. используя схожие связи, объединить исполнителей в кластеры;

. суммировать полученные результаты;

. сделать выводы об информации, полученной в ходе проведенного анализа.

В следующем параграфе будет проведены первые 3 этапа анализа данных, а именно: создание списка успешных исполнителей, идентификация характеристик и сбор данных, базируясь на эти характеристики.

.2 Работа с данными для проведения кластерного анализа, используя модель кластеризации

В первую очередь, перед процессом сбора данных необходимо их идентифицировать. Как было описано выше, за список успешных исполнителей был взят топ популярных альбомов по версии журнала Billboard, так как этот чарт является результатом анализа компании Next Big Sound в ходе оценки большого массива данных интернета, за основу которого берется уровень продаж и скачиваний альбома. Для предлагаемого исследования этот чарт является показателем успеха исполнителя, определяемый уровнем прибыли от записи альбома.

Данные были взяты за текущую неделю мая, а именно за 21 мая 2016 года. Для анализа был взят список из пятидесяти первых альбомов. В список не вошли разные альбомы одного и того же исполнителя, так как данные артиста идентичны, следовательно они могли бы усилить или ослабить влияние определённых характеристик на популярность исполнителя и повлиять на исход расчета модели. Также в список топ популярных альбомов не были включены те, что обрели былую популярность по причине смерти исполнителя. В ходе выборки был получен список из трёх столбцов:

. строка в топе популярности Billboard 200;

. название альбома;

. сценическое имя исполнителя или название группы;

Далее необходимо было собрать характеристики, которые возможно имеют прямое или косвенное влияние на популярность артиста. В первую очередь были собраны данные, которые напрямую касаются творчества и музыкальных композиций в альбоме, а именно жанр музыки. Как выяснилось, на данный момент существуют множество вариаций традиционных жанров, однако с целью упрощения исследования за основу был взят не весь перечень жанров, но устоявшиеся музыкальные направления:

1. Hip-hop;

. R&B;

. Rock - Metal;

4. Pop;

. Country.

Далее было принято решение собрать данные о лейблах звукозаписи, которые участвовали в создании альбома, так как в традиционной музыкальной индустрии успех напрямую зависел от лейбла звукозаписи. Лейбл зарабатывал репутацию и имел вес в сфере музыкальной индустрии, зачастую, задавая вкус слушателям, и за счёт репутации продвигал юных исполнителей. Интересно то, что в процессе сбора данных, несмотря на большое разнообразие звукозаписывающих компаний, встречались повторяющиеся лейблы. Вот почему четвёртый столбец данных занял «Лейбл звукозаписи».

Пятой характеристикой выступило «Сотрудничество». Выбор такой характеристика пол по причине того, что согласно субъективным характеристикам, появление новых звёзд всё чаще обусловлено участием популярных исполнителей в записи треков или альбомов. Использование популярности действующей звезды возможно привлекает внимание к начинающему исполнителю и тем самым может сыграть роль в его собственном успехе. Данная характеристика также описывало сотрудничество при создании конкретного альбома, который вошёл в топ популярности. Далее последовала характеристика «Тур», под которой понимаются выступления за 2016 год. Такой выбор объясняется вопросом, имеет ли влияние живых концертов на уровень продаж альбома. Может ли выступление артиста вызвать интерес и вызвать тем самым желание приобрести альбом для повторного прослушивания треков.

Далее последовала характеристика, выявляющая следующую информацию: исполняется ли альбом сольно или группой. Данный критерий используется, чтобы выявить, может ли сольный исполнитель быть популярнее группы и наоборот. Известно, что во времена Beatles были популярны группы, однако в современном мире упор делается на подчеркивание индивидуальности и уникальность, вот почему было интересно включить данный критерий.

Завершающей характеристикой, которая касается творчества исполнителя, стала «Награды и премии». В данный критерий вошли любые награды, которые артист получил за время карьеры. В процессе сбора данных был выявлен интересный факт. В мире существует большое количество музыкальных наград. В первую очередь они разделяются по странам, в которых данные премии присуждают: музыкальные премии России, Республики Белоруссии, музыкальные премии Великобритании, Канады, Франции, Эстонии, Японии и США. Однако среди исполнителей, которые на данный момент стоят на пике популярности со всем мире, присутствуют победители музыкальных премий Великобритании, Канады и США:

. BRIT Awards (Великобритания)

. NME Awards (Великобритания)

. Q Awards (Великобритания)

. Juno Awards (Канада)

5. American Music Award (США)

. Grammy Award (США)

. Academy of Country Music (США)

. Country Music Association Awards (США)

. GMA Dove Award (США)

. NAACP Image Award (США)

. MTV Video Music Awards (США)

. People's Choice Awards (США)

. ASCAP Awards (США)

Из перечисленных премий, самой часто встречаемой оказалась премия Grammy.

Далее в качестве характеристик последовали личные данные исполнителя. В первую очередь это пол. Важно выяснить имеет ли место дискриминация по гендерному признаку, так например, как существует мнение, что мужчины лучше преуспевают в бизнесе и карьере. Несмотря, что такое мнение имеет и свои опровержения, было интересно рассмотреть данный критерий.

Следующей характеристикой стала страна. Влияет ли географическое расположение выпуска альбома на его популярность, а также национальная принадлежность его исполнителя.

Одной из характеристик стало «Авторство». Данный критерий включает в себя самостоятельное написание текстов песен или музыки для них. Главной целью является выяснить, необходимо ли обладать такого рода творческими данным, чтобы обрети популярность. Возможно осознание того, что исполнитель самостоятельно сочиняет свои песни, вызывает у аудитории большее уважение и как следствие желание покупать его альбомы, а не просто скачать их в интернете.

Одной из характеристик стал столбец с данными о годах активности исполнителя. Является ли долгим пусть к успеху или есть место быстрому взлёту исполнителя на пик славы.

Далее последовали характеристики, которые могли иметь влияние на творчество исполнителя и на его продвижение. Для начала, это наличие музыкантов в семье. Имеет ли место в развитие творческих способностей вдохновение, возникшее в результате воспитания творческой личностью.

Следующим критерием оценивалось участие в различных проектах: от участия в телепрограмме, озвучки фильма до рекламы продукта и создание собственного проекта. Может ли подобного рода популярность повлиять и на успех в сфере музыкальной индустрии.

В заключении, был составлен список по количеству запросов на YouTube по данному исполнителю. Данный критерий представился важным, так как было интересно проследить соответствует ли реальный успех в продажах альбома популярности на видео хостинге. По такому же принципу были собраны данные о наличие песни из альбома в топе 100 популярных треков - Hot 100 - за ту же неделю, что и топ популярности альбомов в журнале Billboard.

В результате сбора данных был получен массив из 750 данных: 50 альбомов различных исполнителей описанные по 15 разного рода характеристикам, в процессе оценки которых следует выяснить, в какой степени каждая из них влияет на успех, популярность и соответственно продаваемость альбома.

.3 Тестирование модели на примере музыкальной индустрии

В процессе сбора данных была получена таблица 50 на 15 - это 50 альбомов различных авторов описанная по 15 различным характеристикам, которые могут иметь влияние на успех альбома. В процессе проведения анализа необходимо выявить связи характеристик и силу влияния на популярность.

Среди всех данных количественную оценку имеет единственная характеристика - это количество видео на запрос в YouTube имени исполнителя или названия группы. Остальных характеристики являются неисчисляемыми, однако в данном исследовании хотелось бы их обозначить как уникальные ресурсы, применение которых возможно повлияло на успех. Интересно выяснить, повлияли ли они на популярность в целом, в какой степени и существует ли набор таких ресурсов, который определил конечный успех исполнителя.

Первым этапом анализа собранных данных было вычисление регрессии - то есть наличие и уровень силы взаимосвязей между зависимой переменной и не зависимыми переменными. За зависимую переменную был взят количественный критерий «Число видео на запрос в YouTube», данный критерий имеет конкретное количество просмотров и определяет популярность исполнителя на видео хостинге. За независимые критерии были взяты все остальные данные, собранные в процессе подготовки к использованию кластерного анализа:

. жанр;

. Лейбл звукозаписи;

. сотрудничество;

. Туры;

. наличие премий и наград;

. пол;

. страна;

. авторство;

. наличие в семье музыкантов;

. участие в проектах;

. наличие трека из представленного в топе популярности альбома в списке ста популярных песен за ту же неделю.

Название альбома и сценическое имя исполнителя/название группы в данный список не вошли. Перечисленные данные были собраны с целью создания списка самых популярных и продаваемых во всем мире артистов. Смысл использования списка в качестве базы - это возможность выявить объясняющие данное явление характеристики и связей между ними. Необходимо также заметить, что данные об артисте, который выбивался из остальных по критерию «число видео на запрос в YouTube» были так же изъяты, так как из-за сценического имени Future невозможно было отсеять данные, относящиеся непосредственно к нему или данные к слову «будущее».

В процессе подготовки к вычислению регрессии данные были более подробно расписаны в таблице данных:

)        Пол мужской определила 1, женский -2

)        Все жанры музыки были выделены в отдельные столбцы и получили бинарное обозначение(1 -да, 0 - нет)

)        То же самое было проделано со странами, наличием наград, участием в различных проектах и наличием в топе Hot 100 популярных песен.

В результате расчета регрессии были получены следующие результаты, что на зависимую переменную «популярность в YouTube» влияют следующие независимые переменные:

. участие в фильмах;

. награда Grammy;

. годы активности;

. стиль Country.

Более подробные данные представлены в приложении.

Обратите внимание на столбец с названием Sig. Данный показатель показывает уровень значимости перечисленных независимых переменных на зависимую переменную: количество видео на запрос в YouTube. Если показатель равен или меньше 0,05, то связь между переменными присутствует. Если же показатель больше данного значения, то это значит, что переменные не связаны между собой. Данные расчёты дали возможность сузить круг независимых переменных, которые влияют на зависимую. Далее было сформировано 4 модели, которые включают в себя разный набор выбранных переменных. В ходе расчётов, было определено влияние разных наборов показателей - независимых переменных на зависимую переменную.

Далее были рассчитаны 4 модели (см. Таблицу 1):

)        Модель 1: Наличие премии Grammy (да/нет);

)        Модель 2: Наличие премии Grammy (да/нет) и влияние участия в фильмах (да/нет);

)        Модель 3: Наличие премии Grammy (да/нет), влияние участия в фильмах (да/нет) и Country стиль (да/нет);

)        Модель 4: Наличие премии Grammy (да/нет), влияние участия в фильмах (да/нет), Country стиль (да/нет) и годы активности;

Таблица 1 Coefficientsa

Model

Unstandardized Coefficients

Standardized Coefficients

T

Sig.


B

Std. Error

Beta



1

(Constant)

2197640.000

1071997.296


2.050

.046


Получали Грэмми или нет

7255065.882

1782453.291

.519

4.070

.000

2

(Constant)

951726.554

1031725.266


.922

.361


Получали Грэмми или нет

6668753.672

1613073.483

.477

4.134


Фильмы

6229567.232

1830592.366

.392

3.403

.001

3

(Constant)

1796903.483

1053257.149


1.706

.095


Получали Грэмми или нет

7249812.811

1562232.814

.518

4.641

.000


Фильмы

5120272.512

1815586.994

.323

2.820

.007


Country - style

-4674884.888

2051245.580

-.261

-2.279

.028

4

(Constant)

478255131.079

189043677.259


-2.530

.015


Получали Грэмми или нет

10061619.982

1841778.486

.719

5.463

.000


Фильмы

4273546.959

1742648.194

.269

2.452

.018


Country - style

-5388472.815

1952787.821

-.301

-2.759

.009


Годы активности

239201.457

94195.830

.329

2.539

.015

a. Dependent Variable: Число видео на завтра в YouTube


Анализируя полученные данные можно сделать вывод, что модель 4: Наличие премии Grammy (да/нет), влияние участия в фильмах (да/нет), Country стиль (да/нет) и годы активности - объявляет 51% дисперсии (см. Таблицу 2). Самый значимый предиктор - это наличие Grammy. Он объясняет 25% дисперсии. За ним по уровню значимости следует участие в фильмах - 14%, стиль Country - 5% и 5% объясняет стаж на сцене. Интересно то, что стиль Country влияет отрицательно, так как из всего списка исполнителей у артистов в стиле Country меньше всего число видео на YouTube.

музыкальный индустрия прибыль кластерный

Таблица 2 Model Summary

Model

R

R Square

Adjusted R Square

Std. Error of the Estimate

1

.519a

.269

.253

5871571.005

2

.649b

.421

.395

5283221.427

3

.696c

.484

.448

5048105.442

4

.743d

.552

.510

4755783.836

. Predictors: (Constant), Получали Грэмми или нет. Predictors: (Constant), Получали Грэмми или нет, Фильмы

c. Predictors: (Constant), Получали Грэмми или нет, Фильмы, Country - style

d. Predictors: (Constant), Получали Грэмми или нет, Фильмы, Country - style, Годы активности

Суммируя эти данные можно сделать вывод, что действительно участие в фильмах повышает внимание к исполнителю, награда премии Grammy подтверждает его успех в сфере музыкальной индустрии.

Безусловно, годы активности определяют число запросов на YouTube, так как чем дольше исполнитель работает, тем больше видеоклипов и видео с концертов он имеет. Это можно учесть, модифицируя зависимую переменную, деля количество видео на годы активности исполнителя, для получения более точного результата.

В заключении нужно отметить, что стиль Country имеет самую низкую популярность из всех на YouTube, вот почему данный критерий необходимо учитывать, но с отрицательным значением.

Следующим этапом анализа данных является кластеризация собранных данных. Были выбраны переменные, по которым строились кластеры:

1)      Hip-hop

2)      R&B

3)      Rock - Metal

4)      Country

)        Наличие Grammy (да/нет)

)        Другие премии (да/нет)

)        Страна США

)        Съемка в фильмах

)        Наличие песни из альбома в топ 100 популярных песен

)        Наличие музыканта в семье (см. Рис. 1)

Рис.1

В результате анализа была получена дендрограмма. На ней наглядно показано, на каждом шаге, кто с кем объединялся. Данная степень похожести (выбирается самый близкий по показанным критериям артист).

На первом шаге объединились исполнители, которые со многом схожи, согласно используемым критериям. С каждым последующим шагом артисты кластеризуются с менее сильной связью, но по большему числу характеристик. Так они объединяются в группы, пока не создадут один большой кластер. Можно сказать, что в конце концов они примут вид исходных данных, тот самый том самых популярных артистом, по уровням продаж альбомов.

Итак, на первом шаге объединились следующие исполнители:

1)      Cydni Lauper и Gwen Stefani

2)      Ruth B и Lucas Ruhum

3)      Goo Goo Dolls и Lauren Daigle

)        Tim MacGrow и Keith Urban

)        Bryson Tiller и Fetty Wap и G-Ezy

)        The Luminers и Disturbed

На следующем этапе группы увеличились и согласно критериям, которые применялись в данных расчётах, возникли более близкие по характеристикам большего следующего уровня группы:

1)      Cydni Lauper и Gwen Stefani и Taylor Swift

)        Mike Posner и Melarie Martinas

)        Flo Rida и Carrie Underwood

)        Cole Swindel и Haisay

)        Tim MacGrow и Keith Urban и Chris Stampleton

)        Future и D. Cole

)        Beyonce и Kanye West

)        Bryson Tiller и Fetty Wap и G-Ezy и Rittz

)        Selena Gomes и Justin Bieber

Группы на следующем этапе (уровень 5 по 10):

1)      Ruth B, Lukas Graham, Mike Posner, Melanie Martines

)        Flo Rida, Carrie Underwood, Meghan Trainor

)        Goo Goo Dolls, Lauren Daigne, Cole Swindell, Halsey

)        The Lumheers, Disturbed, Rob Zombie

)        The Lumheers, Disturbed, Rob Zombie

)        Justin Bieber, Zayn, The Weeknd

)        Alessia Cara, Jamese Blake

На уровне 10 в группы объединяются следующие исполнители:

1)      Goo Goo Dolls, Lauren Daigne, Cole Swindell, Hatsey, Sam Hunt

)        The Lumheers, Disturbed, Rob Zombie

)        Alessia Cara, Jamese Blake

)        Sia, Adele

На следующем уровне объединились следующие исполнители:

1)      The Lumheers, Disturbed, Rob Zombie, James Bay

)        Justin Bieber, Zayn, The Weeknd, Sia, Adele

)        Cyndi Laupes, Gwen Stefani, Taylor Swift, Ruth B, Lukas

)        Graham, Mike Posner, Melanie Martines, Flo Rida, Carrie Underwood, Meghan Trainor

И так далее. С каждым шагом число кластером снижается, а количество в них артистов увеличивается, объединённые по более удалённым сходим характеристикам, имеющие более слабую связь, чем на предыдущем шагу.

В соответствии с числом шага кластеризации можно провести анализ с более или менее подробным расчетом влияния характеристик на степень близости исполнителей.

Для примера объединения в кластеры представлена таблица, в которой все исполнители разделились на 3 разных группы в соответствие с более близкими друг у другу характеристиками. Данная кластеризация имеет только одного исполнителя во 2 втором кластере, вот почему важно расширить число кластеров.

Используя уровень кластеризации, при котором все исполнители объединились в 5 группы-кластера, можно получить следующие по ним данные. Проанализируем полученные в таблице данные. Необходимо обратить внимание, что в кластере 2 и 5 присутствует только один человек, вот почему его можно не учитывать в описании.

В первую очередь обратим внимание на переменные.

)        Среди Рор исполнителей в каждом из кластеров больше половины всех исполнителей составляют мужчины, только в 3 кластере их число с женщинами примерно равно и составляет около 50%;

)        В жанре Hip-hop также работают меньше половины в каждом кластере, интересно отметить, что в 4 кластере их число составляет 0%, вот почему можно сделать вывод, что за основу данной кластеризации был взят данный жанр, а именно его отсутствие;

)        В стиле R&B работают всего 10% 1 кластера, чуть больше половины 3 кластера и 100% исполнителей 4 кластера;

)        В стиле Pop играют 100% 3 кластера;

)        Стиль Country почти совсем отсутствует. Интересно то, что данный стиль в рассечете регрессии показал отрицательное влияние на популярность, это объявляет такое маленький процент среди популярных исполнителей;

)        Награду Grammy получили примерно по 30% в каждом кластере;

)        Наличие другим премий колеблется в районе 50% в каждом кластере;

)        Страна США объединила 1 кластер - почти 100% всех исполнителей из США, и половина приходится на 4 кластер;

)        Небольшое число исполнителей из Канады и Великобритании;

)        Практически нулевой процент приходится на исполнителей в каждом кластере из других стран;

)        Туры в 2016 году проводили больше половины исполнителей из 3 кластера;

)        В фильмах снялись больше половины процентов исполнителей из 3 кластера;

)        В каждом из кластеров наличие треков из альбомов исполнителей составляет около 50%;

)        Наличие музыкантов в семье исполнителей из 3 и 4 кластеров колеблется в районе 30%.

Опираясь на данные результаты можно дать характеристику каждому из трёх полученных кластеров.

Кластер 1:

Больше половины мужчин;

Примерно поровну исполняют треки в стиле Hip-hop, R&B и Pop;

Число премий Grammy и прочих примерно одинаково и составляет меньше 50%;

Почти 100 % исполнителей из США;

Меньше половины исполнителей проводили туры;

Почти вовсе не участвовали в съемках фильмов;

Больше половины исполнителей присутствуют в топ 100 самых популярных треков;

Почти никто не имел музыкантов в семье.

Кластер 3:

Количество мужчин и женщин среди исполнителей кластера почти равно 50%;

Все исполнители делятся на Pop и R&B, последний стиль явно преобладает над первым;

Получение других премий относится к большей части исполнителей;

Исполнители почти наполовину из Канады и Великобритании;

Больше половины исполнителей совершили туры в этом году;

Больше 50% исполнителей снимались в фильмах;

Больше половины составляют исполнители, треки которых входят в топ 100 популярных;

Небольшой процент исполнителей имели в семье музыканта;

Кластер 4:

Преобладают мужчины;

% исполнителей работают в стиле Rock - Metal;

Больше половины исполнителей получили другие награды;

Исполнители разделились на 71% из США и 29% из Великобритании;

Меньшая часть исполнителей совершала туры;

Небольшой процент участвовал в съемках фильмов;

Небольшое количество исполнителей имело в семье музыкантов;

В заключении описания кластеров, ниже представлена таблица (см. Таблица 3 ), в которой обозначены основные отличительные характеристики кластеров.

Таблица 3

Кластер 1

Кластер 2

Кластер 3

В основном мужчины США Grammy Поп 100

Мужчины и женщины R&B Другие премии Туры Участие в фильмах

В основном мужчины Rock-Metal Другие премии Музыканты в семье


Кроме того, можно сделать вывод, что:

)        В Америке популярность в большей степени зависит от премий и наличия трека в топ 100 популярности;

)        А в стиле R&B исполнители получают больше других наград, чем Grammy, а так же такие исполнители участвуют в съемках в фильмах;

)        Rock-Metal исполняют мужчины и для таких исполнителей характерно наличие музыканта в семье.

Однако помимо отличительных свойств у кластеров есть и схожие моменты, которые определяют их популярность, не смотря на различные наборы переменных, определяющих их успех.

Объединяют Кластеры следующие критерии:

) Преобладание мужчин;

) Почти полное отсутствие исполнителей в стиле Country;

) Преимущественно наличие наград и премий;

) присутствие треков исполнителей в топ 100 популярных.

Данные критерии имеют так или иначе прямое или косвенное влияние на популярность артистов, данные критерии в большей степени объединяют кластеры, следовательно, на них необходимо делать больших упор и проводить более точные исследования. Важно заметить, что используя данные переменные, базируясь на перечисленные характеристики, можно сделать предварительный вывод о том или ином артисте. Так, например мужчина из США, играющий не в стиле Country, который снялся в фильме, наверняка окажется популярным. Безусловно, что данные приведенные в исследование и результаты нуждаются в доработке и проведении более тщательного исследования, однако, были найдены зависимые переменные, и получилось всех исполнителей объединить в кластеры, которые имеют чёткие схожие переменные.

Исследование имеет результаты, но не конечные. Необходимо расширить список данных и пробовать использование кластерного анализа для большего круга переменных. Тогда можно будет получить более подробные и точные данные, основываясь на которых определить набор характеристик, которые определят будущий успех и как следствие спрос на исполнителя.

ЗАКЛЮЧЕНИЕ

В процессе исследования были выполнены все поставленные задачи:

. Изучение имеющейся научной литературы о современном состоянии музыкальной индустрии и о методах борьбы с её упадком;

.Изучение математических моделей и выбор подходящей для оценки будущего спроса;

. Описание и адаптация выбранной модели;

. Сбор данных и проверка работы модели.

В данной работе, особое внимание было уделено методам оценке Больших Данных. А также возможность применить Большие данные с целью прогнозирования будущего спроса на артиста. Данный выбор обоснован тем, нелегальный файл-шеринга привел к потере доходов звукозаписывающих компании. Кроме того, традиционно, подбором артистов в сфере музыкальной индустрии занимается «отдел поиска талантов», выбор которых основан на собственном мнении и чутье. На данный момент нет ни одной математической модели, которая могла бы точно предсказать уровень успеха исполнителя, тем самым позволить продюсерам инвестировать средства эффективно.

Возможность прогнозировать будущее артиста всегда считалось утопией, так как критерии оценки успеха сводились к удаче. Вот почему, данная тема, а именно разработка инновационного метода оценки будущего спроса в сфере музыкальной индустрии, оказалась актуальной и бесспорно, в условиях упадка музыкальной индустрии в целом, данная модель станет интересна продюсерским и инвестиционным компаниям.

В процессе работы с данными и применение кластерного анализа было сделано заключение, что данный метод даёт результаты. Действительно, популярность артиста напрямую зависит от определённых характеристик. Важно то, что при сборе большего массива информации и различных данных, используя различные анализы Больших данных, в итоге можно получить реальные данные, на которые следует ориентироваться при выборе инвестировать в исполнителя проект.

Вывод о проведении исследования следующий: идея имеет развитие, необходимо приложить усилия, чтобы развить её, используя инновационные подходы. К субъективному мнению, такой продукт был бы интересен участницам музыкальной индустрии и полезен в эру цифровых технологий.

СПИСОК ЛИТЕРАТУРЫ

1.       Аларен, С. (2013). Что несет нам музыкальное пиратство, сайт-блок Хабрахабр, Гиктаймс.

.        Асташин В. Как Big Data меняют современные финансы. [Электронный ресурс] // Mëbius: [сайт]. - URL : https://mebius.io/practice/how-big-data-has-modified-modern-finance (дата обращения 12.03.2016).

.        Борисов А.Б. Большой экономический словарь. [Текст] // 4-е изд., - М.: Книжный мир, 2003. - 895 с.

.        Брукинг Э. Интеллектуальный капитал [Текст] / Пер с англ.; под ред Л.Н. Ковалик. СПб.: Питер, 2007.

.        Власова, Н. (2008). Роман с клиентом: привлечение, ухаживание и удержание, ООО «Эксмо», г. Моксва, стр. 47-53.

6.       Глебов О. Большие данные для всех: сомнения и перспективы. [Электронный ресурс] // Management: [сайт]. - URL: <#"907255.files/image016.jpg">

Приложение 4


Average Linkage (Between Groups)


1

2

3


Count

Count

Count

Сценическое имя исполнителя/ Группы

Adele

0

0

1


Alessia Cara

0

0

1


Andy Black

1

0

0


Beyonce

1

0

0


Bryson Tiller

1

0

0


Carrie Underwood

1

0

0


Chris Stapleton

1

0

0


Cole Swindell

1

0

0


Cyndi Lauper

1

0

0


Disturbed

1

0

0


Drake

0

1

0


Ed Sheeran

0

0

1


Fetty Wap

1

0

0


Flo Rida

1

0

0


Future

1

0

0


G-Eazy

1

0

0


Goo Goo Dolls

1

0

0


Gwen Stefani

1

0

0


Halsey

1

0

0


J. Cole

1

0

0


James Bay

1

0

0


James Blake

0

0

1


Jeremih

1

0

0


Justin Bieber

0

0

1


Kanye West

1

0

0


Keith Urban

1

0

0


Kevin Gates

1

0

0


Lauren Daigle

1

0

0


Lukas Graham

0

0


Luke Bryan

1

0

0


Meghan Trainor

1

0

0


Melanie Martinez

1

0

0


Mike Posner

1

0

0


Panic! At The Disco

1

0

0


Radiohead

1

0

0


Rihanna

1

0

0


Rittz

1

0

0


Rob Zombie

1

0

0


Ruth B

1

0

0


Sam Hunt

1

0

0


Selena Gomez

0

0

1


Sia

0

0

1


Taylor Swift

1

0

0


The Lumineers

1

0

0


The Weeknd

0

0

1


Thomas Rhett

1

0

0


Tim McGraw

1

0

0


Twenty one pilots

1

0

0


Zayn

0

0

1



Приложение 5


Average Linkage (Between Groups)


1

2

3

4

5


Column N %

Column N %

Column N %

Column N %

Column N %

Пол исполнителя

Мужчины

71%

100%

56%

83%

0%


Женщины

29%

0%

44%

17%

100%

Hip-Hop

нет

65%

0%

89%

100%

100%


да

35%

100%

11%

0%

0%

R&B

нет

90%

100%

44%

100%

0%


да

10%

0%

56%

0%

100%

Rock Metal

нет

100%

100%

100%

0%

100%


да

0%

0%

0%

100%

0%

Pop

нет

65%

100%

0%

86%

100%


да

35%

0%

100%

14%

0%

Country - style

нет

74%

100%

100%

100%

100%


да

26%

0%

0%

0%

0%

Получали Грэмми или нет

нет

65%

0%

78%

71%

0%


да

35%

100%

22%

29%

100%

Другие премии

нет

58%

0%

33%

43%

100%


да

42%

100%

67%

57%

0%

США

Нет

6%

100%

89%

29%

0%


Да

94%

0%

11%

71%

100%

Великобритания

Нет

100%

100%

56%

71%

100%


Да

0%

0%

44%

29%

0%

Канада

Нет

97%

0%

67%

100%

100%


Да

3%

100%

33%

0%

0%

Другие_страны

Нет

97%

100%

89%

100%

100%


Да

3%

0%

11%

0%

0%

Был ли тур в 2016 году

нет

58%

100%

33%

71%

0%


да

42%

0%

67%

29%

100%

Фильмы

нет

94%

0%

33%

86%

0%


да

6%

100%

67%

14%

100%

Включение в топ 100

нет

39%

0%

44%

57%

0%


да

61%

100%

56%

43%

100%

Музыканты в семье

Нет

94%

0%

67%

71%

100%


Да

6%

100%

33%

29%

0%


Похожие работы на - Разработка метода оценки будущего спроса на артиста

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!