Коефіцієнт варіації (на матеріалі художньої літератури)

  • Вид работы:
    Реферат
  • Предмет:
    Литература
  • Язык:
    Украинский
    ,
    Формат файла:
    MS Word
    504,23 Кб
  • Опубликовано:
    2015-04-29
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Коефіцієнт варіації (на матеріалі художньої літератури)

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

ДОНЕЦЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ

КАФЕДРА УКРАЇНСЬКОЇ МОВИ ТА ПРИКЛАДНОЇ ЛІНГВІСТИКИ






РЕФЕРАТ

з курсу «Квантитативна лінгвістика»

На тему

«Коефіцієнт варіації (на матеріалі художньої літератури)»


Студентки 4 курсу

спеціальності «Прикладна лінгвістика»

Бойко Анастасії







Вінниця - 2014

ЗМІСТ

ВСТУП

РОЗДІЛ 1. КВАНТИТАТИВНА СПЕЦИФІКА УКРАЇНСЬКОГО ФОЛЬКЛОРУ НА ПРИКЛАДІ КАЗОК УКРАЇНСЬКОЇ МОВИ НА МОРФОЛОГІЧНОМУ РІВНІ

.1 Частотний аналіз на морфологічному рівні

.2 Коефіцієнт варіації за результатами частотного аналізу

РОЗДІЛ 2. КВАНТИТАТИВНА СПЕЦИФІКА ФОЛЬКЛОРУ РІЗНИХ НАРОДІВ НА ПРИКЛАДІ КАЗОК ТРЬОХ МОВ (УКРАЇНСЬКА, АНГЛІЙСЬКА ТА РОСІЙСЬКА) НА СИНТАКСИЧНОМУ РІВНІ. КОМПАРАТИВНИЙ АСПЕКТ

.1 Частотний аналіз на синтаксичному рівні

.2 Коефіцієнт варіації за результатами частотного аналізу

.3 Метод Флеша та Флеша - Кінсейда

ВИСНОВКИ

ВСТУП

Мета - окреслити основні параметри та особливості українського фольклору, здійснити квантитативний аналіз українських казок «Колобок», «Казка про Іваньку-дурачка», «Хлопчик мізинчик» на морфологічному та синтаксичному рівнях, виконати компаративний аналіз зазначених творів з іншомовними казками аналогійного сюжету: англійськими казками «Johnny-Cake», «Lazy Jack» та «Tom Thumb», а також російськими відповідниками «Колобок», «Сказка про Иванушку-дурачка», «Мальчик с пальчик» відповідно.

Для успішної реалізації мети ми розвязали такі завдання:

ознайомилися з науковою літературою з теми;

визначили кваліфікаційні ознаки та базові особливості українського фольклору; український фольклор варіація казка

зробили вибірку з українських казок та підібрали іншомовні відповідники аналогійного сюжету (по 3 казки з кожної мови);

методом частотного аналізу та за допомогою створеного корпусу текстів окреслили квантитативну специфіку українського фольклору на морфологічному рівні;

методом частотного аналізу окреслили квантитативну специфіку фольклору зазначених народів на синтаксичному рівні;

для отримання більш якісних результатів визначили коефіцієнт варіативності для кожного з етапів дослідження;

за допомогою індексу Флеша - Кінсейда визначили складність текстів казок різних народів, здійснили компаративний аналіз складності читання на синтаксичному рівні;

отримані результати проілюстрували таблицями та діаграмами різних типів.

Об'єктом дослідження є казки української мови: «Колобок», «Казка про Іваньку-дурачка», «Хлопчик-мізинчик», їхні англійські аналоги: «Johnny-Cake», «Lazy Jack» та «Tom Thumb», а також російські відповідники: «Колобок», «Сказка про Иванушку-дурачка», «Мальчик с пальчик».

Предметом дослідження є квантитативні особливості українського фольклору на морфологічному рівні та квантитативні особливості казок трьох зазначених народів на синтаксичному рівні.

Методи роботи. У роботі використовується описовий метод дослідження мовного матеріалу з використанням компонентного аналізу, метод вибірки, метод квантитативного аналізу, кореляційний та порівняльний методи, коефіцієнту варіації, критерію Флеша - Кінсейда, частотного аналізу.

Джерельною базою дослідження слугували тексти казок української мови: «Колобок», «Казка про Іваньку-дурачка», «Хлопчик-мізинчик», їхні англійські аналоги: «Johnny-Cake», «Lazy Jack» та «Tom Thumb», а також російські відповідники: «Колобок», «Сказка про Иванушку-дурачка», «Мальчик с пальчик».

Теоретичне значення роботи визначається тим, що вона являє собою аналіз параметричних характеристик українського, англійського, російського фольклору, надається їхня порівняльна характеристика. Результати проведеного дослідження можуть бути використаними в подальших теоретичних розробках.

Практичне значення роботи полягає у тому, що результати дослідження можна використати для різних лінгвістичних та лексикографічних робіт, подальшого дослідження фольклору різних народів, статистичної структури текстів казок.

РОЗДІЛ 1. КВАНТИТАТИВНА СПЕЦИФІКА УКРАЇНСЬКОГО ФОЛЬКЛОРУ НА ПРИКЛАДІ КАЗОК УКРАЇНСЬКОЇ МОВИ НА МОРФОЛОГІЧНОМУ РІВНІ

.1 Частотний аналіз на морфологічному рівні

Обчислимо частоту вживання базових частин мов: іменника, прикметника, дієслова, прислівника, займенника, числівника у казках української мови. Задля більш якісного та швидкого аналізу створимо корпус казок за допомогою корпусного менеджера Manatee/Bonito. (див. Рис. 1).

Рис.1

За допомогою корпусу обчислимо кількість вживаних у казках частин мови та їхнє співвідношення. (див. Табл.1)

Частота вживання іменника, прикметника, дієслова, прислівника, займенника та числівника в українських казках

КолобокКазка про Іваньку-дурачкаХлопчик-мізинчикУсього3491814325іменники7531857прикметники45510дієслова (у т.ч. форми)9239091прислівники79429займенники5823741числівники0166інше11370491Табл. 1

Аналіз Таблиці 1 показує, що у зазначених казках у відсотковому плані базові частини мови співвідносяться майже однаково. Для наочності побудуємо кругові діаграми. (див. Рис. 2, Рис. 3, Рис. 4).

Рис. 2

Рис. 3

Рис. 4

.2 Коефіцієнт варіації за результатами частотного аналізу

Тепер, аби переконатися у тому, що відсоткове співвідношення у казках української мови є лімітованим та стандартизованим та казки здебільшого мають дієслівний тип, або спростувати цю гіпотезу, визначимо коефіцієнт варіації для цього етапу дослідження за формулою:

де V - коефіцієнт варіації;̅ - середнє аріфметичне;

σ - середнє квадратичне відхилення; виражається за формулою


де σ - середнє квадратичне відхилення;- середина інтервалу;- частоти вживання;̅ - середнє аріфметичне.

Різницю між варіаційними рядами (відсотками вживання частин мови у різних казках однієї мови у нашому випадку) за коливанням навкого середнього значення можна виразити лише за допомогою σ - середнього квадратичного відхилення, адже ми маємо однакові одиниці виміру, аналізуємо варіаційні ряди, варіанти яких були отримані на основі однієї ознаки. Але і у нашому випадку для більш точних результатів доречним виступає використання формули коефіцієнту варіації, тобто такої відносної величини, що виражає співедношення між середньоквадратичним відхиленням та середнім аріфметичним. Отже, наочно продемонструємо коефіціент варіації частоти вживання частин мови в українських казках. (див. Табл. 2)

Коефіцієнт варіації на морфологічному рівні іменникиприкметникидієслова (у т.ч. форми)Стандартне відхилення0,022840,011020,03381Середнє аріфметичне0,188530,024180,25287Коефіцієнт варіації12,11%45,57%13,37% прислівникизайменникичислівникиСтандартне відхилення0,034630,021930,00923Середнє аріфметичне0,053700,141000,09627Коефіцієнт варіації64,48%15,55%9,59%Табл. 2

РОЗДІЛ 2. КВАНТИТАТИВНА СПЕЦИФІКА ФОЛЬКЛОРУ РІЗНИХ НАРОДІВ НА ПРИКЛАДІ КАЗОК ТРЬОХ МОВ (УКРАЇНСЬКА, АНГЛІЙСЬКА ТА РОСІЙСЬКА) НА СИНТАКСИЧНОМУ РІВНІ. КОМПАРАТИВНИЙ АСПЕКТ

.1 Частотний аналіз на синтаксичному рівні

Казки як різновид фольклору розповсюджені по усій земній кулі. Проте є певні культурні, етнічні, релігійні, історичні та інші внутрішні відмінності у казках різних народів. Вочевидь, такі відмінності можуть виражатися і у квантитативному аспекті.

Розглянемо казки трьох народів: українські, англійські, російські. Вибірка складатиме по три казки кожної з мов зі схожою сюжетною лінією: казки української мови: «Колобок», «Казка про Іваньку-дурачка», «Хлопчик-мізинчик», їхні англійські аналоги: «Johnny-Cake», «Lazy Jack» та «Tom Thumb», а також російські відповідники: «Колобок», «Сказка про Иванушку-дурачка», «Мальчик с пальчик».

Порівняємо казки трьох народів із синтаксичної точки зору. Для цього порівняємо середню довжину речення, а отже складність читання казок кожної з мов. Також за допомогою формули Флеша - Кінсейда проаналізуємо гармонійність та загальну читабельність текстів казок різних народів.

Середня довжина речення

Отже, для обчислення середньої довжини речення (СДР) треба загальну кількість слів поділити на кількість речень (див. Табл. 3).

Для наочності та виявлення відмінностей побудуємо гістограми на базі значень СДР для кожної з казок. (Див. Рис. 5, Рис. 6, Рис. 7).

Рис. 5Рис. 6

Рис. 7

Визначимо коефіцієнт варіативності, щоб виявити, наскільки наші показники середньої довжини речення є постійною ознакою для казок поданих мов. (Див. Табл. 4)

Коефіцієнт варіації на синтаксичному рівні (компаративний аспект)МоваукранглросСтандартне відхилення1,34,53,4Середнє аріфметичне9,220,910,6Коефіцієнт варіації13,6 %21,4 %31,8 %Табл. 4

Як бачимо, коефіцієнт варіації є меншим за 50%. Тобто, можна казати про те, що середня довжина речення у різних зразках фольклору не істотно відхиляється від середнього значення СДР для фольклору певного народу.

Тепер можемо за допомогою формули Флеша вирахувати гармонійність казок трьох народів, індекс легкості читання.

Цей тест оцінює текст за 100-бальною шкалою. Чим вище оцінка, тим легше зрозуміти твір. Формула для визначення легкості читання за Флешем така:

= 206,835 - (1,015 x СДР) - (84,6 x СКС)

де:

СДР = середня довжина речення (кількість слів, поділена на кількість речень)

СКС = середня кількість складів у слові (кількість складів, поділена на кількість слів)

Отже, дані СДР для кожної з казок кожною мовою ми вже маємо. Тепер порахуємо СКС та визначимо легкість читання казок. (див Табл. 5).

Тест легкості читання Флеша КолобокКазка про Іваньку-дурачкаХлопчик-мізинчик МоваукранглросукранглросукранглросКількість складів60913317743404111345036673787820Кількість слів349834407181470222343252511427СКС1,741,601,901,881,592,022,051,511,92СДР10,0018,5014,509,8026,009,207,7018,108,20RE49,0653,0431,2338,1346,3126,9725,3960,8736,05Табл. 5

Визначимо коефіцієнт варіації для кожної з мов: (Див. Табл. 6)

МоваукранглросСтандартне відхилення11,87,34,5Середнє аріфметичне37,553,431,4Коефіцієнт варіації31,6%13,6%14,5%Табл. 6

Індекс за шкалою FRES (Flesch Reading Ease Scale) розподіляється таким чином:

: Дуже легко читається. Середня довжина речення складає 12 або менше слів. Немає слів з більш ніж двох складів.

: проста мова. Середня довжина речення складає від 15 до 20 слів. У середньому довжина речення складає від 15 до 20 складів. У середньому слова мають 2 склади.

: Трохи складно читати. Речення містять до 25-ти слів. Зазвичай, двоскладні слова.

: Дуже важко читати. У середньому речення має 37 слів. У середньому речення має 37 слів. Слово має у середньому більше 2-х складів.

Оцінка класу за Флешем - Кінсейдом

Цей тест оцінює текст відповідно до кількості класів в американській школі. Наприклад, оцінка 8,0 означає, що документ може зрозуміти американський восьмикласник. Для більшості документів бажана оцінка має становити в середньому від 7,0 до 8,0.

Формула для оцінки класу за Флешем - Кінсейдом така:

= (0,39 x СДР) + (11,8 x СКС) - 15,59

де:

СДР = середня довжина речення (кількість слів, поділена на кількість речень)

СКС = середня кількість складів у слові (кількість складів, поділена на кількість слів)

Маємо такі результати: (Див. Табл. 7)

МоваукранглросукранглросукранглросКількість складів609,001331,00774,003404,001113,004503,00667,003787,00820,00Кількість слів349,00834,00407,001814,00702,002234,00325,002511,00427,00СКС1,741,601,901,881,592,022,051,511,92СДР10,0018,5014,509,8026,009,207,7018,108,20FRE8,9010,4612,5110,3713,2611,7811,639,2710,27Табл. 7

Як бачимо з таблиці, теорія оцінки класу за Флешем - Кінсейдом не є найкращим показником легкості читання. Адже результати розрахунків показують, що казки, розраховані для малюків та дітей молодшого шкільного віку здатні сприймати учні 8-13 класів.

Визначимо коефіцієнт варіації для кожної з мов: (Див. Табл. 8)

МоваукранглросСтандартне відхилення1,42,01,1Середнє аріфметичне10,311,011,5Коефіцієнт варіації13,3%18,6%9,9%Табл. 8

ВИСНОВКИ

У результаті роботи ми дійшли таких висновків.

На морфологічному рівні існують певні закономірності частотності вживання частин мов в українському фольклорі. У відсотковому співвідношенні частини мови у трьох казках української мови розподіляються відносно рівномірно. Найчастотнішим виявляється вживання дієслів.Коливання значень для різних частин мови у зразках українського ольклору, зокрема у казках: «Колобок», «Казка про Іваньку-дурачка», «Хлопчик мізинчик» навколо середнього є незначними. Показники коефіцієнту варіації менше 50% означають, що такі частоти вживання різних частин мови притаманні українському фольклору, зокрема казкам. Крім того, тип мови у таких творах є дієслівним, тобто важливішими виступають дії персонажів, а не їхній опис та образність.

На синтаксичному рівні є певні відмінності між казками трьох зазначених мов. Середня довжина речення є найбільшою для англійської мови, відповідно за критеріями RE та FRE саме англійські казки є найскладнішими для читання серед трьох мов. Тоді як середня кількість складів у слові найбільшою є у російській мові, що також певним чином впливає на легкість читання текстів. Визначені для кожного випадку коефіцієнти варіації дозволяють зрозуміти, що отримані параметри не сильно відхиляються від середніх та є відносно постійними та лімітованими.

Поза всяким сумнівом, формули RE та FRE не є вичерпними для визначення трудності читання. У всякому разі, вони не чутливі до вживання метафор; вони не звертають уваги на довгі слова, які можуть бути добре знайомі читачеві (напр., Масачусетс); і вони не враховують як семантичної, так і синтаксичної структури речень. Однак її використання дозволяє порівнювати на основі єдиної шкали як легкість читання (що ріднить її зі стандартними тестами читання) різноманітних текстів, так і інтерес до них.

Похожие работы на - Коефіцієнт варіації (на матеріалі художньої літератури)

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!