Тема 3. Інтелектуальний аналіз часових рядів

Сайт: Навчально-інформаційний портал НУБіП України
Курс: Дейта майнінг ☑️
Книга: Тема 3. Інтелектуальний аналіз часових рядів
Надруковано: Гість-користувач
Дата: понеділок, 3 лютого 2025, 21:52

Опис

....

1. Часові ряди, основні поняття та визначення

Важливою особливістю соціально - економічних явищ і процесів е їх безперервний розвиток як у просторі , так і в часі . Протягом певного часу ( за годину, добу, місяць, квартал, рік ) змінюється чисельність населення, його склад, споживання електроенергії , кількість і структура виробленої продукції, продуктивність праці , урожайність сільськогосподарських культур тощо. Тому одним із головних завдань статистики е вивчення суспільно - економічних явищ у їх зміні за часом, тобто у динаміці. Це завдання вирішують побудовою та аналізом рядів динаміки ( хронологічних чи часових).

Вивчення динаміки дозволяє охарактеризувати процес розвитку явищ розкрити основні тенденції і темпи цього розвитку.

Рядом динаміки називають ряд розміщених у хронологічній послідовності чисел (статистичних показників ), які характеризують величину суспільного явища на даний момент або на певний період часу. Наприклад, чисельність населення України на певні дати ( дати перепису) ,урожайність зернових культур у господарствах області за 2010 - й рік, чисельність поголів'я корів в ТОВ на початок кожного місяця тощо.

Ряд динаміки складається з двох елементів : моментів або інтервалів часу     r(і =1 п) (основа ряду)  і рівнів ряду      у(і =1               п). Рівнем ряду називають статистичний показник, який характеризує величину суспільного явища на даний момент або за певний проміжок часу. Рівні ряду можуть бути виражені в абсолютних, відносних чи середніх величинах і задаватися в табличній формі або за допомогою графіків.

Залежно від реєстрації фактів ряди динаміки бувають дискретними і неперервними. Дискретні ряди містять рівні ряду, одержані через певні проміжки часу (місяць, квартал, рік тощо). Розрізняють 3 види дискретних рядів динаміки: моментні, інтервалыні ( періодичні) та ряди середніх.

Моментними називають такі ряди динаміки, рівні яких характеризують стан явища на певний момент часу (дату). Прикладом моментного ряду динаміки можуть бути дані про спискову чисельність працівників підприємства.

Моментні ряди динаміки часто використовують для характеристики стану умов і факторів виробництва. Наприклад, динаміка наявності кормів і поголів'я на початок кожного місяця, потужність машино-тракторного парку на кінець року тощо. Рівні моментного ряду не підлягають підсумовуванню, тому що підсумки позбавлені економічного змісту, оскільки одні і ті самі одиниці сукупності входять до складу кількох рівнів.

Інтервальним називають такий ряд динаміки, рівні якого характеризують розмір явища за певний період (інтервал) часу. 

Ряди середніх характеризують зміну середніх рівнів досліджуваного явища у часі ( урожайність сільськогосподарських культур, продуктивність тварин, продуктивність праці тощо).

Неперервні ряди динаміки одержують тоді , коли відбувається безперервний запис змін явища за допомогою відповідних приладів (механічних, електричних, електронних), але перешкодою тут е обчислювальні труднощі, тому неперервні ряди зводять до дискретних і результати аналізу неперервних рядів отримують на підставі аналізу дискретних послідовностей.

Ряди динаміки бувають одномірні і багатомірні. Одномірні ряди динаміки характеризують зміну в часі одного показника ( валовий збір картоплі в районі за рік). Багатомірні ряди динаміки характеризують зміну в часі двох, трьох і більше показників.

У свою чергу багатомірні ряди динаміки поділяються на паралельні і ряди взаємозв’язаних показників. Паралельні ряди динаміки відображають зміну в часі або одного показника різних об’єктів (чисельність населення різких країн ) або різних показників одного об’єкта ( валовий збір пшениці, цукрових буряків і картоплі в районі за рік ).

Ряди взаємозв’язаних показників характеризують залежність одного явища від іншого (залежність урожайності сільськогосподарської культури від кількості внесених добрив).

За повнотою часу ряди динаміки поділяють на повні і неповні. У повних динамічних рядах дати або періоди часу слідують один за одним з рівними інтервалами. У неповних рядах динаміки у послідовності часу спостерігаються нерівні інтервали.

2. Розкладання часових рядів на складові

Завдання розкладення часового ряду полягає в аналізі чинників, що впливають на значення його рівнів, у вирізненні серед них головних і другорядних (випадкових), а потім серед голов­них — еволюційних та періодичних (сезонних тощо).

  • Еволюційні чинники визначають загальний напрям розвитку економічного показника, провідну його тенденцію. Тенденція — це невипадкова складова часового ряду, яка змінюється повільно, і описується за допомогою певної функції , яку називають функцією тренду або просто трендом. Тренд відображає вплив на економічний показник деяких постійних чинників, дія яких акумулюється в часі. У широкому сенсі під трендом розуміють будь-який упорядкований процес, що відрізняється від випадкового, тобто функцію  у (1.2.12). Іноді під трендом розуміють також зміщення у часі математичного сподівання. Відносно  припускається, що це певна гладка функція, ступінь гладкості якої заздалегідь не відомий. Під ступенем гладкості розуміють мінімаль­ний ступінь поліному, що найкраще згладжує компоненту . На рис. 1.2.4 а) зображено умовний часовий ряд із тенденцією, що лінійно зростає.
  • Серед чинників, що визначають регулярні коливання ряду, розрізняють такі:

Сезонні, що відповідають коливанням, які мають періодичний або близький до нього характер упродовж одного року. Наприклад, ціни на сільгосппродукцію взимку вищі, ніж улітку ; рівень безробіття в курортних містах у зимовий період зростає відносно до літнього. Сезонні чинники можуть охоплювати причини, пов’язані з діяльністю людини (свята, відпустки, релігійні традиції тощо). Так, у ряду щомісячних даних слід очікувати наявності сезонних коливань із періодом 12, у квартальних рядах — із періодом 4. На рис. 1.2.4 б) зображено умовний часовий ряд, який містить лише сезонну компоненту. Результат дії сезонних чинників моделюють за допомогою функ­ції .

Циклічні (кон’юнктурні) коливання схожі на сезонні, але виявляються на триваліших інтервалах часу. Циклічні коливання пояснюються дією довготермінових циклів економічної, демографічної або астрофізичної природи. Наприклад, за багаторічними спостереженнями активність сонця має циклічність у 10,5—11 років, причому сплески сонячної радіації впливають на врожайність зернових культур, репродуктивну властивість тварин тощо. Отже динаміка показника міситиме характерні зміни, що повторюються з однаковою циклічністю. Результат дії цикліч­них чинників моделюють за допомогою функції .

Тренд, сезонна й циклічна компоненти не є випадковими, тому їх називають систематичними компонентами часового ряду.

Випадкові чинники не підлягають вимірюванню, але неминуче супроводжують будь-який економічний процес і визначають стохастичний характер його елементів. До випадкових чинників можна віднести помилки вимірювання, випадкові збурення тощо. Деякі часові ряди, наприклад стаціонарні, не мають тенден­ції та сезонної складової, кожен наступний рівень їх утворюється як сума середнього рівня ряду і випадкової (додатної або від’ємної) компоненти. Результат впливу випадкових чинників позначається випадковою компонентою εt, яку обчислюють як залишок або похибку, що залишається після вилучення з часового ряду систематичних компонент. Це не означає, що така складова не підлягає подальшому аналізу, оскільки містить лише хаос

Фактичні рівні рядів динаміки під впливом різного роду факторів варіюють, відхиляючись від головної тенденції. В деяких рядах коливання мають систематичний характер, повторюючись через певні проміжки часу, в інших – не мають такого характеру і їх називають випадковими. В одному і тому ж ряду можуть поєднуватись систематичні та випадкові коливання.

    Найпростішою оцінкою систематичних коливань є коефіцієнт нерівномірності, який обчислюється як відношення максимального і мінімального рівнів до середнього рівня. Чим більша нерівномірність процесу, тим більша різниця між цими двома коефіцієнтами.

Ряди динаміки, як правило, представлені у вигляді суми таких складових: основної тенденції розвитку – тренду; сезонної (періодичної) компоненти; випадкової компоненти. Методи визначення тренду в динамічних рядах, де випадкові фактори були зведені до мінімуму, вже попередньо розглянуті. Потрібно зупинитись на сезонні складовій ряду динаміки, яка має дуже важливе практичне значення.

Окремим соціально–економічним процесам притаманні внутрішньорічні, щоквартальні або щомісячні сезонні піднесення і спади, тобто сезонні коливання. У більшості випадків ці коливання пов’язані зі зміною пори року. Такі коливання можна спостерігати в багатьох галузях народного господарства. Найчастіше вони зустрічаються в сільському господарстві, оскільки виробництво продукції значно залежить від природних умов. Використання трудових ресурсів і техніки, виробництво і переробка сільськогосподарської продукції, продуктивність тварин тощо має явно виражений сезонний характер. Також сезонні коливання можна спостерігати при використанні електроенергії в різні пори року, при нерівномірному завантаженні підприємств харчової промисловості, яка зв’язана з переробкою сільськогосподарської сировини, при перевезенні пасажирів і вантажів транспортом. Значного коливання у внутріміській динаміці зазнає грошовий обіг і товарообіг. Максимальний обіг роздрібного товарообігу припадає на кінець року. Попит на різні види послуг, виробництво молока, м’яса, яєць, вовни, вилов риби коливаються за сезонами.

     Сезонні коливання негативно впливають на результати виробничої діяльності тому, що порушують ритмічність виробництва. Тому на практиці використовують різні заходи для згладжування сезонності за рахунок раціонального з’єднання галузей, утворення агропромислових фірм, механізації трудомістких процесів тощо.

    Для комплексного регулювання сезонних змін за окремими галузями економіки і потрібно досліджувати сезонні коливання.

Статистика розглядає ряд методів вивчення та виміру сезонних коливань:

    А) метод абсолютних різниць;

    Б) метод відносних різниць;

    В) побудова індексів сезонності;

    Г) побудова аналітичної моделі.

Характер сезонних коливань описується сезонною хвилею, яка утворюють індекси сезонності. У рядах динаміки, які не виявляють чіткої тенденції розвитку, індекси сезонності визначаються як відношення фактичних місячних (квартальних) рівнів уі до середньомісячного (середньо квартального) за рік 

3. Тренд часового ряду та його виявлення

При аналізі рядів динаміки часто виникає потреба в змиканні рядів динаміки, тобто об’єднанні двох або більше рядів, що характеризують динаміку явища.

Змикання необхідне в тих випадках, коли рівні ряду неспівставні в зв’язку з територіальними чи організаційними змінами та зміною методики обчислення показників, тобто коли потрібно мати єдиний ряд динаміки за весь період дослідження.

Цей метод полягає в наступному. Рівень року, протягом якого відбулися зміни, як до змін, так і після змін, приймають за базу порівняння (за 100 %), інші порівнюють з ним і виражають у відсотках. В результаті таких перетворень дістають один ряд відносних величин, який і характеризує зміну досліджуваного явища за весь період.

Змикання рядів динаміки та зведення їх до порівнянного вигляду можна здійснити двома способами:

1)   Виразити ряди динаміки у відносних показниках, вибравши за базу порівняння один і той же період часу;

2)    Перерахувати абсолютні показники.

Змикання рядів способом вираження їх відносними показниками зробимо так. Рік, в якому відбулися територіальні зміни (2007р) візьмемо за базу порівняння або за 100 %.

 Щоб одержати узагальнюючі характеристики ряду динаміки явища чи процесу обчислюють також середні показники: середні рівні ряду динаміки та середні з аналітичних показників. Методи обчислення середніх рівнів динамічних рядів залежать від статистичної структури показників (інтервальних рядів чи моментних, з рівними проміжками часу між датами чи нерівними).

Середній рівень інтервального ряду динаміки з рівними інтервалами визначають за формулою середньої арифметичної простої

Якщо інтервальний ряд динаміки має нерівні інтервали, то середній рівень ряду обчислюється за формулою середньої арифметичної зваженої

 У моментних динамічних рядах з рівними проміжками середній рівень ряду обчислюється за формулою середньої хронологічної

Середній абсолютний приріст характеризує середню швидкість зростання (або зниження) рівня ряду динаміки. Для інтервальних і моментних рядів динаміки з рівними інтервалами між датами його обчислюють як середню арифметичну просту з суми абсолютних ланцюгових приростів або як частку від ділення останнього базисного ланцюгового приросту на кількість членів ряду без одиниці.

Для узагальнюючої характеристики темпів зростання за ряд років обчислюють середній коефіцієнт (темп) зростання Він показує, у скільки разів кожен поточний рівень ряду більший (або менший) від попереднього рівня. Для рядів динаміки з рівними проміжками між датами середній коефіцієнт зростання обчислюється за формулою середньої геометричної простої.

При аналізі рядів динаміки часто виникає потреба в змиканні рядів динаміки, тобто об’єднанні двох або більше рядів, що характеризують динаміку явища.

Змикання необхідне в тих випадках, коли рівні ряду неспівставні в зв’язку з територіальними чи організаційними змінами та зміною методики обчислення показників, тобто коли потрібно мати єдиний ряд динаміки за весь період дослідження.

Цей метод полягає в наступному. Рівень року, протягом якого відбулися зміни, як до змін, так і після змін, приймають за базу порівняння (за 100 %), інші порівнюють з ним і виражають у відсотках. В результаті таких перетворень дістають один ряд відносних величин, який і характеризує зміну досліджуваного явища за весь період.

Змикання рядів динаміки та зведення їх до порівнянного вигляду можна здійснити двома способами:

1)               Виразити ряди динаміки у відносних показниках, вибравши за базу порівняння один і той же період часу;

2)               Перерахувати абсолютні показники.

Одержані зімкнені ряди динаміки дозволяють мати дані про посівну площу зернових за різні роки порівнянними. Ці дані показують, що посівна площа зернових в районі як в абсолютних, так і в відносних показниках систематично зростала.

При вивченні рядів динаміки важливо вміти зводити їх до однієї основи, тобто до загальної бази порівняння. При цьому можна порівнювати ряди динаміки як однойменних, так і різнойменних показників, що відносяться до різних територій або є складовими частинами цілого. Абсолютні рівні таких рядів можуть бути безпосередньо непорівнянними. Тому має смисл порівнювати відносні показники, виражені у відсотках або коефіцієнтах, коли розглядається одна спільна база порівняння ( одиниця або 100%) із неї порівнювати інші рівні ряду у відносних показниках.

Для повної характеристики зміни соціально - економічних явищ і процесів у часі обчислення тільки одних показників динаміки та їх середніх величин не достатньо. Тому в статистиці розглядається ряд спеціальних методів обробки й аналізу рядів динаміки.

Під дією випадкових факторів (у сільськогосподарському виробництві до них відносять вперш за все кліматичні умови) рівні ряду динаміки сильно змінюються по періодах часу, при цьому основна тенденція затушовується, її важко виявити. В зв’язку з цим одним із головних завдань аналізу рядів динаміки є виявлення основної тенденції розвитку соціально – економічних явищ і процесів. Загальна тенденція ряду динаміки – це тенденція до зростання, зниження або стабільності рівня всякого суспільного явища чи процесу. Зростання чи зниження рівнів ряду динаміки відбувається по-різному: рівномірно, прискорено чи уповільнено. Під характером (типом) динаміки розуміють ту чи іншу тенденцію зміни аналітичних показників динаміки.

Встановлення основної тенденції в рядах динаміки дозволяє оцінити характер розвитку досліджуваного явища, визначити ефективність чинників, які формують основні тенденції, знайти значення рівнів досліджуваного явища на перспективу.

Виявлення основної тенденції зміни рівнів ряду динаміки вперш за все передбачає визначення її кількісної (числового) вираження. Основна тенденція розвитку явища, звільнена від випадкових елементів називається трендом.

У практиці економічного аналізу часто зустрічаються випадки, коли основна тенденція зміни явища проявляється досить чітко. Про те тенденцію в рядах динаміки не досить виявити тільки візуально, особливо коли рівні ряду динаміки через будь – які причини (об’єктивні чи випадкові) істотно варіюють, то зростаючи, то знижуючись. Тоді основна тенденція розвитку явища ніби затушовується. В таких випадках для виявлення основної тенденції потрібно використати спеціальні методи обробки динамічних рядів.

До таких методів відносяться:

1)    метод укрупнених (збільшених) інтервалів (періодів);

2)    метод рухомої (ковзної, плинної) середньої;

3)    аналітичне вирівнювання.

Одним з найпростішим способів виявлення тенденції розвитку явища є метод укрупнених інтервалів. Цей метод доцільно застосовувати для великих за обсягом рядів динаміки. Суть цього методу полягає в тому, що первинний ряд динаміки замінюється іншим, у якому абсолютні або середні рівні ряду динаміки за короткі інтервали (день, місяць, декаду, рік тощо), що зазнають випадкових змін, замінюють узагальнюючим (середнім) значенням за більш тривалий період (триріччя, п’ятиріччя тощо).

По суті, спосіб укрупнених інтервалів являє собою типологічне групування рівнів ряду динаміки. При укрупненні інтервалів важливо науково обґрунтовано і правильно виділити періоди (інтервали) часу для укрупнення. Періоди, що їх виділяють, мають бути якісно однорідними і досить тривалими за часом, щоб погасились випадкові коливання. Інтервали (періоди), як правило, повинні бути рівними за часом.

Перші два розглянуті прийоми дозволяють лише візуально помітити тенденцію зміни рівнів ряду динаміки, але не дають ніяких числових характеристик зміни цього ряду. Вирішення цієї задачі ( визначення тренда ) можна досягти тільки, використавши метод аналітичного вирівнювання.

     В основі методу лежить встановлення функціональної залежності ( вирівнюючої функції ) рівнів ряду від часу =f(t) звикористанням кореляційно – регресійного аналізу. На практиці найбільш часто застосовуються наступні математичні функції:

а) лінійна =a0+a1*t;

б) параболічна Y1=a0+a1*t+a2*t2;

в) гіперболічна Y1=a0+a1/t;

г) показникові Y1=a0*;

д) степенева Y1=a0*1 та інші,

де а1, а2, а3 – невідомі параметри, значення яких знаходиться, виходячи з методу найменших квадратів ( МНК ), t - порядковий номер періоду.

      Поняття про рівняння тенденції було введено в статистику в 1902 році англійським вченим Гумером, який і запропонував називати таке рівняння трендом (the trend).

     Вибір найбільш придатної функції  є дуже важливим і відповідальним завданням, від якого в кінцевому підсумку і залежать результати вирівнювання. В основі вибору повинен бути змістовний теоретичний аналіз суттєвості досліджуваного явища і законів його розвитку. Потрібно підібрати таку лінію, яка б була максимально наближеною до фактичних рівнів. Досягти цього явища, виходячи з суті методу найменших квадратів, тобто сума квадратів відхилень фактичних рівнів від розрахункових повинна бути мінімальною:

                   S=∑ (y1-1)2min, де y1 – фактичний рівень ряду динаміки , а 1 – вирівняний          (розрахунковий) рівень, значення якого одержане за відповідним рівнянням (трендом).

     При проведенні економічного аналізу найчастіше поступають так: відбирають кілька рівнянь, визначають їх параметри, а потім віддають перевагу тому рівнянню, для якого функція S і буде мінімальною.

     Можна також обґрунтувати вибір рівняння, що описує основну тенденцію розвитку явища, за допомогою побудови графіка. При виборі типу рівняння перевага надається функціям, параметри яких мають чіткий економічний зміст і вимірюють абсолютну швидкість розвитку явища. При виборі функцій важливим є аналіз ланцюгових характеристик інтенсивності динаміки. Якщо ланцюгові абсолютні прирости відносно стабільні, не мають чіткої тенденції до зростання чи зменшення, вирівнювання ряду можна виконати на основі лінійної функції: Y1 a0+a1*t. Якщо ж стабільними є ланцюгові темпи приросту, то найбільш адекватною такому характеру динаміки є показникова функція: Y1=a0* . У названих функціях t - порядковий номер періоду (дати), a1 - рівень ряду при t=0. Параметр  a1 характеризує швидкість динаміки: середню абсолютну в лінійній функції і середню відносну в показниковій. Коли характеристики швидкості розвитку зростають (чи спадають), використовують інші функції, які зазначені вище.

       Вирівнювання рядів динаміки методом найменших квадратів має бути здійснено в межах одноякісних періодів. Якщо в ряду динаміки є якісно специфічні періоди, то виявляти тенденцію доцільно в межах кожного з них.

Проводження одержаної тенденції за межі ряду динаміки називають екстраполяцією тренду. Це один із методів статистичного прогнозування, що дозволяє передбачити значення рівня динаміки на перспективу.

      Розрізняють короткострокові прогнози (від кількох днів до одного року), cередньострокові (від одного до п’яти років) і довгострокові (понад п’ять років).

Передумовою використання екстраполяції для прогнозування є незмінність причин, що формують тенденцію. Прогнозний (очікування) рівень Yt+v залежить від бази прогнозування та періоду упередження v (нью). 

Інтерполяція – це знаходження відсутніх проміжних рівнів (всередині ряду динаміки). Знаючи рівняння тренду, для обчислення теоретичних рівнів та підставляючи в нього проміжне значення t між зданими рівнями, можна визначити його відповідний теоретичний рівень розглядуваної ознаки Yt. Інтерполяцію здійснюють, виходячи з припущенням, що зміни в межах періоду, які виражають закономірність розвитку, відносно стійкі, тобто, що ні виявлена тенденція, ні її характер не зміняться у тому проміжку часу, рівні якого потрібно визначити.

     Екстраполяцію  інтерполяцію слід проводити в межах однорідних періодів, які мають однакову закономірність розвитку явища.

4. Базові дії з тимчасовими рядами в R

Accessibility

Шрифти

Розмір шрифта

1

Колір тексту

Колір тла