пятница, 24 мая 2019 г.

Предиктивная аналитика и риск-мененджмент

Модели предиктивного анализа использующие модели, построенные на математических функциях, в подавляющем большинстве не содержат в записи функции момент инцидентов, или, как будем писать далее, не содержат в своей структуре момента краха.
Что плохо с точки зрения риск-менеджмента.
Хотелось бы явно иметь момент краха, представленного формулой, а также последствия краха.

Такие модели были предствалены в книге Д.Сорнетте "Как предсказывать крахи финансовых рынков". Отметим, что данные модели применимы не только для финансовых рынков, с равным успехом они применяются в физики, в геологии, возможно, в других областях естествознания.

После выхода книги работа продолжалась, модели совершенстовались.
Опираясь на работу Modified Profile Likelihood Inference and Interval Forecast of the Burst of Financial Bubbles. Vladimir Filimonova, Guilherme Demosa, Didier Sornette представим модель

LPPLS - Long-Periodic Power Low Singularity.

Модель описывается уравнением, вытекающим из решения уравнения диффузионного процесса со скачками (jump-diffusion model)/

Уравенением модели имеет следующий вид:


Это уравнение следует из модели диффузионного процесса со скачками:
t - время, в годах, дробная часть есть доля года.
p(t) - цены.
μ(t) - коэффициент дрейфа.
σ(t) - волатильность.
dW - приращение независимого случайного винеровского процесса.
dj - скачок, рассматриваемый как функция Хэвисайда xi(tc-t).
tc - время скачка. Означает "критическое время" или время краха "пузыря".
k - амплитуда скачка.

Математическое ожидание dj определяет функцию степени опасности:

M[dj]=h(t)dt.

Данная функция может быть описана следующим уравнением:


α, β, ω и φ некоторые параметры.
Множитель, обозначенный (а) представляет собой степенной закон роста, множитель (b) - колебательная составляющая.

Предполагая, что M[dp]=0 (например, это справедливо для эффективных рынков), получим что

μ(t)=k*h(t).

В предположении, что крах находится в будущем (за пределами исторических данных, на которых строится модель), получается исходное уравнение:

В этом уравнении 


Заметим, что уравнение описывает средние цены (а не действительные цены) и строго говоря не может применяться после времени краха tc.

Однако, в практических целях удобнее использовать следующие уравнение, снимающее ограничения по времени модели:

Данная модель содержит три линейных параметра, - A, B, C, и четыре нелинейных параметра {m, ω, tc, φ}. Идентификация параметров проводится в два этапа. Один этап предполагает определение параметров A, B, C для фиксированных параметров {m, ω, tc, φ}. После определения A, B, C решается задача нелинейной оптимизации параметров {m, ω, tc, φ}. Это очень сложная задача. Можно конечно использовать метод "грубой силы" - определить сетку значений параметров и затем детерминированным или случайным перебором организовать поиск субоптимального значения. После выбора параметров, кстати, можно опять пересчитать линейные параметры и уточнить значения нелинейных параметров.
Однако не все так плохо и в цитированной выше статье предложен "строгий" метод решения оптимизационной задачи. Также до выхода статьи решение оптимизационной задачи проводилось с использованием метаэвристических методов.

В развитие модели в статье предложено модифицировать базовую функцию, а именно раскрыть косинус:


Тогда формула приобретает вид:


В этой формуле только три нелинейных параметра {m, ω, tc} и четыре нелинейных - A, B, C1, C2. Вроде бы небольшие изменения - но улучшение значительное.

Ограничения на параметры:

Так как интеграл от h(t) должен быть положительным и это есть вероятность, то это накладывает ограничения на m. В частности, 0<m<1. Приблизительно же - 0.1<m<0.9.
B<0 в силу супер-экспоненциального закона.
Кроме того, имеет место демпфирующий параметр, который связывает ряд параметров:


В статьях приводится оценки, полученные по результатам анализа исторических данных:


В статье предлагается для частоты следующий диапазон: [6,13].
Качество модели может оценивается, например, остаточной суммой квадратов:

Доверительный интернал может быть получен по обычным статистическим формалам (например, хи-квадрат).

График распределения, построенный по формуле имеет примерно такой вид:


Примечание. Параметры модели графика: A=327, B=-1.015, C=0.45 (C1=0.243136, C2=0.3786619), {m=0.8 и 0.4, ω=9, tc=87.65, φ=1}.

Для полноты картины приведу формулы из книги Д.Сорнетте "Как предсказывать крахи финансовых рынков".

Простой экспоненциальный закон.

Формула:
Примерный вид закона:
Примечание. Параметры модели графика: A=327, B=-10, {m=0.8 и 0.4, tc=87.65}.


Линейная логопериодическая функция.

Формула:


Примерный вид графика:


Примечание. Параметры модели графика: A=327, B=-10, C=0.45,  {m=0.8 и 0.4, ω=9, tc=87.65, φ=1}.


Нелинейная логопериодическая функция

Формула:


Примерный вид графика:



Примечание. Параметры модели графика: A=327, B=-10, C=0.45,  {m=0.8 и 0.4, ω=9, tc=87.65, φ=1, Δ=20}.

Утверждается, что переменная tc зависит от локальных максимумов функции log(p(t)). Обозначим tn, tn+1, tn+2 три последовательных максимума. Тогда


Кроме того, следующее значение локального максимума предсказывается на основе трех предыдущих локальных максимумов:


Обобщенная нелинейная логопериодическая функция

Формула:



Примерный вид графика:



Примечание. Параметры модели графика: A=327, B=-1., C=0.45 , {m=0.8 и 0.4, ω=9, tc=87.65, φ=1}.


Рекомендации по области действия

Не стоит уповать, что данные модели способны предсказать все или большинство крахов.

Первое.
Предсказание с большой степенью вероятности возможно для тех процессов, характер которых определяется эндогенными (внутренними) факторами. Если воспользоваться физической аналогий, для экстраполяции используется "инерция" прогнозируемого процесса. 
Соответственно, экстраполяция тем точнее, чем больше "инерция" процесса. С другой стороны, это говорит о том, что процесс определяется статистическими характеристиками и нет акторов, обладающих достаточными ресурсами для изменения протекания процессов. Примером такого процесса является фондовый рынок с большим количеством участников.

Второе.
Предсказательные схемы и связанные с ними прогнозы должны определяться в вероятностных терминах. Модель дает одну потенциальную траекторию, которая экстраполирует прошлое с высокой степенью вероятности, но это отнюдь не детерминистическая модель будущего как функция прошлого. Это - среднее.
Это предопределяет необходимость построения интервальных оценок, сценариев, распределений сценариев.

Третье.
Очень трудно судить о ложном прогнозе краха. Крах прогнозируется в вероятностью. Соответствено, с обратной вероятностью можно избежать крах и "пузырь" может "рассосаться". Так как невозможно с достоверностью судить о точности прогноза, стоит проявлять разумную осмотрительность в том случае, когда модель начинает сигнализировать о наличии эндогенных факторов, которые способствуют образованию пузыря и вытекающего из этого возможного краха.

Комментариев нет:

Отправить комментарий