Decision-making: Предиктивная аналитика и риск-мененджмент

пятница, 24 мая 2019 г.

Предиктивная аналитика и риск-мененджмент

Модели предиктивного анализа использующие модели, построенные на математических функциях, в подавляющем большинстве не содержат в записи функции момент инцидентов, или, как будем писать далее, не содержат в своей структуре момента краха.
Что плохо с точки зрения риск-менеджмента.
Хотелось бы явно иметь момент краха, представленного формулой, а также последствия краха.

Такие модели были предствалены в книге Д.Сорнетте "Как предсказывать крахи финансовых рынков". Отметим, что данные модели применимы не только для финансовых рынков, с равным успехом они применяются в физики, в геологии, возможно, в других областях естествознания.

После выхода книги работа продолжалась, модели совершенстовались.
Опираясь на работу Modified Profile Likelihood Inference and Interval Forecast of the Burst of Financial Bubbles. Vladimir Filimonova, Guilherme Demosa, Didier Sornette представим модель

LPPLS - Long-Periodic Power Low Singularity.

Модель описывается уравнением, вытекающим из решения уравнения диффузионного процесса со скачками (jump-diffusion model)/

Уравенением модели имеет следующий вид:

Это уравнение следует из модели диффузионного процесса со скачками:

t - время, в годах, дробная часть есть доля года.
p(t) - цены.
μ(t) - коэффициент дрейфа.
σ(t) - волатильность.
dW - приращение независимого случайного винеровского процесса.
dj - скачок, рассматриваемый как функция Хэвисайда xi(t_c-t).
t_c - время скачка. Означает "критическое время" или время краха "пузыря".
k - амплитуда скачка.

Математическое ожидание dj определяет функцию степени опасности:

M[dj]=h(t)dt.

Данная функция может быть описана следующим уравнением:

α, β, ω и φ некоторые параметры.
Множитель, обозначенный (а) представляет собой степенной закон роста, множитель (b) - колебательная составляющая.

Предполагая, что M[dp]=0 (например, это справедливо для эффективных рынков), получим что

μ(t)=k*h(t).

В предположении, что крах находится в будущем (за пределами исторических данных, на которых строится модель), получается исходное уравнение:

В этом уравнении

Заметим, что уравнение описывает средние цены (а не действительные цены) и строго говоря не может применяться после времени краха t_c.

Однако, в практических целях удобнее использовать следующие уравнение, снимающее ограничения по времени модели:

Данная модель содержит три линейных параметра, - A, B, C, и четыре нелинейных параметра {m, ω, t_c, φ}. Идентификация параметров проводится в два этапа. Один этап предполагает определение параметров A, B, C для фиксированных параметров {m, ω, t_c, φ}. После определения A, B, C решается задача нелинейной оптимизации параметров {m, ω, t_c, φ}. Это очень сложная задача. Можно конечно использовать метод "грубой силы" - определить сетку значений параметров и затем детерминированным или случайным перебором организовать поиск субоптимального значения. После выбора параметров, кстати, можно опять пересчитать линейные параметры и уточнить значения нелинейных параметров.
Однако не все так плохо и в цитированной выше статье предложен "строгий" метод решения оптимизационной задачи. Также до выхода статьи решение оптимизационной задачи проводилось с использованием метаэвристических методов.

В развитие модели в статье предложено модифицировать базовую функцию, а именно раскрыть косинус:

Тогда формула приобретает вид:

В этой формуле только три нелинейных параметра {m, ω, t_c} и четыре нелинейных - A, B, C₁, C₂. Вроде бы небольшие изменения - но улучшение значительное.

Ограничения на параметры:

Так как интеграл от h(t) должен быть положительным и это есть вероятность, то это накладывает ограничения на m. В частности, 0<m<1. Приблизительно же - 0.1<m<0.9.
B<0 в силу супер-экспоненциального закона.
Кроме того, имеет место демпфирующий параметр, который связывает ряд параметров:

В статьях приводится оценки, полученные по результатам анализа исторических данных:

В статье предлагается для частоты следующий диапазон: [6,13].
Качество модели может оценивается, например, остаточной суммой квадратов:

Доверительный интернал может быть получен по обычным статистическим формалам (например, хи-квадрат).

График распределения, построенный по формуле имеет примерно такой вид:

Примечание. Параметры модели графика: A=327, B=-1.015, C=0.45 (C₁=0.243136, C₂=0.3786619), {m=0.8 и 0.4, ω=9, t_c=87.65, φ=1}.

Для полноты картины приведу формулы из книги Д.Сорнетте "Как предсказывать крахи финансовых рынков".

Простой экспоненциальный закон.

Формула:

Примерный вид закона:

Примечание. Параметры модели графика: A=327, B=-10, {m=0.8 и 0.4, t_c=87.65}.

Линейная логопериодическая функция.

Формула:

Примерный вид графика:

Примечание. Параметры модели графика: A=327, B=-10, C=0.45, {m=0.8 и 0.4, ω=9, t_c=87.65, φ=1}.

Нелинейная логопериодическая функция

Формула:

Примерный вид графика:

Примечание. Параметры модели графика: A=327, B=-10, C=0.45, {m=0.8 и 0.4, ω=9, t_c=87.65, φ=1, Δ=20}.

Утверждается, что переменная t_c зависит от локальных максимумов функции log(p(t)). Обозначим t_n, t_n+1, t_n+2 три последовательных максимума. Тогда