А ваш фильтр Калмана правильно работает?

Фильтр Калмана является одним из самых популярных алгоритмов фильтрации. Он широко распространен в машинном обучении, навигационных системах, автопилотируемых устройствах и пр.

В открытых источниках можно встретить множество работ, статей и книг по тому, как работает этот загадочный фильтр, будь то линейный, расширенный (extended), сигма-точечный (unscented) или любой другой фильтр Калмана. Однако, вопрос корректности работы фильтра освещается намного реже.

А ваш фильтр Калмана правильно работает?

В это же время фильтр Калмана применяется в системах с особыми требованиями к функциональной безопасности, отказ или неисправность которых может привести, в том числе, к летальным исходам, как это имеет место в случае автопилотируемых устройств. Таким образом, валидация результатов работы фильтра Калмана – это один из первостепенных вопросов, который должен стоять перед инженером при разработке ПО для подобных систем.

На поиск необходимой информации по валидации фильтра Калмана у меня ушло больше недели, но результат того стоил. Поэтому в данной статье я хочу поделиться алгоритмом, который позволяет находить неочевидные ошибки в коде фильтра Калмана и определять возможности применения фильтра к конкретной задаче. 

Фильтр Калмана

Я предполагаю, что читатель знаком с базовыми принципами работы фильтра Калмана, поэтому лишь коротко объясню его суть. Для тех, кто не знаком, советую прочитать эту или эту статью.

Вкратце работу фильтра Калмана можно объяснить так:

Рис. 1. Измерения, предсказываемое и оптимальное состояние.
Рис. 1. Измерения, предсказываемое и оптимальное состояние.

Для описания какого-либо процесса мы используем как состояние, полученное посредством измерений (Measurement), так и состояние, полученное по уравнениям, описывающим происходящий процесс (Predicted state estimate). Комбинируя эти два независимых состояния, мы получаем более точное оптимальное состояние (Optimal state estimate). 

В качестве измерений могут служить, например, измерения GPS-датчика в автомобиле, а движение машины может быть описано с помощью кинематических или динамических уравнений, которые по текущей скорости, углу поворота колес, ускорению и прочим характеристикам, могут определить прогнозируемое положение автомобиля в следующий момент времени. 

В зависимости от сложности процесса и измерений можно использовать линейный, расширенный или сигма-точечный фильтр Калмана.

Проблема верификации результатов

Фильтры Калмана используются в том случае, если мы имеем зашумленные измерения, а уравнения, описывающие динамику системы, известны лишь приблизительно. Алгоритмы, использующие фильтры Калмана, относятся к более общему классу оценочных алгоритмов, которые помимо состояния также оценивают возможную ошибку (с помощью ковариационной матрицы ошибок, например).

Есть множество материалов, статей, диссертаций, которые рассматривают существующие или разрабатывают новые разновидности фильтра Калмана, однако, вопрос валидации результатов встречается намного реже. Зачастую авторы ограничиваются сравнением зашумленного/оценочного/реального состояния, как это показано на рис. 2 (источник), аргументируя точность фильтра близким значением оценочного и реального состояний и забывая про ковариационную матрицу ошибок. Проблема такой оценки кроется в том, что без использования ковариационной матрицы ошибок мы не можем оценить, насколько точные данные мы имеем. 

Рис. 2. Пример сравнения зашумленных, оценочных и реальных данных.
Рис. 2. Пример сравнения зашумленных, оценочных и реальных данных.

Проиллюстрируем проблему на простом примере, когда состояние системы описывается одной переменной x. В таком случае, ковариационная матрица ошибок представляет из себя дисперсию σx2 этой величины. Допустим, у нас x = 0 и σx = 1, тогда в соответствии с правилом 3 сигма, мы можем с уверенностью > 99.5 % сказать, что наша величина лежит в интервале [-3, 3]. Если мы увеличим среднеквадратичное отклонение σx до 10, то интервал увеличится до [-30, 30]. Если наш фильтр дает оценку x = 0 и σx = 1, в то время как действительная величина среднеквадратичного отклонения σx = 10, то наш объект может в реальности оказаться в местоположении, которое практически невозможно в соответствии с оценкой нашего фильтра. Чем это может грозить, думаю понятно без комментариев. Таким образом, дисперсия вносит существенный вклад в оценку состояния, и пренебрегать ей ни в коем случае нельзя.

С другой стороны, так как фильтр работает со случайными данными, то вполне возможно, что для какого-то набора данных даже некорректный фильтр выдаст правдоподобные результаты, поэтому делать выводы о том, как работает фильтр, по одному запуску было бы неверно. Кроме того, возникает вопрос: как убедиться, что значения дисперсии, рассчитанные по алгоритму, близки к реальным данным?

Терминология и обозначения

Прежде чем пойти дальше, введем основные обозначения и терминологию. Подстрочный индекс k будет обозначать номер временного слоя, xk – вектор состояния системы, yk – вектор измерений, Pk – ковариационная матрица ошибок, x0, P0 – начальные значения вектора состояния и ковариационной матрицы. Динамика системы описывается дискретными уравнениями:

textbf{x}_k = fleft(textbf{x}_{k-1}, textbf{w}_kright) qquad qquad qquad (1)

где f – функция перехода для рассматриваемого процесса, wk – некоторая матрица шумов, ассоциированная с соответствующей функцией перехода. Функция f может иметь различный вид, например, в простейшем случае быть линейной как относительно xk-1, так и относительно wk.

Связь между измерениями системы и вектором состояния описываются уравнением:

textbf{y}_k = hleft(textbf{x}_k, textbf{v}_kright) qquad qquad qquad (2)

где h – функция, связывающая вектор состояния с вектором измерений, а vk – некоторая матрица ошибок измерений.

Стоит отметить, что в общем случае размерности вектора измерений и вектора состояния различны. Например, состояние может в себя включать вектор положения и вектор скорости – итого 6 компонент, а измерения – только вектор положения, а значит, всего три компоненты.

Реальные значения вектора состояния и ковариационной матрицы мы будем обозначать xk* и Pk*, в то время как значения, полученные с помощью фильтра Калмана, – просто xk и Pk.

Постановка численного эксперимента

Для валидации фильтра Калмана мы будем использовать метод Монте-Карло. Вначале мы вычислим реальные значения состояния xk* на каждом временном слое от 0 до n. Для практических целей это можно сделать с помощью уравнения (1), заменив wk на нулевую матрицу и задав определенные x0*, P0*.

Затем нам нужно смоделировать m независимых численных экспериментов. Всего у нас имеется 3 источника случайности, которые мы будем варьировать за каждый проход итерации Монте-Карло, – это начальное состояние (его мы знаем только с точностью, определяемой ковариационной матрицей P0), и значения шумов, определяемые матрицами wk и vk. Таким образом, на каждом прогоне мы получаем различные значения начального состояния и значений шумов процесса и измерений на каждом временном слое. Номер итерации Монте-Карло мы будем обозначать буквой i. В результате моделирования мы будем иметь m произвольных наборов xki и Pki для 0 ≤ kn и 0 ≤ im.

Стоит заметить, что обычно при постановке задачи значения Pk* не известны, однако их можно заменить на статистические значения, вычисленные по формуле:

textbf{x}_k^{avg}=1/N sumtextbf{x}_k^i qquad qquad qquad qquad qquad quad (3)textbf{x}_k^{i, err}=textbf{x}_k^i - textbf{x}_k^{avg} qquad qquad qquad qquad qquad quad (4)mathbf{P}_k^{est} = 1 / N sum textbf{x}_k^{i, err}left(textbf{x}_k^{i, err}right)^T qquad qquad qquad (5)

где надстрочный индекс T – обозначает транспонирование. В дальнейшем везде под Pk* имеется в виду Pkest.

Верификация результатов

Стороннему наблюдателю может показаться, что мы ничего существенного не сделали, но, на самом деле, самое сложное уже позади. Осталось только понять, насколько близки значения xki и Pki к ожидаемым значениям xk* и Pk*. Для этого мы воспользуемся идеей из статьи [X. R. Li, Z. Zhao Measuring Estimator’s Credibility: Noncredibility Index // In Proceedings of 2006 International Conference on Information Fusion, Florence, 2006.], которая заключается в следующем: для каждого временного слоя k и для каждой итерации Монте-Карло i мы вычисляем noncredibility index по формуле:

gamma_k^i = 10left|logleft( left[textbf{x}_k^{i, err} mathbf{P}_k^i textbf{x}_k^{i, err}right] / left[textbf{x}_k^{i, err}mathbf{P}_k^*textbf{x}_k^{i, err}right] right)right| qquad qquad qquad (6)

Данная формула определяет некоторую ошибку как в случае несоответствия xki, так и в случае несоответствия Pki, и обладает следующими полезными свойствами:

  1. Значение γki близко к нулю, если xki и Pki близки к действительным значениям;

  2. Значение γki безразмерно и, следовательно, не зависит от единиц измерения xki;

  3. Значение γki одинаково серьезно штрафует как за оптимистичные (отношение [xki, err Pki xki, err] / [xki, err Pk* xki, err] > 1) значения, так и за пессимистичные значения Pki (когда это отношение меньше единицы).

Тогда для временного слоя k можно посчитать среднее значение noncredibility index’а:

gamma_k^{avg} = 1 / N sum gamma_k^i qquad qquad qquad (7)

Это и есть основная мера валидности результата, полученного с помощью фильтра Калмана. Таким образом, для каждого временного слоя мы можем посчитать γkavg и по нему понять, насколько хорошо работает наш фильтр. В процитированной работе было показано, что значения γkavg ~ 1 соответствуют достоверным результатам.

Собирая все в одну кучу

Весь процесс валидации фильтра Калмана сводится к следующим шагам: 

  1. Для поставленной задачи задаем функцию перехода f, функцию, связывающую вектор состояния с вектором измерений, h, матрицы шумов wk и vk и начальные значения x0*, P0*;

  2. Проводим симуляцию без шумов для получения действительных значений xk*;

  3. Запускаем m итераций Монте-Карло и получаем xki и Pki для каждого временного слоя k и для каждой итерации i;

  4. Вычисляем Pkest в соответствии с формулой (5). Pkest будет служить в качестве Pk* ;

  5. Для каждого временного слоя вычисляем γkavg, которая и будет показателем достоверности результатов;

  6. (Опционально) Строим график зависимости γkavg от времени и смотрим, как изменялось качество работы фильтра.

Результаты

В качестве примера рассмотрим задачу отслеживания мотоцикла (рис. 3) из статьи.

Рис. 3. Кинематическая модель мотоцикла
Рис. 3. Кинематическая модель мотоцикла

Уравнения, описывающие кинематическую модель движения, запишутся в виде:

dot{x} = vcos{left( psi + beta right)}, qquad qquad qquad qquad qquad qquad (8)dot{y} = v sin{left(psi + betaright)}, qquad qquad qquad qquad qquad qquad (9)dot{psi} = frac{v}{l_r}sin{left(betaright)}, qquad qquad qquad quad qquad qquad qquad (10)dot{v}=a, qquad qquad qquad qquad qquad qquad qquad qquad (11)beta = tan^{-1}{left(frac{l_r}{l_r + l_f}tan{left(delta_fright)}right)}, qquad qquad qquad (12)

где x, y – координаты центра тяжести, v – скорость, ψ – угол между направлением мотоцикла и осью x, β – угол между направлением скорости и направлением мотоцикла, a – ускорение, lr и lf – длина от центра масс до задней и передней части соответственно, δf – угол между направлением переднего колеса и направлением мотоцикла.

Значения lr и lf являются входными параметрами конфигурации мотоцикла, δf и a – значения, которые определяют динамику системы, а x, y – вектор состояния.

Из вида уравнений видно, что они имеют нелинейный вид, а следовательно, нужно применять либо расширенный, либо сигма-точечный фильтр Калмана.

Ради теста фильтров и для усложнения задачи с вычислительной точки зрения, будем считать, что измерения производятся в полярных координатах:

r = sqrt{x^2 + y^2}+v^0, qquad qquad qquad quad (13)phi = tan^{-1}{left( frac{y}{x} right)}+v^1. qquad qquad qquad (14)

Измерения в полярных координатах вносят существенные нелинейности в расчеты и являются неплохой проверкой работы фильтра.

К сожалению, точные результаты работы для разрабатываемой библиотеки, которые можно было бы продемонстрировать, я опубликовать не могу. Однако, приведу здесь основные закономерности, которые были мной замечены при верификации фильтров Калмана. 

Ключевое, что хотелось бы отметить: несмотря на близость реальных и полученных данных состояния, благодаря данной схеме валидации, были выявлены участки кода, в которых происходила потеря значимых разрядов для чисел одинарной точности как для расширенного, так и для сигма-точечного фильтра Калмана. Для чисел с одинарной точностью график зависимости вид, подобный изображенному на рис. 4.

Рис. 4. Зависимость noncredibility index от номера итерации для чисел одинарной точности.
Рис. 4. Зависимость noncredibility index от номера итерации для чисел одинарной точности.

Как видно, значение noncredibility index растет с течением времени, что говорит о накапливаемой ошибке в результатах и, по-видимому, все большему удалению матрицы Pk от действительного значения. 

Для чисел двойной точности значения γkavg от номера итерации колебались в пределах от 0.8 до 1.6, что говорит о правдоподобности результатов (см. рис. 5). Как видно из рисунка, значения noncredibility index не растут с течением времени, а лишь колеблются в окрестности некоторого среднего значения.

Рис. 5. Зависимость noncredibility index от номера итерации для чисел двойной точности.
Рис. 5. Зависимость noncredibility index от номера итерации для чисел двойной точности.

Вывод

В статье была разобрана достаточно простая задача, однако предложенный подход валидации легко обобщить как для более сложных постановок задач, так и для более комплексных подходов проведения численного эксперимента.

При применении рассмотренной выше схемы валидации для ряда более сложных задач мы установили, что расширенный фильтр дает неудовлетворительные результаты, которые было бы невозможно определить «на глаз» простым сравнением графиков векторов состояния. Таким образом, для дальнейшего моделирования мы использовали сигма-точечный фильтр.  

Лично меня подкупила простота подхода – какова бы ни была задача: со сложными дифференциальными уравнениями, описывающими процесс, и большим вектором состояния, или простыми алгебраическими уравнениями и скалярным состоянием, в итоге мы получаем лишь одно число, которое наглядно показывает, насколько хорошо фильтр описывает происходящий процесс. Другой плюс рассмотренного подхода – это возможность валидации не только вектора состояния xki, но и ковариационной матрицы ошибок Pki.

Описанный подход также обладает достаточной общностью и может быть применен на более широкий круг фильтров, нежели фильтры Калмана. 

 

Источник

верификация программ, метод монте-карло, фильтр калмана

Читайте также