Фоменков С.А., Давыдов Д.А. (сост.) Построение математических моделей методом идентификации Методические указания к лабораторным работам - файл n1.doc

Фоменков С.А., Давыдов Д.А. (сост.) Построение математических моделей методом идентификации Методические указания к лабораторным работам
скачать (906.5 kb.)
Доступные файлы (1):
n1.doc907kb.21.10.2012 18:03скачать

n1.doc



Министерство образования Российской Федерации
Волгоградский государственный технический университет
Кафедра «Системы автоматизированного проектирования
и поискового конструирования»

ПОСТРОЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ
МЕТОДОМ ИДЕНТИФИКАЦИИ

Методические указания
к лабораторным работам



РПК

«Политехник»
Волгоград 2002
УДК 519.216.001.57:519.246.87
Построение математических моделей методом идентификации. Методические указания к лабораторным работам/Сост. Фоменков С.А., Давыдов Д.А.- Волгоград: ВолгГТУ, 2002, с.
В методических указаниях приводятся основы построения математических моделей многомерных систем с использованием методов корреляционно-регрессионного анализа и поисковой идентификации. Излагаются методики выполнения двух лабораторных работ, приводятся контрольные вопросы.

Методические указания предназначены для студентов, выполняющие лабораторные работы по курсу «Моделирование».
Рис. 3, библиогр. – 3 назв.

Рецензент: кандидат технических наук,

доцент кафедры физики В.А. Герасименко

Печатается по решению редакционно-издательского совета

Волгоградского государственного технического университета.



© С. А. Фоменков, Д.А. Давыдов, 2002

© Волгоградский государственный
технический университет, 2002

ВВЕДЕНИЕ
При построении математических моделей большого числа объектов достаточно эффективным оказывается использование методов идентификации - процедур построения адекватной в регламентированном смысле модели какого-либо объекта по экспериментальным данным (реализациям входных и выходных процессов).

Идентифицированные модели используются в дальнейшем для анализа и оптимизации процессов функционирования, диагностики, управления технических систем, создания математического обеспечения соответствующих САПР, АСНИ. В связи с этим современному инженеру необходимы знания и навыки построения достаточно простых и адекватных математических моделей технических систем, основываясь на экспериментальных данных.

Настоящие лабораторные работы ориентированы на ознакомление студентов с основами теории идентификации систем, привитие навыков построения моделей методами множественного корреляционно-регрессионного анализа и поисковой идентификации.

Перед выполнением лабораторных работ необходимо изучить теоретические основы идентификации, ознакомиться с порядком выполнения работ.

Отчет по лабораторным работам должен содержать письменный протокол, в котором представлены исходные данные, структура модели и рассчитанные значения коэффициентов модели с указанием количественной оценки ее адекватности экспериментальным данным.
ОСНОВНЫЕ ПОНЯТИЯ И СВЕДЕНИЯ В ОБЛАСТИ ИДЕНТИФИКАЦИИ

Под идентификацией объекта понимают построение его математической модели по данным о реакции объекта на известные внешние воздействия. Задача идентификации формулируется следующим образом (рис.1).




Рис. 1. Принципиальная схема задачи идентификации

Пусть в результате каких-либо экспериментов над некоторым объектом замерены его входные переменные и выходные переменные . Требуется определить вид (структуру) и параметры некоторого оператора , ставящего в соответствие переменные и : . Различают задачи идентификации в широком (структурная идентификация) и узком (параметрическая идентификация) смысле. В первом случае считаются неизвестными структура и параметры оператора , во втором - лишь параметры этого оператора.

В качестве «объекта идентификации» в общем случае могут рассматриваться механическая, электрическая или биологическая система, замкнутые или разомкнутые (с обратной связью) системы управления и т. д. Методы идентификации таких разнообразных по назначению, виду и структуре объектов естественно различаются, хотя существует и ряд общих закономерностей. В практике идентификации обычно используют совокупность различных методов, применяя их в порядке возрастания адекватности и точности получаемых моделей.

Будем считать, что в общем случае в результате экспериментов получена информация о состояниях выходных переменных и входных переменных , от которых предположительно зависят . Результатом наблюдений является таблица экспериментальных данных:


где – количество опытов (повторений эксперимента), – число входных переменных, – число выходных переменных, – значение -ой входной переменной для k-го опыта, – значение j-той выходной переменной для k-го опыта.

Требуется для каждой выходной переменной построить аналитическую зависимость , адекватно описывающую имеющиеся экспериментальные данные (в дальнейшем индекс при у будем опускать, предполагая, что выходные переменные друг от друга не зависят, и без ограничения общности достаточно рассмотреть случай одномерного вектора : ).

В рассматриваемых лабораторных работах для построения моделей идентификации используются два метода: множественный корреляционно-регрессионный анализ и поисковая идентификация. Ниже представлена краткая характеристика используемых методов идентификации и дано описание функциональных возможностей автоматизированных систем, реализующих эти методы.

Регрессионный анализ является классическим методом построения моделей идентификации. Минимизируемой функцией ошибки (разностью между моделью и данными эксперимента) при регрессионном анализе является сумма квадратов отклонений расчетных и экспериментальных значений выходной переменной у. Для минимизации функции ошибки вычисляют частные производные по всем параметрам модели и приравнивают полученные выражения к нулю. Вычисление значений параметров (решение системы нормальных уравнений) сводится к использованию методов линейной алгебры. Регрессионный анализ может использоваться в двух режимах: параметрической и структурной идентификации.

В случае параметрической идентификации пользователь определяет заранее структуру (вид) модели, а система рассчитывает параметры (коэффициенты) модели, минимизирующие функцию ошибки. При этом выбор структуры может производиться среди моделей трех классов.

1. Линейная модель.

(1)

В этом случае пользователь задает только таблицу экспериментальных значений входного вектора и выходной переменной y. Система рассчитывает численные значения коэффициентов а0, а1, ... , аn .

2. Псевдолинейная (внутренне линейная) модель.

К этому классу относятся нелинейные по идентифицируемым параметрам модели, которые простыми преобразованиями и подстановками сводятся к линейным. В качестве примера псевдолинейной модели приведем мультипликативную модель:

. (2)

Логарифмируя это выражение

(3)

и производя замены переменных:



получаем линейную форму

. (4)

После нахождения коэффициентов по процедурам линейной модели необходимо сделать обратное преобразование a0=exp(b0). Другими примерами псевдолинейных моделей являются следующие:



, (5)

,  

.  

В случае выбора моделей этого класса пользователь должен ввести таблицу экспериментальных данных, а также указать с помощью каких преобразований и подстановок рассматриваемая псевдолинейная модель сводится к линейной, и какие требуются обратные преобразования рассчитанных коэффициентов. Такой способ организации обработки псевдолинейных моделей позволяет рассчитывать большое количество заранее неизвестных по структуре моделей.

3. Дробно-рациональные модели.

К этому очень широкому классу относятся модели вида

, (6)

где fi(), gj() - известные функции входной переменной , ai, bj - идентифицируемые параметры. С помощью несложных преобразований (которые мы здесь опускаем) расчет коэффициентов ai, bj сводится, как и для линейных и псевдолинейных моделей, к решению системы линейных алгебраических уравнений. В случае выбора моделей этого класса пользователь задает таблицу экспериментальных данных, а также указывает конкретный вид и количество функций fi(), gj(). Система рассчитывает численные значения коэффициентов ai, bj.

В режиме «структурная идентификация» структура модели считается заранее неизвестной. Пользователь задает только таблицу экспериментальных значений, а система производит последовательный расчет моделей из имеющейся библиотеки моделей. При этом может быть выбрана наиболее точная модель (с наименьшей функцией ошибки) или все модели, точность которых выше некоторого установленного пользователем значения.

Помимо расчетов коэффициентов регрессионной модели в системе предусмотрено проведение следующих видов работ.

1. Корреляционный анализ, т.е. вычисление так называемых коэффициентов парной корреляции между входными и выходными переменными (здесь xi - компонент входного вектора ). Коэффициент парной корреляции характеризует меру линейной зависимости между двумя переменными xi и у и меняется от -1 до +1. Чем ближе модуль к 1, тем ближе изучаемая зависимость к линейной. Значение  0 свидетельствует об отсутствии линейной связи между xi и у, т. е. при построении линейной регрессионной модели переменную хi учитывать не следует. Коэффициент парной корреляции вычисляют по формуле [1]:

, где (7)

N - количество опытов (повторений эксперимента),

xik - значение (экспериментальное) i-ой входной переменной для k-го опыта,

уk - значение (экспериментальное) выходной переменной для k - го опыта.

Оценку значимости коэффициента парной корреляции (проверку наличия корреляции) проводят разными способами. В лабораторной работе №1 значение коэффициента корреляции сравнивается с некоторым его критическим значением, если rкрит, то переменную xi необходимо учитывать в зависимости (1) для у.

2. Расчет погрешности моделирования.

Погрешность моделирования вычисляется по формуле:

, где (8)

уkp - расчетное значение у для k-го опыта (значение, которое дает модель при подстановке вместо его значения в k-ом опыте),

n - количество компонент вектора (число независимых входных переменных).

3. Проверка модели на адекватность.

Для проверки модели на адекватность используется F - критерий Фишера [1]. В рамках этого критерия вычисляют дисперсию среднего

, (9)

где и так называемую остаточную дисперсию

. (10)

Затем сравнивают F= с табличным значением. Считают, что модель адекватна, если F достигает или превышает табличное значение при выбранном уровне значимости. Отметим, что проверка на адекватность по критерию Фишера справедлива только для нормального закона распределения отклонений экспериментальных и расчетных значений у. В силу этого в системе предусмотрена проверка на нормальность распределения (yk - ykp).

В лабораторной работе №2 реализован поисковый метод идентификации. В поисковых методах идентификации используются численные методы минимизации функции ошибки (в данной лабораторной работе в качестве функции ошибки снова используется сумма квадратов отклонений расчетных и экспериментальных значений у). Поисковые методы необходимо применять, когда другие методы идентификации оказываются неэффективными. Это наблюдается в объектах, имеющих существенно нелинейную природу, особенно, когда нелинейности не являются непрерывными и аппроксимация полиномами или дробно-рациональными функциями невозможна. Поисковые методы также применяются к объектам, описываемым сложными нелинейными функциями априорно известной формы (например, полученными физиками - теоретиками или инженерами - исследователями из анализа физических представлений и требующими уточнения численных значений коэффициентов).

В лабораторной работе №2 для нахождения минимума функции ошибки используются два численных метода: метод поиска локального экстремума функции многих переменных Нелдера - Мида и метод поиска глобального экстремума функции многих переменных на сетке кода Грея (RRR), встроенные в электронную таблицу «Гипотеза – 2» [2]. Методы могут применяться по отдельности или в комбинации друг с другом.

Метод Нелдера-Мида [3] является развитием симплексного метода Спендли, Хекста и Химсворта. Множество из (n+1)-ой равноудаленных точек в n-мерном пространстве называется регулярным симплексом: в двумерном пространстве симплексом является равносторонний треугольник, а в трехмерном пространстве – правильный тетраэдр. Идея метода состоит в сравнении значений функции в (n+1) вершинах симплекса и перемещении симплекса в направлении оптимальной точки с помощью итерационной процедуры. Перемещение симплекса происходит с помощью трех основных процедур: отражение, растяжение, сжатие относительно специальным образом выбираемых точек симплекса.

Нелдер и Мид предложили несколько модификаций этого метода, допускающих, чтобы симплексы были неправильными. В результате получился очень надежный метод прямого поиска, являющийся одним из самых эффективных, если n<6.

Вводимой информацией для метода Нелдера-Мида является число переменных минимизируемой функции n, значение вектора (состоящего из идентифицируемых параметров модели) в начальной точке , точность нахождения экстремума функции по аргументу.

Программы семейства RRR реализуют ряд модификаций алгоритма нелинейного программирования прямого поиска глобального минимума вещественной функции многих переменных (от 2 до 100 вещественных и/или булевых) в ограниченной области поиска на равномерной сетке, задающей точность решения задачи. Сетка представляет собой множество точек в n-мерном пространстве; k-ая координата каждой точки является границей одного из одинаковых отрезков, на которые разбивается диапазон допустимых значений k-го параметра (Jk называется параметром дискретизации). Результатом работы алгоритма является координата точки сетки (), в которой значение функции является минимальным.

Программы данного семейства успешно применялись при проектировании сложных технических объектов и для научных исследований, но благодаря своей инвариантности могут быть применены во многих других отраслях, например экономике, физике, химии и так далее.

В данной лабораторной работе реализован оригинальный алгоритм нелинейного программирования [2], который позволяет находить глобальный минимум вещественной функции многих вещественных переменных (ими могут быть представлены и булевы переменные):

Fopt (opt) = min [F (var)]

в параметрически ограниченной области поиска при ограничениях-неравенствах, задающих область поиска минимума:

min<var<max,

где  Fopt – значение глобального минимума вещественной функции F из допустимой области поиска;

opt – вектор значений аргументов функции F в точке ее глобального минимума;

var – вектор аргументов (переменных) минимизируемой вещественной функции F;

min – вектор параметрических ограничений, задающий нижнюю границу области изменения var в процессе поиска;

max – вектор параметрических ограничений, задающий верхнюю границу области изменения var в процессе поиска;

opt, var, min, max – вектора с размерностью от 1 до N var;

N var – число аргументов минимизируемой функции F.

Минимизируемая функция F(var) представляет собой реализуемую пользователем подпрограмму, которая является внешней по отношению к программе поиска минимума. Входной информацией подпрограммы являются переменные значения аргументов функции, а выходной – значение функции. Значение функции должно быть определено при любых допустимых значениях аргументов.

Входной информацией программы поиска минимума являются:

1) число аргументов N var (2 N var100) минимизируемой функции;

2) значение вектора start минимизируемой функции (minstartmax), при априорно известном начальном приближении к решению (если оно не известно, то берется любое значение из допустимой области поиска);

3) значение вектора min нижних границ изменения аргументов;

4) значение вектора max верхних границ изменения аргументов;

5) значение вектора (1Jk15) параметров дискретности, определяющее величину равномерного шага по каждому из аргументов var (число 2 в степени Jk равно числу равноотстоящих дискретных значений, на которое разбивается диапазон поиска по k-му аргументу. Например, при параметре дискретности, равном 1, интервал разбивается на 2 дискрета, при параметре, равном 2 – на 4 дискрета, равном 3 – на 8 дискретов и так далее. Обычно в реальных задачах выбираются параметры дискретности, равные 8, что соответствует разбиению на 256 дискретов).

Данный состав входной информации позволяет алгоритму рационально планировать ресурсы на поиск и не расходовать ресурсы как на анализ функции вне допустимой области поиска, так и на анализ деталей функции меньших, чем этого требует точность решения поставленной практической задачи. При этом для работы алгоритма не требуется вычисления значений производных функции, как в алгоритмах градиентного поиска, что значительно снижает время вычислений.

Форма представления вводимой и выводимой информации на экране дисплея или при печати задается пользователем. Минимальный объем выводимой информации – значения Fopt и opt. Дополнительно могут выводиться значения функции и аргументов в начальной точке поиска и в лучших точках шагов поиска, а также некоторые особые переменные, характеризующие процесс поиска.
ЛАБОРАТОРНАЯ РАБОТА № 1

Построение моделей идентификации методом
корреляционно-регрессионного анализа

1. ПОРЯДОК ВЫПОЛНЕНИЯ РАБОТЫ
1.1. Получить у преподавателя задание: протокол наблюдений входных и выходных характеристик определенного объекта, требуемую точность моделирования.

1.2. Запустить автоматизированную систему идентификации многомерного объекта.

1.3. Ввести исходные данные, проверить правильность ввода численных значений входных и выходных переменных (при необходимости откорректировать введенные данные).

1.4. Провести корреляционный анализ, установить от каких входных переменных xi зависит каждая выходная переменная yj, указанная в задании.

1.5. Для каждого yj провести множественный регрессионный анализ для построения математической модели заданной точности. Для этого осуществить последовательный расчет моделей из имеющейся библиотеки моделей и выбрать наиболее точную модель (с наименьшей функцией ошибки) или все модели, точность которых выше заданного значения.

1.6. Получить распечатки результатов корреляционного и регрессионного анализов и оформить отчет по лабораторной работе.


2. ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ

2.1. Что понимают под термином «идентификация объекта», в чем заключается отличие структурной идентификации от параметрической идентификации?

2.2. Какую информацию несет в себе коэффициент парной корреляции, в каких пределах он может изменяться?

2.3. Что понимают под «внутренне линейными» моделями? Приведите примеры таких моделей.

2.4. Каким образом осуществляется проверка модели на адекватность по критерию Фишера? Какие ограничения существуют для этого способа проверки?

2.5. Какие действия можно предпринять, если в результате регрессионного анализа не удалось достичь требуемой точности моделирования?

ЛАБОРАТОРНАЯ РАБОТА № 2

Построение моделей идентификации поисковыми методами

1. ПОРЯДОК ПРОВЕДЕНИЯ РАБОТЫ
1.1. Получить у преподавателя задание и подготовить протокол наблюдений входных и выходной характеристик некоторого объекта с априорно заданной структурой модели.

1.2. Запустить автоматизированную систему моделирования. Система представляет собой специализированную электронную таблицу, снабженную подробной контекстно-зависимой помощью с гипертекстовыми ссылками.

1.3. Ввести таблицу экспериментальных значений входных и выходной переменных. В заголовке таблицы привести структуру модели, начальные приближения идентифицируемых параметров, границы поиска, параметры дискретности. Фрагмент экрана после ввода таблицы для конкретного примера приведен на рис. 2.

1.4. Произвести предварительный расчет данных, а именно: теоретических значений выходной переменной (в тех же точках , где проводились измерения, при начальном приближении идентифицируемых параметров); квадратов отклонений теоретических и экспериментальных значений выходной переменной в каждой точке ; начального значения функции ошибки (критерия качества – в данной работе за него принимается сумма квадратов отклонений выходной переменной). Фрагмент экрана после предварительного расчета данных для того же примера приведен на рис. 3.


Рис. 2. Таблица экспериментальных значений



Рис. 3. Таблица экспериментальных значений

Расчетные формулы по правилам электронных таблиц для получения данных, приведенных на рис. 3, представлены на рис. 4. Отметим, что расчетные формулы в столбцах y(расч.) и Квадрат отклонения набираются только для первых строк, для остальных они формируются самой системой при использовании операции копирования в режиме изменения адресов копируемых ячеек.

1.5. Выбрать соответствующий метод минимизации функции ошибок и запустить систему на его выполнение.

1.6. Оформить отчет по лабораторной работе.


Рис. 4. Расчетные формулы

  1. ВОПРОСЫ ДЛЯ САМОКОНТРОЛЯ


2.1. Какова основная особенность поисковых методов идентификации?

2.2. В каких случаях целесообразно применение поисковых методов идентификации?

2.3. В чем принципиальное отличие методов Нелдера-Мида и RRR?

2.4. Что является входной информацией для метода Нелдера-Мида и для метода RRR?

2.5. Каким образом можно совместно использовать методы Нелдера-Мида и RRR для повышения точности нахождения экстремума функции?

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
1. Львовский Е.Н. Статистические методы построения эмпирических формул. – М.: Высшая школа, 1988. – 239 с.

2. Костерин В.В. Оптимизация технических систем и устройств. Учебное пособие. - Волгоград: ВолгГТУ, 1996. - 160 с.

3. Банди Б.Б. Методы оптимизации. Вводный курс. – Минск: Высшая школа, 1988. – 189 с.


Составители: д.т.н. Сергей Алексеевич Фоменков,

к.т.н. Денис Алексеевич Давыдов


ПОСТРОЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ МЕТОДОМ ИДЕНТИФИКАЦИИ

Методические указания


Редактор Е.И. Кагальницкая

Темплан ____ г. Поз. № __.

Подписано в печать ________. Формат 6084 1/16.

Бумага газетная. Печать офсетная. Усл. печ. л. 1,4.

Уч.-изд. л. 1,45. Тираж 150 экз. Заказ __________.
Волгоградский государственный технический университет.

4000131, Волгоград, пр. Ленина,28.

РПК «Политехник» Волгоградского государственного
технического университета.

400131, Волгоград, ул. Советская, 35.



Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации