Лекции по теории эксперимента - файл n3.doc

Лекции по теории эксперимента
скачать (1193.2 kb.)
Доступные файлы (8):
n1.doc54kb.14.06.1999 18:11скачать
n2.doc167kb.14.06.1999 18:09скачать
n3.doc788kb.14.06.1999 18:21скачать
n4.doc536kb.14.06.1999 18:46скачать
n5.doc155kb.14.06.1999 18:47скачать
n6.doc649kb.14.06.1999 19:06скачать
n7.doc127kb.14.06.1999 19:19скачать
n8.doc1975kb.14.06.1999 19:09скачать

n3.doc

  1   2   3   4   5   6

3. ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА

ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ


Предварительная обработка результатов измерений и наблюдений необходима для того, чтобы в дальнейшем с наибольшей эффективностью, а главное корректно, использовать для построения эмпирических зависимостей статистические методы и корректно проанализировать полученные результаты.

Содержание предварительной обработки состоит в отсеивании грубых погрешностей, оценке достоверности результатов измерений. Другим важным моментом предварительной обработки данных является проверка соответствия распределения результатов измерения закону нормального распределения и определения параметров распределения. Если эта гипотеза неприемлема, то следует определить какому закону распределения подчиняются опытные данные и, если это возможно, преобразовать данное распределение к нормальному.

3.1. Вычисление характеристик эмпирических распределений


При рассмотрении основных положений теории вероятностей и математической статистики, определении параметров распределения мы исходили из предположения, что осуществляется достаточно большое, в пределе бесконечное число испытаний nN (N), что практически осуществить невозможно. Однако имеются методы, которые позволяют оценить эти параметры по выборке (части) случайных событий.

Генеральной называется совокупность всех мыслимых значений наблюдений, которые мы могли бы сделать при данном комплексе условий. Другими словами все возможные реализации случайной величины, теоретически в пределе их может быть бесконечное число (N). Часть этой совокупности nN, т.е. результаты ограниченного ряда наблюдений x1,x2,...,xn случайной величины, можно рассматривать как выборочное значение случайной величины (например, при определении химического состава сплавов, их механической прочности и т.п.). Если все слитки данной марки стали, чугуна, сплава разделать на образцы и исследовать их химический состав, механическую прочность и другие физические характеристики, то имели бы генеральную совокупность наблюдений. Фактически доступно, возможно (целесообразно), исследовать свойства весьма ограниченного числа образцов – это и есть выборка их генеральной совокупности.

По результатам такого ограниченного числа наблюдений можно определить точечные оценки законов распределения и их параметров. Оценкой (или выборочной статистикой) * какого-либо параметра  называется произвольная функция *=*(x1, x2,..., xn) наблюдаемых значений x1, x2,..., xn, в той или иной степени отражающая действительное значение параметра .

Если говорить о характеристиках распределений вероятностей, то характеристики теоретических распределений (Mx, x2, Mo, Me) можно рассматривать как характеристики, существующие в генеральной совокупности, а характеризующие эмпирическое распределение – как выборочные их характеристики (оценки). Числовые параметры для оценки Mx, x2 и др. – называются иногда статистиками.

Для оценки математического ожидания используется среднеарифметическое (среднее значение) ряда измерений по выборке:

(3.1)

где хi– реализация либо дискретной, либо отдельная точка для непрерывной случайной величины; n – объем выборки.

Для характеристики разброса случайной величины используется оценка теоретической дисперсии – выборочные дисперсии (см.рис.2.4):

(3.2а)

(3.2б)

Неотрицательное значение квадратного корня из выборочной дисперсии – это выборочное стандартное отклонение (выборочное среднеквадратичное) отклонение

(3.3а)

(3.3б)

Следует отметить, что в любой задаче, связанной с выполнением измерений, возможны два способа получения оценки значения x2.

При использовании первого способа снимается последовательность показаний прибора и путем сравнения полученных результатов с известным или калиброванным значением измеряемой величины находится последовательность отклонений. Затем полученная последовательность отклонений используется для вычисления среднего квадратичного отклонения по формуле (3.3а).

Второй способ получения оценки значения x2 состоит в определении среднего арифметического , т.к. в этом случае действительное (точное) значение измеряемой величины неизвестно. В этом случае целесообразно использовать другую, формулу для нахождения среднеквадратичного отклонения (3.2б, 3.3б). Деление на (n-1) производится по той причине, что наилучшая оценка, получаемая путем усреднения массива Х, будет отличаться от точного значения на некоторую величину, если рассматривается выборка, а не вся генеральная совокупность. В этом случае сумма квадратов отклонений будет несколько меньше, чем при использовании истинного среднего . При делении на (n-1) вместо n эта погрешность будет частично скорректирована. В некоторых руководствах по математической статистике рекомендуется при вычислении выборочного среднеквадратичного отклонения всегда делить на , хотя иногда этого делать не следует. Нужно делить на лишь в тех случаях, когда истинное значение не было получено независимым способом.

Выборочное значение коэффициента вариации , являющееся мерой относительной изменчивости случайной величины, вычисляют по формуле

(3.4а)

или в процентах

(3.4б)

Та из выборок имеет большее рассеяние, у которой вариация больше.

К оценкам , Sx2 предъявляются требования состоятельности, несмещенности и эффективности.

Оценка параметра * называется состоятельной, если по мере роста числа наблюдений n (т.е. nN в случае конечной генеральной совокупности объема N и при n в случае бесконечной генеральной совокупности) она стремится к оцениваемому теоретическому значению параметра

Например, для дисперсии

(3.5)

Оценка параметра * называется несмещенной, если ее математическое ожидание M(*) при любом n асимптотически стремится к истинному значению M(*)=. Удовлетворение требованию несмещенности устраняет систематическую погрешность оценки параметра, которая зависит от объема выборки n и в случае состоятельности стремится к нулю при n. Выше было определены две оценки для дисперсии и . В случае неизвестного значения математического ожидания (истинного значения измеряемой величины) обе оценки состоятельны, но только вторая (3.2б), (3.3б), как было показано ранее, является несмещенной. Требование несмещенности особенно важно при малом числе наблюдений, так как при n .

Оценка параметра 1* называется эффективной, если среди прочих оценок того же параметра 2*, 3* она обладает наименьшей дисперсией.

(3.6)

или

(3.6a)

где i* – любая другая оценка.

Так, если имеется выборка х1, х2,..., хn из генеральной совокупности, то среднее математическое ожидание можно оценить двумя способами:

(3.7)

где xmax(n), xmin(n) – соответственно максимальное и минимальное значения случайной величины из выборки n.

Обе оценки обладают свойствами состоятельности и несмещенности, однако можно показать, что дисперсия при первом способе оценки равна Sx2/n, а во втором 2Sx2/[24ln(n)], т.е. существенно больше. Таким образом, первый способ оценки математического ожидания является состоятельным, несмещенным и эффективным, а второй – только состоятельным и несмещенным. Заметим, что из всех несмещенных и состоятельных оценок следует предпочесть такую, которая оказывается наиболее близкой к оцениваемому параметру.

Заметим, что все сказанное относится к равноточным измерениям, т.е. к измерениям, которые содержат только случайную погрешность, подчиняющуюся нормальному закону распределения.
  1   2   3   4   5   6


Учебный материал
© bib.convdocs.org
При копировании укажите ссылку.
обратиться к администрации