Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

I. Статистическое оценивание



Учебный модуль

СТАТИСТИЧЕСКИЕ ОЦЕНКИ ПАРАМЕТРОВ

ПОСТРОЕНИЕ ДОВЕРИТЕЛЬНЫХ ИНТЕРВАЛОВ

 

 

 


 

Учебный модуль «Статистические оценки параметров. Построение доверительных интервалов» предназначен для студентов специальности «Управление качеством». Основная направленность модуля углубленное и самостоятельное изучение студентами дисциплины «Статистические методы в управлении качеством».

Модуль может быть использован также при подготовке студентов к государственному экзамену и в процессе дипломного проектирования, а также в процессе подготовки аспирантов по специальности 05.02.23 «Стандартизация и управление качеством продукции».

Модуль рассчитан также на широкий круг лиц, занимающихся разработкой систем качества, практическим управлением качеством и анализом результатов самооценки эффективности функционирования систем менеджмента качества.

Требования к уровню подготовки студентов:

Студенты должны предварительно освоить курс «Математическая статистика», знать основные статистические законы и формулы вычисления их параметров: математического ожидания и дисперсии.

 

 


 

Содержание учебного модуля
Введение
I. Статистическое оценивание
II. Построение доверительного интервала для математического ожидания генеральной совокупности при известном стандартном отклонении
III. Построение доверительного интервала для математического ожидания генеральной совокупности при неизвестной дисперсии
IV. Построение доверительного интервала для доли признака в генеральной совокупности
V. Определение объема выборки
5.1. Определение объема выборки для оценки математического ожидания
5.2. Определение объема выборки для оценки доли признака в генеральной совокупности
VI. Применение доверительных интервалов при проведении самооценки СМК
6.1. Оценка суммы элементов генеральной совокупности
6.2. Оценка разности
6.3. Односторонняя оценка доли нарушений установленных правил
VII. Вычисление оценок и объема выборок, извлеченных из конечной генеральной совокупности
7.1. Оценка математического ожидания
7.2. Оценка доли признака
7.3. Определение объема выборки
Таблица 1. Значения функции Ф(-x £ z£ x)
Таблица 2. Критические значения распределения Стьюдента

В результате изучения данного модуля и выполнения самостоятельной работы студент должен овладеть следующими компетенциями:

 

• Уметь применять методологию построения доверительных интерваловв различных областях производственной и управленческой деятельности

• Выполнять построение доверительного интервала для математического ожидания генеральной совокупности при известной и неизвестной дисперсии

• Уметь выполнять построение доверительного интервала для доли признака в генеральной совокупности

• Определять объем выборки для оценки математического ожидания и доли признака в генеральной совокупности

• Уметь использовать методологию построения доверительных интерваловпри проведении внутреннего аудита и анализа результатов, характеризующих эффективность функционирования систем менеджмента качества

• Проводить вычисления оценок и объема выборок, извлеченных из конечной генеральной совокупности

•Уметь разрабатывать вербальные модели бизнес-процессов, качество функционирования которых может быть описано с использованием формул доверительных интервалов

Уметьиспользоватьпроцедуры Ехсеl при построении доверительных интервалов.

Качество усвоения студентами данного модуля оценивается по результатам защиты индивидуальной контрольной работы, оформляемой каждым студентом в письменном виде.


Введение

Понятие качества, определенное стандартом ИСО 9000, как «степень, с которой совокупность собственных характеристик выполняет требования»,по своей сути является фундаментальной всеобъемлющей характеристикой любой продукции и каждого вида целенаправленной деятельности человека. Из данного определения следует, что в понятие качества входят одновременно как объективные характеристики, так и субъективные требования, предъявляемые к объекту.[1] Поэтому один и тот же объект может быть охарактеризован, с точки зрения качества, различными людьми по-разному, и, кроме того, один и тот же человек в различных ситуациях неоднозначно реагирует на одни и те же свойства объекта.

При таком подходе к введенному определению, вроде бы, невозможно найти количественную оценку для качества – степени, «с которой совокупность собственных характеристик выполняет требования». Однако если с этим согласиться, то становится бессмысленным сам термин качества, который и был введен для количественной оценки степени совершенства объекта.

В повседневной жизни, когда интересуются качеством, то высказывания и заключения потребителей, как правило, относятся к уже существующему классу объектов, идентифицированных по определенному составу показателей, и поэтому, выделение лучшего, в том или ином смысле, представителя из рассматриваемого класса образцов производится зачастую по одному или небольшому числу определяющих характеристик. С точки зрения производителя, если он стремится придерживаться требований потребителя, следует обратить внимание на поддержание и обеспечение этих важнейших характеристик вновь создаваемых или модернизируемых образцов, превосходящих по качеству своих предшественников. При этом для потребителя важно иметь конкретный образец, удовлетворяющий всем характеристикам (показателями качества), заявленным производителем, а для производителя необходимо, чтобы все образцы обладали бы декларированными характеристиками. Однако производитель, наметивший практически реализовать определенный уровень качества, понимает, что значения каждого и любого из множества параметров конкретного вида объектов, даже весьма высокого качества, распределены в некотором диапазоне. Обычно делается предположение о том, что значения любого параметра или показателя качества для массовой продукции случайны и распределены по нормальному закону, а его параметрами являются величины μиσ,где μматематическое ожидание, номинальное или целевое значение определяющего[2] параметра качества данного класса образцов; σ –среднее квадратическое отклонение (в англоязычной литературе – стандартное отклонение).

Величинаσхарактеризует меру разброса определяющего параметра качества для данного класса образцов относительно целевого значения μ.

Итак, если мы оцениваем качество продукции по одному из определяющих параметров, то должны указать пару значений μиσ.Обычно заявление производителя о качестве выпускаемой им продукции декларируется в виде номинального значения μопределяющего параметра и его допустимых значений в пределах диапазона от (μkσ)до(μ + kσ). Здесь k – числовой показатель, определяющий с какой вероятностью значения xi какого-либо одного их определяющих параметров x для всей генеральной совокупности объектов, будут находиться в нормированном диапазоне.

По сути, значения k, выраженные в долях σ,определяют доверительный интервал, т.е. интервал (относительно μ), в который с заданной вероятностью попадут возможные значения параметра x.

В случае нормального распределения при k = 1 эта вероятность (Р) равна 0,67, при k = 2 ее значение Р = 0,96, а при k = 3 – Р = 0,997.

Таким образом, со статистической точки зрения, процесс создания продукции, даже наивысшего качества, есть процесс получения двух фундаментальных показателей качества, присущих любому классу и виду объектов. Такими показателями являются: μ – математическое ожидание, в роли которого выступает номинальное или целевое значение определяющего параметра качества, и σ– среднее квадратическое отклонение, характеризующее меру допустимого разброса значений этого параметра для всей совокупности выпускаемой в обращение продукции относительно μ. Создавать массовуюпродукцию, для которой параметр качества σ= 0, невозможно. Каждый образец продукции имеет свое индивидуальное значение определяющего параметра, но при этом разброс возможных отклонений не должен превышать допустимых границ, заявленных производителем или поставщиком продукции. Однако различные вешние и внутренние факторы могут вызвать нарушение статистической устойчивости процесса производства продукции, что приведет к изменению целевого значения μ. Чтобы этого не произошло производителем (в некоторых случаях и потребителем) проводятся испытания выпускаемой продукции, ее сертификация, проверки, контроль, диагностика и т.п. Существует большое множество различных видов испытаний в зависимости от вида самой продукции, этапа ее создания, а также технологии и вида производства. Все эти испытания и проверки организуются, планируются и проводятся разработчиками, технологами, инженерами и техниками - всем персоналом, занятым разработкой и созданием продукции требуемого (декларируемого) качества.

А какова же роль представителя по качеству? В организации поставщика он обязан организовать и обеспечить работы по гарантированию потребителю, что заявленные характеристики выполняются для всей поставляемой продукции (генеральной совокупности). С этой целью разрабатывается система менеджмента качества в организации разработчика, одним из элементов которой является выходной контроль продукции перед ее отправкой потребителю.

В организации потребителя менеджер по качеству организует входной контроль получаемой продукции. Для массовой продукции выходной и входной контроль, как правило, организуются и проводятся выборочно – либо по характеристикам, либо по образцам. А иного варианта быть не может, т. к. только этот вариант доступен по стоимости и по времени и не приводит к разрушению продукции.

В данном учебном модуле изложены подходы, каким образом можно, изучив только часть совокупности продукции (выборку), распространить полученные данные на всю совокупность (генеральную совокупность). Для решения этой задачи используется аппарат математической статистики. При этом во всех случаях полагается, что для определенного вида продукции разброс ее параметров качества относительно установленного значения μ носит нормальный закон распределения, а значение σ либо известно заранее, либо определяется по результатам выборочной оценки.

Фундаментальной основой для подобного утверждения является результат известный в математической статистике как «центральная предельная теорема». Заключается он в том, что для широкого класса независимых случайных величин предель­ный (по ) закон распределения их нормированной суммы вне за­висимости от типа распределенияслагаемых стремится к нормальному закону распределения.

 

I. Статистическое оценивание

Статистическое оценивание – это анализ выборочных характеристик. Его преимуществами являются:

• результаты выборочного исследования объективны и обоснованны, поскольку определение объема выборки основано на точно сформулированных статистических принципах;

• метод позволяет оценить ошибку выборочного исследования;

• этот подход целесообразен, т.к. исследование большой генеральной совокупности может занять много времени и сопровождаться значительными ошибками нестатистического характера.

Случайная выборка из n элементов — это такой отбор, при котором элементы извлекаются по одно­му из всей генеральной совокупности и каждый из них имеет равный шанс быть отобранным. Требо­вание случайности обеспечивается отбором по таб­лицам случайных чисел или по жребию. Такая выборка называется собственно-случайной. Одним из примеров использования собственно-случайной выборки является проведение тиражей выигрышей денежно-вещевых лотерей, при которых обеспечи­вается равная возможность попадания в тираж лю­бого номера лотерейного билета.

По способу отбора элементов различают два типа случайных выборок: собственно-случайная повтор­ная (схема возвращенного шара); собственно-случай­ная бесповторная (схема невозвращенного шара).

Выбор схемы отбора зависит от характера изучае­мого объекта. При повторном отборе единица наблюдения после извлечения из генераль­ной совокупности регистрируется и вновь возвраща­ется в генеральную совокупность, откуда опять мо­жет быть извлечена случайным образом. При бес­повторном отборе элемент в выборку не возвращает­ся. Следует отметить, что независимо от способа орга­низации выборки она должна представлять собой уменьшенную копию генеральной совокупности, т.е. быть представительной (репрезентативной).

Числовые характеристики генеральной совокуп­ности, как правило, неизвестны (математическое ожидание, диспер­сия и др.), называются параметрами генеральной совокупности. Их обозначают:μ, . Доля единиц, обладающих тем или иным при­знаком в генеральной совокупности, называется ге­неральной долейи обозначается буквой р.

По данным выборки рассчитывают числовые характеристики, которые называют статистиками. Обозначим выборочные статистики для среднего арифметического, дисперсии и доли соответственно через , и рn.Одноименные статистики, получаемые по раз­личным выборкам, как правило, отличаются друг от друга. Поэтому статистика, полученная из вы­борки, является только оценкойнеизвестного пара­метра генеральной совокупности. Оценка парамет­ра — это определенная числовая характеристика, по­лученная из выборки.Желательно, чтобы оценки параметров генеральной совокупности обладали свойствами несмещенности, состоятельности и эффективности.

Несмещенная оценка означает свойство, состоящее в том, что математическое ожидание оценки (например, средняя выборочного распределения) равно параметру генеральной совокупности (М( )=μ). При соблюдении этого свойства в результате осуществления множества выборок для определения оценки одни выборочные показатели будут больше параметра генеральной совокупности, другие меньше, но среднее значение будет равно параметру генеральной совокупности. Напротив, при смещенной оценке среднее значение будет больше или меньше параметра генеральной совокупности.

Состоятельность – это свойство оценки, согласно которому дисперсия оценки уменьшается до нуля с увеличением объема выборки до бесконечности.

Оценки, которые одновременно и несмещенные, и имеют наименьшую дисперсию, называются эффективными оценками.

Когда оценка определяется одним числом, ее называют точечной оценкой.

В качестве точечных оценок параметров генераль­ной совокупности используются соответствующие выборочные характеристики. Теоретическое обосно­вание возможности использования этих выборочных оценок для суждений о характеристиках и свойствах генеральной совокупности дают закон больших чи­сел. Смысл его результатов заключается в том, что при осреднении большого числа (n) случайных слагаемых все менее ощуща­ется характерный для случайных величин неконтролируемый разброс в их значениях, так что в пределепри этот разброс исчезает вовсе или, как принято говорить, случайная величина вырождается в неслучай­ную. Однако при любом конечном числе слагаемых пслучайный разброс у среднего арифметического этих слагаемых остается. Поэтому возникает вопрос исследования характера этого разброса.

Выборочная средняя является точечной оценкой генеральной средней, т.е.

Генеральная дисперсия имеет 2 точечные оцен­ки[3]: σ2выб.выборочная дисперсия; S2— исправлен­ная выборочная дисперсия. σ2выб вычисляется по выборке при п > 30, a S2при п < 30:

(1)

При больших объемах выборки σ2выб и S2 практи­чески совпадают.

Поскольку выборочная совокупность представля­ет собой лишь часть генеральной совокупности, то вполне естественно, что выборочные характеристи­ки не будут точно совпадать с соответствующими генеральными. Ошибка репрезентативности может быть представлена как разность между генераль­ными и выборочными характеристиками изучаемой совокупности:

 

Согласно центральной предельной теореме, выборочные распределения статистик (при п > 30) будут иметь нормальное распределение независимо от того, какое распределение имеет генеральная со­вокупность, а применительно к выборочному методу из теоремы Чебышева следует, что с вероятностью, сколь угодно близкой к единице, можно утверждать, что при достаточно большом объеме выборки и ограниченной дисперсии генеральной совокупности разность между выборочной средней и генеральной средней будет сколь угодно мала и ее можно оценить по формуле:

(2)

 

где среднее арифметическое по выборке;

μсреднее арифметическое по генеральной совокупности;

σсреднее квадратическое отклонение в гене­ральной совокупности;

t – коэффициент доверия;

Ф0(t) — функция Лапласа.

Функция Лапласа табулирована и часто используемся для вычисления вероятности попадания случайной величины Х, распределеннойпо нормальному закону в интервал от значения α до значения β:

Выражение (2) показывает, что о величине расхождения между и μ можно судить лишь с определенной вероятностью, значение которой зависит от стандартной ошибки (standard error) выборочных средних и показателя t. Поэтому в теории статистического анализа для оценки характеристик генеральной совокупности помимо точечных оценок используются и интервальные оценки.

При выборочном исследовании генеральной совокупности необходимо понимать, что результаты статистических выводов должны быть основаны не точечных, а интервальных оценках. При этом особое внимание следует уделять корректному назначению объемов выборки. Чтобы доказать обоснованность полученных точечных оценок, необходимо указывать объем выборки, на основе которой они получены, границы доверительного интервала и его уровень значимости.

Интервальной оценкой называют оценку, кото­рая определяется 2 числами — концами интерва­ла, который с определенной вероятностью накры­вает неизвестный параметр генеральной совокуп­ности. Интервал, содержащий оцениваемый пара­метр генеральной совокупности, называют дове­рительным интервалом.

Для его определения вы­числяется предельная ошибка выборки, позволя­ющая установить предельные границы, в которых с заданной вероятностью (надежностью) должен на­ходиться параметр генеральной совокупности.

Предельная ошибка выборки равна t - кратному числу средних ошибок выборки. Коэффициент tпозволяет установить, насколько надежно выска­зывание о том, что заданный интервал содержит параметр генеральной совокупности. Если мы вы­берем коэффициент таким, что высказывание в 95% случаев окажется правильным и только в 5% — неправильным, то мы говорим: со статистичес­кой надежностью в 95% доверительный интервал выборочной статистики содержит параметр гене­ральной совокупности.Статистической надежности в 95% соответствует доверительная вероятность — 0,95. В 5% случаев утверждение «параметр принадлежит доверительному интервалу» будет неверным, т. е. 5% задает уровень значимости(α),или вероятность ошибки равна 0,05. Обычно в статистике уровень значимости выбирают таким, чтобы он не превы­сил 5% (α < 0,05). Доверительная вероятность и уровень значимости дополняют друг друга до 1 (или 100%) и определяют надежность статистического высказывания (см. рис.1).

Доверительный уровень равный 95%, интерпретируется следующим образом:

если из генеральной совокупности извлечь все выборки, имеющие объем п, и вычислить их выборочные средние, то 95% доверительных интервалов, построенных на их основе, будут содержать математическое ожидание генеральной совокупности, а 5% — нет.

 

 

Рис. 1. Доверительный интервал и предельная ошибка выборки


 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.