Лекция 11 icon

Лекция 11




НазваЛекция 11
Сторінка1/5
Дата20.09.2012
Розмір0.99 Mb.
ТипЛекция
  1   2   3   4   5

Статистичекие методы. СИ ч. 6.

Лекция 11.


2.5 Диаграммы разброса.

Часто две переменные случайные величины бывают статистически связаны между собой. Статистическая связь означает не жесткую детерминированную взаимосвязь, как например, для тока и напряжения в законе Ома, а связь в смысле взаимозависимости "в среднем".

2.5.1 Корреляция.

Рассмотрим, например, поведение двух диаметров х и у для деталей, вытачиваемых на токарном станке-автомате. Каждый из двух диаметров имеет свой разброс на множестве деталей, но иногда оказывается, что пары значений Хi и Yi для i-детали ведут себя не абсолютно независимо, а имеют статистическую связь, например, меньшим значениям Хi соответствуют "в среднем" меньшие значения Yi и наоборот. Такую статистическую связь называют корреляцией. Наличие корреляции не обязательно означает причинно-следственную зависимость у от x или наоборот. Возможно, на колебания обеих этих величин влияет какая-то общая причина. При изучении корреляции обе переменные x и у равнозначны, хотя они могут быть совершенно разными физическими величинами и иметь разную размерность.

Величина или "степень" взаимозависимости случайных величин х и у определяется коэффициентом корреляции К который можно оценить из экспериментальных данных по формуле:




(5.1)


где Хср и Ycp- выборочные средние для множества значений Хi, и Yi, (i=1,n). Коэффициент корреляции (5.1) может иметь значения от -1 до +1, причем положительное значение коэффициента корреляции означает положительную взаимозависимость х и у, т.е. чем больше X, тем в среднем больше и Y, а отрицательные значения коэффициента корреляции означают отрицательную взаимозависимость х и у т.е. меньшим значением Х в среднем соответствуют большие значения Y и наоборот.

Абсолютная величина коэффициента корреляции указывает на "степень связи" переменных х и у, на степень близости этой связи к детерминированной, т.е. к линейной связи без разброса. Случаю полной детерминированной взаимозависимости соответствуют значения К =1 и К=-1. При этом если построить точки (Xi Уi) на плоскости X, Y то они лягут точно на одну наклонную прямую, причем при К=1 прямая будет иметь положительный, а при К=-1 - отрицательный наклон. Величина наклона прямой при этом не имеет значения и зависит от масштаба переменных х и у.

Если взаимосвязь переменных x и у не абсолютно детерминирована, то точки будут отклоняться от этой средней линейной зависимости. При этом абсолютная величина К может отличаться от 1. При К = 0 статистическая взаимозависимость х и у отсутствует, т.е. значения х ведут себя в среднем совершенно независимо от значений у и наоборот (см. примеры на рис.7).

Заметим, что само понятие корреляции означает линейную связь. Если мы, например, возьмем даже абсолютно детерминированную связь, но квадратичную и рассмотрим квадратичную параболу:



То реальная связь между х и у, конечно, будет и даже абсолютно жесткая в соответствии с формулой. Однако, если мы возьмем ряд "выборочных" значений Х в области положительных значений и такой же ряд в области отрицательных значений и вычислим соответствующие значения У, то, подставив все эти значения в формулу (1,19), мы получим: К=0, т.е. корреляции нет! Если положительные и отрицательные значения х будут не одинаковыми по абсолютной величине, но в среднем симметричными относительно нуля, то формула (1.19) покажет очень маленькое значение К. хотя в данном эксперименте переменные х и у имели абсолютно жесткую взаимозависимость. На эту особенность особенно следует обратить внимание при анализе данных.

При графическом анализе данных, которые носят название "диаграмм разброса", по расположению точек (Хi; Уi) хорошо видны только сравнительно высокие коэффициенты корреляции, более высокие, чем 0,5 по абсолютной величине (см. примеры на рис.7). С другой стороны, для целей реального управления поведением случайного показателя качества на производстве, рекомендуется использовать только случаи высокой корреляции, с коэффициентом корреляции более 0,7 по абсолютной величине.

Обычно коэффициент корреляции вычисляют для отдельных изделий, при этом исследуется корреляция между двумя показателями качества, которые измеряются для каждого изделия отдельно, т.е. между двумя индивидуальными показателями качества. Наличие существенной корреляции (положительной или отрицательной) указывает на наличие какой-то причины, одновременно влияющей на первый и второй индивидуальные показатели качества.

Однако при массовом производстве продукции, производимой партиями, можно вычислять коэффициент корреляции между двумя групповыми показателями качества, характеризующими партии продукции. Такими групповыми показателями качества могут быть, например, уровни несоответствий двух определенных видов. Если для множества партий выделенные два вида уровней несоответствий могут иметь высокую положительную корреляцию, то это указывает на существование общего фактора (причины), вызывающего статистически связанные изменения этих двух видов несоответствий. Тогда этот фактор должен быть обнаружен (если возможно) и установлен таким, чтобы минимизировать оба вида несоответствий.

2.5.2 Регрессия

Регрессия, в отличие от корреляции, предполагает явную статистическую причинно - следственную зависимость случайной переменной у от случайного или неслучайного аргумента х. В этом случае для практических целей управления переменной у необходимо знать зависимость среднего значения у от управляющего фактора х. При этом (в простейшем одномерном случае) обычно предполагается, что среднее значение (математическое ожидание) случайной величины y линейно зависит от управляющего фактора x:



(5.2)


а случайные индивидуальные значения у распределены вокруг этого среднего значения по нормальному



закону с некоторой дисперсией



(5.3)


где нормально распределенная случайная величина с нулевым средним



и дисперсией



которая и определяет разброс индивидуальных значений около среднего значения при данном х. Уравнение (5.3) обычно называют линией регрессии у по х.

Примечание - в более общем случае вместо (5.3) может предполагаться, что известная функция от у линейно зависит от другой известной функции от х.



(5.4)


где и должны быть полностью известны, например:




тог да




Соответственно запишем и (5.4):



(5.4а)


Методика определения коэффициентов-А и В для линии регрессии при этом сохранится.

Для определения коэффициентов регрессии А и В необходим набор экспериментальных данных у:

Y1, Y2, ... ,Yn (5.5)

полученных при соответствующих значениях управляющего фактора x:

Х1, X2, ... ,Хn, (5.6)

Иногда управляющий фактор x сохраняет свое значение для ряда измеренных значений у, это не играет роли, просто будут совпадающие значения в (5.6). Важно, чтобы общее число различных значений управляющего фактора x в (5.6) было не менее 2.

Оценка коэффициентов регрессии А и В проводится по формулам:




(5.7)


где




(5.8)


При этом выборочная дисперсия случайной величины у относительно среднего значения (5.3), зависящего от x, вычисляется по формуле:



(5.9)


где




а выборочное среднее квадратическое отклонение определяется как квадратный корень из (5.9).

После нахождения коэффициентов А и В мы можем "наилучшим образом" управлять значениями y задавая значения управляющего фактора x, мы фактически управляем средним значением показателя качества y и знаем его среднее квадратическое отклонение (точнее, оценку этого отклонения).



Рисунок 7 - Графические примеры поведения "облака экспериментальных точек" при различных значениях коэффициента корреляции К (диаграммы разброса)


^ 3. Методы сбора информации.

Определите, какую информацию о ходе производственного процесса нужно собирать, на участке подлежащем исследованиям с применением статистических методов. Скорее всего, это данные результатов контроля качества продукции, замеры параметров технологических процессов, количества изготовленных изделий и т.д.

3.1 Расслоение-стратификация

Олределите, где и в каком виде собранная информация регистрируется? Кто это делает? А удобны ли формы сбора этих данных? А кто и как использует собранную информацию? Используют ее, как правило, для принятия только оперативных решений. Проводится ли при этом статистический анализ имеющихся данных?

Начнем с того, что определим цели сбора и анализа данных. Пусть Вы хотите уменьшить разброс значений какого-либо показателя качества изделия. Если производить только один замер в день, то нельзя судить об изменениях показателя в течение дня.

Если Вы хотите понять, каким образом два разных рабочих на одной операции допускают дефекты, то нужно брать информацию о дефектах каждого рабочего раздельно, чтобы затем можно было сравнить эти данные между собой. Если сравнение показывает явные различия, то меры по их устранению будут способствовать уменьшению изменчивости процесса.

Такой прием разделения данных на несколько подгрупп по определенному признаку называется расслоением или стратификацией - разделением полученных данных на отдельные группы (слои) в зависимости от выбранного стратифицирующего фактора. В качестве стратифицирующего фактора могут быть выбраны любые парааметры определяющие особенности условий возникновения и получения данных. При отсутствии стратифицирующего фактора, (расслоения данных) происходит их объединение и обезличивание, затрудняющее установление действительной взаимосвязи между полученными данными и особенностями их возникновения Например, при анализе источника дефектной продукции, поставляемой предприятию несколькими сторонними поставщиками, целесообразно в качестве стратифицирующего фактора выбрать поставщиков и произвести стратификацию дефектной продукции по поставщикам. Спланируйте дальнейшую работу для дополнительного подтверждения полученных результатов

Расслоение можно осуществлять не только по рабочим, но и по станкам (оборудованию), по качеству материалов, комплектующих, по методам и условиям производства (температура, давление, скорость

резания и т.д.), по времени изготовления, по изделиям (тип, сорт, партия) и т.п.

Вообще, расслоение данных очень полезно. Его целесообразно применять постоянно и во всех задачах анализа данных.

^ 3.2 Контрольные листки

А теперь давайте позаботимся о том, чтобы Вам или Вашим подчиненным было удобно фиксировать данные, а затем было удобно их обрабатывать и анализировать.

Очень важно четко и полно зарегистрировать источник данных. Пожалуй, Вы извлечете мало полезной информации, если при замерах показателя качества не будете фиксировать день недели, может быть час, смену, когда делались замеры; станок, на котором производилась обработка; рабочего, делавшего операцию; партию используемого материала и т.д. Конечно, необходимый объем данных, их полнота во многом зависят от поставленной Вами задачи, от цели статистического анализа.

Очень удобной формой сбора данных может служить - контрольный листок - бумажный бланк, на котором заранее напечатаны контролируемые параметры с тем, чтобы можно было легко и точно записать данные измерений и упорядочить их для дальнейшего использования. Какие же контрольные листки обычно применяют?

^ 3.2.1 Контрольный листок для регистрации распределения измеряемого параметра в ходе производственного процесса.

Предположим, что мы хотим выявить изменения в размерах некоторой детали, подвергающейся механической обработке, причем размер, указанный в чертеже, - от 8,292 до 8^308 мм. Для получения распределения значений этого показателя в ходе процесса обычно используются гистограммы. На основе гистограммы вычисляются среднее значение и дисперсия, исследуется также и форма кривой распределения. Чтобы построить гистограмму, надо затратить немало труда на сбор большого числа данных и на представление частотного распределения в графической форме. Проще классифицировать данные в момент сбора. На рис. 3.1 показан бланк, который можно заранее заготовить для этой цели. Каждый раз, когда производится замер, в соответствующую клеточку ставится крест, так что к концу измерений гистограмма готова. Если нужно произвести расслоение с использованием одного контрольного листка, лучше для пометок брать карандаши разного цвета, чтобы разница проявлялась наглядно.

Контрольный листок




Отклоне
















З

а

м

е

р

ы




























Частота




ние













5













10













15













20







-10



































































-9
































































*

-8



































































-7



































































-6



































































-5

X


























































1




-4

X

X























































2




-3

X

X

X

X

















































4




-2

X

X

X

X

X

X











































6




-1

X

X

X

X

X

X

X

X

X


































9

8.300

0

X

X

X

X

X

X

X

X

X

X

х




























11




1

X

X

X

X

X

X

X

X





































8




2

X

X

X

X

X

X

X








































7




3

X

X

X




















































3




4

X

X























































2




5

X


























































1




6

X


























































1




7
































































*

8



































































9



































































10



















































































































и

т

о

г

о

55

*) Границы поля допуска (по чертежу)

Рисунок 3.1 - Контрольный листок для регистрации распределения измеряемого параметра в ходе производственного процесса.

  1   2   3   4   5

Схожі:

Лекция 11 iconДокументи
1. /XML-Лекция 1. концепция Семантического Веб.doc
2. /XML-Лекция...

Лекция 11 iconДокументи
1. /Лекция 1. Основы РС.docx
2. /Лекция...

Лекция 11 iconДокументи
1. /АИТ/Аналитика_определения.doc
2. /АИТ/ДИИД027_анал_у.doc
Лекция 11 iconДокументи
1. /А_Т_3м_ст.doc
2. /ЛЕКЦИИ_6_7_Добыча_Конкур_разв.doc
Лекция 11 iconДокументи
1. /А_Т_3м_ст.doc
2. /ЛЕКЦИИ_6_7_Добыча_Конкур_разв.doc
Лекция 11 iconЛекция Вопросы лекции

Лекция 11 iconЛекция №9 Информационная безопасность

Лекция 11 iconЛекция №13 Организация проектных групп

Лекция 11 iconЛекция на тему: "Идиопатические заболевания с прогрессирующим лизисом тканей пародонта. Клиника, диагностика, лечение" Лектор професор Каськова Л. Ф. Полтава 2009
Украины «Украинская медицинская стоматологическая академия» Кафедра детской терапевтической стоматологии с профилактикой стоматологических...
Лекция 11 iconДокументи
1. /ЛЕКЦ_материал/А_Т_3м_ст.doc
2. /ЛЕКЦ_материал/ЛЕКЦИИ_6_7_Добыча_Конкур_разв.doc
Лекция 11 iconЛекция Введение. Теория и методика обучения русскому языку как наука. Науки о языке основа его методики
Лекция Введение. Теория и методика обучения русскому языку как наука. Науки о языке – основа его методики. Обучение грамоте как особая...
Додайте кнопку на своєму сайті:
Документи


База даних захищена авторським правом ©zavantag.com 2000-2013
При копіюванні матеріалу обов'язкове зазначення активного посилання відкритою для індексації.
звернутися до адміністрації
Документи