Теорема 9.8. Если в задаче нормальной линейной регрессии (9.1)-(9.4), (9.10) , тогда:  

Теорема 9.8. Если в задаче нормальной линейной регрессии (9.1)-(9.4), (9.10) , тогда:

Если в задаче нормальной линейной регрессии (9.1)-(9.4), (9.10) , тогда:

1) оценка имеет нормальное распределение ;

2) случайная величина имеет распределение ;

3) случайная величина имеет распределение ;

4) случайный вектор и случайная величина независимы;

5) случайные величины и независимы.

, тогда статистика:

по определению имеет распределение Стьюдента . Отсюда следует, что доверительным интервалом для неизвестного параметра с уровнем доверия будет интервал:

,

где – квантиль уровня распределения Стьюдента .

Построение доверительного интервала для неизвестной остаточной дисперсии основывается на пункте 3 теоремы 9.8, согласно которому статистика имеет распределение . Легко видеть, что доверительным интервалом для с уровнем доверия является интервал:

,

где и – квантили уровней и распределения .

Для построения доверительной области для вектора заметим, что по теореме 9.8 из пункта 3 случайная величина имеет распределение , из пункта 2 случайная величина имеет распределение и согласно пункту 6 случайные величины и независимы, тогда статистика:

по определению имеет распределение Фишера . Поскольку является решением нормального уравнения, то как было показано при доказательстве утверждения (9.2) для любого вектора параметров :

,

тогда для вектора ,

,

отсюда,

Внутренность эллипсоида образует доверительную область. Действительно, пусть есть некоторый уровень доверия, обозначает квантиль уровня распределения Фишера и область :

,

тогда,

,

где – функция распределения для распределения Фишера . Отсюда следует, что область является доверительной областью для с уровнем доверия .

Если в (9.1) все величины равны нулю, то это означает отсутствие зависимости между случайной величиной и случайными величинами . Пусть рассматривается гипотеза об отсутствии зависимости:

: , …, ,

и требуется построить критерий проверки гипотезы . Из теоремы 9.8 следует, что статистика:

имеет распределение Фишера при всяком параметре . Отсюда, если гипотеза верна, тогда статистика:

,

(где , )

имеет распределение Фишера .

Большие значения статистики свидетельствуют против гипотезы , действительно, если гипотеза не верна, то есть , тогда вектор наблюдение имеет ненулевое смещение и с большой вероятностью попадает в окрестность ненулевого вектора . Оценка по методу наименьших квадратов минимизирует величину среднеквадратичного отклонения , поэтому вектор регрессионных значений оказывается близким в наблюдению и тоже с большой вероятностью оказывается в окрестности ненулевого вектора , отсюда величина не является малой, а величина является малой, поэтому отношение не является величиной близкой к нулю и умножается на возрастающий при коэффициент . Таким образом, если гипотеза не верна, то статистика с большой вероятностью принимает значения не из окрестности нуля.



Отсюда следует, что в качестве критической области гипотезы следует выбирать область вида:

,

где квантиль распределения уровня и – заданный уровень значимости. Действительно, вероятность отклонения гипотезы при условии, что верна:

,

где – функция распределения для распределения Фишера .

Методы получения случайных величин: с равномерным распределением, бинарной, с распределением Бернулли, с нормальным распределением. Метод получения векторных случайных величин с нормальным распределением. Метод получения случайной величины с заданной функцией распределения.

Для использования методов статистического моделирования требуется располагать реализацией вектора случайных величин , имеющего заданную функцию распределения (в общем случае каждая случайная величина является векторной). В частных случаях, все случайные величины имеют одинаковую функцию распределения , поэтому получение реализации сводится к -кратному получению реализации одной случайной величины с заданной функцией распределения .

Метод получения случайной величины с распределением .

Среди всех методов получения реализаций основными являются методы получения реализации случайной величины с равномерным распределением , часть из которых основана: а) на физических процессах, б) на функциях специального вида. Правильнее было бы сказать, что методы позволяют строить реализации случайной величины дискретного типа, которая с равной вероятностью принимает значения, равномерно рассредоточенные на отрезке , и потому функция распределения, которой оказывается близкой к функции распределения .

В некоторых методах, основанных на физических процессах, предварительно получают реализации случайной величины , принимающей с равной вероятностью значения 0 и 1:



(10.1)

Например, некоторый датчик регистрирует в течение фиксированного отрезка времени количество частиц распада от источника радиоактивного излучения, если количество частиц оказывается четное, то считается, что реализация случайной величины равна 0, если количество частиц нечетное, то считается, что реализация случайной величины равна 1. В качестве другого примера можно указать датчик, регистрирующий количество флуктуаций напряжения в радиоэлектронном элементе (дробовый эффект в лампах). Если количество флуктуаций четное, то реализация считается равной 0, если нечетное – 1.

Предположим, что получен вектор , в котором все величины независимы и каждая случайная величина является величиной вида (10.1), образуем новую случайную величину :

(10.2)

Легко видеть, что наименьшее значение равно 0 (все ), а наибольшее значение равно (все ), причем все значения величины равномерно рассредоточены на отрезке с шагом и все значения величина принимает с равной вероятностью. Отсюда следует, что при больших функция распределения случайной величины незначительно отличается от функции распределения случайной величины , равномерно распределенной на отрезке .

В методах, основанных на функциях специального вида, используется рекуррентные вычисления: пусть , …, уже имеющиеся случайные величины, тогда остальные величины вычисляют рекуррентно:

,

,

где функция подбирается таким образом, чтобы величина имела функцию распределения близкую к функции распределения . Вопрос получения величин , …, , как правило, разрешается за счет привлечения другого метода.

Широкое распространение получили линейно конгруэнтные методы, в которых функция сочетает в себе линейную функцию и операцию приведения по модулю:

.

Для эффективной реализации число обычно полагают равным , в этом случае приведение по модулю сводится к отбрасыванию всех битов старше . В наиболее простом случае:

,

– произвольное.

Легко видеть, что различных значений в последовательности не больше (в силу приведения по модулю) и поскольку следующее значение зависит только от одного значения (непосредственно предшествующего), то, начиная с некоторого номера , последовательность значений начнет повторяться, отсюда число имеет название периода. Считается, что чем больше период , тем лучше метод, поэтому постоянные и стараются выбирать так, чтобы оказалось наибольшим (наибольшее значение равно ). В качестве конкретных примеров можно указать следующие методы:

, – произвольное.

, – произвольное.

Метод получения бинарных случайных величин.

Предположим, каким-то образом составлен метод получения величин , имеющих равномерное распределение , и требуется составить метод получения бинарных величин , которые с вероятностью принимают значение 1 и с вероятностью – значение 0:

(10.3)

Легко видеть, что таким методом является, например, метод полагающий:

,

поскольку,

,

.

С помощь величин моделируется наступление события , имеющего заданную вероятность : если , то событие в испытании с номером не наступило, если , то событие в испытании с номер наступило.

Заметим, что в действительности имеются не величины с равномерным распределением , а некоторые другие величины , имеющие распределение близкое к равномерному распределению , поэтому вместо получаются случайные величины :

В частности, величины , полученные по методу (10.2), принимают лишь значения вида , где , отсюда следует:

,

.

Таким образом, с помощью величин могут быть получены лишь такие случайные величины , для которых при некотором , в этом случае в качестве следует брать значение , тогда распределения и совпадают:

.

Поскольку , то

,

то есть с помощью величин можно получить только случайные величины с вероятностью , отсюда следует, что события и величины вероятностью не могут быть представлены величинами , получаемыми с помощью .


0875505609256418.html
0875616729638564.html
    PR.RU™