Корреляционный момент и коэффициент корреляции. Ковариация и корреляция

Корреляционные моменты, коэффициент корреляции - это числовые характеристики, тесно связанные во введенным выше понятием случайной величины, а точнее с системой случайных величин. Поэтому для введения и определения их значения и роли необходимо пояснить понятие системы случайных величин и некоторые свойства присущие им.

Два или более случайные величины, описывающих некоторое явление называю

т системой или комплексом случайных величин.

Первые начальные моменты представляют собой математические ожидания величин Х и Y, входящих в систему

σ1,0=mx σ0,1=my.

Совокупность математических ожиданий mx , my представляет собой характеристику положения системы. Геометрически это координаты средней точки на плоскости, вокруг которой происходит рассеивание точки (Х, Y).

Важную роль на практике играют также вторые центральные моменты систем. Два из них представляют собой дисперсии величин Х и Y

характеризующие рассеивание случайной точки в направлении осей Ox и Oy.

Особую роль играет второй смещенный центральный момент:

называемый корреляционным моментом (иначе - "моментом связи")случайных величин Х и Y.

Корреляционный момент есть характеристика системы случайных величин, описывающая, помимо рассеивания величин Х и Y, еще и связь между ними. Для того, чтобы убедиться в этом отметим, что корреляционный момент независимых случайных величин равен нулю.

Заметим, что корреляционный момент характеризует не только зависимость величин, но и их рассеивание. Поэтому для характеристики связи между величинами (Х;Y) в чистом виде переходят от момента Kxy к характеристике

где σx, σy - средние квадратичные отклонения величин Х и Y. Эта характеристика называется коэффициентом корреляции величин Х и Y.

Согласно определениям момента корреляции и коэффициента корреляции

. (6.37)

Пусть имеется выборка . Выборочным коэффициентом корреляции называется оценка истинного коэффициента, полученная по формуле

. (6.38)

Здесь , , - выборочные средние значения и дисперсии. Выборочный коэффициент корреляции является случайной величиной. Отсюда после вычисления возникает необходимость проверки гипотезы о значимости полученной оценки. Проверяется гипотеза о равенстве нулю генерального коэффициента корреляции против альтернативы о неравенстве нулю коэффициента корреляции. Для проверки гипотезы против альтернативы используют статистику

Известно , что эта статистика имеет распределение Стьюдента с (n-2) степенями свободы. Введем уровень значимости для решения и тогда решающее правило принимает вид

. (6.40)

Здесь - квантиль распределения Стьюдента уровня (1-) с степенями свободы.

Для графической оценки корреляционной связи двух случайных переменных строят так называемые диаграммы рассеяния

Коэффициент корреляции определяет тесноту линейной корреляционной связи между двумя случайными переменными x и y. Однако корреляционная связь между переменными не обязательно является линейной. Поставим задачу описания корреляционной связи в самом общем виде. Выясним меняется ли одна случайная величина (y) при изменении другой случайной величины (x). Рассмотрим плоскость (xy), на которой заданы эти величины. На оси x укажем k точек в интересующем нас диапазоне значений и для каждой j-й точки этого диапазона измерим q раз значение переменной y. В результате получаем k диапазонов (групп) для величины y, в каждом из которых имеется q отсчетов. Значения y внутри отдельной группы будем рассматривать как самостоятельную совокупность и для нее найдем внутригрупповую среднюю и внутригрупповую дисперсию соответственно:

. (6.41)

(Отметим, что в пределах данного пункта используется формула для вычисления смещенной оценки дисперсии.)

Найдем среднюю арифметическую внутригрупповых дисперсий

, (6.42)

а также среднее значение по всей совокупности точек

. (6.43)

Запишем выражение для расчета межгрупповой дисперсии, описывающей рассеяние групповых средних относительно средней по всей совокупности точек

, (6.44)

и выражение для расчета общей дисперсии, описывающей рассеяние отдельных точек относительно среднего по всей совокупности

(6.45)

Если переменная y связана с x функциональной зависимостью, то определенному значению x соответствует определенное значение y и в каждой группе содержатся q одинаковых чисел. Это означает, что внутригрупповая дисперсия равна нулю и на основание (6.51)

Если же переменные x и y связаны корреляционной зависимостью, то

На основание данного важного свойства соотношения межгрупповой и общей дисперсий вводится мера оценки тесноты корреляционной связи

Как часто Вам приходилось слышать высказывания, в которых говорилось о том, что одно явление коррелируется с другим?

«Высокий рост коррелируется с хорошим образованием и счастьем, установили эксперты социологической службы Gallup.»

«Цена на нефть коррелируется с курсами валют.»

«Боль в мышцах после тренировки не коррелируется с гипертрофией мышечных волокон.»

Складывается впечатление, что понятие «корреляция» стало широко использоваться не только в науке, но и в повседневной жизни. Корреляция отражает степень линейной зависимости между двумя случайными явлениями. Так, когда цены на нефть начинают падать, то курс доллара относительно рубля начинает расти.

Из всего выше сказанного, можно сделать вывод о том, что при описании двумерных случайных величин бывает недостаточно таких хорошо известных характеристик, как математическое ожидание, дисперсия, среднее квадратическое отклонение. Поэтому часто для их описания используются еще две очень важные характеристики: ковариация и корреляция .

Ковариация

Ковариацией $cov\left(X,\ Y\right)$ случайных величин $X$ и $Y$ называется математическое ожидание произведения случайных величин $X-M\left(X\right)$ и $Y-M\left(Y\right)$, то есть:

$$cov\left(X,\ Y\right)=M\left(\left(X-M\left(X\right)\right)\left(Y-M\left(Y\right)\right)\right).$$

Бывает удобно вычислять ковариацию случайных величин $X$ и $Y$ по следующей формуле:

$$cov\left(X,\ Y\right)=M\left(XY\right)-M\left(X\right)M\left(Y\right),$$

которая может быть получена из первой формулы, используя свойства математического ожидания. Перечислим основные свойства ковариации .

1 . Ковариация случайной величины с самой собой есть ее дисперсия.

$$cov\left(X,\ X\right)=D\left(X\right).$$

2 . Ковариация симметрична.

$$cov\left(X,\ Y\right)=cov\left(Y,\ X\right).$$

3 . Если случайные величины $X$ и $Y$ независимы, то:

$$cov\left(X,\ Y\right)=0.$$

4 . Постоянный множитель можно выносить за знак ковариации.

$$cov\left(cX,\ Y\right)=cov\left(X,\ cY\right)=c\cdot cov\left(X,\ Y\right).$$

5 . Ковариация не изменится, если к одной из случайных величин (или двум сразу) прибавить постоянную величину:

$$cov\left(X+c,\ Y\right)=cov\left(X,\ Y+c\right)=cov\left(X+x,\ Y+c\right)=cov\left(X,\ Y\right).$$

6 . $cov\left(aX+b,\ cY+d\right)=ac\cdot cov\left(X,\ Y\right)$.

7 . $\left|cov\left(X,\ Y\right)\right|\le \sqrt{D\left(X\right)D\left(Y\right)}$.

8 . $\left|cov\left(X,\ Y\right)\right|=\sqrt{D\left(X\right)D\left(Y\right)}\Leftrightarrow Y=aX+b$.

9 . Дисперсия суммы (разности) случайных величин равна сумме их дисперсий плюс (минус) удвоенная ковариация этих случайных величин:

$$D\left(X\pm Y\right)=D\left(X\right)+D\left(Y\right)\pm 2cov\left(X,\ Y\right).$$

Пример 1 . Дана корреляционная таблица случайного вектора $\left(X,\ Y\right)$. Вычислить ковариацию $cov\left(X,\ Y\right)$.

$\begin{array}{|c|c|}
\hline

\hline
-2 & 0,1 & 0 & 0,2 \\
\hline
0 & 0,05 & p_{22} & 0 \\
\hline
1 & 0 & 0,2 & 0,05 \\
\hline
7 & 0,1 & 0 & 0,1 \\
\hline
\end{array}$

События $\left(X=x_i,\ Y=y_j\right)$ образуют полную группу событий, поэтому сумма всех вероятностей $p_{ij}$, указанных в таблице, должна быть равна 1. Тогда $0,1+0+0,2+0,05+p_{22}+0+0+0,2+0,05+0,1+0+0,1=1$, отсюда $p_{22}=0,2$.

$\begin{array}{|c|c|}
\hline
X\backslash Y & -6 & 0 & 3 \\
\hline
-2 & 0,1 & 0 & 0,2 \\
\hline
0 & 0,05 & 0,2 & 0 \\
\hline
1 & 0 & 0,2 & 0,05 \\
\hline
7 & 0,1 & 0 & 0,1 \\
\hline
\end{array}$

Пользуясь формулой $p_{i} =\sum _{j}p_{ij} $, находим ряд распределения случайной величины $X$.

$\begin{array}{|c|c|}
\hline
X & -2 & 0 & 1 & 7 \\
\hline
p_i & 0,3 & 0,25 & 0,25 & 0,2 \\
\hline
\end{array}$

$$M\left(X\right)=\sum^n_{i=1}{x_ip_i}=-2\cdot 0,3+0\cdot 0,25+1\cdot 0,25+7\cdot 0,2=1,05.$$

$$D\left(X\right)=\sum^n_{i=1}{p_i{\left(x_i-M\left(X\right)\right)}^2}=0,3\cdot {\left(-2-1,05\right)}^2+0,25\cdot {\left(0-1,05\right)}^2+0,25\cdot {\left(1-1,05\right)}^2+$$

$$+\ 0,2\cdot {\left(7-1,05\right)}^2=10,1475.$$

$$\sigma \left(X\right)=\sqrt{D\left(X\right)}=\sqrt{10,1475}\approx 3,186.$$

Пользуясь формулой $q_{j} =\sum _{i}p_{ij} $, находим ряд распределения случайной величины $Y$.

$\begin{array}{|c|c|}
\hline
Y & -6 & 0 & 3 \\
\hline
p_i & 0,25 & 0,4 & 0,35 \\
\hline
\end{array}$

$$M\left(Y\right)=\sum^n_{i=1}{y_ip_i}=-6\cdot 0,25+0\cdot 0,4+3\cdot 0,35=-0,45.$$

$$D\left(Y\right)=\sum^n_{i=1}{p_i{\left(y_i-M\left(Y\right)\right)}^2}=0,25\cdot {\left(-6+0,45\right)}^2+0,4\cdot {\left(0+0,45\right)}^2+0,35\cdot {\left(3+0,45\right)}^2=11,9475.$$

$$\sigma \left(Y\right)=\sqrt{D\left(Y\right)}=\sqrt{11,9475}\approx 3,457.$$

Поскольку $P\left(X=-2,\ Y=-6\right)=0,1\ne 0,3\cdot 0,25$, то случайные величины $X,\ Y$ являются зависимыми.

Определим ковариацию $cov\ \left(X,\ Y\right)$ случайных величин $X,\ Y$ по формуле $cov\left(X,\ Y\right)=M\left(XY\right)-M\left(X\right)M\left(Y\right)$. Математическое ожидание произведения случайных величин $X,\ Y$ равно:

$$M\left(XY\right)=\sum_{i,\ j}{p_{ij}x_iy_j}=0,1\cdot \left(-2\right)\cdot \left(-6\right)+0,2\cdot \left(-2\right)\cdot 3+0,05\cdot 1\cdot 3+0,1\cdot 7\cdot \left(-6\right)+0,1\cdot 7\cdot 3=-1,95.$$

Тогда $cov\left(X,\ Y\right)=M\left(XY\right)-M\left(X\right)M\left(Y\right)=-1,95-1,05\cdot \left(-0,45\right)=-1,4775.$ Если случайные величины независимы, то их ковариации равна нулю. В нашем случае $cov(X,Y)\ne 0$.

Корреляция

Коэффициентом корреляции случайных величин $X$ и $Y$ называется число:

$$\rho \left(X,\ Y\right)={{cov\left(X,\ Y\right)}\over {\sqrt{D\left(X\right)D\left(Y\right)}}}.$$

Перечислим основные свойства коэффициента корреляции .

1 . $\rho \left(X,\ X\right)=1$.

2 . $\rho \left(X,\ Y\right)=\rho \left(Y,\ X\right)$.

3 . $\rho \left(X,\ Y\right)=0$ для независимых случайных величин $X$ и $Y$.

4 . $\rho \left(aX+b,\ cY+d\right)={sgn \left(ac\right)\rho \left(X,\ Y\right)\ }$, где ${sgn \left(ac\right)\ }$ - знак произведения $ac$.

5 . $\left|\rho \left(X,\ Y\right)\right|\le 1$.

6 . $\left|\rho \left(X,\ Y\right)\right|=1\Leftrightarrow Y=aX+b$.

Ранее было сказано, что коэффициент корреляции $\rho \left(X,\ Y\right)$ отражает степень линейной зависимости между двумя случайными величинами $X$ и $Y$.

При $\rho \left(X,\ Y\right)>0$ можно сделать вывод о том, что с ростом случайной величины $X$ случайная величина $Y$ имеет тенденцию к увеличению. Это называется положительной корреляционной зависимостью. Например, рост и вес человека связаны положительной корреляционной зависимостью.

При $\rho \left(X,\ Y\right)<0$ можно сделать вывод о том, что с ростом случайной величины $X$ случайная величина $Y$ имеет тенденцию к уменьшению. Это называется отрицательной корреляционной зависимостью. Например, температура и время сохранности продуктов питания связаны между собой отрицательной корреляционной зависимостью.

При $\rho \left(X,\ Y\right)=0$ случайные величины $X$ и $Y$ называются некоррелированными. Стоит отметить, что некоррелированность случайных величин $X$ и $Y$ не означает их статистическую независимость, это говорит лишь о том, что между ними нет линейной зависимости.

Пример 2 . Определим коэффициент корреляции $\rho \left(X,\ Y\right)$ для двумерной случайной величины $\left(X,\ Y\right)$ из примера 1.

Коэффициент корреляции случайных величин $X,\ Y$ равен $r_{XY} ={cov(X,Y)\over \sigma (X)\sigma (Y)} ={-1,4775\over 3,186\cdot 3,457} =-0,134.$ Поскольку $r_{XY}<0$, то с ростом $X$ случайная величина $Y$ имеет тенденцию к уменьшению (отрицательная корреляционная зависимость).

Определение:

Корреляционным моментом случайных величин и называют математическое ожидание произведения отклонений этих величин

Напомним, что приведенное выражение является элементом формулы дисперсии суммы двух случайных величин:

Замечание:

Корреляционный момент может быть представлен в виде:

Доказательство:

Теорема:

Корреляционный момент двух независимых случайных величин и равен 0

Доказательство:

Согласно замечанию:

Но для независимых случайных величин

Тогда для независимых случайных величин и :

Определение:

Безразмерная величина называется коэффициентом корреляции.

Теорема:

Абсолютная величина корреляционного момента двух случайных величин не превосходит произведения их средних квадратических отклонений:

Доказательство:

Введем в рассмотрение случайную величину и найдем ее дисперсию:

Так как любая дисперсия неотрицательная

Аналогично введем случайную величину и найдем, что:

Определение:

Случайные величины и называются некоррелированными, если , и коррелированными, если .

Теорема:

Коэффициент корреляции случайных величин, связанных линейной зависимостью, равен .

Доказательство:

Найдем коэффициент корреляции:

Отметим некоторые свойства коэффициента корреляции.

1. Из примера 1 следует, что если - независимые случайные величины, то коэффициент корреляции равен 0.

Заметим, что обратное утверждение неверно.

2. Абсолютная величина коэффициента корреляции в общем случае не превосходит единицы:

Доказательство следует из доказанной ранее формулы для корреляционного момента:

Разделим обе части неравенства на произведение и получим

3. Коэффициент корреляции характеризует относительную (в долях ) величину отклонения математического ожидания произведения от произведения математических ожиданий величин . Так как такое отклонение имеет место только для зависимых величин, то можно сказать, что коэффициент корреляции характеризует тесноту зависимости между и .



Это утверждение следует из доказанного ранее равенства: . Приведем корреляционный момент к коэффициенту корреляции:


Куликов А. А. Форекс для начинающих. Справочник биржевого спекулянта – СПб.: Питер, 2007; Коммерсантъ № 62 от 13.04.2007 – Мировая торговля замедлится.

Bachelier L. Theorie de la speculation. //Annales de l"Ecole Normale Superieure. 1900. V. 17. P. 21-86. Описание идей Л. Бушелье, их судьба и их современная критика содержатся в книгах: Мандельброт Б. Непослушные рынке, фрактальная революция в финансах – пер. с англ. – М.: Издательский дом «Вильямс», 2006; Сорнетте Д. Как предсказывать крахи финансовых рынков – пер. с франц. – М.: Издательство «И-трейд», 2008.

Cootner Paul H. The Random Character of Stock Market Prices – Cambridge, MA, MIT Press

Harry M. Markowitz, Portfolio Selection, Journal of Finance, 7, no 1 (March 1952), pp, 79-81.

В представленном разделе используются материалы следующих книг: Шарп У. Ф.., Александер Г. Дж., Бэйли Дж. В. Инвестиции – пер. с англ. – М.: ИНФРА-М, 1997; Бромвич М. Анализ экономической эффективности капиталовложений – пер. с англ. – М.: ИНФРА-М, 1996; Ширяев В. И. Модели финансовых рынков. Оптимальные портфели, управление финансами и рисками – Учебное пособие – М.: КомКнига, 2007; Шаповал А. Б. Инвестиции: математические методы – М.: ФОРУМ: ИНФРА-М, 2007; Коростелева М. В. Методы анализа рынка капитала – СПб.: Питер, 2003.

Тобин Дж. обратил внимание на недостаточность показателей математических ожиданий и дисперсии для сравнения портфелей (См. Ширяев В. И. Модели финансовых рынков… - стр. 18-19). Тем не менее, их применение оправдано своей конструктивностью.

См. Аскинадзи В. М. и др. Инвестиционное дело – Учебник - М.: Маркет ДС, 2007, стр. 238-241 или Ширяев В. И. Модели финансовых рынков. Оптимальные портфели, управление финансами и рисками – Учебное пособие – М.: КомКнига, 2007, стр. 17.

См. Бромвич М. Анализ экономической эффективности капиталовложений – пер. с англ. – М.: ИНФРА-М, 1996, стр. 343. Обсуждение альтернативных мер риска, например, приведение к нормальному типу так называемого логнормального распределения можно найти в книге: Шарп У. Ф.., Александер Г. Дж., Бэйли Дж. В. Инвестиции – пер. с англ. – М.: ИНФРА-М, 1997, стр. 179-181.

См. Бромвич М. Ук. Соч. стр. 342.

Считают, что первым шагом в создании теории полезности было формулирование так называемого Санкт-Петербургского парадокса. Любопытно, что сформулировал этот парадокс Николай Бернулли, а объяснение дал ему Даниил Бернулли - См.: Бернулли Д. Опыт новой теории измерения жребия / Д. Бернулли; пер. А. Нардовой // Вехи экономической мысли / сост. и общ. ред. В. М. Гальперина. Спб., 1993. Т. 1: Теория потребительского поведения и спроса. С. 11-27.

Полезные материалы по теории полезности можно найти в книгах, посвященных теории игр, в частности: Льюс Р.Д., Райфа Х. Игры и решения - Пер. с англ. - М.: Изд-во иностр. лит., 1961; Нейман фон Джон, Моргенштерн О. Теория игр и экономическое поведение - Пер. с англ. - М.: Наука, 1970.

См. Приложение к модели Г. Марковица

См. в книге Ширяева В. И. Модели финансовых рынков. Оптимальные портфели, управление финансами и рисками – М.: КомКнига, 2007, стр. 25-26.

Аналитическую формулировку модели Марковица можно найти в книгах: Шаповал А. Б. Инвестиции: математические методы – М.: ФОРУМ: ИНФРА-М, 2007, стр. 21-22; Аскинадзи В. М. и др. Инвестиционное дело – Учебник - М.: Маркет ДС, 2007, стр. 288.

Нами использованна формулировка, предложенная в книге: Аскинадзи В. М. и др. Инвестиционное дело – Учебник - М.: Маркет ДС, 2007, стр. 256-257.

См. в книге: Шаповал А. Б. Инвестиции: математические методы – М.: ФОРУМ: ИНФРА-М, 2007, стр. 16-18 (раздел «Модель Марковица»).

См.:Шарп У. Ук. соч. стр. 213-218, 226-228, стр. 271 – о связи и отличиях рыночной модели и модели САРМ; также Аскинадзи В. М. и др. Ук. соч., стр. 278-294; Ширяев В. В. Ук. соч., стр. 47-58

См.: Шарп У. Ф., Александер Г. Дж., Бэйли Дж. В. Инвестиции –пер. с англ. – М.: ИНФРА-М, 1997, стр 316-337.

См.: Оценка бизнеса – под ред. Грязновой А.Г., Федотовой М.А. – М.: Финансы и статистика, 2007, стр. 199

См: Шаповал А. Б. Инвестиции: математические методы – М.: ФОРУМ: ИНФРА-М, 2007, глава 3.

См. Мандельброт Б., Хадсон Р. Л. Непослушные рынки: фрактальная революция в финансах – пер. с англ. – М.: Издательский дом «Вильямс», 2006, 187 стр.

См. там же, стр. 34-39.

См.: Сорнетте Д. Как предсказывать крахи финансовых рынков – пер. с франц. – М.: Издательство «И-трейд», 2008, стр. 19-22.

Это раздел основан, главным образом, на материалах книги: Экономическая теория (New Palgraiv) – пер. с англ. – М.: ИНФРА-М, 2004, стр. 263-273 – глава Гипотеза эффективного рынка, автор - Бертон Мэлкил (Berton G, Malkiel). Ссылки на авторов различных исследований также сделаны по материалам этой статьи. См. также: Бертон Мэлкил «Случайная прогулка по Уолл-Стрит – пер. с англ. - Минск: Попурри, 2006. Последняя книга издается уже 30 лет. Любопытно, что в конце 90-х годов вышла иная книга: Эндрю Лоу. Неслучайная прогулка по Уолл-Стрит. Б. Мелкил является, в целом, сторонником гипотезы эффективного рынка, а Эндрю Лоу – наоборот.

См.: Чеботарев Ю.Н. Случайность и Неслучайность биржевых цен – М.: СмартБук; И-трейд, 2008, 198.

Инвариантность - неизменность какой-либо величины при изменении физических условий или по отношению к некоторым преобразованиям, например, преобразованиям координат и времени при переходе от одной инерциальной системы отсчета к другой (релятивистская инвариантность). Практически строгое описание «случайного блуждания» в наиболее простой версии «винеровского процесса» можно найти в книге: Шаповал А.Б. Инвестиции: математические методы – Учебное пособие – М.: ФОРУМ: ИНФРА-М, 2007, стр. 42-43.

Случайный процесс называется винеровским, если выполнены следующие условия:

1) Процесс начинается с нуля, то есть;

2) Случайная величина имеет нормальное распределение с нулевым математическим ожиданием и с дисперсией равной для любого момента времени;

3) Для произвольных непересекающихся интервалов и случайные величины и независимы.

Вообще, пособие Шаповала А.Б. мы рекомендуем для ознакомления с математическими моделями портфельного анализа, оценки опционов. Изложение достаточно строгое для практики и краткое (96 стр.), но вводит в современную теорию финансов. В главе о портфельном анализе мы в значительной мере используем

См. материал из Википедии:

Последовательность случайных величин называется мартингалов с дискретным временем, если:

Пусть дана другая последовательность случайных величин. Тогда последовательность случайных величин называется мартингалом относительно или -мартингалом, если:

Пусть дана последовательность случайных величин. Тогда последовательность случайных величин называется суб(супер) мартингалом относительно, если:

Этот эффект можно объяснить налоговым влиянием. В конце года инвесторы сбрасывают акции, в первую очередь, мелких фирм для имитации убыточности и облегчения налоговых платежей, цены акций падают, а в январе они могут вернуться даже с излишком вверх – См.: Бертон Мэлкил. Случайная прогулка по Уолл-Стрит, стр. 316-317.

Эффект уик-энда, эффект понедельника не имеет однозначного объяснения. Эффект говорит о том, что цены акций в понедельник ниже, чем вечером в пятницу. В книге «Случайная прогулка по Уолл-Стрит» Бертон Мэлкил уточняет эффект: цены акций утром в понедельник немного выше, чем вечером в пятницу, а к вечеру понедельника они понижаются, так что доходность становится относительно отрицательной. Поэтому следует покупать акции в понедельник вечером. Но проверка эффекта, проведенная автором по материалам Нью-Йоркской фондовой биржи с мая по июль 2002 года показала, что эффект проявился лишь в восьми уик-эндах из тринадцати.

Стратегию «купил и держи» реализуют так называемые «индексные фонды», которые держат структуру своих вложений в соответствии с популярными биржевыми индексами. По данным информационного портала «Вложи.ру», в России в 2007 году действовало 11 ПИФов как индексные фонды. Первый российский индексный фонд был образован в 2003 году. В США такие фонды действуют уже 30 лет. Российские фонды ориентируются на индексы ММВБ или РТС (после модификации в 2006 году индекс РТС стал учитывать и ликвидность бумаг, что требуется для правильной работы индексного фонда). Строго следовать индексам индексные фонды, конечно, не могут, так как было бы нерационально вносить изменения во вложения непрерывно. См. материалы об индексных фондах на портале частного инвестора «Вложи.ру»: http://www.vlozhi.ru/

Дробление акций снижает их номинальную стоимость, в результате чего она становится более доступной мелким акционерам. Расширение рынка акций может повысить к ним интерес и, соответственно, увеличить спрос на них, а значит, и рыночную стоимость акций

Эффективность взаимных фондов относительно эффективности индексных акций за 1980-1990 годы см.: Бертон Мэлкил. Случайная прогулка по Уолл-Стрит, стр. 238. В 80-е годы взаимные фонды обгоняли индекс S&P 500, в 90-е годы – отставали. Там же и другие современные материалы по эффективности взаимных фондов. Например, по данным с 1968 по 2002 годы проведено сопоставление доли наличности в активах взаимных фондов и индекса S&P 500. Сопоставление показало, что доля наличности в активах фондов была высока именно в те моменты, когда индекс был низок, то есть когда надо было, наоборот, тратить наличные деньги на покупку акций – стр. 244-248.

Результаты расчетов см.: Бертон Мэлкил. Случайная прогулка по Уолл-Стрит, стр. 235.

См. номера журнала «Финанс» за 2009-2010 годы.

См. Элдер А. Как играть и выигрывать на бирже: Психология. Технический анализ. Контроль над капиталом – М.: Альпина Бизнес Бук, 2007, стр. 29-35.

См.: Дамодаран А. Инвестиционные байки: разоблачение мифов о безпроигрышных биржевых стратегиях – пер. с англ. СПб.: Питер, 2007, стр. 396-428.

См.: Хэгстром Р. Дж. Инвестирование. Последнее свободное искусство – пер. с англ. – М.: ЗАО «Олимп-Бизнес», 2005.

Сравнение среднегодовой доходности и риска (квадратичного отклонения доходности) акций компаний крупных и мелких за период с 1926-2001 показало, что среднегодовая доходность акций мелких компаний – 17.5%, а крупных – 12.4 при риске 35.3 и 20.8%% соответственно. Среднеожидаемый ежемесячный доход за период 1963-1990 годы также показывает зависимость от размера компании. В то же время в 90-е годы ситуация изменилась, большие доходы стали давать компании с высокой капитализацией. Дело, по-видимому, в том, что выросла доля институциональных инвесторов, работающих с акциями крупных компаний, и акции мелкий компаний потеряли часть ликвидности – См. Бертон Мэлкил. Случайная прогулка по Уолл-Стрит, стр. 265, 333-334.

Данные за 80-е годы показывают, что акции с низким коэффициентом доходности (отношение цены акции к чистой прибыли компании) показывали более высокую доходность. Аналогично, акции с низким оотношением цены к стоимости активов фирмы дают обычно большую доходность – См. Бертон Мэлкил. Случайная прогулка по Уолл-Стрит, стр. 334-340.

Доказательства приведены по материалам книги: Бромвич Майкл. Анализ экономической эффективности капиталовложений – М.: ИНФРА-М, 1996.

См. Б.В. Гнеденко. Курс теории вероятности – М.: Наука, 1969, стр. 179 (глава 5. Числовые характеристики случайных величин)

Корреляционные моменты, коэффициент корреляции - это числовые характеристики, тесно связанные во введенным выше понятием случайной величины, а точнее с системой случайных величин. Поэтому для введения и определения их значения и роли необходимо пояснить понятие системы случайных величин и некоторые свойства присущие им.

Два или более случайные величины, описывающих некоторое явление называют системой или комплексом случайных величин.

Систему нескольких случайных величин X, Y, Z, …, W принято обозначать через (X, Y, Z, …, W).

Например, точка на плоскости описывается не одной координатой, а двумя, а в пространстве - даже тремя.

Свойства системы нескольких случайных величин не исчерпываются свойствами отдельных случайных величин, входящих в систему, а включают также взаимные связи (зависимости) между случайными величинами. Поэтому при изучении системы случайных величин следует обращать внимание на характер и степень зависимости. Эта зависимость может быть более или менее ярко выраженной, более или менее тесной. А в других случаях случайные величины оказаться практически независимыми.

Случайная величина Y называется независимой от случайной величины Х, если закон распределения случайной величины Y не зависит от того какое значение приняла величина Х.

Следует отметить, что зависимость и независимость случайных величин есть всегда явление взаимное: если Y не зависит от Х, то и величина Х не зависит от Y. Учитывая это, можно привести следующее определение независимости случайных величин.

Случайные величины Х и Y называются независимыми, если закон распределения каждой из них не зависит от того, какое значение приняла другая. В противном случае величины Х и Y называются зависимыми.

Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующими им вероятностями.

Понятие "зависимости" случайных величин, которым пользуются в теории вероятностей, несколько отличается от обычного понятия "зависимости" величин, которым пользуются в математике. Так, математик под "зависимостью" подразумевает только один тип зависимости - полную, жесткую, так называемую функциональную зависимость. Две величины Х и Y называются функционально зависимыми, если, зная значение одного из них, можно точно определить значение другой.

В теории вероятностей встречаются несколько с иным типом зависимости - вероятностной зависимостью. Если величина Y связана с величиной Х вероятностной зависимостью, то, зная значение Х, нельзя точно указать значение Y, а можно указать её закон распределения, зависящий от того, какое значение приняла величина Х.

Вероятностная зависимость может быть более или менее тесной; по мере увеличения тесноты вероятностной зависимости она все более приближается к функциональной. Т.о., функциональную зависимость можно рассматривать как крайний, предельный случай наиболее тесной вероятностной зависимости. Другой крайний случай - полная независимость случайных величин. Между этими двумя крайними случаями лежат все градации вероятностной зависимости - от самой сильной до самой слабой.

Вероятностная зависимость между случайными величинами часто встречается на практике. Если случайные величины Х и Y находятся в вероятностной зависимости, то это не означает, что с изменением величины Х величина Y изменяется вполне определенным образом; это лишь означает, что с изменением величины Х величина Y

имеет тенденцию также изменяться (возрастать или убывать при возрастании Х). Эта тенденция соблюдается лишь в общих чертах, а в каждом отдельном случае возможны отступления от неё.

Примеры вероятностной зависимости.

Выберем наугад одного больного с перитонитом. случайная величина Т - время от начала заболевания, случайная величина О - уровень гомеостатических нарушений. Между этими величинами имеется явная зависимость, так как величина Т является одной из наиболее главных причин, определяющих величину О.

В то же время между случайной величиной Т и случайной величиной М, отражающей летальность при данной патологии, имеется более слабая вероятностная зависимость, так как случайная величина хоть и влияет на случайную величину О, однако не является главной определяющей.

Тем более, если рассматривать величину Т и величину В (возраст хирурга), то данные величины практически независимы.

До сих пор мы обсуждали свойства систем случайных величин, давая только словесное разъяснение. Однако существуют числовые характеристики, посредством которых исследуются свойства как отдельных случайных величин, так и системы случайных величин.

Одной из важнейших характеристик случайной величины нормального распределения является математическое ожидание.

Рассмотрим дискретную случайную величину Х, имеющую возможные значения Х 1 , Х2 , ... , Хn с вероятностями р1 , р2 , ... , рn . нам требуется охарактеризовать каким-то числом положение значений случайной величины на оси абсцисс с учетом того, что эти значения имеют различные значения. Для этой цели обычно пользуются так называемым "средним взвешенным" из значений Хi , причем каждое значение Хi при осреднении должно учитываться с "весом", пропорциональным вероятности этого значения. Таким образом, если обозначить "среднее взвешенное" через М[X] или mx , получим

или, учитывая, что,

Математическим ожиданием случайной величины называется сумма произведений всех возможных значений случайной величины на вероятности этих значений.

Для большей наглядности рассмотрим одну механическую интерпретацию введенного понятия. Пусть на оси абсцисс расположены точки с абсциссами х 1 , х2 , …, хn , в которых сосредоточены соответственно массы р1 , р2 , … , рn , причем. Тогда математическое ожидание есть не что иное, как абсцисса центра тяжести данной системы материальных точек.

Формула (1) для математического ожидания соответствует случаю дискретной случайной величины. Для непрерывной величины Х математическое ожидание, естественно, выражается не суммой, а интегралом:

где - плотность распределения величины Х.

Формула (2) получается из формулы (1), если в ней заменить отдельные значения Хi непрерывно изменяющимся параметром Х, соответствующие вероятности рi элементом вероятности f(x)dx, конечную сумму - интегралом.

В механической интерпретации математическое ожидание непрерывной случайной величины сохраняет тот же смысл - абсциссы центра тяжести в случае, когда масса распределения по оси абсцисс непрерывна с плотностью f(x).

Следует отметить, что математическое ожидание существует не для всех случайных величин, что, однако, по мнению некоторых ученых, не представляет для практики существенного интереса.

Помимо математического ожидания важное значение имеют также другие числовые случайной величины - моменты.

Понятие момента широко применяется в механике для описания распределения масс (статистические моменты, моменты инерции и т.д.). Совершенно теми же приемами пользуются в теории вероятностей для описания основных свойств распределения случайной величины. Чаще всего применяются на практике моменты двух видов: начальные и центральные.

Начальным моментом s-го порядка прерывной случайной величины Х называется сумма вида

Очевидно это определение совпадает с определением начального момента порядка s в механике, если на оси абсцисс в точках х 1 , …, хn сосредоточена масса р1 , …, рn .

Для непрерывной случайной величины Х начальным моментом s-го порядка называется интеграл

Очевидно, что

т.е. начальный момент s-го порядка случайной величины Х есть не что иное, как математическое ожидание s-ой степени этой случайной величины.

Перед тем как дать определение центрального момента введем понятие "центрированной случайной величины".

Пусть имеется случайная величина Х с математическим ожиданием m x . Центрированной случайной величиной, соответствующей величине Х, называется отклонение случайной величины Х от её математического ожидания

Нетрудно видеть, что математическое ожидание центрированной случайной величины равно нулю.

Центрирование случайной величины равносильно переносу начала координат в точку, абсцисса которой равна математическому ожиданию.

Центральным моментом порядка s случайной величины Х называется математическое ожидание s-ой степени соответствующей центрированной случайной величины:

Для прерывной случайной величины s-й центральный момент выражается суммой

а для непрерывной - интегралом

Важнейшее значение имеет второй центральный момент, который называют дисперсией и обозначают D[X]. Для дисперсии имеем

Дисперсия случайной величины есть характеристика рассеивания, разбросанности значений случайной величины около её математического ожидания. Само слово "дисперсия" означает "рассеивание".

Механической интерпретацией дисперсии является не что иное, как момент инерции заданного распределения масс относительно центра тяжести.

На практике часто применяется также величина

называемая средним квадратичным отклонением (иначе - "стандартом") случайной величины Х.

Теперь перейдем к рассмотрению характеристик систем случайных величин.

Начальным моментом порядка k,s системы (Х, Y) называется математическое ожидание произведения X k и Y s ,

xk,s =M.

Центральным моментом порядка k,s системы (Х, Y) называется математическое ожидание произведения k-ой и s-ой степени соответствующих центрированных величин:

Для прерывных случайных величин

где р ij - вероятность того, что система (Х, Y) примем значения (xi , yj ), а сумма рассматривается по всем возможным значениям случайных величин X,Y.

Для непрерывных случайных величин

где f(x,y) - плотность распределения системы.

Помимо чисел k и s, характеризующих порядок момента по отношению к отдельным величинам, рассматривается ещё суммарный порядок момента k+s, равный сумме показателей степеней при Х и Y. Соответственно суммарному порядку моменты классифицируют на первый, второй и т.д. На практике обычно применяются только первые и вторые моменты.

Первые начальные моменты представляют собой математические ожидания величин Х и Y, входящих в систему

у1,0 =mx у0,1 =my.

Совокупность математических ожиданий m x , my представляет собой характеристику положения системы. Геометрически это координаты средней точки на плоскости, вокруг которой происходит рассеивание точки (Х, Y).

Важную роль на практике играют также вторые центральные моменты систем. Два из них представляют собой дисперсии величин Х и Y

характеризующие рассеивание случайной точки в направлении осей Ox и Oy.

Особую роль играет второй смещенный центральный момент:

называемый корреляционным моментом (иначе - "моментом связи")случайных величин Х и Y.

Корреляционный момент есть характеристика системы случайных величин, описывающая, помимо рассеивания величин Х и Y, еще и связь между ними. Для того, чтобы убедиться в этом отметим, что корреляционный момент независимых случайных величин равен нулю.

Заметим, что корреляционный момент характеризует не только зависимость величин, но и их рассеивание. Поэтому для характеристики связи между величинами (Х;Y) в чистом виде переходят от момента K xy к характеристике

где уx , уy - средние квадратичные отклонения величин Х и Y. Эта характеристика называется коэффициентом корреляции величин Х и Y.

Из формулы (3) видно, что для независимых случайных величин коэффициент корреляции равен нулю, так как для таких величин kxy =0.

Случайные величины, для которых rxy =0, называют некоррелированными (несвязанными).

Отметим однако, что из некоррелированности случайных величин не следует их независимость.

Коэффициент корреляции характеризует не всякую зависимость, а только так называемую линейную зависимость. Линейная вероятностная зависимость случайных величин заключается в том, что при возрастании одной случайной величины другая имеет тенденцию возрастать (или же убывать) по линейному закону. Т.о., коэффициент корреляции характеризует степень тесноты линейной зависимости между случайными величинами.

Для определения коэффициента корреляции имеется несколько методов. Однако мы приведем пример с использованием коэффициента корреляции смешанных моментов Пирсона, где

с применением таблицы данных (в нашем примере относительного содержания Т-лимфоцитов в % и уровня IgG в г/л):

Подставив полученные значения в формулу (4), получим

Т.е., коэффициент корреляции динамики Т-лимфоцитов и иммуноглобулина G у детей при перитонитах равен 0,9933, что говорит о высокой связи между данными показателями.