August 21, 2006

Ковариация, корреляция и вычисление дисперсии портфеля

Итак, перейдем к вычислению средней доходности, дисперсии и стандартного отклонения для портфеля акций, состоящего на 60% из акций А и на 40% из акций В. Мы предполагаем, что доходность по каждой из акций А и В - это случайные величины R A и RB.

Среднее значение доходности акции А равно 10%, со стандартным отклонением 8,66%. Среднее значение доходности акции В равно 15%, со стандартным отклонением 12%.

Теперь нас интересует, каково будет среднее значение доходности портфеля и стандартное отклонение для портфеля. Вопрос средней доходности портфеля решается просто. А вот стандартное отклонение - показатель уровня изменчивости доходности портфеля, не отражает средней изменчивости доходности его компонентов (акций). Причина в том, что диверсификация снижает изменчивость, так как цены различных акций изменяются неодинаково. Во многих случаях снижение стоимости одной акции компенсируется ростом цены на другую.

Continue reading "Ковариация, корреляция и вычисление дисперсии портфеля"

Posted by mazoo at 12:43 PM | Comments (0)




August 16, 2006

Вычисление коэффициента вариации

Допустим ,что наш портфель ценных бумаг состоит на 60% из акций А и на 40% из акций В. Мы предполагаем, что доходность по каждой из акций А и В - это случайные величины RA и RB.

Для начала, давайте вычислим среднее значение и дисперсию для акции А. Допустим, что акция А имеет следующее распределение вероятности для доходности:

Доходность                Вероятность
(-5%)                                  20%
10%                                    50%
20%                                    30%

Формула для среднего значения RA:

 

Вычислим: rA = (-5%)*0.2 + 10%*0.5 + 20%*0.3 = 10%

Формула для вычисления дисперсии RA:

 
Вычислим: = (-5-10)(-5-10)*0.2 + (10-10)(10-10)*0.5 + (20-10)(20-10)*0.3 = 75

Стандартное отклонение равно квадратному корню из дисперсии:
= 8.66%

Предположим, что акция B имеет ожидаюмую доходность rB = 15%, со стандартным отклонением доходности 12%.

Стандартные отклонения доходности по каждой из акций A или B отражают степень рискованности инвестиции в данную акцию. Для того, чтобы сравнить степень риска различных акций с различной средней (ожидаемой) доходностью и различным стандартным отклонением доходности, используется понятие коэффициент вариации:
 
Таким образом, для акции A, коэффициент вариации равен: 8.66/10 = 0.866

                           для акции B, коэффициент вариации равен:  12/15 = 0.8
То есть, можно сказать, что акция B имеет меньший риск относительно акции A.


В следующем посте, мы посчитаем среднее значение доходности портфеля состоящего из акций A и B, определим ковариацию и коэффициент корреляции двух акций, и как эти величины влияют на дисперсию и стандартное отклонение доходности портфеля из двух акций.

Posted by mazoo at 2:58 PM | Comments (0)

December 26, 2005

Симплекс метод, пример №2

В прошлом примере мы разобрали пошаговое решение простой задачи линейного программирования в каноническом виде с неотрицательной правой частью в неравенствах ограничений. Рассмотрим более общий случай:

4х1 + 15х2 + 12х3 + 2х4 -> min

2x2 + 3x3 + x4 >= 1
x1 + 3x2 + x3 - x4 >= 0
x1, x2, x3, x4 >=0

Приведем задачу в следующий вид:

-4х1 - 15х2 - 12х3 - 2х4 -> max

-2x2 - 3x3 - x4 <= -1
-x1 - 3x2 - x3 + x4 <= 0
x1, x2, x3, x4 >=0

Введем переменные S1, S2 >= 0, тогда задача примет стандартный (канонический) вид:

-4х1 - 15х2 - 12х3 - 2х4 -> max

0x1 - 2x2 - 3x3 - x4 + 1s1 + 0s2 = -1
-x1 - 3x2 - x3 + x4 + 0s1 + 1s2 = 0
x1, x2, x3, x4, s1, s2 >=0

Составим симплекс таблицу (кликните для увеличения):

симплекс таблица
1 шаг
: В строке Cj выписываем коэффициенты целевой функции при переменных x1, x2, x3, x4, s1, s2. В строках 1,2 - коэффициенты при соответсвующих переменных из уравнений ограничений. В столбце RHS (right hand side), в строках 1, 2 пишем числа -1 и 0 из правой части уравнений ограничений. Переменные, образующие единичную матрицу (выделена бежевым) будем называть базисными, в данном случае s1 и s2.

2 шаг: Заполняем столбец CB строки 1, 2 коэффициентами целевой функции при базисных переменных, то есть 0 при s1 в строке 1 (пересечение строки 1 и столбца s1) и 0 при s2 в строке 2.

3 шаг: заполняем строку 3 (Zj) путем перемножения каждого элемента столбца CB на соответствующие элементы строк 1, 2 и сложением. То есть первый элемент строки Zj получается как: 0*0 + 0*(-1) = 0. Второй как 0*(-2)+0*(-3). В данном случае все элементы строки получаются равными 0. Аналогично получается 0 в столбце RHS.

4 шаг: строка 4 (Cj - Zj) получается почленным вычитанием элементов строки 3 (Zj) из элементов строки Cj (всегда из верхней строки на всех шагах).

5 шаг: Смотрим на элементы RHS выше строки Zj (у нас на строки 1 и 2). Если все элементы RHS неотрицательные, то идем на шаг 5". Если есть хоть один отрицательный элемент, идем на шаг 5'.

5' шаг: В каждой строке 1 и 2 вычисляем соотношения RHS/x, где x пробегает значения той же строки, что и RHS, столбцы x1, x2, x3, x4, s1, s2. Мы ищем МИНИМАЛЬНЫЙ СТРОГОПОЛОЖИТЕЛЬНЫЙ ЭЛЕМЕНТ среди получившихся чисел (то есть мы можем вычислять RHS/x только для х того же знака, что и RHS). В нашем случае:
Строка 1:
столбец х2: (-1)/(-2)=0,5; столбец х3: (-1)/(-3)=0,3333(3); столбец х4: (-1)/(-1)=1;
Строка 2: все соотношения равны нулю.
Минимальный строгоположительный элемент получился в столбце x3. Этот элемент назовем ведущим, у нас -3. В таблице он выделен зеленым цветом. Строка и столбец, содержащие этот элемент называются ведущими.
Идем на шаг 7.

7 шаг: Формируем строки 5, 6 путем деления ведущей строки на ведущий элемент и формирования единичного столбца на месте ведущего). Не забываем RHS.

Сделаем совместно еще одну итерацию. На предыдущем шаге мы заполнили строки 5, 6. Далее выполняем последовательно шаг 2, шаг 3 и шаг 4, получаем новую строку (Cj - Zj), у нас строка 8. Идем на шаг 5 - на второй итерации у нас RHS в строках 5, 6 >0 , значит идем на шаг 5".

5" шаг: Ищем в строке 8 (Cj - Zj) МАКСИМАЛЬНЫЙ СТРОГОПОЛОЖИТЕЛЬНЫЙ элемент. Если такой есть, то ему соответствует ведущий стролбец (у нас x4). Идем на шаг 6. Если в (Cj - Zj) нет строгоположительных элементов, то идем в конец.

6 шаг: Ищем в ведущем столбце МИНИМАЛЬНО ПОЛОЖИТЕЛЬНОЕ число из формулы (RHS/ведущий столбец). То есть, в данном случае, выбираем между 0,33/0,33=1 и 0,33/1,33=0,25. Найдя такое число, определяем ведущую строку, у нас строка 6. Пересечение ведущих столбца и строки дает нам ведущий элемент, в нашем случае 1,33 (выделен зеленым). Идем на шаг 7.

Конец: итерации продолжаются до тех пор (в случае, что оптимальное решение задачи существует), пока на шаге 5' или на шагах 5" и 6 мы не сможем отыскать положительного ведущего элемента.

В нашем примере:
Мы сформировали строки 9, 10, 11. RHS (строки 9, 10) неотрицательна, следовательно идем на шаг 5". Число 3,50 - максимальный строгоположительный элемент (стролбец s1), но положительного ведущего элемента в этой строке нет.
Тогда в строке Zj (у нас строка 11) в RHS - столбце получим значение целевой функции в оптимальной точке (x3, x4) = (0,25; 0,25) равное -3,5. Значения 0,25 и 0,25 получаем из RHS в строках 9, 10.

Posted by mazoo at 2:36 PM | Comments (22)

March 29, 2005

Что такое "кривая обучения" (learning curve)

Данная статья отвечает на вопросы, возникшие к предыдущей статье о кривых обучения.

Кривая обучения (learning curve) является графическим представлением модели, которая описывает зависимость производительности труда от объема выпуска.
В основе этой модели лежит предположение, что при совершении повторяющихся действий продуктивность повышается неким постоянным и предсказуемым образом, каждый раз, когда количество выпуска удваивается. Чаще всего модели кривой обучения рассматриваются в контексте продуктивности (производительности) труда, которую можно измерить как количество выпущенной продукции в единицу времени.

Таким образом, кривая обучения (learning curve) -- это функция, показывающая, как с увеличением выпуска уменьшается количество часов, требующихся для производства единицы продукции.

Для описания характера снижения трудозатрат на единицу продукции в зависимости от объема выпуска существуют используют следующие модели:

Первая модель:
1. Интегральное среднее время на единицу выпуска (cumulative average time per unit) уменьшается на определенный процент каждый раз, когда выпуск удваивается.
Если требуется 100 часов, чтобы произвести 1 деталь, тогда (для 80% кривой обучения) интегральное среднее время на единицу выпуска для производства двух деталей будет 100-20%=80 часов. Следовательно, общее время на производство 2 (двух) деталей будет 80*2=160 часов. Таким образом, на производство второй детали было затрачено только 160-100=60 часов.

Пример 1:
Объем выпуска         Общие затраты на труд
10                                $120
20                                $192

Найдем ставку кривой обучения:

Интегральные средние трудозатраты на единицу выпуска для 10 единиц продукции равны 120/10=12 $;
Интегральные средние трудозатраты на единицу выпуска для 20 единиц продукции равys 192/20=9.6 $;

Пусть x - ставка кривой обучения, тогда
12*x=9.6
x=0.8 (или 80%)
Следовательно, эта компания показывает 80% -ную кривую обучения в соответствии с первой моделью.

Вторая модель:
2. Время на производство дополнительной единицы продукции (incremental unit time) уменьшается на определенный процент каждый раз, когда выпуск удваивается.
Если требуется 100 часов, чтобы произвести 1 деталь, тогда (для 80% кривой обучения) время на производство дополнительной единицы продукции , то есть для производства второй детали будет 100-20%=80 часов. Следовательно, общее время на производство 2 (двух) деталей будет 100+80=180 часов.

Пример 2:
Объем выпуска         Общие затраты на труд
10                                $120
20                                $192

Найдем ставку кривой обучения:

Затраты на оплату труда для производства 10 единиц продукции составили 120 $;
Затраты на оплату труда для производства следующих десяти единиц продукции (от 10 до 20) составили 192-120=72 $;

Пусть x - ставка кривой обучения, тогда
120*x=72
x=0.6 (60%)
Следовательно, эта компания показывает 60% -ную кривую обучения в соответствии со второй моделью.

Posted by mazoo at 4:35 PM | Comments (4)

March 26, 2005

Простая Линейная Регрессия, Часть 2

Первая Часть

В Части 1, мы получили уравнение линейной регрессии для следующей задачи:

Некая фирма решила использовать модель линейной регрессии для определения зависимости вида y = a + bx между годовым объемом продаж и годовыми расходами на рекламу. За предшествующие годы была собрана следующая статистика.

Мы получили уравнение линейной регрессии:

y = f(x) = 4.2 + 0.31x

Пусть y' есть среднее арифметическое результатов наблюдений, т.е.

y' = (y1 + y2 + y3 + y4 + y5)/5

1. Оценка дисперсии случайной ошибки (оценка дисперсии годового объема продаж) S2 равна:
variance_of_estimate.gif

где n = 5 число наблюдений, k = 1 число независимых переменных в модели линейной регрессии (у нас только x).
n-k-1 называют количеством степеней свободы.

Получаем S2 = 2.624

Величину S называют стандартной ошибкой регрессии, она равно квадратному корню из величины S2. В нашем примере, стандартная ошибка регрессии
S = 1.62

2. Дисперсия регрессионного коэффициента a равна Sa2:

variance_of_a.gif

Sa2 = 6.216

Sa - стандартная ошибка регрессионного коэффициента a равна квадратному корню из дисперсии a , то есть
Sa = 2.49

3. Дисперсия регрессионного коэффициента b равна Sb2:

variance_of_b.gif

Sb2 = 0.002332

Sb - стандартная ошибка регрессионного коэффициента b равна квадратному корню из дисперсии b , то есть
Sb = 0.0483

4. Коэффициент детерминации r2:
determination.gif

r2 = 0.9328

r - коэффициент корреляции, r = 0.9658

Коэффициент корреляции показывает силу линейной зависимости между зависимой переменной х и независимой переменной у. Значение r=1 (-1) свидетельствует о прямой (обратной) линейной зависимости между x и y. Коэффициент корреляции r = 0 свидетельствует об отсутствии линейной зависимости между переменными.

Коэффициент детерминации r2 интерпретируется как процент дисперсии зависимой переменной y, объясненный дисперсией независимой переменной x. То есть дисперсия годовых продаж равна 93.28% от дисперсии годовых расходов на рекламу.

5. Доверительный интервал для значений параметра b (совершенно аналогично для других параметров):
interval.gif

Если мы хотим построить 90%-ный доверительный интервал для b, нам нужно табличное t- значение статистики Стьюдента (t - критерий Стьюдента):
t(5-1-1,(1-0.90)/2) = t(3 , 0.05) =2.35

Таким образом, фирма может быть на 90% уверена, что значение параметра b будет в пределах доверительных границ:

(0.1965; 0.4235)

Доверительный интервал с уверенностью "на две трети" лежит (приблизительно) в пределах одной стандартной ошибки от среднего. Таким образом, если расходы на рекламу составят $40 000 (40 тысяч) в год, то с вероятностью 2/3 годовые продажи попадут в интервал:

( 4.2+0.31*40 – 1.62; 4.2+0.31*40 + 1.62)
или
(14.98; 18.22)
или
($14 980 000; $18 220 000).


Предыдущая часть

Posted by mazoo at 2:03 PM | Comments (4)

March 3, 2005

Простая Линейная Регрессия, Часть 1

Первый экзамен CMA в разделе "Численные методы" (Quantitative methods), включает в себя задачи на линейную регрессию. Обычно в тестовых вопросах не требуется громоздких вычислений, так как необходимые параметры чаще всего уже даны в условии задачи, но необходимо увязать их между собой, что мы и сделаем на примере. На основании статистических наблюдений мы выведем функцию линейной регрессии, коэффициенты линейной регрессии, вычислим коэффициент детерминации, доверительные интервалы для параметров модели и т.д.

Некая фирма решила использовать модель линейной регрессии для определения зависимости вида y = a + bx между годовым объемом продаж и годовыми расходами на рекламу. За предшествующие годы были собраны следующие данные:

Объем продаж (млн. $) (yi) Расходы на рекламу (тыс. $) (xi)
2871
1431
1950
2160
1635

1. Найдем линейную теоретическую функцию регрессии y = a + bx и параметры линейной регрессии (коэффициенты регрессии) a и b, используя метод наименьших квадратов. Для этого надо решить следующую систему уравнений:

regression_equation.gif

В нашем случае n=5 - число наблюдений и:

Regression_sums.gif

Подставив эти значения в вышеуказанные уравнения:

98 = 5a + 247b
5192 = 247a + 13327b

Решив эту систему относительно a и b, получим a=4,2 и b=0,31. Таким образом, ожидаемые продажи будут составлять 4.2 плюс 0.31 умножить на рекламный бюджет,

y = 4,2 + 0,31x

То есть, если расходы на рекламу на следующий год составят $40 000, то можно ожидать, что продажи составят $16 600 000.

На графике наблюдения и функция регрессии выглядят следующим образом:

Resression.gif

a называется постоянным коэффициентом линейной регрессии, а b переменным коэффициентом линейной регрессии.

Итого, в Части 1 из статистических данных мы получили:
- теоретическую функцию регрессии,
- постоянный и переменный коэффициенты регрессии.

В Части 2 мы получим:
- средние квадратические отклонения ошибок коэффициентов регрессии,
- коэффициент детерминации r2,
- доверительные интервалы для оценки значимости параметров модели.

Posted by mazoo at 11:13 PM | Comments (2)

January 19, 2005

График кривой обучения (learning curve)

Кривая обучения (learning curve) отражает увеличивающуюся производительность при выполнении задач с увеличением опыта. Пусть задачей является выпуск продукции.

Стандартное предположение состоит в том, что интегральное среднее время на единицу выпуска (cumulative average time per unit), то есть среднее по совокупности единиц продукции, уменьшается на определенное количество процентов каждый раз при удвоении объема выпуска.

Рассмотрим 75% -ную модель со следующими исходными данными:

Объем выпуска (нарастающим итогом)Cumulative average time per unit - время на единицуИтого - общее время на выпуск
80564 480
16042 (56*0,75)6 720
32031,5 (42*0,75)10 080
64023,625 (31,5*0,75)15 120


Для выпуска 80 единиц продукции по 56 часов на единицу потребовалось 4 480 часов, а для выпуска 160 единиц по 42 часа потребовалось 6 720 часов. Таким образом на производство дополнительных 80 единиц (от 81 до 100) потребовалось 2 240 часов, то есть в среднем 2 240/80 = 28 часов на единицу. Следовательно, также, признаком данной модели о кривых обучения (learning curve model) является то, что incremental unit time (время на производство дополнительной единицы продукции) уменьшается при удвоении выпуска. Судя по тестовым вопросам, существуют модели кривой обучения, в которых начальным предположением является уменьшение на определенный процент именно добавочного времени - их надо решать аналогично нашей модели, где уменьшается интегральное среднее время.

Из приведенной выше таблицы получаем формулу кривой обучения - зависимость общего времени на выпуск от количества выпущенной продукции:

F(x) = 0.75^( ln(x/80) /ln (2) ) * 56 * x, где

0,75 - процентная ставка кривой обучения;
80 - величина начальной партии продукции;
ln(x/80) /ln (2) - преобразованный для удобства вычисления логарифм (x/80) по основанию 2 , который является выражением для степени 0,75 для соответствующего выпуска (например, для 320 этот логарифм равен 2, что мы и видим в таблице);
56 - начальное время на единицу продукции.

Итого получаем следующий график:
Learning-curve.gif

Posted by mazoo at 5:06 PM | Comments (0)

January 18, 2005

Пример задачки на симплекс-метод

Рассмотрим простой пример решения задачки с помощью симплекс-метода для запоминания последовательности действий.

Некая компания производит большие и маленькие садовые скамейки. Каждая скамейка должна быть построена и отполирована. На постройку маленькой скамейки уходит 2 часа, на полировку 3 часа. На постройку большой уходит 4 часа, на полировку 3 часа. Строительный цех работает 100 часов в неделю, а полировочный 90. Прибыль, получаемая с маленькой скамейки составляет 5$, а с большой 7$. Сколько скамеек каждого вида должна производить компания для максимизации прибыли?

Пусть фирма производит X маленьких и Y больших скамеек. Тогда для решения задачи необходимо найти такие X и Y, что:

5X + 7Y - > max
2X + 4Y < = 100
3X + 3Y < = 90,
X , Y > = 0

Введем переменные S1, S2 >= 0, тогда задача примет стандартный (канонический) вид:
5X + 7Y +0S1 + 0S2 - > max
2X + 4Y +1S1 + 0S2 = 100
3X + 3Y +0S1 + 1S2 = 90,
X , Y, S1, S2 > = 0

Рассмотрим решение этой задачи, используя симплекс таблицу. Данное решение подходит для всех случаев, когда правая часть уравнений ограничений неотрицательна (90 и 100 в нашем примере). Если правая честь уравнений ограничений, после приведения задачи к каноническому виду, содержит отрицательные числа, то используйте вариант решения, разобранный во втором примере.

Составим симплекс-таблицу:
Simplex.jpg

1 шаг: В строке Cj выписываем коэффициенты целевой функции при переменных X, Y, S1, S2. В строках 1,2 - коэффициенты при соответсвующих переменных из уравнений ограничений. RHS (столбец right hand side :-) ) , в строках 1, 2 пишем числа 100 и 90 из правой части неравенств ограничений. Переменные, образующие единичную матрицу будем называть базисными, в данном случае S1 и S2.

2 шаг: Заполняем столбец CB строки 1, 2 коэффициентами целевой функции при базисных переменных, то есть 0 при S1 в строке 1 (пересечение строки 1 и столбца S1) и 0 при S2 в строке 2.


3 шаг: заполняем строку 3 (Zj) путем перемножения каждого элемента столбца CB на соответствующие элементы строк 1, 2 и сложением. То есть первый элемент строки Zj получается как: 0*2 + 0*3 = 0. В данном случае все элементы строки получаются равными 0. Аналогично получается 0 в столбце RHS.

4 шаг: строка 4 (Cj - Zj) получается почленным вычитанием элементов строки 3 (Zj) из элементов строки Cj (всегда из верхней строки на всех шагах).

5 шаг: Ищем в строке 4 (Cj - Zj) МАКСИМАЛЬНЫЙ СТРОГОПОЛОЖИТЕЛЬНЫЙ элемент. Ему соответствует ведущий стролбец. В данном случае, в строке 4 выбираем элемент 7, следовательно ведущим будет столбец Y (строки 1,2).

6 шаг: Ищем в ведущем столбце МИНИМАЛЬНО ПОЛОЖИТЕЛЬНОЕ число из формулы (RHS/ведущий столбец). То есть, в данном случае, выбираем между 100/4=25 и 90/3=30. Найдя такое число, определяем ведущую строку, у нас строка 1. Пересечение ведущих столбца и строки дает нам ведущий элемент, в нашем случае 4.

7 шаг: Формируем строки 5, 6 путем деления ведущей строки на ведущий элемент и формирования единичного столбца на месте ведущего). Не забываем RHS. Далее следуем на шаг 2.

Итерации продолжаются до тех пор, пока в строке (Cj - Zj) не останется положительных элементов (в случае, что оптимальное решение задачи существует).

Тогда в строке Zj (у нас строка 11) в RHS - столбце получим значение целевой функции в оптимальной точке (X, Y) = (10, 20). Значения 10 и 20 получаем из RHS в строках 9, 10.

Posted by mazoo at 5:32 PM | Comments (52)