天天向上教育网

):对正态分布函数的图形,是对称图形 Symmetrical

简介: ):对正态分布函数的图形,是对称图形 Symmetrical ,所以偏度skewness=0;也学习过峰度kurtosis=3如果随机变量X服从正态分布,随机变量Y服从正态分布,那么X和Y的线性组合也服从正态分布永远不

PATR 1 货币的时间价值 Time value of Money金融学基本假设 货币是有时间价值的(1)只是假设 金融学基础(2)货币用于投资或者再生产中(3)货币投资会产生正向价值 也就是会盈利引出问题:如何度量这个价值 ---利率如何计算不同时间点价值----终值和现值核心知识点: 1、利率 2、 终值和现值三个角度理解利率interest rate 利率required rate of return 最低回报率 投资者投资可以接受的最低的回报率discount rate 折现率 折现未来现金流的利率(货币具有时间价值 现在和未来之间的折算)不同时间点现金流不能相加减,折现到t=0 未来现金流折现后求和opportunity cost 机会成本 放弃未来的可能收益就是决策的机会成本。

利率的组成:1、名义利率real risk-free interest rate 实际无风险利率 不考虑通货膨胀因素inflation premium 通货膨胀溢价名义利率 ≈ 实际无风险利率+通货膨胀溢价2、风险资产收益率 riskpremium(风险溢价) 补偿投资者承担的风险default risk premium 违约风险溢价 到期无法偿还风险 只要违约,就是违约风险liquidity premium 流动性风险溢价 流动性风险:短期内无法将资产按照市场公允价值迅速变现的风险 如:国债流动性风险低于个人欠条的 市场交易的活跃程度,持有资产迅速变现的能力,看供给情况maturity premium 期限风险溢价 一般情况下,期限越长利率越高,例如长期国债利率高于短期的 夜长梦多利率=实际无风险利率+通货膨胀溢价+违约风险溢价+流动性风险溢价+期限风险溢价计息方式simple interest 单利 compounding interest 复利 考虑了时间因素各种金融机构提及的利率如无特别提及,都是复利复利模式下:stated anuual interest rate / quoted interst rate 报价利率非1年内真实利率,要关联报价次数Effective Annual Rate ,EAR 有效年利率rs为报价利率 m为1年内的计息次数1年内计息次数趋于无穷,连续复利continuous compounding(在100%的报价利率下,无穷次数计算复利1年内1块钱最多可以变成多少钱)e为“欧拉数” e=2.71828present value ,PV 现值 future value ,FV 终值r为给定利率 n为计息周期数 关键点:复利计息如果是一年复利多次,rs 为报价利率 ,m为1年内的计息次数,N为年份,将EAR概念代入,得到:如果1年为无限次复利,rs为报价利率,N为年份代入连续复利公式:一定要先画现金流量图 这是必考题!

画图计算方法: 0时刻为当前时间点,标出不同时间点的现金流,用箭头表示折算的方向; 在进行终值和现值计算是,不一定非要折算到0时刻或者从0时刻开始折算,任何一期都可以。

比如一家基金,预期第五年磨将收到一笔钱,需要计算这笔钱在第15年后的终值,计息的起点就是第五年,计息期是10年而不是15年。

Anuuity 年金 广义:等额且定期支付的一系列现金流,例如:养老金发放、分期付款、分期还贷等。

A为每期年金金额,r为有效利率, n为年金期次等比数列求和的公式:S=a1*[(1-q^n)/(1-q)] 可以认为a1=A/(1+r),q=1+r,代入后得到上面终值计算公式r为计息期利率 n为计息期数 括号内成为年金终值系数。

普通年金的现值计算通过上两个公式可以得出[也可以认为从最后一期A向前折算,最后一期折算到第0期就是 A/(1+r)^n,也就是PV=A/(1+r)+A/(1+r)^2+...+A/(1+r)^n )]:计算月供:FA=-R (R为贷款金额);r为计息期利率; n为分期期数;PV=0;可以计算出分期还款金额A 。

计算器计算:N=n;I/Y=r=R(报价利率)/m(计息次数);PV=-R;FV=0,求PMT先付年金的现值计算:可以认为是第一期年金和一个普通年金现值之和在计算不规则现金流时,就只能依靠逐一计算单独现金流现值,再相加永续年金的现值:n趋向于+∞,上述公式可以计算为:永续年金现实中的产品例子:a consol bond永续债券--无到期日不可赎回源源不断支付利息例题:每年支付100英镑,年回报率5%的永续年金,可以折算出其现值为2000英镑 (PV=100/5%)例题1:丰田汽车2018年销量896辆,2012年销量为735,求这六年的复合增长率。

解:N=6;PV=735;FV=-896;P;MT=0;计算得出I/V=3.36% 注意:PV正数意思是投资金额或现有资产 FV负数就是收回投资或收回资产例题2:一千万在7%的复利下,多久可以成为两千万?

解:PV=-(8788-1000)=-7788;N=24;PMV=8788/24=366.17;FV=0;计算器得到月度利率为0.98%,年化有效利率=(1+0.98%)^12-1=12.91%PATR 2 数据的整理、可视化和描述数据分类(变量 variable、观测值 observation)数值型数据 Numerical Data(也称:定量数据 Quantitative Data)连续数据 continuous data :变量可以在一个特定范围内连续取值。

例如:掷骰子出现点数的数据分类数据 Categorical data (也称:定性数据 Qualitative Data)名义数据 nominal data : 分类不涉及排序排序数据 ordinal data : 根据数据的某些特征有次序排序截面数据 Cross-Sectional Data 多个观测对象在同一特定时间点一些列取值时间序列数据 Time-Series Data 同个观测对象同一个变量在等时间间距的时间段内的取值面板数据 Panel Data截面数据和时间序列数据的综合形式,通常以数据表格形式呈现结构化数据 Structured Data 数据可以有序组织和储存。

区间尺度零点不具备数学自然数0的 意义,不能乘除。

统计度量:(一)中心趋势度量指标:均值 Mean算数平均数 Arithmetic Mean 计算公式为数据加总平均 总体均值用μ,总体样板数N;样本容量n几何平均数 Geometric Mean算数平均数每个数值相互独立,在计算利率时,每个数值都是相互影响的,下一个数值以上一个为基础,所以要寻找到相关影响的平均数算法,这就是几何平均数。

在几何中,长方形的面积是边长的成绩,开根号可以认为是两个边的平均长度(面积相等的所有长方形中正方形的边长),所以这种计算平均数的方法叫做几何平均数 计算公式为所有的数据相乘然后开方 上面公式的弊端为根号内的计算结果为负,就无法计算,投资事务中,收益率有可能为负,所以计算平均收益率时,将每个参数都加1(收益率最坏就是-100%,+1可以确保都是正数),可得到平均收益率的计算公式: 对投资行业来说,几何平均数比算数平均数更有实用价值调和平均数 Harmonic MeanHarmonc,和声 琴弦长度的数量关系时用到 定投测算平均购买成本就要用到调和平均数 可以解释为:每期定投1元,每期的股价分别是X1,X2,X3...Xi,那么各期购买的股票数量就是1/X1,1/X2,1/X3...1/Xi,相加就是所有的股票数量。

加权平均数 Weighted Mean投资实务中,一个投资组合由不同的资产类别,不同的资产类别有不同的权重和收益率,在计算该组合平均收益率时必须考虑其权重。

调和平均数 ≤ 几何平均数 ≤ 算数平均数 可以通过数学严格证明所有数值完全相同时,三个平均数相等,等号成立数值的离散程度越大,三个平均数的差距越大中位数 Median 一组按顺序排列的数据中位于中间位置的数n为奇数,中位数为位于(n+1)/2位置的数;n为偶数,中位数为处于n/2和(n+2)/2两个位置数的平均值众数 Mode 数据中出现频率最高的数众数可以不止一个,1个为单峰unimodal、2个为双峰bimodal、3个为三峰trimodal,也有不存在众数分位数 Quantile (词根来源:Quanlity )五分位数 Quintiles(词根来源:Quint)四分位数 Quartiles (词根来源:Quarter)十分位数 Deciles (词根来源:Decade)百分位数 Percentiles (词根来源:Percent)分位数的位置计算公式:其中:n观测数量值(+1是为了调整误差,比如n是奇数,中位数位置就是(n+1)/2 )y分位数Ly分位点位置例题分析:<-------------易错、不会题某基金旗下共有15各基金经理,去年收益率按照从小到大排列顺序为-20%、-15%、-13%、-7%、5%、8%、10%、11%、13%、15%、18%、20%、25%、38%、52%,求该基金经理收益率的第2个五分位数。

解: Ly=(15+1)*40/100=6.4 6<6.4<7,第6个数为8%,第7个数为10%, 则 第2个5分位数 即 6.4位置的数 为 8%+(10%-8%)*(6.4-6))=8.8%插值法:假设第10位第11位数字之间的数据呈线性变化,这样就可以将其切成更小的单位。

考察离散程度,就会使用到四组层层递进关系的概念(主要指标: 变异系数 Coefficient of variation):极差 Range数据组中最大值与最小值之差。

平均绝对离差 Mean Absolute Deviation ,MAD和平均数相比,每个具体数值相对于平均数值的差值,即离差。

方差与标准差 Variance and Standard Deviation处理负值的另外一种方法就是取平方,这样就引入了“方差”的概念。

For Population:For Sample:(分母为n-1的原因是很大概率会出现1个非常或者完全接近均值的样本值,拔除这个样本值会更确保样本统计量的无偏性,调整自由度。

在抽样完成后已确定,所以大小为n的样本中只要n-1个数确定了,第n个数就只有一个能使样本符合 /X(X拔) 的数值。

这里,平均数 /X(X拔)就相当于一个限制条件,由于加了这个限制条件,样本方差s的自由度为n-1。

)标准差的量纲与期望均值的量纲相同,更便于比较理解,所以求出方差后再开根号得到标准差:For Population:For Sample:固定代表字母(英文字母--样本量 希腊字母--总体量):重点!

:当给出一组基金(funds 或者 portfolio)的回报率数值求方差标准差时,如果没有说明是选取了一部分数据时,认为是全部的总体值已经收取到,不是样本量不是样本量不是样本量,是总体是总体是总体!

下行标准差 Downside Deviation半方差 Semivariance :小于均值的数值离散度目标半方差 Target Semivariance :比目标值小的数值的离散度相对离散程度 Relative Dispersion延伸出来三个公式(本章重点):切比雪夫不等式 Chebyshev's Ineqaulity切比雪夫不等式:对任意一组观测值,个体落在均值周围k个标准差之内的概率不小于1-1/k^2,对任意k>1。

代表的含义:比如k=2 不管数据怎么分布,落在均值周围2个标准差的概率大于等于(1-1/4)即不小于75%。

常遇到的考试题型:已知k值,求概率P已知均值、标准差、和概率,求范围上下限变异系数 Coefficient of Variation变异系数 Coefficient of variation ,CV 剔除量纲和取值大小的影响。

描述:每单位均值/X(X拔)的标准差s、每单位均值的风险大小-------------每隔几年就考一次性质:(1)剔除了规模(量纲和取值)scale - free(2)相对离散程度 relative dispersion对比不同资产时,对于风险厌恶的投资者而言,变异系数越低越好描述:每单位均值的risk考试题型:给出几组数据CV值,S值 衡量谁的相对/绝对离散程度的值高夏普比率 Sharp Ratio夏普比率 Sharp Ratio 是一个业绩衡量指标,即:单位风险下的超额收益作用: (1)用于资产收益率和期待值(或者标准值 Benchmark)相比较(2)衡量风险率。

Rp代表资产P的收益率 RF代表无风险收益率,σp代表资产P收益率的标准差。

描述:每单位risk的excess return性质:对投资者而言,SR也就是夏普比率越大越好(σp越小,则收益的不确定性越小;Rp高于RF的值越大,收益率越高。

偏度和峰态 Skewness & Kurtosis偏度 Skewness 标红部分经常用于判断左右(正负)偏 的 题型正态分布mean=median=mode正偏(右偏)分布 Positively(Right) Skewned mode

右偏的偏度>0负偏(左偏)分布 Negatively(Left) Skeness mean

左偏的偏度<0对于return distribution来说:右偏 小的损失发生的比较多,可以取到一些极大的收益(极端受益)。

)左偏 小的收益发生的比较多,可以取到一些极大的损失(极端损失)。

标准正态分布的峰度:3峰度 Kurtosis和正态分布(Normal Distribution)的峰度 峰度=3 超峰度=0,比较。

尖峰态 lepkuetic 峰度>3,超峰度>0,尖峰肥尾低峰态 platykurtic 峰度<3, 超峰度<0, 厚峰瘦尾做风控主要研究尾部,对风险厌恶者来说 肥尾代表极端损失和极端获利的可能性高,不喜欢肥尾。

)PATR 3 概率论基础 Founditions of ProbabilityProbability conceptsOdds for or againstMultiplication rule and Addition ruleCalculation rules and correlation***必考Expected return and variance of portfolios***必考Bayes' formula 隔几年考一次Principles of counting 隔几年考一次概率论术语 Terminology of Probability随机变量 Radom Varable 取值不确定的量 一般记为X结果 Outcomes 随机变量产生的的所有可能结果组成的集合叫做样本空间随机 Event 本质是一个集合,可以使样本空间的任意集合之间关系互斥 Mutually Exclusive Events 不可能同时发生的遍历 Exhaustive Events 包含随机变量所有可能结果的独立 Independent Events 一个的发生不影响另一个的发生,两个独立不独立 Dependent Events 一个的发生影响另一个发生,互斥不独立概率的定义:P(E)实际上是一个把映射到概率的函数特征:(1)0≤P(E)≤1 ;(2)一组互斥且遍历的概率和为1:概率的确定方法客观概率 objective probability 用历史数据经验概率 empirical probability 通过历史数据来估算发生的概率分析过去,得到将来先验概率 priori probability 通过逻辑分析来估计发生的概率分析过去,得到过去 | 加逻辑、 贝叶斯公式是典型的先验概率主观概率 subjective probability 只要加入自己的想法,就一定是主观概率通过个人主观判断估计发生的概率赔率 Odds ---常考!

发生的赔率 Odds for the Event E = P(E) / 1- P(E)不发生的赔率 Odds against for the Event E = 1-P(E) / P(E)条件概率 Conditional ProbabilityP(A|B) 在已知B发生的情况下,A发生的概率概率的计算:联合概率 Joint Probability 一组同时发生的概率 P(AB)计算适用乘法法则 Multiplication Rule ;P(AB)=P(A|B)P(B)乘法法则推导过程:先让A发生,得到P(A),再计算A发生之后B发生的概率 P(B|A)加法法则 Addition Rule 适用于A或B至少一个发生的概率P(A or B)=P(A)+P(B)-P(AB)两个法则比对两个:1、A、B是互斥 P(AB)=0 P(A or B)=P(A)+P(B)2、A、B是独立 P(A|B)=P(A) P(B|A)=P(B) P(AB)=P(A)P(B)----非常重要,每年考到!

3、如果A与B互斥,则A、B一定是不独立的 ,相反不一定成立。

考试题型:1、给一段描述计算一个概率 2、给一段描述判断关系(互斥、独立)由乘法和加法法则可以得出 全概率公式:其中A1,A2,...,Aj互斥且遍历分析:A是研究问题中所关注的概率,如果得到新的信息B,可以依据新的信息来更新对A的概率的估计,即P(A|B)。

P(A|B)=P(AB)/P(B)=P(B|A)*P(A)/P(B)随机变量的统计量期望 Expectation1、定义:对于随机变量来说,在某一时刻其取值并不确定,已知的仅是可能的结果以及对应的概率。

在不考虑成本情况下,期望收益应该为加权平均(计算来源于赌博,比如赢的概率是60%,赢20,输的概率40%,输10,则期望的概率(其实就是加权平均)为:60%*20+40%*(-10))2、性质对任意常数:E(cX)=cE(X)对资产组合来说,资产组合收益率的期望等于组合中每个资产收益率的加权平均,权重为资产在组合中的占比。

w1+w2+...+wn=1引出:二叉树工具其中 P(上涨)=60% P(EPS=1|上涨)=30% P(EPS=1 同时 上涨)=60%*30%=18%随机变量的方差与标准差求方差的本质,是求期望---- 对(Xi-/X)^2 的期望 下图黄颜色部分是考点!

如果题目中提到数据的概率(权重)的话,则要用上图 方差的本质的这种计算公式来计算。

(资产配置中,资产A与资产B互相之间的影响)协方差 Covariance 度量不同资产之间的收益率联动性。

比如,两只股票的ruturn为 X、Y,从历史数据看,/X /Y都是向上增长 or 都是向下下滑的,计算出来的协方差Covariance>0。

取值范围:负无穷到正无穷方差Variance的本质为求期望,即Var(X)=E[(X-/X)^2]=E[(X-/X) (X-/X)]协方差的公式就借用了这个公式 即:Cov(X,Y)=E[(X-/X) (Y-/Y)] 也可以反推:自己和自己的协方差就是方差协方差矩阵图如下:如果题目的题干中给出了协方差矩阵图,那么Cov(Ra,Ra)就是Ra的协方差。

展开后的协方差公式就是:相关系数 Correlation 每年必考!

1、公式:(分母是标准差,开根号出来的也就是分母大于0)2、含义:衡量两个随机变量之间的线性关系。

伪相关Spurious Correlation:万物之间有联系,两组毫不相关数据也有可能出现相关关系数据,这样的现向叫做伪相关,比如标普指数和天气投资组合的收益和风险Portfolio Return and Risk投资组合的期望收益 Expected return ---加权平均投资组合风险 (标准差) Standard deviation只考两个资产做组合,做风险(标准差)评估,可以由上推导出:----------必考!

其中:相关系数Correlation:记忆方法:1、完全平方和公式(A+B)^2=A^2+B^2+2AB 其中这个AB相乘时候要加上AB之间的关系系数(协方差)。

2、协方差矩阵图权重、协方差如果是三个资产:考点:1、计算2、结论:把Correlation取出的原因,是因为其范围在[-1,1]之间取值,体现性质:Correlation=+1则两个资产完全正相关,标准差(风险)等于两个资产取权重相加Correlation=-1则两个资产完全负相关,标准差等于两个资产取权重减绝对值,如果此时标准差(代表风险)等于0,表示资产组合完全无风险No riskCrrelation取值+1 时候,组合方差最大,风险最大;Crrelation取值11 时候,组合方差最大小,风险最小。

可以理解成极端风险厌恶者选择资产组合配置时候,尽量选择两两资产的相关系数Correlation趋近于-1,完全线性负相关(比如美金和大宗商品(原油)组合)对于n个资产,对组合方差(风险)有影响的变量:单个资产的权重、单个资产的方差风险、两两资产之间的相关系数。

解:A 测谎仪测出结果为撒谎 B1 嫌犯撒谎 B2嫌犯没撒谎 得到题目符号化: 已知P(B1)=0.8 、P(B2)=1-0.8=0.2 、P(A|B1)=0.85 、P(A|B2)=0.1 求P(B1|A)则:P(B1|A) = P(B1A)/ P(A) P(A)=P(AB1)+P(AB2)【说明:B1、B2互斥且遍历】 =P(A|B1)P(B1)+P(A|B2)P(B2)=0.85*0.8+0.1*0.2=0.7 P(B1A)=P(AB1)=P(A|BI)P(B1)=0.85*0.8=0.68 P(B1|A)=0.68/0.7=97.14%做题方式:公式法:1、设字母 2、字母代入条件 用表达式表达出题干和问题 3、代入公式运算二叉树法计数法则 Role of Counting从n个元素中任取r个元素:组合Combination 不区分取出元素的次序乘法计数法则 Multiplication Role of Counting一项工作分为k个步骤,每个步骤有n(i)个办法,则完成工作的总的办法有n1 * n2 * ... *ni种办法,即办法数量就是每个办法数量相乘。

分房间问题:n! 给n个人分到n个不同房间的办法多项式公式 Multinomial Formula标签问题,将n 个物品分为k类,第i类n i个物品,n1+n2+...+ni=n,方法有n!/(n1! n2! ...ni!)种第i类的ni个物品不用内部排序组合公式 Combination Formula将n个物品分为两类,第1类r个,第2类n-r个2. 排列Permutation 区分取出元素的次序分房间--贴标签--组合(即两种方案的贴标签)---排列(考虑先后顺序的两种标签的贴标签)考试考点:1、分清排列和组合 C 组合 不考虑顺序 ;P 组合 要考虑顺序(order)2、考试只考排列和组合PATR 4 常见概率分布 Probability Distribution对于随机变量--有概率---概率分布图离散型随机变量 Discrete Radom Variable :取值可数Can be countableP(X)=0代表完全不会发生,=1表示一定会发生连续型随机变量 Continuous Radom Variable 不可数(取值无穷) Outcomes is infiniteP(X)=0 即使X发生研究P(X1

(1)伯努利随即变量:P(Y=1)=p P(Y=0)=1-p(1代表完成,0代表失败)-----进行了一次实验(抛了一次硬币)(2)进行n次实验,就是二项式分布 Binormial distribution:公式推导:①实验总数n次,成功x次②计数法则,不考虑顺序,使用组合概念 得到:nCx③单次成功概率p,x次成功概率就是p^x,计入乘法法则④但是不要忘记,还有n-x次没成功,只计算成功次数的概率并不能分化没有成功里面不能有成功的现实,所以一定要追加乘法法则,即单次不成功概率(1-p),x次不成功概率就是(1-p)^(n-x),同样必须就乘法法则。

②计算公式 如上伯努利实验的均值、方差计算方法:P(Y=1)=p P(Y=0)=1-p均值就是每个结果(取值)乘以概率(权重)再求和:E(Y)=1*p+0*(1-p)=p=/Y方差Var(Y)=E[(Yi-/Y)^2]=p*(1-p)^2+(1-p)*(0-p)^2=p(1-p)而二项式分布就是n次单独独立的伯努利实验均值 E(X)=E(Y1)+E(Y2)+...+E(Yn)=p*n方差 Var(X)=n*E(Yi)=n*p(1-p)连续均匀分布 Continuous Uniform distribution1、基本特征: 连续随机变量取值不可数+均匀(取到每个取值的概率是一样的)2、计算:计算概率就是要取上下限,计算出面积就是概率( 连续型变量概率符合概率密度函数F(x) )即:For all a ≤ x1 ≤ x2 ≤ b 全部取值完整范围为a-b时 P(b-a)=1 P(x1≤X≤x2)=(x2-x1)/(b-a) 底乘以高(完整面积是1.完整底是b-a,则高固定为1/(b-a)) P(xb)=0连续性随机变量的 正态分布 Normal Distribution 本章最重点密度函数图形the shape of the density function:基本性质对于正态分布的公式,决定正态分布的变量是均值、方差。

):对正态分布函数的图形,是对称图形 Symmetrical ,所以偏度skewness=0;也学习过峰度kurtosis=3如果随机变量X服从正态分布,随机变量Y服从正态分布,那么X和Y的线性组合也服从正态分布永远不和X轴相交,即概率取值永远大于0置信区间Confidence Intervals定义: 落在 某个区间 的 概率 是多大(也就是切比雪夫不等式的应用,当然,切比雪夫不等式是取了一个极限值,对于标准正态分布,更准确的值如下且满足切比雪夫不等式----- 均值左右各k个标准差的取值概率确定 [μ-kσ,μ-kσ] )有一个k值,就对应一个区间,得到区间概率,常用的4组值为:k=1 对应 P=68% k=1.65 对应 P=90%k=1.96 对应 P=95% k=2.58 对应 P=99%标准化标准正态分布 Standard normal Distributionμ=0 , σ=1 即标准正态分布函数N(0,1),也记为 Z公式变形基础:E(x)=μ 则 E(ax+b)=aE(x)+b=aμ+bVar(x)=σ^2 则 Var(ax)=a^2 * σ^2 ,每组数据加减相同常数的话,不影响离散程度,也就是说常数的方差等于0,所以Var(ax+b)=a^2 * σ^2也就是说对x进行(x-μ)/σ的变形,则回归到标准正态分布!

同样可以理解为:将μ设为新坐标轴的原点,再将x轴的每个单位坐标收束变为1/σ倍调整为标准正态分布的原因为:方便查表,给出一个正态分布表,然后将其标准化,查表得到累计概率Cumulative Probability. 。

注意,查的是累计概率,也就是P(X)考试题型,求概率步骤:①标准化 先看 μ,σ的值(此处注意标准差要方差值开根号!

已知 X∽N(2,9),求 P(3≤x≤4)解:μ=2,σ=9^(1/2)先标准化即 P(3≤x≤4)=Z( (3-2)/3 ≤ y ≤ (4-2)/3 )=Z(0.33≤y≤0.67) 再计算查表求概率 =Z(0.67)-Z(0.33)=0.7486-0.6393=10.93%1:上下限均为正2、上下限均为负:3、上下限一正一负2个推导出的公式:F(-z)=1-F(z)P(Z>z)=1-F(z)分布分为两种类型的分布:单变量 Univariate distribution 比如单只股票的收益分布多项变量 Multivariate distribution 比如标普500考虑同时发生的概率,如果全部服从正态分布那他们的线性组合也符合正态分布。

把两个分布都转化成正态分布,三维空间中,查立体阴影的体积资产收益率多项分布的三类参数:每个资产收益率的均值;每个资产收益率的方差,资产收益率两两之间的相关系数(n 个资产之间的 系数个数为 nC2=n(n-1)/2 )第一安全比率Safety First Ratio亏空风险Shortfall risk :资产收益率在一段时间内低于最低可接受水平的概率。

如果收益率服从正态分布,亏空风险就是P(R

罗伊第一安全比率 Roy's Safety-Firest Ratio ,SF ratio在进行投资时必须最小化亏空风险,也可以通过最大化Roy's Safety-First Ratio 来实现 其中,E(Rp)为资产p的均值,RL为资产p的最低收益接收水平,σp是资产p的标准差。

与Sharp tatio夏普比率相对照,当RL=RF(期待值、期待收益率)时,第一安全比率就是夏普比率。

) 对于SF ratio 来说,值越大,客户面对的低于最低要求回报率的概率越小。

对数正态分布Lognormal Distribution性质特征:如果 lnX 服从正态分布,则X服从对数正态分布 (不要记反了!

) lnX∽N => X∽log正偏(右偏)Right skewed / Positive skewed (右长尾 偏度>0 mode

反顾EAR 和 HRD (了解即可)参照EAR (Effective Annual Rate有效年利率)EAR是离散数据分布 ,当计息期数趋于无穷:而股票的Return(视为连续复利) 的HPR (Holding period Return持有期利率)可以推导出相对于总体参数的正态分布,当向样本数量选取时候,有三种分布:学生t分布 Students t-Distribution 特征如下:有且只有一个参数自由度,此分布的自由度是指在计算样本统计量能自由取值的个数其概率密度函数 Probability Density Function ,PDF的图是对称的钟形曲线,相对于正态分布尖峰肥尾,即偏度Skewness>0、峰度 kurtosis>3当t分布的自由度增加并趋于无穷大时,PDF无限趋近于标准正态分布卡方分布 Chi-Squar Distribution 特征如下:概率密度函数(Probability density Function,PDF)非对称Chi-Squar Distribution的自由度是n-1 (n是Sample statistics 的个数)Chi-Squar Distribution的样本取值不取负值当自由度增大,PDF趋向于钟型F分布 F-Distribution 特征如下:F分布是以0为界的非对称分布,有两个自由度定义,称为分子自由度和分布自由度当两个随机变量X1 ,X2服从卡方分布,自由度分别是m,n,则随机变量F=(X1/m)/(X2/n)服从F分布,且服从分子自由度是m,分母自由度是n的F分布当自由度增大,PDF图形趋于钟形模拟 Simulation1、定义:用一组数据模拟出值举例:有金融产品定价的核心公式(未来现金流折现求和)中核心参数r。

2、需要掌握的模拟方式:历史模拟 Historical Simulation也就是用历史数据推导模拟。

蒙特卡洛模拟 Monte Carlo Simulation如果全部使用历史数据进行模拟,缺陷明显,这时候加入相关极端数据的取值,进行全面的假设分布。

--->全面可能情况,假设出分布,也就是蒙特卡洛Simulation应用:养老规划基金经理,考虑到生存年龄所有可能特征:①给予假设出来的分布 Based on their assumed distributions②缺陷:加入假设,相对来说比较复杂 It's fairly complex不是统计出来的结果,不能确定可分析意义两个模拟办法优点缺陷互补PART 5 抽样与估计 Sampling & Estimation1.Sampling:Simple radom and stratif radom samplingTime-series and cross-sectional dataCeal limit theoremStandard error of the sample mean2.EstimationThe desirable peroperties of an estimatorConfidence interval estimate3.Student‘s t-distribution4.Five kinds of biases一、抽样概率抽样 Probability Samples简单随机抽样Simple Radom Sampling公平原则:每个个体被抽中的概率是一样的分层随机抽样Stratif Radom Sampling 先划分不同类别,每个类别进行简单抽样得到样本整群抽样Cluser sampling将总体划分成子总体非概率抽样 Non-Probability Samples便利抽样Convenience Sampling依据得到数据的容易程度挑选样本判断抽样Judgmental Sampling依据专业和指示选择性挑选样本抽样误差 Sampling error 抽样误差只能在一定程度上减少而无法避免sampling error of the mean = sample mean - population mean 抽样误差均值等于样本均值减去总体均值最重要一句话:样本统计量(/X ,X拔,样本均值)本身就是一个随机变量,因而存在概率分布 The sample statistic itself is a radom variable and has a probability distribution抽样偏差Sampling Bias在抽样过程中有可能产生各种偏差,从而基于样本得出错误的结论数据挖掘偏差 Data-snooping Bias把偶然当必然样本选择偏差 Sample Selection Bias由于这样那样的原因排除了一些样本数据,比如进不去马云的豪宅排除了其情况而推导的豪宅情况幸存者偏差Survivorship Bias 取得信息的渠道,仅来自于幸存者,信息与实际情况不同,未幸存者已无法发声。

Heedeg fund 对冲基金收益(无法继续的基金无法选择)前视偏差Look-Ahead Bias使用了预测时候尚且不确定的信息,在这个时间点用的数据得不到,未来才能得到。

比如对财报数据(次年年报推迟披露)的使用时间段偏差Time-Period Bias时间段偏差结论只在特定时间段成立,不能推广到所有时期抽样数据的分类时间序列数据 Time-series data 特征:同一公司,不同时间的数据剖面数据(横截面数据)Cross-sectional data 特征:同一时间,不同公司的数据二、估计估计方法,在取样之后,就要对样本统计量进行估计,推导总体参数。

估计的方法有:点估计Piont Estimate表述:利用样本统计量Sample Statistic 来估计总体参数Parameter,也就是用样本均值/X来估计总体均值μ。

估计量的判断标准(一个好的估计量应该有什么性质)Desirable Properties of Estimator:①无偏性 Unibiasedness:E(/x)=μ 样品本统计量的期望值等于总体参数②有效性 Efficiency 在所有无偏样本统计量中,方差最小的最有效(离散程度更小,紧紧围绕在均值附近)。

③一致性 Consistency 当样本容量增大时,样本统计量逼近总体参数的概率上升(注意是逼近的概率上升),当样本容量增大时,标准误的值变小,一致性更好。

点估计方法(看样本均值服从什么样的分布):中心极限定理Ceal Limit Theory ---大重点Ceal Limit Theory 讲的是/X服从什么样的分布定理都是有条件的,ceal limit theory的条件:n≥30 样本容量Slection of Sample Size足够大总体均值、方差是已知的,即μ,σ^2已知。

结论:/x∽N 样本均值服从正态分布样本均值服从正态分布,对此正态分布,该分布的均值=μ(Unbiasedness 满足无偏性),该分布的方差=σ^2/n,即:σ/(n^0.5)称为标准误 (样本均值的标准差)Standard Error--每年都考!

方式:取/X 的无偏性。

考点:①计算②宽度受哪些变量的影响 正相关:K σ 负相关:n其中:k的取值叫做置信度 Degree of confidencek值确定后,双尾被分开,被排除的尾巴面积成为显著性水平Significance level,记做ɑ.题目中经常给出置信度水平Significance level也就是ɑ的取值,要计算出执行区间Degree of cinfidence:k+ɑ=1 t分布 Student's t-distribution基本性质:PDF概率密度函数图形对称 symmertica(无偏)决定t分布的自由度Dgree of Freedom,df =n-1t分布相对于正态分布,它属于低峰肥尾(离散程度也就是方差一样情况下出现尖峰肥尾)-------非常重要低峰代表:峰度kurtosis<3 肥尾代表:方差(离散程度)比较大,也就是σt>1当自由度df增大时,t分布逐渐接近于正态分布,峰度变高,尾部变小,t分布方差变小并趋近于1正态分布可以视为t分布的特殊极端情况在相同的Significance level 显著性水平下,t分布的置信区间宽于正态分布确定置信区间,如何判断是使用正态分布还是t分布1、方差已知 用Z2、 方差未知 用t2、非正态总体小样本不可估计3、n>=30,任何情况均可用Z根据中心极限定理的条件(1、样本空间足够2、均值方差已知):点估计测量判断标准考量一致性,需要样本空间足够大,小样本总体不适用Z分布正态分布满足无偏和有效 正知Z不知踢t不正又小不做足够大必做PART 6 假设检验 Hpthothesis testing 难点 重点!

====核心思想类似于反证法逻辑性强,环环相扣Critical Value methodsNull hypothesis and alternativeHythesisIdentify the approiate test statisticsCritical ValueDecision ruleP-value methodsType I and Type II errorsparametrical test & non-parametrical test假设检验Hypothesis test检验性执法过程流程:第一步:建立一个检验的假设 State null and alternative hypothesis 假设平均身高170第二步:选择合适的检验统计量,并确定其服从的分布 Identfy the test statistic找到一个检验方法第三步:选择假设是否成立的显著性水平select a level of significance设定检验的标准,关键就是找到k值,来选择一个置信区间第四步:陈述判断准则Formula a decision rule陈述一下判断的准则是置信区间内还是区间外第五步:收集数据,计算检验统计量 Take a sample arrive at decision 计算是否在置信区间内第六步:做出判断 Reject / Do not reject第七步:进行决策以下所有课程逻辑都是按照这个步骤一步一步来进行的推导完成。

了解流程 再学习怎么使用流程Step1 --建立一个检验的假设涉及到的名词:原假设null hypothesis(也叫0假设 虚假设) 用H0表示备择假设 Alternative hypoehesis 用Ha表示H0和Ha是一个互补的关系什么放在原假设里,什么放在备择假设里的表述方式未:想要拒绝的放在原假设中H0,把想要接受的放在Ha中做假设都是给总体参数μ做假设。

平时做假设时候是分为单尾检验和双尾检验One-tailed and two-tailed test of hypothesis的,单尾的意思是 拒绝域在一边双尾的意思是 拒绝域在两边判断单尾还是双尾的方法:看备择假设,如果Ha的式子里是不等号,则是双尾假设检验,只有大于或者小于号,则是单尾检验。

考点:①原假设和备择假设 的区别②学会区别双尾和单尾假设Step2:-----选择合适的检验统计量,并判断其服从什么样的分布检验统计量是检验的方法用/X 检验总体参数μ,看/x是否落在置信区间里,要想测算要先看/X服从什么分布/x服从正态分布 ,对该正态分布标准化也就是/x减去均值 再除以标准差 (此处标准差就是标准误)服从了正态分布Z,Z落在置信区间里则不可拒绝原假设,落在区间外,则拒绝原假设对总体均值μ做检验的检验统计量在原假设中设出μ,如果总体的标准差是知道的,也就是总体方差已知,总体已知用z,未知用t,样本方差代替总体方差。

对样本均值/X 标准化后的Z分布首先,有个变量,计算出样本统计量,减去原假设中总体中的参数,再除以样本的标准误。

设置置信区间,就要研究k值,k值被称为关键值Ciitrical ValueK 关键值Critical value影响因素:与显著性水平、置信度Significence level、Degree rate有关,也就是与α、1-α有关单尾 α=5% k=1.96 双尾:α=10% k=1.65(考点!

) α=0.5% k=2.58 α= 1% k=2.58 α=2.5% k=1.96 α=5% k=1.96 α=16% k=1 α=32% k=1统计学要严谨:不能拒绝原假设或者拒绝原假设在N(0,1)分布的情况下,确定α假设检验考试做题步骤:1、设定假设 H0 Ha2、画分布 确定对什么检验 是 μ,方差 σ^2,还是ρ3、找到拒绝域 (看是单尾检验还是双尾检验),标识出来4、 找到拒绝域的面积5、查表计算出k值6、计算检验统计量,减去均值除以标准误7、比较k 和z的大小,如果z 在区间内 不能拒绝 在区间外拒绝原假设8、做出判断考试考点:1、设假设,判断单尾检验还是双尾检验,看>,<,(单尾)=(双尾)2、判断分布,看总体样本量3、看k的影响因素①显著性水平②查表③看但我还是双尾4、计算检验统计量,一般形式就是标准误5、综合性题目:α 已知,计算z/t判断判断分布:大难点!

(一)对总体均值进行检验1、对一个总体均值进行检验 单个正态分布的总体方差已知用z,方差未知用t,非正态总体小样本无可用,对任何N大于等于30均可用z2、对两个总体均值进行检验用t分布,t分布在实务中应用比较多,z分布计较极端两个总体之间独立的 检验统计量只需要两个总体均值记住使用t分布即可两个总体之间关联的 一对一对的进行检验,叫做成对数检验Parires Comparitsond Test检验统计量只需要两个总体均值记住使用t分布即可,分成两个总体之间方差是否相等,公式要学会记:检验 H0:μX=μY 做个变形 d=μY-μY转换成d 也就是可以转换成检验是否等于0 即:H0:μd=0 也就是检验μd是否等于0 /X变成/d μ变成μd(二)对总体方差进行检验对一个正态分布总体方差进行检验 用卡方分布(相当于正态分布求了一个平方)记住用卡方分布对两个正态分布总体方差进行检验,用F分布(用方差相除)经常考什么时候用F分布(三)对两个总体的Corretion进行检验通过计算两个总体检验后相关系数检测出来后,对两个主体的相关系数进行检验,检验中原假设设为corretion =0 ,相关系数服从t分布(自由度df=n-2查表要认真注意!

如果拒绝原假设,则两个总体之间的相关系数是显著不等于0的,简单记为Corretion是显著的公式:P-value method1、定义:当拒绝原假设时最小的显著性水平,拒绝原假设的最小α 本质是概率取值范围:【0,1】假如计算检验统计量,双尾尾巴上的面积之和就是p- value2、判断准则 p和α进行比较,p对应的双尾面积>α 则不能拒绝原假设,p值对应的双外面积=α完完全全 可以拒绝原假设,P值越小越拒绝。

把原假设分成两个状态 一种是正确的,一种是错误的拒绝正确的 是第一类错误,拒真(错杀好人)接受错误的 是第二类错误,受伪(放走坏人)则:拒真概率p(I)=α受伪概率p(II)=1-α(统计检验力 power of test 与第二类错误有关)p(I)+p(II)概率之和不一定等于1,第一类错误的概率与第二类错误概率此消彼长希望两种错误都下降方法就是样本铜梁都增大!

参数检验parametrics test参数检验都与总体参数有关参数检验一般事先假定总体分布服从某个分布非参数检验nonparametrics test总体分布未知,或者样本数据(比如非正态小样本)并不满足某个特定分布按照等级分类的数据When data is given in ranks假设不涉及总体参数,也就是检验的不是参数(例如:检验+++----)如果想要检验两个总体是否存在关系,可以使用卡方分布的非参数检验统计量进行检验。

总结:一、关键值测量 Criticlal Value metod 掌握5种题型的八个解题步骤1、设假设2、判断分步:3、k值的影响因素4、计算检验统计量 z/t (s-H0)/标准误 s^2/n^0.55、判断拒绝还是不拒绝二、p值 计算1、定义α2、判断准则 p值越小越拒绝。


以上是文章"

):对正态分布函数的图形,是对称图形 Symmetrical

"的内容,欢迎阅读天天向上教育网的其它文章