文档库 最新最全的文档下载
当前位置:文档库 › 基于容量限制—分批加载和 LOGIT 模型

基于容量限制—分批加载和 LOGIT 模型

https://www.wendangku.net/doc/285570448.html,

的多路径交通分配研究

李鹏飞,曹更永

华南理工大学交通学院,广东广州 (510640)

E-mail:wwwlpf@https://www.wendangku.net/doc/285570448.html,

摘 要:对容量限制—增量加载交通分配模型和LOGIT模型的优点进行综合,提出一种分批加载并使用LOGIT模型进行概率选择的多路径交通分配方案。对交通量进行分批加载,目的是不断修正道路阻抗,然后通过LOGIT模型进行交通分配,这样可较好地符合容量限制条件。最后以一个实际算例,通过与单独使用LOGIT模型所得的分配结果相比较,进行了分析。

关键词:交通分配,LOGIT模型,分批加载,容量限制

中图分类号:U491.1

1.引言

在城市交通中,由于交通网络的复杂性和路段上交通状况的多变性,以及各个出行者主观判断的多样性,某PA点对之间不同出行者所感知的最短路径将是不同的、随机的[1],因此事实上的交通分配应该考虑不同路径的选择概率,即合理的交通分配应该是多路径交通分配。在多路径交通分配方面,相关人员做了大量研究工作,如温凯歌、曲仕茹在文献[2]中提出了一种基于LOGIT方法并结合了动态出发时间选择和随机用户平衡的联合交通分配模型;李琰等人在文献[3]中提出了一种结合了迭代动态网络负荷算法和路径选择算法的动态交通分配算法;黎新华等在文献[4]中以Fisk 提出的LOGIT分配优化思想及Wardrop 的系统最优为基础,建立了容量限制下的路网分配优化模型,并给出了相应的启发式优化算法。

出行者进行路线选择时,其选择结果受最短路因素和随机因素的双重影响,多路径交通分配中应考虑这些影响,因此通常采用下,采用LOGIT离散选择模型来计算路径被选择的概率是适用的。但是,单纯采用LOGIT模型进行交通分配往往容易忽视各路段的容量限制,导致分配交通量与实际承受能力严重失衡的局面。因此,在追求路网均衡、概率化选择的基础上,还有必要考虑容量限制因素,对传统的多路径交通分配方法进行改进。

2.多路径交通分配中的LOGIT模型

由出行者的路径选择特性可知,出行者问题希望选择最合适(最短、最快、最方便、最舒适等)的路线出行,称之为最短路因素,但由于交通网络的复杂性及交通状况的随机性,出行者在选择出行路线时往往带有不确定性,称之为随机因素。这两种因素存在于出行者的整个出行过程中,两因素所处的主次地位取决于可供选择的出行路线的阻抗(行驶时间或费用差等)。因此,各出行路线被选用的概率可采用LOGIT型的路径选择模型计算。

[2],

用表示,用表示路径的实际阻抗,于是有以下关系

rs k C rs k c s r k c C rs

k rs k rs k ,,?+=λ (1)

上式中:为随机误差项,有

。根据Wardrop 路径选择原则,第k 条路被选择的概率为

rs k λ0)(=rs k E λs r k k l C C rs l rs k r rs k ,,;)(?≠?≤=μμ (2)

此时,路径的选择就是一个多项选择中挑选效用最大的选择枝的问题,根据随机效用理

论,假定相互独立,且服从相同的Gumbel 分布(此种情况下,可用一个rs k λλ表示所有的)

的条件下,路径k 的选择概率为

rs k λs r k c

c l ks l rs k rs

k ,,)exp()exp(?????=θθμ (3)

上式中:θ为参数,与λ的方差有关。式(3)即为LOGIT离散选择模型。在模型的求解方面,Dial 通过有效路径的定义提出了一种有效求解LOGIT 分配模型的算法[5]

LOGIT 模型考虑了路径选择的概率因素,比较符合现实情况,但其缺点也很明显,那就是它没有考虑到路段的承载能力,即它忽视了路网的容量限制条件。 3. 容量限制分配方法

在上述基于LOGIT 模型的多路径分配方法中,认为路段行驶时间为一常数,这与实际的交通情况有一定的出入。实际上,路段行驶时间与路段交通负荷有关,随着交通量的变化,路段行驶时间也发生动态的改变,而不是一个常数。考虑到交通负荷带来的影响,需要对路权作出修正。目前这方面较为通用的模型为容量限制——增量加载模型,其思路为:将某PA 点对之间的PA 量分解成K 个部分,然后分K 次将PA 量按一定规则(通常为最短路规则)分配到路网上,每分配一次,将各路段的阻抗修正一次,直到把所有PA 量全部分配完毕。

容量限制—增量加载模型一般是采用最短路径原则进行交通分配的,其分配精度在一定程度上也可以得到保证,但在路径选取时过于注重最短路而忽视其它路径被选择的概率,因此在合理性上难以得到有力说明。

4. 容量限制与LOGIT 的组合模型

由2、3知,LOGIT 模型与容量限制分配模型各具特点,但各自对路径选择概率与路网容量限制条件的考虑又都不全面,因此,本文综合以上两类模型的优点,充分考虑路径选择

图1 容量限制—增量加载分配模型计算流程

Fig1 Flow of Capacity constrain —Assign in groups model

4.1 阻抗的确定与LOGIT 模型的变换

在对路网的通行能力进行研究时,通常用道路的行驶时间或行驶费用来表示其阻抗。相同路况下,不同交通实体通过同一路段的费用各有差异,而通行时间却相差不大,因此,用行驶时间来表示阻抗更具意义。

在LOGIT 模型中,用某路线的相对行驶时间t t /表示其阻抗,则式(3)可写为

∑=????=m i t i t t k t k s r P 1]

/)(exp[]

/)(exp[),,(θθ (4)

式中:——PA 量在第条出行路线上的分配率;

),,(k s r P ),(s r T k )(k t ——第条出行路线的阻抗(行驶时间);

k t ——各出行路线的平均路权(行驶时间);

m ——有效出行路线的条数。

有效路段判别依据为:对路段,若最小行驶时分满足,则它为有效路段。定义有效路线行驶时间],[j i ),(),(min min s i T s j T ≤),(s j i T ?为有效路段的阻抗(i-j 路段的行驶时间)加上有效路段终点j 至出行终点s 的最短行驶时间。即

],[j i ),(j i t ),(min s j T

+=? (5)

4.2 道路阻抗与交通量的关系

路段阻抗的设计是路网分配的重要组成部分,实践中最简单,也是最常见的阻抗函数公式是由美国公路局提供的BPR函数[6],其形式为: ])(1[0βαr k

k k k c x t t += (6) 其中和分别为路段k 上的阻抗(通行时间)和交通流量,为零流阻抗(时间),为路段上的实际通行能力,即容量。k t k x 0

k t r k c k α、β为模型参数,通常取15.0=α,0.4=β。

4.3 基于容量限制—分批加载和LOGIT 模型的交通分配方法

在用LOGIT 模型进行多路径交通分配时,根据BPR 函数,分配的交通量会对路段的阻抗产生影响,也就是说,在交通量变化的过程中,道路阻抗也一直在变化。实时动态地跟踪这种变化从而对道路阻抗进行修正是很有必要的,但可操作性不好,模型求解起来也很复杂。因此,本文仿照容量限制分配模型中的增量加载方法,提出采用分批加载方法来进行交通分配,即将要分配的交通量分成若干等份,分批进行交通分配,每分配一次,对道路阻抗进行修正一次,直到分配完毕。

算法的步骤如下:

第1步 初始化:置当前路网所有路段的流量为零,确定基于完全自由流的阻抗;

0k t 第2步 对交通量进行分批,应用LOGIT 模型进行加载,详细流程为:

(1) 根据当前各路段的阻抗,计算各交通节点i 至出行终点s 的最短路权;

(2) 令r 等于出行起点r ,即从出行正点r 开始进行分配;

(3) 判别与节点i 邻接的有效路段,并根据式(5)计算各有效出行路线的时间花费;

(4) 由LOGIT 模型,按式(7)计算各有效路段的[i,j]的边权

),(j i T w ]/),(exp[),(T s j i T j i T w ???=θ (7) 式中,T ——与节点i 相接的所有有效出行路线的平均最短行驶时分,即由式(5)所得的所有的平均值。

),(s j i T ?(5) 按式(8)计算节点i 的点权

)(i N w ),()(j i T i N j

w w ∑= (8) (6) 按LOGIT 模型计算各有效路段[i,j]的交通量分配率P(i,j)

???≠?==r i N j i T i E r i i N j i T j i P w

w n w w /),()()(/),(),( (9) 式中为进入节点i 的上游各邻接有效路段的分配率之和。

∑=k n i k P i E )

,()((7) 计算有效路段[i,j]的分配交通量

),(j i Q ),(),(),(s r Q j i P j i Q ?= (10)

(8) 令上述有效路段中的某一路段终点j 为i (确定i 时,以从上游进入该点的有效路段的分配率均已确定为条件)。返回(3),按步骤继续分配,直至终点s 。

第3步 阻抗调整:按各路段已分配的交通量,根据式(6)进行阻抗的重新计算;

第4步 根据第3步得到的阻抗,转第2步,对下一批交通量进行分配,直至分配结束。

5. 实例分析 以实例验证本文提出的多路径交通分配方法。

图2 网络与行驶时间 图3 网络的容量限制 Fig2 Road network and travel time Fig3 Capacity constrain of the road network 某个较短时间内,节点①至节点⑨的出行量辆500)9,1(=Q ,在此时间段内将交通量分配到网络中。

路网中各路段的自由流行驶时间如图2所示,各路段的容量限制如图3。按4.3的分配步骤,将交通量分为5批次进行加载,每次100辆,每次分配完毕后,计算各路段新的行驶时分,然后再进行下一批交通量的分配。计算时θ取经验值3.3。

在以上分配过程中,根据各次分配后各路段实得分配量和各路段的容量限制(即设计通行能力),对路段的阻抗进行调整,从而使尚未分配的交通量在各个交叉口得到各有效路段的新的选择概率,结果是分配量已接近或达到容量限制的路段被选择的概率大大减小,而当

Tab1 Data of each time traffic assignment

路段设计容量第1次第2次第3次第4次第5次合计

①-②250 38 38 38 40 45 199

①-④250 62 62 62 60 55 301

②-③150 12 12 12 14 17 67

②-⑤100 26 26 26 26 28 132

④-⑤180 62 62 62 46 39 271

④-⑦80 0 0 0 14 16 30

③-⑥150 12 12 12 14 17 67

⑤-⑥250 62 62 62 51 45 282

⑤-⑧120 26 26 26 21 22 121

⑦-⑧80 0 0 0 14 16 30

⑥-⑨330 74 74 74 65 62 349

⑧-⑨200 26 26 26 35 38 151

分配量超过容量限制时,路段的阻抗会急剧增加,从而使得此路段被选择的概率迅速向零收敛,从而达到一种惩罚的效果,这符合交通状况动态变化的特点。由表1的结果可知,最后所得的各路段的分配量均能较好地符合其容量限制条件,尽管存在某些路段,其分配量小幅

图4 未改进LOGIT模型的分配结果

Fig4 Output of original Logit-model

超出容量限制,但这种情况在实际中是可能存在的,并非不合理。可以预见,如果将预分配交通量分成更多批次,其分配结果与容量限制的符合情况将更为良好。图4所示为采用LOGIT 模型进行一次性分配所得的结果,相比较而言,本文所采取的分配方法无疑更符合实际情况。

6.结论

本文研究了LOGIT离散选择模型和基于容量限制—增量加载的交通分配方法,综合了前者的概率随机分配特点和后者的分批分配的长处,提出了一种基于容量限制—分批加载和

参考文献

[1]刘灿齐.现代交通规划学.人民交通出版社,2001,6.

[2]温凯歌,曲仕茹.基于LOGIT模型的动态交通分配研究。交通与计算机,2006,24 [1]:12-14.

[3]李琰,周八益,周溪召.多用户动态交通分配模型的算法研究.上海海运学院学报,2004,25[1]:87-91.

[4]黎新华,侯桂荣,莫辉辉,等.容量限制的交通分配优化方法研究.中南公路工程,2005,30[4]:116-118.

[5]DIAL R B.A probabilistic multipath traffic assignment model which obviates path enumeration

[ J ].Transportation Research,1971,[5]:83 - 111.

[6]李志纯,古强.基于LOGIT 的随机用户平衡配流模型的算法[J].中南工业大学学报,2001,[1]:75-79.

A Traffic Assignment Model Based on Capacity Constrain

Assign In Groups and LOGIT-model

Li Pengfei1, Cao Gengyong2

South China University of Technology, Guangzhou (510640)

Abstract

This paper presented a traffic assignment model which based on Capacity constrain—

Assign in groups and LOGIT-model, combined the strong points of Capacity constrain—

Increment load model and LOGIT-model. We can correct the road’s impedance in the

process by assigning traffic in groups, then use the LOGIT-model to assign the traffic. The

data we finally get can agree with the capacity constrain quite well. In the end, we use a

sample to analyze the effects of the model by comparing the outcome with that of the way

using LOGIT-model only.

Key words: traffic assign, LOGIT-model,Assign in groups, Capacity constrain

作者简介:

李鹏飞(1983-),男,山东荷泽人。2006年中国矿业大学交通运输专业本科毕业,现为华南理工大学交通学院硕士研究生,主要研究方向为交通运输规划与

管理。

曹更永(1984-),男,山东荷泽人。2006年山东交通学院交通工程专业本科毕业,现为华南理工大学交通学院硕士研究生,主要研究方向为交通运输规划与

管理。

Chapter9-受限因变量模型

第1章 受限因变量模型 这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量y *,y *的实际观测变量为y i 。引入二元指示变量D i ,如果a i < y *? 如果如果如果。 (1) 如果只有当D i = 1时实际观测变量y i 才有观测数据,即:当D i = 1时,潜在变量与实际观测变量相等,而当D i = 0时,y i 没有观测值,这时称数据被截断(truncated ),即小于a i 的数据和大于a i 的数据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。 将潜在随机变量y *的基本模型设定为: *i i i y v μσ=+。 (2) 其中μi 为位置参数,σ为刻度参数;v i 为独立于x i 的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F 、f 。在这些假定条件下,y i *的均值为μi ,方差为σ2,分布函数为*()i i y F μσ -, 概率密度函数为*( )/i i y f μσσ-(证明请参见附录1) 。a i < y i * < b i 等价于i i i i i i i a b c v d μμσ σ --=<< =, 那么y i *被观测到的概率为: *Pr()Pr(1)()()i i i i i i a y b D F d F c <<===- (3) 下面对截断数据模型和归并数据模型分别进行介绍 1.1 截断数据模型 如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶层(月收入x ≥ 10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x ≥ 10000的区间里观测得到的。下面介绍截断数据的分布特征和模型估计。

计量经济学经典eviews 离散和受限因变量模型

离散和受限因变量模型 前面所描述的回归方法要求能在连续和无限制的规模上观察到因变量。然而,也经常出现违背上述条件的情形,即产生非连续或受限因变量。我们将会识别三种类型的变量: 1.定性(在离散或排序的规模上); 2.审查或截断; 3.整数估值(计数数据)。 在这章里我们讨论这几种定性和受限因变量模型的估计方法。EViews 提供了二元或排序(普罗比特probit 、逻辑logit 、威布尔gompit ),审查或截断(托比特tobit 等),和计数数据模型的估计程序。 §17.1 二元因变量模型 二元因变量模型(Binary Dependent V ariable Models )估计方法主要发展与20世纪80年代初期。普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策领域的研究。例如,公共交通工具和私人交通工具的选择问题。选择利用公共交通工具还是私人交通工具,取决于两类因素:一类是诸如速度、耗费时间、成本等两种交通工具所具有的属性;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。研究这一关系对制定交通工具发展规划无疑是十分重要的。 在本节介绍的模型中,因变量y 只具有两个值:1或者0。y 可能是代表某一事件出现的虚拟变量,或者是两种选择中的一种。例如,y 可能是每个人(被雇佣或不被雇佣)雇用状况的模型,每一人在年龄、教育程度、种族、婚姻状况和其它可观测的特征方面存在差异,我们将其设为x 。目标是将个体特征和被雇用的概率之间的关系量化。 假定一个二元因变量y ,具有0和1两个值。y 对x 简单的线性回归是不合适的。而且从简单的线性回归中得到y 的的拟合值也不局限于0和1之间。替代地,我们采用一种设定用于处理二元因变量的特殊需要。假定我们用以下模型刻画观察值为1的概率为: Pr )(1),1(ββi i i x F x y '--== 这里F 是一个连续、严格单调递增的函数,它采用实际值并返回一个介于0和1之间的数。F 函数的选择决定了二元模型的类型。可以得到 Pr )(),0(ββi i i x F x y '-== 给出了这样的设定以后,我们能用极大似然估计方法估计模型的参数。极大似然函数为 ∑=--+'--==n i i i i i x F y x F y L 0))(log )1())(1log(()(log )(ββββ 极大似然函数的一阶条件是非线性的,所以得到参数估计需要一种迭代的解决方法。缺省地,EViews 使用二阶导数用于参数估计的协方差矩阵的迭代和计算。 有两种对这种设定的重要的可选择的解释。首先,二元变量经常作为一种潜在的变量规定被生成。假定有一个未被观察到的潜在变量*i y ,它与x 是线性相关的: i i i u x y +'=β* 这里i u 是随机扰动。然后被观察的因变量由*i y 是否超过临界值来决定

基于Logit模型的上市公司评级研究

基于Logit模型的上市公司评级研究 摘要:本文选用Altman的ZETA模型中7个变量,利用Logit 模型对我国上市公司进行了评级分类,结论表明Logit模型能够将估计样本中的71.89%的公司进行正确评级分类,而能将预测样本中62.50%的公司进行正确评级分类,Logit 模型对我国上市公司的评级具有一定的效力。 关键词:Logit模型;上市公司;评级 一、引言 我国股票市场和债券市场的扭曲发展不仅使得资本市场的资源配置作用并未得到有效发挥,而且使得股票市场独自承担了所有的市场风险,从而导致了股票市场的巨大波动。然而,引起我国债券市场发展滞后的主要原因之一就是债券评级制度的不成熟。因此,对上市公司能够做出独立且正确的信用评级,不仅可以引导投资者做出正确的投资决策,完善市场结构,还对我国债券市场乃至整个资本市场的健康发展具有重要的意义。 随着资本市场的资本配置作用日益显著,公司的信用评级研究在国内外都有了巨大的发展。Altman(1968)与Altman等(1977)利用多元判别分析(MAD)分别建立了著名的得分模型和第二代信用评分模型,即ZETA模型。Ohlson (1980)将Logit模型引入到公司财务危机预测上来,发现logit模型能够将具有不同财务质量的公司做出有效的分类。李湛和徐一骞(2009)运用Altman的Z 得分模型,检验了2006-2007年由中诚信所作信用评级的34家企业,结果表明我国企业存在众多信用评级相背离的现象。刘瑞霞、张晓丽、陈小燕以及郝艳丽(2008)将多元有序Logit模型应用于我国的信用评级,并选取我国53家上市公司作为样本对Logit模型的适用性进行了检验,但未对结果做出详细的分析。 本文将659家具有五种不同财务质量的公司分为估计样本和测试样本,以Altman的ZETA模型中的7个变量作为本文的解释变量,应用Logit模型对我国上市公司进行信用评级,结论表明Logit模型对我国上市公司具有较好的分辨能力,能够把不同财务质量的上市公司进行有效区分。 二、变量及数据 在大量的实证检验中,由于Altman的ZETA模型具有较高的信用分辨能力,因此,本文直接采用ZETA模型由财务指标构造的的7个变量,分别是:资产收益率、收益稳定性指标、留存收益/总资产、利息保障倍数、资本化率、流动比率和规模。下表是对本文变量的简要说明。 表1 变量说明 对于因变量y,本文从我国A股市场一共选取了659家上市公司,根据其风险属性将这659家公司分成5类不同的风险级别。并且将样本分为估计样本和预

基于Logit模型的中小企业信贷风险实证分析

基于Logit模型的中小企业信贷风险实证分析 【摘要】中小企业普遍存在的“融资难”现象影响了中小企业的发展。文章分析了中小企业的信贷风险,适当选取2013年上市公司为样本,利用SPSS统计软件,运用因子分析方法对中小企业信贷风险指标进行了筛选,构建了基于Logit回归模型的中小企业信贷风险度量模型。实证分析表明,模型具有较高的有效性和准确性,可作为中小企业信贷风险评估的科学依据。 【关键词】中小企业;信贷风险;因子分析;Logit回归模型 一、引言 中小企业在国民经济发展中具有重要地位,在推动技术创新、缓解就业压力、方便群众生活、保持社会稳定等方面发挥着重要作用。但是,相对于大型企业而言,中小企业一般规模较小、员工素质不高、研发投入不足、把握市场能力较弱,在激烈的市场竞争中缺乏应变能力,使商业银行对其设置了严格的融资约束和限制,普遍出现“融资难”的情况,导致经营状况、财务状况越来越差,进一步加剧了中小企业获取资金的难度。为了改善中小企业经营环境,促进中小企业健康发展,中国人民银行先后发布了有关服务中小企业的货币信贷政策和指导意见,加大了对中小企业的信贷支持。工业和信息化部发布的《“十二五”中小企业成长规划》指出,中小企业成长面临着国际和国内经济巨大变革带来的历史机遇和严峻挑战,提出了完善政策、加强金融支持等一系列保障措施。根据中国人民银行发布的《2013年金融机构贷款投向统计报告》,金融机构(含商业银行及农村合作社、城市信用社和外资银行等)全年中小企业贷款余额增加1.63万亿元,占全部企业新增贷款的43.5%;年末小企业贷款余额13.21万亿元,同比增长14.2%。因此,研究中小企业面临的信贷风险,分析其来源和表现形式,科学地度量其风险水平,对于提高中小企业风险控制能力具有重要的理论价值和现实意义。 二、中小企业信贷风险分析 目前,中小企业财务融资和信贷风险主要表现在:融资渠道单一、融资成本较高、信贷支持不够等方面。现有的信贷风险分析的方法和度量模型,大多数针对大型上市公司,并没有一套完全适合我国中小企业信贷风险的评价体系。针对我国中小企业自身的特点,结合我国的经济发展状况和中小企业面临的环境,分析中小企业信贷现状和存在的风险,是建立中小企业信贷风险度量模型的基础。 与大型企业不同,中小企业信贷风险来源广泛,主要是宏观经济风险、金融机构的风险、企业自身的风险等方面。 1.宏观经济风险。宏观政策风险——宏观政策的调整(产业政策调整、信贷政策紧缩及出口退税政策等)可能为中小企业带来不可抗力的市场风险;利率风险——当财政和货币政策较为宽松时,贷款利率降低,融资成本较低,反之会增大企业的融资风险;汇率风险——对涉及进出口、外贸型的中小企业,汇率变动风险也是不可忽略的。

Logit模型

Logit模型 LOGLINEAR vary (1,2) BY devolve(1,2) data(1,2) /CRITERIA=DELTA(0) /PRINT=ESTIM /DESIGN=vary vary by devolve vary by data . CROSSTABS /TABLES=vary BY devolve BY data /FORMAT= A V ALUE TABLES /CELLS= COUNT . 饱和模型和分层模型 HILOGLINEAR data(1 2) vary(1 2) devolve(1 2) /METHOD=BACKWARD /CRITERIA MAXSTEPS(10) P(.05) ITERATION(20) DELTA(0) /PRINT=ASSOCIATION /DESIGN . try’s data analyze HILOGLINEAR str(1 2) in(1 2) mea(1 2) /METHOD=BACKWARD /CRITERIA MAXSTEPS(10) P(.05) ITERATION(20) DELTA(0) /PRINT=ASSOCIATION /DESIGN . LOGLINEAR str (1,2) BY in(1,2) mea(1,2) /CRITERIA=DELTA(0) /PRINT=ESTIM /DESIGN=str str by in str by mea . CROSSTABS /TABLES=str BY in BY mea /FORMAT= A V ALUE TABLES /CELLS= COUNT . LOGLINEAR ch (1,2) BY stan(1,2) ore(1,2) sit(1,4) /CRITERIA=DELTA(0) /PRINT=ESTIM /DESIGN=ch ch by stan ch by ore ch by sit .

第14章-受限被解释变量

? 陈强,《高级计量经济学及Stata 应用》课件,第二版,2014 年,高等教育出版社。 第 14 章受限被解释变量 被解释变量的取值范围有时受限制,称为“受限被解释变量”(Limited Dependent Variable)。 14.1 断尾回归 对线性模型y i =x i 'β +ε i ,假设只有满足y i ≥c 的数据才能观测到。 例:y i 为所有企业的销售收入,而统计局只收集规模以上企业 数据,比如y i ≥100,000。被解释变量在100,000 处存在“左边断尾”。

2 ? 断尾随机变量的概率分布 随机变量 y 断尾后,其概率密度随之变化。 记 y 的概率密度为 f ( y ) ,在 c 处左边断尾后的条件密度函数为 ? f ( y ) 若 y > c f ( y | y > c ) = ? ?? P( y 0, > c ) , 若 y ≤ c 由于概率密度曲线下面积为 1,故断尾变量的密度函数乘以因子 1 。 P( y > c )

图14.1 断尾的效果 3

断尾分布的期望也发生变化。以左边断尾为例。对于最简单情形,y ~ N (0, 1),可证明(参见附录) E( y |y >c) = φ(c) 1 -Φ(c) 对于任意实数c,定义“反米尔斯比率”(Inverse Mill’s Ratio,简记IMR)为 则E( y | y >c) =λ(c)。λ(c) ≡ φ(c) 1 -Φ(c) 4

图14.2 反米尔斯比率 5

6 对 于 正 态 分 布 y ~ N (μ, σ 2 ) , 定 义 y - μ z ≡ σ ~ N (0, 1) , 则 y = μ + σ z 。故 E( y | y > c ) = E(μ + σ z | μ + σ z > c ) = E ??μ + σ z z > (c - μ) ?? = μ + σ E ?? z z > (c - μ) σ ?? = μ + σ ? λ [(c - μ) σ ] 对于模型y = x 'β + ε ,ε | x ~ N (0, σ 2 ),则y | x ~ N ( x 'β , σ 2 ),故 i i i i i i i i E( y i | y i > c ) = x i 'β + σ ? λ [(c - x i 'β ) σ ] 如 果 用 OLS 估 计 y i = x i 'β + εi , 则 遗 漏 了 非 线 性 项 σ ? λ [(c - x i 'β ) σ ],与x i 相关,导致 OLS 不一致。

基于Logit模型的上市公司财务预警模型研究以及实证分析

基于Logit模型的上市公司财务预警模型研究以及实证分析 【摘要】上市公司是现代公司的最高形式,上市公司的数量和质量直接影响着证券市场的兴衰。在上海和深圳证券交易所上市公司需要连续三年盈利,上市之后如果连续两年亏损,就会被戴上ST的帽子,这标志着上市公司陷入了财务困境。本文以沪深A股市场上于2015年被ST和未被ST的上市公司为研究的总体,随机抽取样本90个,并结合公司的财务数据,尤其是代表公司经营状况的动态指标,来预测企业在未来一年内是否会有财务危机,给公司的财务人员预警,同时也有利于投资者判断一家公司的发展状况,做出合理决策。 【关键字】上市公司财务预警Logit模型 一、引言 (2) 1.1财务预警模型的研究背景 (2) 1.2财务预警模型的研究概况 (2) 1.3本文的创新之处 (2) 二、Logit模型简介 (2) 三、样本和财务指标的确定 (3) 3.1样本采集 (3) 3.2财务指标的初步选择 (3) 四、财务预警模型的实证分析 (4) 4.1案例处理摘要 (4) 4.2模型汇总 (4) 4.3Hosmer-Lemeshow检验结果 (5) 4.4预测分类结果 (5) 4.5逐步回归过程 (7) 4.6不在方程中的统计变量 (9) 4.7预测概率直方图 (9) 五、模型的改进和对上市公司风险防范的建议 (11) 5.1模型的改进 (11) 5.2对上市公司的建议 (11) 参考文献 (12)

一、引言 1.1财务预警模型的研究背景 现代企业从创业到发展,都在追求一个目标——上市。而在我国的股票市场上,公司上市需要最近三年连续盈利,上市后的公司要接受社会的监督,定期公布财务报告以及其他信息,因此我们可以很容易得到上市公司的财务指标,相比通过经验来判断公司的财务状况,财务指标是量化的,更容易分析。 一个公司的财务指标一定程度上反映了该公司的财务状况,从财务状况我们可以看出该公司的经营管理情况以及发展情况,如果一个公司财务发生了危机,那么整个公司的现状也令人担忧。因此,正确的预测企业财务危机将有助于保护投资者和债权人的权益、有助于经营者防范财务危机、有助于政府管理部门监控上市公司质量和证券市场的风险,所以建立企业财务危机预警模型具有重要意义。 各种不同的原因共同导致了公司的财务危机,既有企业内部的原因,也有企业外部不可控制的原因。以下我们归纳归属于企业自身的原因: 1.公司管理者盲目追求扩张,决策缺乏科学性。 2.企业筹资方式不当,资本结构不合理 3.企业内控制度不完善,公司治理结构不合理。 如果企业不对其存在的问题作出快速的反映,在不断创新和变革的时代,最终会走向破产,因此财务预警能够在公司财务危机发生前进行预测,避免其陷入财务困境。 1.2财务预警模型的研究概况 对上市公司的财务预测和预警的常用模型是上市公司信用风险度量,我国关于财务风险预警分析的研究起步较晚,而国外开始相关领域的研究比较早,已有企业将财务风险预警模型投入实际运用中。信用风险的度量和管理的探索大致可分为三个阶段;第一个阶段是1970年以前,主要分析工具有5C分析法、LAPP 法、五级分类法,大多数金融机构基本上是依据银行专家的经验和主管分析来评估信用风险。第二个阶段是建立于基于财务报表的信用评级模型,主要有Logit 模型、线性比率模型、Probit模型、判别分析模型等。第三个阶段是进入20世纪90年代以来,西方若干商业银行以风险价值为基础,开始运用数学工具、现代金融理论来定量研究信用风险,建立了以违约概率、预期损失率为核心指标的度量模型。 1.3本文的创新之处 我国财务预警模型处于发展初期,复杂的财务预警模型在实践中运用较少。简单而又实用的预警模型应属Logit模型,多数学者已对Logit模型进行了实证分析,肯定了Logit模型有较好的预测能力。本文拟对Logit模型在上市公司财务危机预警分析与评估应用方面进行研究,避开大多数研究者选取的盈利指标等静态指标,以与上市公司经营状况有关的财务指标为变量(包括两个动态指标)通过实证分析验证改进结果。 二、Logit模型简介 Logit方法采用logistic回归建立一个非线性模型,其曲线是s型或倒s 型。因变量的取值在O~1之间,回归方程为:

第4章(3)受限数据模型

§4.6受限被解释变量数据模型 ——选择性样本 Model with Limited Dependent Variable ——Selective Samples Model 一、经济生活中的受限被解释变量问题 二、“截断”问题的计量经济学模型 三、“归并”问题的计量经济学模型

The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000 "for his development of theory and methods for analyzing selective samples” James J Heckman USA

?“Shadow Prices, Market Wages and Labour Supply”,Econometrica42 (4), 1974, P679-694发现并提出“选择性样本”问题。 ?“Sample Selection Bias as a Specification Error”,Econometrica47(1), 1979, P153-161 证明了偏误的存在并提出了Heckman两步修正法。

一、经济生活中的受限被解释变量问题

2、“归并”(censoring)问题 ?将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。 ?经常出现在“检查”、“调查”活动中,因此也称为“检查”(censoring) 问题。 ?需求函数模型中用实际消费量作为需求量的观测值,如果存在供给限制,就出现“归并”问题。?被解释变量观测值存在最高和最低的限制。例如考试成绩,最高100,最低0,出现“归并”问题。

Logistic模型应用模板

基于logistic模型的2014年影响中国各省城市化水平的 经济地理因素分析 摘要:本文利用2013年中国31个省份的数据,从经济与地理位置两个因素出发,运用logistic回归的方法在SPSS软件上进行分析。结果显示:中国城市化发展水平不仅与经济密切相关,而且与其地理位置也有很大的关系,地区间城市化发展水平差距较明显,城市化各方面的因素水平发展不平衡。 关键词:logistic模型,城市化水平,SPSS软件

目录 一、引言 (3) 二、Logistic模型 (3) 1. 基本概念 (3) 2. 统计原理 (4) (1)logit变换 (4) (2)Logistic回归模型 (4) (3)统计检验 (4) 三、基于logistic模型的我国各省城市化水平影响因素实证分析 (5) 1.数据来源与说明 (5) 2.模型检验 (5) 3.模型的建立与预测 (6) 四、结论 (7) 参考文献 (8)

一、引言 城市化的定义众多,本文参照《中华人民共和国国家标准城市规划术语》,认为城市化是“人类生产与生活方式由农村型向城市型转化的历史过程,主要表现为农村人口转化为城市人口及城市不断发展完善的过程。”城市化是一个系统的动态过程,包含了人口、经济、社会、城市建设等各方面变化的影响。它是经济发展和社会进步的必然结果,反过来也推动了经济的发展和社会的进步。 中国大陆的城市化进程在不同的时期具有不同的特点,总的来看城市化水平普遍较低,并已成为制约国家经济、社会和谐发展的主要原因之一。因而,各地区普遍把推进城市化进程作为经济、社会发展战略的一项重要目标选择。当前中国大陆已经进入了城市化水平的持续上升发展时期,此时对这样一个过程实施有效、客观、科学、动态的监测,从而及时发现并解决城市化进程中出现的难题,就必须加强对中国大陆城市化水平质与量等方面的考察和研究。这对于我们这样一个人口众多、区域经济发展不平衡的国家尤为重要。 本文不仅分析影响城市化水平的经济因素,还加入了地理位置对其城市化发展的影响。由于地理因素数据不是数值型变量,因此我们引用logistic回归方法对其进行建模。 二、Logistic模型 1.基本概念 Logistic回归分析就是针对因变量是定型变量的回归分析,这与一般的回归分析不同。在实际生活中,我们会经常遇到因变量是定型

基于logit模型的旅客出行选择行为

浅析基于logit模型的旅客出行选择行为摘要:通过分析铁路客流构成和旅客列车分类,将铁路旅客乘车选择行为的影响因素归结为旅客主体特性、列车特性和随机因素。采用随机效用理论建立铁路旅客乘车选择行为非集计模型,给出个体旅客对列车选择概率的多项logit模型,并通过影响因素选择及参数标定等设定求解方法。 关键词:铁路旅客运输;乘车选择行为;影响因素;logit模型abstract: through the analysis of railway passenger traffic composition and classification of passenger trains, railway passengers’ choice behavior will choose the influence factors of subject characteristics, boil down to the passenger train characteristics and random factors. using the random utility theory, a railway passengers’ choice behavior choice disaggregate model given individual passengers on the train choose a number of probability logit model, and through the influence factors such as parameters calibration set choice and the solving method. keywords: railway passenger transportation; bus choice behavior; influencing factors; logit model 中图分类号:f530.32 文献标识码:a 文章编号: 对旅客出行选择行为的研究,向来是铁路运输组织研究的重要

第14 章 受限被解释变量

教学用PPT ,《高级计量经济学及Stata 应用》,陈强编著,高等教育出版社,? 2010年 第14章 受限被解释变量 14.1断尾回归(Truncated Regression ) 对于线性模型(1,2,,)i i i y i n ε′=+=x β",假设只有满足 i y c ≥(c 常数)的数据才能观测到。

断尾随机变量的概率分布 记y 原来的概率密度为()f y ,则断尾后的条件密度函数为, ()P() (|)0f y if y c y c f y y c if y c ???>?>>=???≤??? (14.1)

图14.1、断尾的效果 首先,对于最简单的情形,~(0,1)y N ,可以证明

() E(|)1()c y y c c φ>=?Φ (14.2) 对于一个任意实数c ,定义“反米尔斯比率”(Inverse Mill’s Ratio ,IMR )为() ()1() c c c φλ≡?Φ,则E(|)()y y c c λ>=。

图14.2、反米尔斯比率 其次,对于2~(,)y N μσ,定义~(0,1)y z N μσ ?≡,则

y z μσ=+, []E(|)E(|)E ()E ()()y y c z z c z z c z z c c μσμσμσμσμσμσμσλμσ??>=++>=+>??? ??=+>?=+???? (14.3) 对于回归模型i i i y ε′=+x β,假设2 |~(0,)i i N εσx 。因此, 2 |~(,)i i i y N σ′x x β。套用方程(14.3)可得, E(|)()i i i i y y c c σλ??′′>=+????x βx β (14.4)

chapter受限因变量模型

c h a p t e r受限因变量模 型 SANY标准化小组 #QS8QHH-HHGX8Q8-GNHHJ8-HHMHGN#

第1章 受限因变量模型 这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量y *,y *的实际观测变量为y i 。引入二元指示变量D i ,如果a i < y *?如果如果如果。 (1) 如果只有当D i = 1时实际观测变量y i 才有观测数据,即:当D i = 1时,潜在变量与实际观测变量相等,而当D i = 0时,y i 没有观测值,这时称数据被截断 (truncated ),即小于a i 的数据和大于a i 的数据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。 将潜在随机变量y *的基本模型设定为: *i i i y v μσ=+。 (2) 其中?i 为位置参数,?为刻度参数;v i 为独立于x i 的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F 、f 。在这些假定条件下,y i *的均值为?i ,方差为?2 ,分布函数为*( )i i y F μσ -,概率密度函数为*( )/i i y f μσσ -(证明请参见附录1)。a i < y i * < b i 等价于i i i i i i i a b c v d μμσ σ --= << =,那么y i * 被观测到的概率为: *Pr()Pr(1)()()i i i i i i a y b D F d F c <<===- (3) 下面对截断数据模型和归并数据模型分别进行介绍 1.1 截断数据模型 如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶层(月收入x ? 10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x ? 10000的区间里观测得到的。下面介绍截断数据的分布特征和模型估计。

相关文档 最新文档