Extended DEA-DA 模型以及其Lingo代码

目录 学术

DEA(数据包络分析)是一个广泛被用来进行效率评价的模型。自从1978年由Charnes和Cooper首次提出以来,已经成为经济学以及运筹学中的重要模型。DEA模型的求解软件和代码网上有很多,很多人也比较了解。

DEA-DA模型是由Sueyoshi(1999)提出来的一个模型。这个模型的作用是:首先对观测值进行分类,接着可以判断新加进来的观测值归属于那个分类。这个模型被广泛应用。

然而,我们有时候会面临一个问题。那就是总会有一些观测值,我们通过DEA-DA方法没办法很好的辨别其分类。Lofti和Mansouri(2008)提出了一个基于模糊方法的Extended DEA-DA(Extended Data Envelopment Analysis/Discriminant Analysis)模型。这个方法通过两阶段来准确分类。第一个阶段进行一个分类,找出其中比较模棱两可的观测值,进入第二阶段,进行二次分类。

下面我们来简单介绍一下这个模型,具体模型参见(Hosseinzadeh Lotfi and Bahareh Mansouri (2008)The Extended Data Envelopment Analysis/Discriminant Analysis Approach of Fuzzy Models)。

假定有n个样本,每个样本都有k个特征,Z_ij(i=1,…,k,j=1,…,n)表示第j个样本的第i个特征数据。这是一个初始的样本。先主观上将样本分成两个组G1,G2,分别有n1和n2各样本,n=n1+n2。(也可以随机分组,n1和n2的大小可以不一致,但最好不要相差太多)

第一个阶段的时候,通过一个优化目标,将观测值区分成三类(这三类跟以前的G1/G2没有任何关系)。其中有一类是没有办法通过第一阶段明确区分分类的观测值集合。第二阶段,对无法明确区分分类的观测值集合,再同构一个优化目标,将其区分。

这个模型的代码也分第一阶段和第二阶段。模型的代码使用Lingo编写。注意要看懂这个代码必须要看原论文。另外,三个分类需要自己在Excel里写公式区分。

Stage1.lg4

Stage2.lg4