Sci论文 - 至繁归于至简,Sci论文网。 设为首页|加入收藏

SCI论文网开场白:为SCI创作者提供分享合作的小而美圈子

当前位置:首页 > 计算机论文 > 正文

大学生贫困资助评定的多粒度粗糙集研究(附论文PDF版下载)

发布时间:2018-08-11 17:59:15 文章来源:SCI论文网 我要评论














SCI论文(www.scipaper.net):
 
特别说明:理工类、计算机类和医药类等论文在小编发布时可能会因为复杂的科学计算公式,导致文本格式出错,在阅读时较难读懂,阅读体验一般,建议大家可以直接在文章底部翻页到最后一页下载论文PDF版文档进行深度学习和阅读,感谢理解!

任 俊 1,唐绮雯 1,徐 怡 2,胡善忠 2
REN Jun1, TANG Qiwen1, XU Yi2, HU Shanzhong2

1.安徽大学计算机科学与技术学院,合肥 230601)
2.安徽大学计算智能与信号处理教育部重点实验室,合肥 230039)
1.Department of Computer Science and Technology Anhui University, Hefei 230601, China 2.Key Lab of IC&SP at Anhui University, Ministry of Education, Hefei 230039, China
REN Jun, TANG Qiwen, XU Yi, et al. Research on multi granularity rough set for university students' Poverty Support Evaluation. Computer Engineering and Applications

\

Abstract:The CPC Central Committee and the State Council have always attached great importance to the financing of students with family difficulties. In recent years, in order to ensure the family financial difficulties students successfully completed their studies, Central and local governments have developed a variety of policies, including the Subsidy policy for poor students in university. But will also face a problem, is how to judge whether students are poor students. There are many factors that affect the assessment of funding, leading to the existence of funding assessment is not fair. In order to help the major colleges and universities to do a better job of poor student funding work. Firstly, this paper designs the questionnaire of the college students' poverty support assessment standard, to collect data from college freshmen to seniors. Then, take advantage of the improved rough set theory which based on the pessimistic multi-granularity information reduction algorithm, optimistic multi- granularity reduction algorithm and the two-layer absolute granularity reduction algorithm, we have excavated the key factors that affect the evaluation criteria of poor students, and verified the correctness of the results by experiments. The research results can make the poverty assessment standard more just, so that poor students can better finish their studies under the assistance of the state, and lay a good foundation for future life.
Key words:Multi-granularity rough sets;College students poverty aid; Absolution reduction;The particle size reduction; Amount of information

摘 要:党中央、国务院历来高度重视家庭困难学生的资助工作。近年来,为保证家庭经济困难学生顺利完成学业,中央和地方各级政府制定了各种各样的政策,其中包括了大学贫困生资助这项政策。但是也会面临一个问题,就是如何去判断学生是否是贫困生。由于影响资助评定的因素有很多,导致资助评定存在不公平性。为了帮助各大高校更好的做好贫困生资助工作,本文首先设计了大学生贫困资助评定标准调查问卷,向本校大一至大四学生分发调查问卷收集数据,然后利用了粗糙集理论改进的基于悲观多粒度约简算法、乐观多粒度约简算法以及双层绝对粒度约简算法,挖掘出了影响贫困生评定标准的关键因素,并通过实验验证了结果的正确性。研究成果可以使得贫困生评定标准更加公正,让贫困生学子能在国家的资助下更好地完成学业,为以后的人生打好基石。

关键词: 多粒度粗糙集;大学生贫困资助;绝对约简;粒度约简;信息量

基金项目:国家自然科学基金项目(No.61402005);安徽省自然科学基金项目 (No.1308085QF114);安徽省高等学校省级自然科学基金项目 (No.KJ2013A015 , No.KJ2011Z020) ;安徽大学科研训练项目(No.KYXL2016048);计算智能与信号处理教育部重点实验室课题项目。

作者简介:任俊,男,安徽大学计算机科学与技术学院,本科在读学生;徐怡(1981-),女,副教授,博士,研究方向为智能信息处理和粗糙集理论。

1 引言

贫困大学生主要是指家庭经济情况贫困的学生, 虽然随着国家经济的发展,很多家庭的经济水平都有 了改善,但是还是有很多家庭处于经济贫困的状况, 贫困大学生在高校中占了不少的人数。因此国家对于 贫困生资助给予很大的重视,贫困生资助也是当前各 大高校的重点工作之一。但大量情况表明,高校贫困 生资助问题并没有得到根本的解决,贫困生资助体系 在设计和运行上仍然存一些问题,比如贫困大学生的 认定标准不完善。随着社会总消费水平的提高,贫困 生标准也在变化,目前我国高校还没有一套科学的贫 困生指标评价体系,使贫困生的界定主观性,随意性 增加。各高校对学生的经济情况的了解还仅仅依赖于《家庭经济调查表》、学生源地贫困证明或者学生个人的贫困申请,没有收入申报制度和收入监控机制等, 这使高校 贫困生资格认定缺乏科学性、针对性与可操作性[1]。因此完善贫困证评定标准是一项重要而又 有意义的工作。

粗糙集理论是Pawlak 教授在1982 年提出的一种能够定量分析处理不精确、不一致、不完整知识与信息的数学工具[2]。该理论无需数据集之外的任何先验信息,所以对问题的描述和处理比较客观。目前广泛应用于数据挖掘、决策分析、机器学习与知识发现等领域[3]。从粒计算[3]的角度来看,经典粗糙集模型是基于单粒度和单层次的,无法从多粒度、多层次的角度对异构数据进行分析和处理。钱宇华和梁吉业等[4]提出,采用一个属性集序列而非一个属性集来对论域进行分类,提出了多粒度粗糙集模型的概念,定义了两种具体的多粒度模型:乐观多粒度粗糙集模型和悲观多粒度粗糙集模型[5]。多粒度粗糙集模型可以有效处理异构数据和多源数据。当前在多粒度粗糙集上的研究大多数是在把多粒度粗糙集的这种思想推广到不同的粗糙集模型中,文献[6]定义了可变多粒度粗糙集,文献[7,8]将多粒度思想引入到不完备信息系统中, 文献[9]将多粒度思想引入到了不完备多标记信息系统 中。而且现在已经有不少研究多粒度粗糙集属性约简 的论文[10~16],但是上面的研究基本上是单层的约简, 没有从事物变化的角度约简,也没有考虑到异构数据 的约简。因此本文中也用到了双层绝对粒度约简,从 而使最后得到的结果更精确。

由于这种影响大学生贫困评定的因素又是方方面面的,它的数据是异构的,是一种多粒度结构的,所以我们选用多粒度粗糙集的方法来分析这些数据。粒度约简是多粒度粗糙集里核心的内容之一。本次贫困生标准的评定就用到了粒度约简中悲观多粒度粗糙集粒度约简、乐观多粒度粗糙集约简[5]以及多粒度的双层绝对约简[17]。文中首先设计了大学生贫困资助评定的调查问卷表,面向本校大一至大四的学生分发调查问卷收集数据,通过改进双层粒度绝对约简以及悲观和乐观的多粒度粗糙集约简的算法,从乐观和悲观的两个角度,我们对贫困生评定标准的数据做了粒度的约简和绝对约简。通过粒度约简我们删除了冗余的粒度,再通过绝对约简我们又在每个粒度中删除冗余属性,保留重要的属性评定标准,最后得出一个总的可行的评定方案。通过应用这套新的贫困生评定标准可以使得高校的评定机制更加科学,提高资助的有效性,从而让贫困生拥有更好的未来。

2 粗糙集的基本概念

下面将介绍本文用到的基本概念。


定义1:IS  (U , A) 为一个信息系统,其中U 为论域, A 为论域U 上的条件属性集。 对于每个属性 a  A ,都对应着一个函数 a :U Va ,Va
称为属性 a的值域, U 中每个元素称为个体、对象
或行。对于每个属性子集  B  A 和任何个体
x U ,都对应着一个如下的信息函数:

InfB  x  {(a, a(x)) : a  B}

定义2:B —不分明关系(或称为不可区分关系):

IND(B) {(x, y) : InfB (x)  InfB (y)}
任何满足关系 IND(B) 的 2 个元素 x 、 y 都不能由属性子集 B 区分,[x]B 表示由 x 引导的 IND(B)
等价类。


对于信息 系 统 IS  (U , A) , 属 性子集
B  A 和论域子集 X  U , B —下近似和 B — 上近似定义为:

B(X )  B(IS, X ) {xU :[x]B  X}



B( X )  B(IS, X )  {x U :[x]B  X  }

m
p
i A1
i1

 X [x]  X
2

[x]
m

 X , x U}

B —下近似也称为正区域,记为 POSB (X ) 。序偶  
m  m 
 Ap ( X ) ~   Ap (~ X ) 


(B( X ), B( X )) 称为粗糙集。

i1

 i1  



定义 3 : 在信息系统 IS  (U , A) 中, if
B  A ,满足:

1)对于任意 x U ,都有[x]B [x]A ,

其中上标“ P ”为“悲观”。

定义 6[5]:设 S  (U , AT  D,V , f ) 是一个完备决策信息系统, A1, A2 ,, Am  AT , D 为

2)对于任意 S  B
[x]S [x]A ,

,存在 x U


,使得

决策属性, A {A1, A2 ,, Am} , B  A ,
U / D  {Y1,Y2,,Yr },则悲观多粒度粗糙集下


则 B  A 称为其绝对约简。

3多粒度粗糙集

近似分布定义为:


(U , D)  { A p (Y ),  A p (Y ),

i 1
i1
m

i 2
i1

多粒度粗糙集分为乐观粗糙集和悲观粗糙集[5], 分别定义如下。
定义 4:设 S  (U , AT  D,V , f ) 是一个完 备决策信息系统,A1  A, A2  A,..., Am  AT 。对于任意 X  U ,乐观多粒度下、上近似分别定义为[5]:

m

,  A p (Y )}
i1


若 B (U, D)  A (U, D) ,则称 B 为 A 的粒度下近似分布一致集。若对 B'  B ,都有
B'  (U , D)  A (U , D) ,则称 B 为 A 的粒度下近似分布约简。
无论是乐观粗糙集还是悲观粗糙集,都是在单个决策表中以及在粗糙集的框架下,某个概念对一系

 Ao ( X )  {x :[x]
i1

 X [x]
2

 X 

列的属性子集的等价类进行合取、析取和补集运算。

[x]
m



 X , x U}

这一系列的属性子集无论是子集个数,还是子集内部都可能含有冗余属性。所以在下文我们将讨论在多粒
度粗糙集在条件属性信息熵意义下不损失信息的双

m  m 

 Ao ( X ) ~   Ao ~X 

层多粒度绝对约简。

i1

 i 1  


4基于信息量的多粒度约简

其中,符号“ ~ ”为集合的补集运算,上标“ O ” 为“乐观”。

定义 5:设 S  (U , AT  D,V , f ) 是一个完 备决策信息系统,A1  A, A2  A,..., Am  AT 。


基于信息量的多粒度约简是通过求信息量来在粒度的层次上对粒度进行约简。

定义 7:粒度集的信息量

设 S  (U, AT  D,V, f ) 是一个完备决策信息系统,

对于任意 X  U ,悲观多粒度下、上近似分别定义
为[5]:

A1, A2 ,, Am  AT

, A {A1, A2 ,, Am} ,

U / D  {Y1,Y2,,Yr },定义:


I ( A | D)  1

2
2   Ai (Yj )
U j 1 Ai A

大的粒度 Ai
转到 Step4。

增加到粒度集 B 中,B1   B1 {Ai },


为悲观多粒度下粒度集 A 的信息量。这里

 Ai (Yj ) 表示集合的基数。
Ai A

Step5:输出粒度约简 C ,算法结束。

乐观下近似分布粒度约简算法与悲观悲观下近似分布粒度约简算法类似,在此就不在写出乐观下近似分布粒度约简算法的算法步骤了。

\

5多粒度绝对约简

定义 8:设 S  (U , AT  D,V , f ) 是一个完


对于多粒度粗糙集,每个粒度的属性子集都可

备 决 策 信 息 系 统

A1, A2 ,, Am   AT ,

能含有冗余属性,本文研究了如何约简属性子集簇中

A {A1, A2 ,, Am} U / D  {Y1,Y2,,Yr },
粒度 Ai 在粒度集 A 中的重要度定义为:

的冗余属性而不影响多粒度粗糙集。


定义 9 : 设 IS  (U , A) 为一个信息系统,


SGF(Ai , A)  I(A| D)  I(A{Ai}| D)

A1  A, A2  A,..., Am  A


,如果

定理 1[18]:设 S  (U , AT  D,V , f ) 是一个完备决 策 信息系 统 A1, A2 ,, Am    AT ,

A'1  A, A'2  A,, A'm  A,满足

1)对 于 任 意 x U 和 任 意
A '  A (i  1, 2,..., m) ,都有[x]A  [x]A

i i i i
A {A1, A2 ,, Am} U / D  {Y1,Y2,,Yr },


B  A ,若(I  B | D)  I ( A | D) 且对Ai   B ,
2)
对于任意 a  Ai ,存在 x U ,存在
i1

Ai  Ai  ,使得[x]A

 [x]A{a} 

SGF ( Ai , B)  0 ,则 B 为 A 的一个悲观下近似分布粒度约简。

i i



则 A'1  A, A'2  A,, A'm  A

,称为IS 的多

算法 1:在删除冗余粒度时采用悲观下近似分布粒度约简。
输入:决策信息系统 S  (U , AT  D,V , f ) ,

粒度绝对约简。

定理 2[18]: 在信息系统 IS  U , A 中,

A , A ,, A  AT , A {A , A ,, A } .

A '   A, A '   A,, A  '  A 为

1 2 m

1 2 m

A1  A, A2  A,, Am  A 的多粒度绝对约简,

输出:决策信息系统的一个悲观下近似分布粒度
约简C。

Step1 :对每一个 Ai  A ,计算 U / Ai 和
U / D 。

Step2:对每一个基于单粒度的粒度空间U / Ai

如果 A   Ai ,存在一个 IS  U , A 的绝对约
i 1
m
简 B  A ,使得 B   A 'i
i1


多粒度绝对约简就是保持每个属性子集对论域

和Yj U / D ,计算 A(i


Yj)。

的划分都不变的最小属性子集的集合,它要求每个属


Step3:首先令 B 为空,然后对任意 Ai  A , 计算 SGF(Ai, A)   ,将使 SGF ( Ai, A)  0   的
Ai 增加到粒度集 B 。
Step4:如果 I (B | D)  I ( A | D) ,则C  B , 转到 Step5;否则令 B1  A  B ,对Ai  B1 ,计算

性子集都不存在冗余属性.因为每个属性子集中包含的元素并不完全相同,所以本质上多粒度绝对约简属于异构数据的约简。

算法 2:按照双层多粒度绝对约简算法,将各个
n
粒度属性集中各自的冗余属性删除.设C   Ai .
i1

I (B {Ai }|D)  I (B | D) ,将使信息量增加到最

Step1 : 分 别 把
A1 ', A2 ',, Am '。

A1, A2,, Am     赋  给

包含于目标概念,这个要求较为严格,实际系统中的对象很难满足。所以我们得到的结果只有一个。

Step2:对于每个 Ai ' C(i 1, 2,, m) 中的


而在乐观多粒度中,一个对象属于某个目标概

属性,分别约去使得 X 

X
Ai '{a} 


Ai '

中的属性

念的下近似,要求粒度集合中的至少一个粒度上满足

这个对象的等价类包含于目标概念,这个要求较为宽

a ,令 Ai '  Ai '{a}.//这是个求同存异的过程,
尽可能约简每个属性子集中的非公共属性。

Step3 : 对于每个 C 中的属性分别约去使得
X    X 中的属性a ,令 A '  A '{a}。
Ai '{ a } Ai '
//这是一个存异求同的过程,在 Ai ' C 中独有属性保留的情况下继续约简共同属性。

Step4:输出信息系统 IS  (U , A) 的多粒度绝对约简 A1 ', A2 ',, Am '.

文章出自SCI论文网转载请注明出处:http://www.scipaper.net/jisuanjilunwen/443.html
0

相关内容

发表评论

Sci论文网 - Sci论文发表 - Sci论文修改润色 - Sci论文期刊 - Sci论文代发
Copyright © Sci论文网 版权所有 | SCI论文网手机版