个人信用风险评估的一种基于XGBoost的集成学习方法 CNKI文献
在信用卡数据建模的分类器构造问题中,“好”“坏”客户具有严重不均衡的数据特性,在抽样方法的框架下,解决数据非均衡性的方法主要是欠抽样、过抽样或者两者的结合,一般情况下,欠抽样会造成信息损失,过抽样易导致过拟...
在互联网金融如火如荼的今天,以P2P网贷为例,目前该行业规模正以每年翻5倍的趋势增长。该行业的核心问题就是如何正确有效帮借款方找到资金以及帮贷款方进行风险控制。而在大数据的浪潮下,面临的用户数据无论在用户数...
尹超 导师:崔文泉 中国科学技术大学 2016-06-01 硕士论文
关键词: 个人信用度评级模型 / 网贷贷款发放 / 分类器 / 门限logistic模型
下载(131)| 被引(3)
高维不均衡数据情形下一种基于随机投影的决策树集成分类方... CNKI文献
随着时代的发展,高维不均衡数据越来越频繁地出现在各个领域,比如基因数据、信号数据、金融数据等;如何有效地对高维不均衡数据进行分类是一个重要的研究方向。为此,本文提出一种基于随机投影的决策树集成分类方法;并...
含多元非线性结构的高维Logistic模型的同时变量选择及半参... CNKI文献
众所周知,Logistic模型是一种广义线性回归分析模型,在医药学、经济学等领域都有重要的应用。本文将介绍具有多元非线性结构的高维Logistic回归模型,其线性部分是高维的,非线性部分为多元函数。文中采用Lasso方法,并结...
潘玉婷 导师:崔文泉 中国科学技术大学 2016-05-01 硕士论文
关键词: 高维 / 含多元非线性结构的Logistic模型 / Lasso / RKHS
下载(152)| 被引(0)
由于科学技术的不断发展,特别是计算机技术的快速发展,高维数据在众多领域中不断地涌现,例如互联网大数据、社会经济数据、生物医学数据等。高维数据在带来更大信息量的同时,也伴随着出现了“维数灾难”的问题。如何有...
非均衡数据的分类问题广泛存在于金融、医疗、电信等领域,而传统的分类方法如决策树、支持向量机等存在对少数类识别不够准确的问题。本文针对严重非均衡数据提出一种非迭代核逻辑回归的学习方法,不仅减轻了由于迭代所...
高维数据越来越频繁的出现在各个领域,例如基因研究,经济学等。高维数据在带来更多信息量的同时,也不可避免的带来了“维数灾难”的难题。如何有效的处理高维数据也成为当今的研究热点,其中,充分降维是一个重要研究方...
基于RKHS理论处理非线性数据的一种广义半参数充分降维方法 CNKI文献
“大数据”逐渐的成为很多领域里面热门的话题,例如新闻智能推送,经济学研究,机器学习等。当对高维数据处理时经常遇到“维数灾难”问题。如何从高维数据中有效的提取感兴趣信息是当今统计学研究的热点和难点。其中充...