急需数据挖掘相关的毕业论文题目
寿险是保险业的一个重要分支,具有巨大的市场发展空间。因此,随着寿险市场的开放和外资公司的介入,竞争逐渐升级,竞争对手之间的角逐已成定局。如何保持核心竞争力,使自己立于不败之地,是每个企业必须面对的问题。信息技术的应用无疑是提高企业竞争力的有效手段之一。经过多年的发展,寿险信息系统逐渐成熟和完善,积累了相当数量的数据资源,为数据挖掘提供了坚实的基础。然而,通过数据挖掘发现知识,并用于科学决策,越来越受到寿险公司的重视。
数据挖掘技术
数据挖掘是指从大量不完整、有噪声、模糊和随机的数据中提取有用信息和知识的过程。它的表现形式是概念、规则和模式。
目前,业界有许多成熟的数据挖掘方法,为实际应用提供了理想的指导模型。Crisp-DM(跨行业数据挖掘标准过程)是公认的和有影响力的方法之一。CRISP-DM强调的是,DM不仅仅是数据组织或呈现,更是数据分析和统计建模,更是从理解业务需求、寻求解决方案到被实践检验的完整过程。CRISP-DM将整个挖掘过程分为以下六个阶段:业务理解、数据理解、数据准备、建模、评估和部署。
业务理解是对企业运营、业务流程、行业背景的理解;数据理解是对现有企业应用系统的理解;数据准备就是从大量的企业数据中,取出与待探究问题相关的样本数据子集。建模就是在对业务问题的理解和数据准备的基础上,选择更切合实际的挖掘模型,形成挖掘的结论。评价是在实践中检验挖掘的结论,如果达到了预期的效果,就可以发表结论。在实际项目中,CRISP-DM模型中的数据理解、数据准备、建模和评估都不是单向的操作,而是一个反复、调整、不断修正的过程。
行业数据挖掘
经过多年的系统运行,寿险公司积累了相当多的保单信息、客户信息、交易信息、财务信息等。,而且还出现了超大规模的数据库系统。同时,数据集中为提升原有业务水平和拓展新业务提供了条件,也为数据挖掘提供了丰富的土壤。
根据CRISP-DM模型,数据挖掘首先要做的是了解业务,找到数据挖掘的目标和问题。这些问题包括:代理选择、欺诈识别和市场细分,其中市场细分对企业制定经营战略具有重要的指导意义,是关系到企业生存发展和企业营销战略制定与实现的首要问题。
根据寿险经营的特点,可以从不同的角度对客户群体进行分类汇总,从而形成各种客户分布统计,作为管理者决策的依据。从寿险产品入手,分析客户对不同险种的偏好,引导代理人重点推广,相对容易实现。因为国内经济发展不一样,各省之间差异很大,所以需要把分析数据的抽样限定在一个经济水平相当的地区。同时,市场波动也是必须考虑的问题。一个模型从建立到废弃有一个生命周期,这个周期是根据模型的适应性和命中率来决定的,所以模型需要不断的修正。
采矿系统架构
挖掘系统包括两部分:规则生成子系统和应用评估子系统。
规则生成子系统主要根据数据仓库提供的保单历史数据,完成统计并生成相关规则,输出相关结果。具体包括数据提取与转换、挖掘数据库建立、建模(包括参数设置)、模型评估和结果发布。发布的对象是高层决策者,模型提交给应用评估子系统,每月根据效果动态生成新的模型。
应用评估子系统可以理解为生产系统中的一个挖掘代理程序,它根据生成子系统生成的规则和一定的策略对策略数据进行无类预测。通过系统的任务规划,生成生产数据的评估指标。具体包括核心业务系统数据自动转移到数据平台、规则实时评估、评估结果动态显示和实际效果评估。规则评估子系统根据规则进行检测。经过一段时间的测试,规则生成子系统可以用来重新学习,获取新的规则,不断更新规则库,直到规则库稳定。
目前常用的分析指标有:投保、缴费年限、被保险人职业、被保险人年收入、被保险人年龄、被保险人性别、被保险人婚姻状况等。
在实践中,可以根据实际数据,适当选择因素,进行不同程度的总结,从而形成满意的决策树,产生可解释的结论。