论文范文网-权威专业免费论文范文资源下载门户!
当前位置:毕业论文格式范文>毕业论文>范文阅读
快捷分类: 论文算法伪代码 计算机算法分析论文 算法多样化开题报告 聚类算法文献外文翻译 论文算法重复不出来 遗传算法英文参考文献

算法方面有关论文范本 和基于ARFM模型和K均值算法的理财客户价值分析方面论文范文检索

分类:毕业论文 原创主题:算法论文 发表时间: 2024-02-06

基于ARFM模型和K均值算法的理财客户价值分析,本文是算法方面论文范文和价值分析和ARFM模型和K均值算法有关论文范文.

中国银行软件中心 徐福昌 李雪飞 李红杰 马成

伴随着经济社会的稳步发展,客户已经越来越成为决定企业发展的关键力量.现代营销学之父菲利普·科特勒指出:在一个产品泛滥而客户短缺的世界里,以客户为中心是走向成功的关键.对于商业银行来说,面对来自同业和互联网金融企业愈发激烈的竞争,要想脱颖而出,必须以客户的需求为出发点,以满足客户的需求为目标,通过优质的服务和产品吸引和留住客户.

为此,商业银行一方面要根据市场需求,为客户提供优质的服务,推出更多具有竞争力的产品;另一方面,需要分析客户的基本信息和业务数据,构建画像,分析客户价值,以采取相应的措施拓展重要客户、挖掘潜在客户和挽留有价值的客户.

一、基于ARFM 模型和K 均值算法的理财客户价值分析决策架构

在客户关系管理CRM 技术中,有三个重要的要素:最近一次消费(Recency)、消费频率(Frequency) 和消费金额(Monetary).这三个要素构成了CRM 重要的客户价值分析模型,即RFM 模型.由于客户在商业银行的资产情况也会对客户的理财价值产生重要影响,本文在RFM 模型基础上增加资产信息(Asset),建立了ARFM 模型.

为了对客户建立画像,分析客户价值,受多属性决策理论的启发,本文首先从客户基本信息和理财信息中获取数据;其次,对获取到的数据进行缺失值和异常值分析和数据预处理(包括数据清洗、属性规约、数据规范化),将原始数据各属性规约到ARFM 模型的指标属性中,并将各指标属性规约到一个统一量纲和范围数据区域内;再次,对处理后的ARFM 模型的指标数据采用K 均值算法进行聚类;最后,对聚类的结果进行价值特征分析,识别出有价值的客户.在识别出客户价值信息之后,商业银行就可以有针对性地进行产品推荐和服务.

如图1 所示,基于ARFM 模型和K 均值算法的理财客户价值分析决策模型主要包括数据获取模块、数据预处理模块、数据聚类模块和价值分析模块.

(1)数据获取模块

该模块主要是收集商业银行存储的用户基本信息,用户理财信息等数据,并将这些信息发送到数据预处理模块.

(2)数据预处理模块

该模块主要包括数据清洗、属性规约和数据规范化三个子功能.数据清洗功能首先对原始数据进行缺失值和异常值分析,然后据此对原始数据进行数据清洗,使原始数据合法.属性规约功能主要是对原始数据中各属性进行规约,去掉不用做价值分析的属性,将价值分析相关属性归约到ARFM 模型中的四个属性中.数据规范化功能对规约后的数据进行规范化等处理,将所有数据统一到相同的量纲之中,采用的 是z-score 规范化方法.在完成数据清洗、属性规约和数据规范化后将规范化后的ARFM 数据发到数据聚类模块.

(3)数据聚类模块

该模块主要采用K 均值算法对规范化后的ARFM 数据进行聚类分析,并将聚类分析结果发送给价值分析模块.

(4)价值分析模块

根据聚类结果分析每一个客户的价值,并将价值分析结果交给商业银行业务,由业务决策对每一位客户进行营销和个性服务等,从而实现拓展重要客户,挖掘潜在客户,挽留有价值的客户.

二、ARFM 模型

在客户关系管理中,RFM 模型的应用非常广泛.RFM 模型是衡量企业客户价值的重要方法.该模型通过一个客户的最近一次消费、消费频率、消费总金额三项指标来描述该客户的价值状况.

(1)R 指标- 最近一次消费(Recency)

最近一次消费是指上一次购买的时间.理论上,最近一次消费距当前时间越近的客户应该是比较有价值的客户,是最有可能再次进行消费的客户.这些客户对该企业提供的新商品或服务也是最有可能会感兴趣.

(2)F 指标- 消费频率(Frequency)

消费频率是客户在选定的时间范围内所购买的次数.消费频率高的客户,往往是对产品或服务满意度高的客户,对产品或服务的忠诚度往往也较高.

(3)M 指标- 消费总金额(Monetary)

消费总金额是客户在选定的时间范围内所购买商品和服务的价钱.消费总金额高的客户,往往是对产品或服务需求量大或者具有较高经济承受能力的客户.

消费总金额可以用来验证“帕雷托法则”(Pareto’sLaw),即公司80% 的收入来自20% 的客户,所以必须重视这一类客户.

由于客户的资产情况也会对其是否会购买理财行为产生影响(资产多的客户有更多的购买能力),所以,我们将客户的资产情况纳入考虑范围,构成ARFM 模型.

(4)A 指标- 资产情况(Asset)

资产情况是客户在选定的时间范围内所拥有的总资产的平均值.总资产的来源可能包含很多,例如股票、基金、理财、存款、房产、信用卡透支金额、贷款等等.在这里,我们认为一定时期的资产情况由客户的存款金额平均值(D)和欠银行的金额平均值(L)构成.具体计算公式为:

资产情况等于 存款金额平均值- 欠银行的金额平均值等于D-L

三、K 均值算法

K 均值算法是硬聚类算法,是目标函数聚类算法的代表.K 均值算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V 最优分类,使得评价指标J 最小.算法采用误差平方和准则函数作为聚类准则函数.其核心思想是:随机选定K( 聚类数) 个初始中心,然后根据这K 个初始中心,将N 个数据点根据欧氏距离进行聚类,每个数据点离哪个初始中心更近就归于此初始中心一类,直至聚类完成,再计算每个聚类的均值作为新的中心,然后根据欧氏距离进行聚类,如此迭代下去,直至收敛(即重新计算的中心与前一次计算的中心位置一致或小于指定阈值).

其算法过程如下:

从数据集N 个数据中选择K 个初始聚类中心;

对剩余的(N-K)个数据计算到K 个初始聚类中心的欧氏距离,并将其归类于最小距离的中心的类;

对K 个类重新进行计算,得到迭代后的聚类中心;

迭代直到聚类中心不再变化或者变化小于设置的阈值为止.

算法详述如下:

输入:k, 数据点集合data[0]…data[n];

(1)从数据点集合中选择k(聚类数)个作为初始聚类中心点,例如a[0]等于data[0],…a[k-1]等于data[k-1];

(2)data[0]…data[n] 数据点集合中的剩余n-k 个数据点,依次取出每个数据点,与聚类中心点a[0]…a[k-1] 进行欧氏距离计算,并对计算结果进行比较,假定data[j] 与a[i] 差值最少,则将data[j] 标记为i(归类为i);

(3)对于所有标记为i 的点,重新计算聚类中心点a[i];

a[i]等于 所有标记为i 的数据点data[j] 之和/ 标记为i的个数;

(4) 重复(2) 和(3),直到所有a[i] 值的变化小于设置的阈值.

四、实验分析

1. 数据获取

首先从商业银行系统的数据库中获取到2 年内500多个客户的基本信息以及这些客户的购买记录和统计情况,然后将客户的一些非相干属性删除,只保留和ARFM 模型相关的六个属性.

CustomerNo 是客户的ID;D 代表客户的存款;L代表客户当前欠银行的钱;R 代表最后一次购买理财距离当前的月数;F 为2 年时间范围内购买理财的次数,及购买频率;M 为2 年时间范围内购买理财的总金额.

2. 数据预处理

(1)数据清洗

选取的数据中可能会存在部分字段缺失和异常的情况,例如字段为空或者为负数,我们认为CustomerNo属性不能为空;D 和L 属性若为空设置为0,负数则代表相反的意思(如D 属性,若存款为负数,即认为是欠款);R、F、M 属性不能为负数,也不能为空,如出现则将所属记录抛弃,结果如表1.

(2)属性规约

由于客户的资产状况(A 属性)是由客户的存款金额平均值和欠银行的金额平均值构成.所以,根据资产状况计算公式对属性进行规约,将D 和L 属性转化为A属性.转化后的结果如表2.

(3)数据标准化

这里我们采用z-score 方法对清洗后的数据中的每个属性分别进行规范化,z-score 方法的公式如下:

z等于(x-μ)/σ

其中x 为某属性的一个具体取值,μ 该属性的所有取值的平均数,σ 为标准差.

经过标准化之后的数据见表3.

3. 聚类分析

我们使用K 均值算法对标准化后的数据进行聚类,我们设置K等于5,聚类结果见表4.

具体分类的分布情况和每个分类的聚类值如表5所示:

4. 价值分析

首先,我们可以通过上面聚类分析出在分类结果中每个属性上的极大值和极小值.从表5 我们可以得出以下结果.

(1)客户类别0 在R 属性上最大,F、M 属性上最小.

(2)客户类别1A 属性次小,R 属性次小,F 属性次大,M 属性次大.

(3)客户类别2 在F、M 属性上最大,在R 上最小.A 属性次大.

(4)客户类别3 在A 属性上最小.F 属性次小,M 属性次小.

(5)客户类别4 在A 属性上最大.R 属性次大.汇成价值分析类别特征表,见表6.

由此,理财客户的价值分析如下:

(1)客户类别0

购买理财产品的频率和总金额最低,但最后一次购买理财产品时间最近.此类客户可以认为是理财产品的新客户/ 或者是理财倾向少的客户,属于一般发展客户.

(2)客户类别1

购买理财产品的频率和总金额较高,但是其资产状况较差,最后一次购买理财产品时间较久,此类客户证明为是因为资金短缺较长时间没有来过的忠实客户.一方面,我们主动和他保持联系;另一方面也要关注他的较差的资产情况,购买可能性比较低.综合来看,由于他的资产状况,不能认为他是重要挽留客户,可以认为是一般价值客户(也就是说资产问题解决后,此类客户一般会在近期购买理财产品;但是如果不能解决资产问题,则不会购买).

(3)客户类别2

购买理财产品的频率和总金额最高,资产状况较高,但是其最后一次购买理财产品时间最久,此类客户证明为是很久没有来过的忠实客户,我们需要主动和他保持联系.在此我们可以认为他们是重要保持客户.

(4)客户类别3

购买理财产品的频率和总金额较低,资金状况最差.此类客户可以认为是不太会购买理财的客户,属于低价值客户.

(5)客户类别4

资产状况最好,且最后一次购买理财产品时间较近.此类客户可以被认为是有很好的理财产品购买倾向,是重要发展客户.

以上价值分析的结果见表7.

根据价值分析的结果,商业银行可以针对不同类别的客户采取不同的措施.例如,客户类型2,即重要保持客户,此类客户很长时间没有买过理财了,但是之前他购买的金额总数和频率都很高,这说明最近没有他喜欢的理财产品.如果此时不考虑主动联系该类客户并为该类客户制定个性化的服务和新的优质理财产品,这类客户就有可能流失.

所以,通过识别客户价值信息,有针对性地进行产品推荐和服务,做到精准营销,深层次地挖掘客户潜在资源,这就是基于ARFM 模型和K 均值算法的理财客户价值分析的意义所在.

此文结束语:这是大学硕士与算法本科算法毕业论文开题报告范文和相关优秀学术职称论文参考文献资料,关于免费教你怎么写价值分析和ARFM模型和K均值算法方面论文范文.

参考文献:

1、 基于均值-方差模型的我国企业年金基金海外投资 我国企业年金基金进行市场化运营以来,始终被封锁于国门之内,由于投资范围的局限,非市场风险一直未得到充分分散 本研究利用国内外债券市场和股票市场的投资工具,充分考虑风险偏好与政府设定投资限制……因素对海.

2、 基于遗传算法的药物疗效评价模型 1 引言(Introduction)心脑血管疾病是全球威胁人类健康的重大疾病,其发病和死因一半以上与高血压有关,同时居民脑卒中和冠心病发病最重要的危险因素也是高血压,所以控制高血压是防治心脑血管病.

3、 基于移动视觉搜索技术的智慧公共文化服务模型* 董 晶 吴 丹 (1 武汉大学信息管理学院 湖北武汉 430072)摘 要移动视觉搜索应用于公共文化服务符合国家 “互联网”的发展战略 通过对移动视.

4、 移动图书馆用户采纳行为模型构建与实证 摘要系统全面地获取用户采纳移动图书馆的主导影响因素以及它们之间的复杂关系,对提高图书馆移动服务质量具有重要的实践指导意义 文章采取开放式问卷获取移动图书馆用户采纳的影响因素,并结合用户采纳理论中的TT.

5、 高校科研数据管理和共享政策的案例和执行模型 摘要文章采用网络调查、内容分析和现场考察法,从政策内容、角色定位、平台建设三个方面剖析伊利诺伊大学数据银行政策体系现状与特点 在对已有政策执行模型优缺点与适用范围比较的基础上,选择史密斯过程模型来验证.