下面是小编为大家整理的数据挖掘建模过程及python处理实例研究,供大家参考。
数据挖掘建模过程及python处理实例研究
摘要:目前,在我国电信行业存在大量业务数据,利用这些数据进一步拓宽通
信业务,已经成为各个通信单位的当务之急。近几年迅速崛起的数据挖掘技术可
以深入分析客户信息、客户价值和行为,从而使营销具有洞察力、精确化,并通
过从数据中挖掘价值来减少营销成本、提高营销效益。本文以通信行业为例,利
用python编程对其数据进行挖掘,并详细介绍了数据挖掘过程,从而促进通信业
务发展,为通信业提供决策支持服务。
关键词:数据挖掘;通信业务数据;python处理
引言
随着中国通信市场的竞争日趋激烈,通信运营商的经营理念已逐步从“技术质量第一”转变
为“服务客户至上”。以前的营销模式无法满足客户的多样化,层次化和个性化需求。长期以来,通信单元的大量详细业务数据已经简单地应用于各种业务系统,并且还没有得到更有效的开发
和利用。
1 数据挖掘模型
本文的数据挖掘示例使用呼叫行为,数据服务使用等作为客户分类变量,并将具有相似通
信行为的人员分组到一个组中。数据挖掘方法论选用CRISP-DM(Cross-Industry Process for Data Mining)过程模型,即交叉行业数据挖掘过程标准。它从数据挖掘技术应用的角度划分挖掘任务,并将数据挖掘技术与实际应用紧密结合。这里,为了简化说明,我们不考虑循环的探索和
调整过程,并直接按顺序检查每个链接,通过问卷调查和访谈实现客户的消费行为和需求。
1.1 数据准备
数据准备过程如下:
(1)确定项目目标,制定挖掘计划。
(2)分析变量的获取。
(3)数据收集和获取。
(4)数据集成。
根据CRISP-DM流程,首先是确定项目目标。本文定义的客户细分的业务目标是“从客户行
为的角度对某个地方的数十万普通客户进行分类,了解不同客户群体的消费者行为特征,为新
业务的发展,现有客户的保留,以及其他通信公司之间的竞争制定有针对性的策略提供依据。
并实现公司战略目标,稳定现有客户,增加客户增长。”之后,应充分获取分析变量,并在确保数据的一致性,完整性,有效性和层次结构的基础上,数据指标完整,应涵盖所有业务分析和
数据挖掘的需求。本文选择的数据源主要包括客户文件记录,客户营销记录,销售订单主表。
1.2建立模型
生成最终数据集后,就可以构建模型以执行集群分析。建模阶段主要是选择和应用各种建
模技术,同时校准其参数以获得最佳值。在建模过程中,本文采用多种技术手段并对建模效果
进行了比较,需要挑选合适的变量参与建模。该模型的建立是一个螺旋式,连续的优化过程。
如果结果不理想,则需要调整聚类模型以优化模型,这称为聚类优化。可以通过调整聚类数量
和调整聚类变量的输入,或者通过多次运行来选择满意的结果来实现聚类优化。通常可以根据
以下原则判断聚类结果是否理想:类间特征差异是否明显;群内特征是否相似;集群结果是否
易于管理并具有业务指导意义。
2 数据挖掘结果分析
根据客户分类的结果,重新定位客户,加深对客户的了解,并在此基础上制定响应策略。
客户分类模型最终产生一些客户分类,根据这些组的特征可以分为三组。各组的频繁与不频繁
通信行为比较见表1。
表1 各组的频繁与不频繁通信行为比较
相关热词搜索: python数据分析实战 建模 实例 数据挖掘版权所有:求精文档网 2018-2025 未经授权禁止复制或建立镜像[求精文档网]所有资源完全免费共享
Powered by 求精文档网 © All Rights Reserved.。备案号:粤ICP备18015855号-3