当前位置:首页 > 教育

数据建模 浅谈数据分析和数据建模

51CTO网络+首届中国APP创新评选大赛>;

大数据应用有几个方面,一是效率提升,帮助企业提高数据处理效率,降低数据存储成本。二是对业务给予指导,如精准营销、反欺诈、风险管理、业务提升等。以前企业都是通过线下渠道联系客户,客户数据不完整,只能用财务数据进行业务运营分析,缺少客户身边的个人数据。数据分析的应用领域主要集中在企业内部经营和财务分析。

一般情况下,如果IV值大于0.3,说明该变量具有较强的预测能力,可以采用。

三个数据分析过程

调查业务部门,了解业务需要解决的问题,将业务问题映射到数据分析工作和任务中,调查企业的内部和外部数据,找到分析所需的数据,收集特定区域、数据集市或数据仓库中的数据,并进行探索性的分析数据清理,包括检查数据的一致性、处理异常值和缺失值、删除重复数据以及其他数据转换,如数据宁滨。将字符变量转换为数字变量,根据所需的数据维度进行总结和建模,根据业务需求构建不同的模型(如客户流失预警、欺诈检测、购物篮分析、营销响应等)。),并解释和评估模型结果,而业务专家则解释和评估业务结果

四种数据分析场景和模型应用

数据分析建模需要先明确业务需求,然后选择描述性分析或者预测性分析。如果分析的目的是描述客户行为模式,则采用描述性数据分析,描述性分析考虑关联规则、序列规则、聚类等模型。

预测性数据分析是对未来某一事件发生的概率进行量化。有两种预测分析模型,分类预测和回归预测。在常见的分类预测模型中,目标变量通常是欺诈、损失、信用等二元分类变量。在回归预测模型中,目标变量通常是连续变量,如股价预测、违约损失预测等。

生存分析侧重于分析事件的结局和出现的时间,起源于医学领域,研究患者治疗后的生存时间。生存分析还可以用来预测客户流失时间、客户下次购买时间、客户违约时间、客户提前还贷时间、客户下次访问网站等。

常见的数据分析应用场景如下:

1营销

营销响应分析建模(logistic回归、决策树)网络推广分析建模(关联规则)客户保留分析建模(Kaplan Meier分析、神经网络)购物蓝分析(关联分析Apriori)自动推荐系统(协同过滤推荐、基于内容的推荐、人口统计推荐、基于知识的推荐、组合推荐、关联规则)客户细分(聚类)损失预测(logistic回归)

2风险管理

客户信用风险评分(SVM、决策树、神经网络)市场风险评分建模(逻辑回归和决策树)运营风险评分建模(SVM)欺诈检测(决策树、聚类、社交网络)

数据模型评估的五种方法

1 AUC值判别法

AUC小于0.7,识别能力弱,AUC在0.7-0.8之间,识别能力尚可,AUC在0.8-0.9之间,识别能力优秀,AUC大于0.9的模型发生事故

2 KS判别法

KS值大于0.2意味着更好的可预测性

[编辑推荐]

[负责编辑:赵利婧电话:(010) 68476606]

比如0

1.《数据建模 浅谈数据分析和数据建模》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《数据建模 浅谈数据分析和数据建模》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/jiaoyu/1573924.html

上一篇

费渡和骆闻舟肉 默读费渡第几章表白

下一篇

任梦燊 昆明女大学生李心草临死之前到底经历了什么?

参观的英语 如何用英语带客户参观工厂

关于工厂五个字 效率效率a:这条产品线的效率如何?乙:大约是85%。这条生产线的效率如何?乙:差不多85%。人工成本人工成本A:为什么我们会有这么高的人工成本?我们的工人来自国有企业。为什么我们的人工成本这么高?我们的工人来自国有企业。精益制造精益制造A:为什么我们需要精益制造?很简单,降...

参观英语 如何用英语带客户参观工厂

关于工厂五个字 效率效率a:这条产品线的效率如何?乙:大约是85%。这条生产线的效率如何?乙:差不多85%。人工成本人工成本A:为什么我们会有这么高的人工成本?我们的工人来自国有企业。为什么我们的人工成本这么高?我们的工人来自国有企业。精益制造精益制造A:为什么我们需要精益制造?很简单,降...

参观英文 如何用英语带客户参观工厂

关于工厂五个字 效率效率a:这条产品线的效率如何?乙:大约是85%。这条生产线的效率如何?乙:差不多85%。人工成本人工成本A:为什么我们会有这么高的人工成本?我们的工人来自国有企业。为什么我们的人工成本这么高?我们的工人来自国有企业。精益制造精益制造A:为什么我们需要精益制造?很简单,降...

oracle资料 Oracle数据库巡检模板 | 周末送资料

五x综合征 Oracle数据库运行状况检查和评估1.查看介绍 1.1检查系统 该系统主要包括一个数据库,如下:数据库名称数据库实例名应用程序名称应用类型OLTP/DSS/批处理开发工具应用介绍RDBMS版本CRS版本所有数据文件占用的磁盘空SGA目标规模数据库_块大小表格之间的数字空数据文...

数据库试题 2019数据库部分面试题经典集

常见的关系数据库管理系统产品有哪些? 答:Oracle、SQL Server、MySQL、Sybase、DB2、Access等。 SQL语言有哪些部分?各部分有哪些操作关键词? 答案:SQL语言包括四个部分:数据定义(DDL)、数据操作(DML)、数据控制(DCL)和数据查询(DQL)。...

superrecovery 超级硬盘数据恢复软件superrecovery的快速注册

  • superrecovery 超级硬盘数据恢复软件superrecovery的快速注册
  • superrecovery 超级硬盘数据恢复软件superrecovery的快速注册
  • superrecovery 超级硬盘数据恢复软件superrecovery的快速注册

适途 适途科技举办业务数字化大数据伙伴分享会

  • 适途 适途科技举办业务数字化大数据伙伴分享会
  • 适途 适途科技举办业务数字化大数据伙伴分享会
  • 适途 适途科技举办业务数字化大数据伙伴分享会

万方医学数据库 “万方医学图书”数据库正式开通通知