什么是预测建模?
预测建模是使用已知结果来创建,处理和验证可用于预测未来结果的模型的过程。 它是预测分析中使用的一种工具,它是一种数据挖掘技术,旨在回答“未来可能会发生什么?”这一问题。
了解预测建模
向数字产品的快速迁移已创造了海量数据,企业可以轻松获取和访问这些数据。 公司利用大数据来改善客户与企业关系的动态。 大量的实时数据来自社交媒体,互联网浏览历史,手机数据和云计算平台等来源。
通过分析历史事件,企业很可能能够预测将来会发生什么并相应地进行计划。 但是,这些数据通常是非结构化的,太复杂了,以至于人类无法在短时间内进行分析。 由于存在大量数据的复杂性,公司越来越多地使用预测分析工具来预测可能在不久的将来发生的事件的结果。
预测分析如何工作
预测分析收集并处理大量历史数据,并使用功能强大的计算机评估过去发生的情况,然后提供对未来发生情况的评估。
预测分析使用预测器或已知功能来创建将用于获取输出的预测模型。 预测模型能够了解数据的不同点如何相互连接。 回归和神经网络是最广泛使用的两种预测建模技术。
公司越来越多地使用预测模型来预测在不久的将来可能发生的事件。
特别注意事项
在统计领域,回归是指输入和输出变量之间的线性关系。 具有线性函数的预测模型需要一个预测器或特征才能预测输出/结果。 例如,一家希望在早期发现洗钱的银行可能会采用线性预测模型。
该银行特别想知道哪个客户可能会在某个时间点从事洗钱活动。 呈现银行的所有客户数据,并围绕每个客户在一段时间内进行的转账的美元价值建立预测模型。
教导该模型识别洗钱交易和正常交易之间的差异。 该模型的最佳结果应该是一种模式,该模式可以指示哪些客户洗了钱,哪些没有洗钱。 如果模型感知到特定客户正在出现欺诈模式,那么它将为银行的欺诈分析师提供行动信号。
预测模型还用于神经网络,例如机器学习和深度学习,这是人工智能(AI)的领域。 神经网络受到人脑的启发,并由代表层次结构的互连节点构成,这些节点代表了AI的基础。 神经网络的力量在于它们处理非线性数据关系的能力。 他们能够在变量之间创建关系和模式,这对于人类分析家来说是不可能的或太耗时的。
重要要点
- 预测建模是使用已知结果创建,处理和验证可用于进行未来预测的模型的过程。回归分析和神经网络是最广泛使用的两种预测建模技术。
因此,尽管银行可以将已知变量(例如由客户发起的转账价值)输入其模型中,以获得谁可能从事洗钱活动的预期结果,但神经网络可以创建更强大的模式成功地在输入变量之间建立关系,例如登录时间,用户地理位置,用户设备的IP地址,资金的接收者或发送者以及可能构成洗钱活动的任何其他功能。
金融公司使用的其他预测建模技术包括决策树,时间序列数据挖掘和贝叶斯分析。 通过预测性建模手段利用大数据的公司可以更好地了解其客户如何与他们的产品互动,并可以确定公司的潜在风险和机会。