什么是大数据?
数据的大量扩散和日益复杂的技术继续改变着行业运作和竞争的方式。 在过去的几年中,每天创建2.5兆字节数据的结果是,全球创建了90%的数据。 通常被称为大数据,这种快速增长和存储为结构化和非结构化数据的收集,处理和分析创造了机会。
大数据如何运作
遵循大数据的4 V,组织可以使用数据和分析来获得有价值的见解,以更好地制定业务决策。 仅举几例,采用大数据的行业包括金融服务,技术,市场营销和医疗保健。 大数据的采用继续重新定义了行业的竞争格局。 估计有84%的企业认为没有分析策略的企业冒着失去市场竞争优势的风险。
尤其是金融服务业已广泛采用大数据分析,以提供更好的投资决策和一致的回报。 结合大数据,算法交易使用具有复杂数学模型的大量历史数据来最大化投资组合收益。 继续采用大数据将不可避免地改变金融服务的格局。 但是,除了其明显的好处外,在大数据捕获大量数据的能力方面仍然存在重大挑战。
4 V的大数据
4 V是大数据的基础:容量,种类,准确性和速度。 面对日益激烈的竞争,监管限制和客户需求,金融机构正在寻求新方法来利用技术来提高效率。 根据行业的不同,公司可以利用大数据的某些方面来获得竞争优势。
速度是必须存储和分析数据的速度。 纽约证券交易所每天捕获1 TB的信息。 到2016年,估计有189亿个网络连接,地球上每人大约有2.5个连接。 金融机构可以专注于高效,快速地处理交易,从而从竞争中脱颖而出。
大数据可分为非结构化或结构化数据。 非结构化数据是无组织的信息,不会属于预定模型。 这包括从社交媒体来源收集的数据,可帮助机构收集有关客户需求的信息。 结构化数据包含组织已在关系数据库和电子表格中管理的信息。 因此,必须主动管理各种形式的数据,以便更好地制定业务决策。
市场数据量的增加对金融机构构成了巨大的挑战。 除了大量的历史数据,银行和资本市场还需要积极管理股票行情数据。 同样,投资银行和资产管理公司也使用大量数据来做出合理的投资决策。 保险和退休公司可以访问过去的保单和索赔信息,以进行主动风险管理。
算法交易
由于计算机功能的增长,算法交易已成为大数据的代名词。 自动化过程使计算机程序能够以人类交易者无法执行的速度和频率执行金融交易。 在数学模型中,算法交易可提供以最佳价格执行的交易,并及时进行交易,并减少由于行为因素造成的人工错误。
机构可以更有效地减少算法以合并大量数据,利用大量历史数据回测策略,从而降低风险投资。 这有助于用户识别要保留的有用数据以及要丢弃的低价值数据。 鉴于可以使用结构化和非结构化数据创建算法,将实时新闻,社交媒体和股票数据整合到一个算法引擎中可以产生更好的交易决策。 与决策制定不同,决策制定可能会受到各种信息来源,人类情感和偏见的影响,而算法交易仅在财务模型和数据上执行。
机器人顾问在数字平台上使用投资算法和大量数据。 投资是通过现代投资组合理论构架的,现代投资组合理论通常认可长期投资以保持稳定的回报,并且需要与人力财务顾问的互动最少。
挑战性
尽管金融服务业越来越欢迎大数据,但该领域仍然存在重大挑战。 最重要的是,各种非结构化数据的收集支持对隐私的关注。 可以通过社交媒体,电子邮件和健康记录收集有关个人决策的个人信息。
特别是在金融服务领域,大多数批评都落在数据分析上。 庞大的数据量需要更先进的统计技术,才能获得准确的结果。 特别是,批评者高估了信噪比作为虚假相关性的模式,纯粹是偶然地表示了统计上可靠的结果。 同样,由于历史数据的趋势,基于经济理论的算法通常会指出长期投资机会。 有效地产生支持短期投资策略的结果是预测模型固有的挑战。
底线
大数据继续改变着各个行业的格局,尤其是金融服务。 许多金融机构正在采用大数据分析来维持竞争优势。 通过结构化和非结构化数据,复杂的算法可以使用许多数据源执行交易。 可以通过自动化使人的情感和偏见减到最少; 但是,使用大数据分析进行交易有其自身的特定挑战。由于该领域的相对新颖性,到目前为止所产生的统计结果尚未完全被接受。 但是,随着金融服务趋向大数据和自动化的趋势,复杂的统计技术将提高准确性。