什么是大数据?
大数据是指以不断增加的速度增长的各种大型信息。 它涵盖了信息量,创建和收集信息的速度或速度,以及所涵盖的数据点的种类或范围。 大数据通常来自多个来源,并以多种格式到达。
大数据如何运作
大数据可分为非结构化或结构化。 结构化数据包含组织已在数据库和电子表格中管理的信息; 本质上,它经常是数字。 非结构化数据是未组织的信息,不会落入预定的模型或格式。 它包括从社交媒体来源收集的数据,可帮助机构收集有关客户需求的信息。
传统上,三个V代表大数据:数据量(数量),数据收集的速度(速度)以及信息的多样性。
可以通过问卷,产品购买和电子签到从社交网络和网站上的公共共享评论中收集大数据,从个人电子产品和应用程序中自愿收集大数据。 智能设备中传感器和其他输入的存在允许在各种情况下收集数据。
大数据通常存储在计算机数据库中,并使用专门设计用于处理大型,复杂数据集的软件进行分析。 许多软件即服务(SaaS)公司专门管理这种类型的复杂数据。
大数据的使用
数据分析人员查看人口统计数据和购买历史记录等不同类型数据之间的关系,以确定是否存在关联。 此类评估可以在公司内部进行,也可以由专注于将大数据处理为可消化格式的第三方进行外部评估。 企业经常使用此类专家对大数据的评估,将其转换为可操作的信息。
公司中几乎每个部门都可以利用从数据分析,人力资源和技术到市场营销和销售的发现。 大数据的目标是提高产品上市的速度,减少获得市场采用,确定目标受众所需的时间和资源,并确保客户保持满意。
重要要点
- 大数据是大量多样的信息,它们以越来越大的速度和越来越高的速度到达。大数据可以是结构化的(通常是数字的,易于格式化和存储的)或非结构化的(形式更自由,可量化的)。公司的部门可以利用大数据分析的结果,但是处理混乱和噪音会带来问题。
大数据的优缺点
可用数据量的增加带来了机遇和问题。
一般而言,拥有更多有关客户(和潜在客户)的数据应使公司能够更好地定制其产品和营销活动,以创造最高的满意度并重复业务。 能够收集大量数据的公司将有机会进行更深入,更丰富的分析。
尽管更好的分析是肯定的,但大数据也会产生过载和噪音。 公司必须能够处理大量数据,同时还要确定与噪声相比,哪些数据代表信号。 确定什么使数据相关成为关键因素。
此外,在对数据进行操作之前,可能需要对其进行特殊处理。 由数值组成的结构化数据可以轻松存储和排序。 非结构化数据(例如电子邮件,视频和文本文档)在变得有用之前可能需要应用更复杂的技术。