大数据的4v特性都有什么
大数据的4V特性包括:
1. 规模性(Volume):大数据的规模非常大,数据量以PB、EB或ZB为计量单位。例如,人类生产的所有印刷材料的数量是200PB,而历史上全人类总共说过的话的数据量大约是5EB。
2. 高速性(Velocity):大数据对处理数据的响应速度有严格的要求,需要实时分析而非批量分析,数据输入、处理与丢弃立刻见效,几乎无延迟。例如,根据IDC的“数字宇宙”的报告,预计到2020年,全球数据使用量将达到35.2ZB。
3. 多样性(Variety):大数据的类型多样,包括结构化数据、非结构化数据和半结构化数据。结构化数据如财务系统数据、信息管理系统数据等,非结构化数据如视频、图片、音频等,半结构化数据如HTML文档、邮件、网页等。数据来源于不同的应用系统和设备,关联性强。
4. 价值性(Value):尽管企业拥有大量数据,但是发挥价值的仅是其中非常小的部分。大数据的价值体现在从大量不相关的各种类型的数据中挖掘出对未来趋势与模式预测分析有价值的数据。
