大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的特征是容量、种类、速度、可变性、真实性、复杂性和价值,大数据包括结构化、半结构化和非结构化数据,大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据,适用于大数据的技术,包括大规模并行处理数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。