1.何为大数据?
大数据指一个超大的、难以用现有常规的数据库管理技术和工具处理的数据集。
大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产,可被称为“未来的石油”。
2.大数据有哪几个特征?
大体量(Volume):可从数百TB到数十数百PB,甚至EB的规模。
多样性(Variety):大数据包括各种格式和形态的数据
时效性(Velocity):很多大数据需要在一定时间限度下得到及时处理
准确性(Veracity):处理的结果要保证一定的准确性
大价值(Value):大数据包含很多深度的价值,大数据分析挖掘和利用将带来巨大的商业价值(但是数据密度低)。
3.请解释数据和信息的区别和关系
联系上,信息与数据是不可分离的,数据是信息的符号表示或称载体,信息是数据的内涵,是对数据的定义的解释,不同知识、经验的人,对于同一数据的理解,可得到不同信息。
区别上,数据是客观对象的表示,而信息则是数据内涵的意义;数据的格式往往随着载荷它的物理设备的形式而改变,具有多种多样的形式,也可以加以转换,但其中包含的信息内容不会改变,即信息不随载体的物理设备形式的改变而改变。信息可以离开信息系统而独立存在,也可以离开信息系统的各个组成和阶段而独立存在。
4.请简述金融数据的特征。
一般具有“数据流”特征,需要在短时间内快速处理。具有逻辑关系紧密,处理实时性要求高,可展示性需求强等特征。