个人发布数据,机器测量与传感器数据,设备带有的定位 GPS 设备或者温度、光度感受器等测量的数据,交易数据,移动通信数据,人为数据,互联网上的开放数据来源。
大数据顾名思义,就是对规模巨大的数据进行分析,是研究大量的数据的过程中寻找模式,相关性和其他有用的信息,可以帮助企业更好地适应变化,并做出更明智的决策。如今数字信息化爆炸发展,大数据时代大数据的来源广泛,手机监听、网络直播等都不再是新鲜事,甚至有人说大数据时代没有“隐私”。那么这么厉害的大数据,它的来源都有哪些呢?
个人发布数据
例如个人的电子邮件、word、照片、视频、音频、qq 空间、微信朋友圈、社交软件聊天记录等。如今几乎人人都有智能手机,或者说人人都会“网上冲浪”。记得当年鹿晗官宣的那一则微博创下访客第一的吉尼斯世界纪录。他所发布的微博也是一种大数据的来源,包括我们大家在社交网站上的聊天信息,都是大数据的来源。
机器测量与传感器数据
设备带有的定位 GPS 设备或者温度、光度感受器等测量的数据。疫情当下,许多商场都在门口安装了红外体温检测仪,路过的行人在视野范围内都会接受测量,所得的体温信息便被马上记录下来,这便是一种大数据的来源。包括行车记录仪,车辆的 GPS 系统等都是大数据的来源。
交易数据
包括 POS 机数据、信用卡刷卡数据、电子商务数据、互联网点击数据、“企业资源规划”(ERP)系统数据、销售系统数据、客户关系管理(CRM)系统数据、公司的生产数据、库存数据、订单数据、供应链数据等。
移动通信数据
能够上网的智能手机等移动设备越来越普遍。移动通信设备记录的数据量和数据的立体完整度,常常优于各家互联网公司掌握的数据。移动设备上的软件能够追踪和沟通无数事件,从运用软件储存的交易数据(如搜索产品的记录事件)到个人信息资料或状态报告事件(如地点变更即报告一个新的地理编码)等。
人为数据
人为数据包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基等社交媒体产生的数据流。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。
开放数据
互联网上的“开放数据”来源,如政府机构,非营利组织和企业免费提供的数据。