数据全生命周期管理包括数据采集、数据存储、数据处理、数据传输、数据交换、数据销毁这六个阶段。
数据采集:指新的数据产生或现有数据内容发生显著改变或更新的阶段。对于组织机构而言,数据的采集既包含在组织机构内部系统中生成的数据也包含组织机构从外部采集的数据。
数据存储:指非动态数据以任何数字格式进行物理存储的阶段。
数据处理:指组织机构在内部针对动态数据进行的一系列活动的组合。
数据传输:指数据在组织机构内部从一个实体通过网络流动到另一个实体的过程。
数据交换:指数据经由组织机构内部与外部组织机构及个人交互过程中提供数据的阶段。
数据销毁:指通过对数据及数据的存储介质通过相应的操作手段,使数据彻底丢失且无法通过任何手段恢复的过程。
特定的数据所经历的生命周期由实际的业务场景所决定,并非所有的数据都会完整的经历六个阶段。
呈现与使用方面:
在这个数据爆炸的时代,人类数据分析的能力已经远远落后于获取数据的能力。这个挑战不仅在于数据量大、高维、多元源、多态等,更重要的是数据获取的动态性、数据内容的噪声和相互矛盾,数据关系异构与异质性等。
还有,通过纯粹数字和数字术语这样数据思考并非人类的本能,想要在有需要时迅速、准确的判断和决策实属不易。面对这些挑战可借助于数据可视化完成DIWK(数据、信息、知识和智慧)模型定义数据到智慧的转换。
数据生命周期应该指的是数据从创建到销毁的整个过程。例如:静态变量生命周期取决于类的生命周期,当类被卸载,静态变量也被销毁;局部变量生命周期是程序运行出局部作用域即被销毁。定义的话,就是各种变量的定义方法,如:int static a=1。