1.3 DaaS面临的问题
现有服务网络出现以下几方面特征。
数据规模逐渐增大。2015年工业和信息化部发布的《移动互联网产业发展白皮书》中指出,2012~2014年,移动数据流量每年都保持在两倍以上的增长,全球每月移动互联网数据流量平均在3 200 PB以上。而在网络数据总量方面,物联网的发展导致原有以结构化数据为主的网络数据呈现出多元化发展的态势,多种结构化与非结构化数据的占比大大提升,根据IDC预测,全网数据量在2020年达到35 ZB。
数据服务类型的多样化。网络中的数据服务复杂性与不确定性逐渐攀升,随着移动应用的多样化发展,其中的数据服务内容也呈现出多样的发展态势,数据服务类型也不断增加;不断增加的数据类型导致对于数据服务识别与交互的不确定性也不断增大,如手游、电子商务与社交等应用产生的大量异构数据服务为传统的数据集成方式带来了极大的挑战。
大规模网络服务协作导致数据服务交互复杂度增加。随着互联网与移动互联网中的应用服务持续增长,数据服务发现、选择过程效果不一致与数据质量良莠不齐的问题也在逐渐增加。文献[15]指出,很多使用者发现过数据服务失效的问题,因而在大规模服务协作的环境中,在保证整体数据质量的前提下,完成数据服务的平稳交互与演化是目前需要解决的问题。
随着服务计算在Internet与企业信息网络中的空前发展,B2B、B2A、O2O与LBSNS等新的服务模式不断涌现,服务网络中服务间的协作与交互呈现爆发式增长。同时服务网络的自治性、松散耦合性与弱监管性等特性导致网络中数据服务的交互复杂度急剧攀升,数据间的格式异构、内容不相容与数据源异质等问题也不断呈现。网络中的服务系统越发需要通过动态、可伸缩的形式进行相互整合,提高数据服务调度能力与计算服务的协调能力,并保证服务系统的服务质量,提高组合服务的执行效率。
然而,当前的DaaS在以下几方面还存在缺点。
(1)数据对象方面
大部分DaaS仅支持结构化数据,并且随着大数据技术的发展,大数据环境下的数据源不仅有结构化数据,更多的是非结构化数据。为了使数据服务能够支持非结构化数据,需要设计一种通用的、能够表达非结构化基本信息、背景信息等特征的数据模型,从而为面向非结构化数据的数据服务奠定基础。大量的非结构化数据将成为数据处理的主要对象,因此需要在突破对非结构化数据统一描述障碍的基础上,实现对非结构化数据的支持。
(2)服务模型方面
DaaS 沿用传统 Web 服务的描述方法,仅描述了服务接口规范,而新的DaaSDN服务模型应该能够对数据模型、数据质量、隐私等数据特征进行描述。
(3)服务内容方面
DaaS 主要表现为“数据提供服务”,即为服务消费者提供原始数据,而新的DaaS面临的主要挑战是如何将检索、分析和可视化以服务形式提供给消费者。此外,为了适应多变的服务场景和个性化的用户需求,如何提高数据服务能力,这也是DaaSDN面临的挑战。
为此,本书提出了以数据虚拟化的方式解决上述问题,而这也是本书的主要内容。