
序
数据安全已然成为当今社会一个极为复杂且棘手的问题。它涵盖了诸多方面,既包括数据本身的数据确权、数据分类分级等法律法规和标准化难题,也涉及数据访问权限控制等IT基础设施相关问题,同时还存在在原始数据不流通的前提下如何实现价值流通等的创新技术困境。在国家将数据视为第五大生产要素的当下,中国各级政府与企业都对数字经济的蓬勃发展寄予厚望,然而数据安全问题却如同拦路虎般横亘在数字经济发展的道路上。
尽管数据要素流通的需求日益强劲,但能够保障数据要素安全流通的技术与产品却远未成熟。数据确权并非单纯的法律问题,更需要相应的技术作为支撑;数据分类分级的准确性与效率问题长期困扰着我们,在过去很长一段时间里都难以得到有效解决,直到人工智能大模型的出现,才让我们窥见了低成本解决这一问题的可能性;数据访问的细粒度控制依赖于权限管理和访问控制机制,而老旧的IT系统往往不具备这样的机制,面对海量老旧系统的改造,高昂的成本令人望而却步,我们急需找到成本可接受的解决方案;原始数据的流通极易引发数据泄露与个人隐私保护问题,而诸如安全多方计算、同态加密、联邦学习等旨在避免原始数据流通的计算方法,也面临计算效率低下、存在潜在数据泄露风险等问题。市场上的各类数据安全解决方案鱼龙混杂,用户在选择时面临着很高的试错成本。
刘文懋是多年战斗在技术一线的优秀安全研究人员,拥有丰富的攻防实战经验。尤为难得的是,他具备将复杂技术用通俗易懂的语言阐释清楚的非凡能力。这本书便是有力证明:本书从体系、技术洞察和实践案例3个维度,围绕数据安全自用、数据可信确权、数据可控流通、协同安全计算等典型应用场景,对敏感数据识别与分类分级、区块链、零信任架构、新型加密技术、去中心化身份、数字水印、数据脱敏、合成数据、API安全、同态加密、联邦学习、安全多方计算、可信执行环境及机密计算、可信计算等数据安全相关技术进行了深入浅出的讲解,并专门针对大模型的数据安全问题展开论述。
对有数据安全需求的读者来说,这本书能够帮助他们快速建立对相关技术基本概念的认知,并根据自身应用场景选择合适的技术,从而避免被那些堆砌专业名词的不可靠技术方案误导,让读者少走弯路。这无疑是对我国数字经济发展的重要贡献。