
第二章 人工智能技术及其应用
杜宁 杨颖[1]
摘要:政策与市场驱动人工智能向大规模应用方向发展,但在这个过程中面临安全、数据、人才、成本等各种门槛,使市场产生了一些怀疑的声音,这些问题的解决需要政产学研各方的共同努力。从人工智能角度来说,科技创新将推动这些痛点问题的解决,并在金融领域的应用中由外围向核心业务渗透、由感知向决策类应用扩展,推动金融行业向数字普惠化演变,引领监管科技新潮流。
关键词:人工智能 迁移学习 数据安全 软硬一体 自动机器学习
一 政策与市场环境
(一)各国加码扶持人工智能发展
全球范围内许多国家和地区高度重视人工智能,不断加强顶层布局,为人工智能技术的创新应用提供了良好的政策环境。美国、欧盟、德国、英国、法国、日本等都已发布了人工智能战略。2018年4月,英国政府公布了《产业战略:人工智能领域行动》,就发展人工智能事宜制定了具体的实施政策。
在我国,继2017年人工智能上升为国家战略之后,2018年人工智能再度被写入《政府工作报告》。2018年10月,中共中央政治局就人工智能发展现状和趋势举行第九次集体学习,再次释放出中央层面对人工智能战略高度重视的信号。截至2018年底,超过20个省份发布了30余个人工智能专项扶持政策。
政策扶持的侧重点正从技术研发转向研发应用。2019年,我国新一代人工智能技术将加大推进力度,加快实施重大科技项目,建设一批国家级新一代人工智能创新发展试验区。
(二)数据安全与隐私保护更加严苛
新一代人工智能的崛起,在给人类带来科技革命、产业变革的同时,也引发了对安全和社会伦理道德的担忧。国外一些互联网巨头严重数据泄露导致用户隐私泄露的事件,引起了社会各方的关注,因此加大数据安全和隐私保护力度成为大势所趋。2018年5月,被誉为“全世界最严厉的数据隐私保护法”的欧盟《通用数据保护条例》(GDPR)生效。该条例强调,机器学习模型必须具有可解释性,而且收集用户数据必须公开、透明,用户可以要求经营者删除其个人数据并且停止利用其数据进行建模。脸书和谷歌等企业成为GDPR下的第一批被告。无独有偶,美国也通过了《2018年加州消费者隐私法案》。我国在数据安全和隐私保护方面虽然起步较晚,但也越来越重视,与人工智能密切相关的《数字安全法》《个人信息保护法》已经被列入全国人大常委会的立法规划。
无法获取足够的数据就无法建模,趋于严格的数据安全与隐私保护对人工智能的发展来说是一个不小的挑战。
(三)市场从盲目热捧到趋于理性
2019年,整个人工智能行业将面临“期中考试”,业界对人工智能的要求不再是“仰望星空”,而是要规模化落地,为社会创造价值。
然而人工智能落地的过程不是一帆风顺的,阻碍人工智能行业规模化落地的门槛很多,在此我们列举有代表性的四大类。
一是数据安全与隐私保护。数据安全与隐私保护政策的出台是市场推动的结果,尤其是金融业涉及较多商业秘密和敏感数据的信息,在处理、共享和使用过程中面临违规越权使用或被用于非法用途等数据泄露的安全风险,在使用人工智能时不得不对此重点考虑。
二是数据门槛。为支持人工智能应用的有效运行,需要利用包含不同维度的数据信息,即便是已有海量数据储备的金融机构,也需要获取多种外部数据。例如,金融机构都希望获取大量的客户行为数据进行精准营销和提供以客户为中心的服务,但由于前述数据安全与隐私保护的问题得不到解决,以及商业垄断等原因,合法的数据供应市场发展滞后。要使数据具有分析和智能学习价值,金融机构需要加强对数据的清洗以及标签化处理,为人工智能提供多渠道获取信息和深度学习的数据基础。但前期耗费的时间长、成本高,导致金融机构裹足不前,这是当前人工智能面临的普遍困境。
三是人才门槛。在传统机器学习的应用中,机器学习专家参与了所有阶段的机器学习,然而机器学习技术的使用门槛和专家成本都很高,这对很多传统企业尤其是中小型企业来说,很难组建这样的团队。以银行为例,目前银行软件开发人员拥有的专业知识和技能偏向数据管理层面,而数据分析人员分布于多个业务条线,在算法方面缺少尖端人才支撑,难以对各领域庞大的数据进行有效的利用,限制了人工智能的发展和应用。
四是成本门槛。随着人工智能应用场景的推广与普及,机器学习更加复杂的算法要求更快的数据运算速度。由于满足大规模高速并行运算要求的GPU(图形处理器)、FPGA(现场可编程门阵列)等相关硬件以及模式识别和数据采集所需的各类电子传感器的耗能水平和价格成本均较高,这就阻碍了人工智能相关技术解决方案的大规模应用和商业化。
云端部署会降低使用人工智能的成本,但对于安全隐私要求较高的金融机构来说,更倾向于部署在本地。这意味着企业要花很多钱买算力、建机房,运维成本也很高。此外,单点式解决问题、缺乏标准化流程也是企业成本高的主要原因。
由于上文所提及的各种门槛,以及商业模式、认知问题等多种原因的存在,市场对人工智能能否大规模落地出现了一些怀疑的声音,这也是新技术发展的必然,总体来说回归理性是大势所趋。
人工智能的大规模落地,需要政产学研各方的共同努力。
对政府来说,可以为人工智能与产业融合营造更好的环境,如推进数据共享、提供更多应用场景、组织标准制定、加快相关立法等。
对市场来说,技术概念从提出到实际投产使用需要一段较长的时间,而业务的紧迫性又会倒逼技术快速投入应用,一些揠苗助长的行为会导致风险增大。对人工智能应用的研究需要有足够的耐心,尊重技术发展的客观规律。
而对技术供给方来说,也要顺应市场变化,通过技术创新、产品创新、商业模式创新帮助企业降低人工智能应用门槛,脚踏实地地服务于产业发展,为社会创造价值。
二 人工智能技术的进展与趋势
综合第三方咨询和研究机构的研究成果[2]以及媒体报道可以发现,近年来一些技术的进展及趋势有望推动人工智能的大规模落地。
(一)数据安全与隐私保护
一种基于差分隐私的技术是在模型训练里引入一些随机信息来隐藏用户信息,使攻击者无法通过部分数据推断出其他隐私信息。苹果公司从用户的设备收集数据时就使用了这种技术,国内瑞金医院的一款糖尿病智能预测产品也用到了这种技术,以保护病人隐私。
联邦学习可以理解为在一个数据联邦内各企业无须进行数据移动或互通,而是通过某种加密机制进行参数交换,从而建立一个虚拟的共有模型,让彼此都能获得模型效果的提升。2017年,谷歌公司开始在安卓设备中测试联邦学习方法。
安全多方计算是姚期智院士提出的一个概念,在整个计算协议执行过程中,各参与方对自身数据始终拥有控制权,只有计算逻辑公开。各参与方拿到计算结果后也无法推断出原始数据。人工智能可以利用该技术在不归集各方数据、不泄露各方隐私的前提下,通过协同计算进行算法训练。目前该技术已经用于互联网金融风险防控场景验证。
边缘计算是在靠近数据源的地方进行计算。例如,智能手机就是个人与云端的“边缘”,相较于上传到云端,直接在设备上处理数据,在提高效率的同时,也会降低数据泄露的风险。
此外,欧盟《通用数据保护条例》强调,机器学习模型必须具有可解释性。可解释性是指人(包括机器学习中的非专家)能够理解模型在其决策过程中所做出的选择(怎么决策、为什么决策和决策什么)。复杂的模型通常具有更好的预测性能,但随着模型维度和复杂度的提升,模型本身的可理解性会变得越来越差,所以被视为黑盒模型。黑盒模型也意味着风险,如在金融行业预测潜在的犯罪、信用评分、欺诈发现、贷款等,模型如有偏差则影响很大,尤其不利于金融监管。目前国内可解释模型转换技术已经有相关专利,可以利用专利技术将复杂模型转换为一个业务人员可以理解的简单模型。
值得注意的是,模型具有可解释性不仅有利于消除偏见,而且可以改进模型、提高模型效果。
(二)降低数据门槛
迁移学习是机器学习的一个分支,可以把已训练好的模型参数迁移到新的模型中,以指导新模型训练,更有效地学习底层规则,减少对标签数据量的需求。例如,假设有两个相关的场景A和B,A有大量的标签,B仅有少量标签或没有标签。迁移学习通过将A学习的结果转移到B的建模中,以此提高B的建模效率。目前迁移学习技术已经应用于变量有限的小规模场景中,如基于传感器网络的定位、文字分类和图像分类等,未来将被广泛应用于解决更有挑战性的问题,如视频分类、社交网络分析、逻辑推理等。在金融行业,目前国内迁移学习已经应用于反欺诈场景和营销场景。
其实对于人工智能来说,需要的数据量不一定是越大越好,而应该是有利于解决业务问题、符合机器学习建模要求的数据。人工智能对数据服务的关键技术需求正在改变,传统的大数据平台将不再符合智能数据的要求,未来“数据一致性、实时性以及智能数据管理”将是面向人工智能的数据治理的趋势。
(三)降低技术使用门槛
人工智能要解决业务问题需要一个能够使算法与业务进行低门槛对接的中间件,将业务闭环与人工智能产生的过程融合到一起,AI PaaS(人工智能平台即服务)应运而生。据Gartner预计,AI PaaS将在5~10年内达到高峰期[3],这种技术相当于把众多数据科学家分析建模的能力封装起来,帮助用户从错综复杂的大量数据中抽象出各种变量因素,提炼出一套机器学习的模型,并运用在业务中。
被称为“AI爆发必经之路”的自动机器学习技术是在无须人工智能专家介入的情况下,让机器自动完成数据预处理、特征工程、机器学习算法选择和配置等工作,主要面向无机器学习背景的人,这就降低了对技术人员能力的要求,被Gartner列入2019年“七大人工智能科技趋势”。美国权威科学杂志《麻省理工科技评论》也把它评为2018年“全球十大突破性技术”,认为这将降低机器学习的使用难度和价格。在此领域,我国处于世界领先地位,国内已有科技公司早于谷歌公司发布该技术并在金融风控领域成功落地。
(四)提高算力降成本
在过去5~10年,人工智能技术得以商业化主要得益于芯片处理能力提升、云服务普及以及硬件价格下降的并行,这使计算力大幅提升。国内仅2017年一年,算力就增长了230.7%。[4]在“AICC 2018人工智能计算大会”上,浪潮集团发布了一款超级AI应用服务器,这款处理器的AI计算性能高达2000万亿次/秒,是目前全球最强大的AI计算主机之一。
人工智能芯片价格下降而尺寸缩小。据德勤预计,2020年全球芯片价格将比2014年下降70%左右。相信伴随着算力提升的硬件单位成本的下降,企业应用人工智能的门槛将逐步降低。
算力的提升不仅涉及硬件,而且涉及软件和硬件的“结合体”,只有了解AI算法的运算架构与逻辑,才能针对硬件去做深层次的优化,即“算法定义算力”。软硬技术一体化趋势正引领AI发展潮流。在这一趋势下,AI平台一体机、行业应用解决方案一体机等新兴产品将助力传统金融企业向智能化快速转型。例如,一家银行不用扩大机房规模,仅利用一体机服务器上搭载的智能营销模型,就能提升营销能力。对于企业来说,未来IT不再是成本中心,而将是利润中心。
三 人工智能技术应用于金融领域的发展趋势
(一)由外围向核心业务渗透,由感知向决策类应用扩展
近年来,国内外较早布局人工智能的金融机构已尝试将人工智能应用贯穿于整个业务体系。从银行业业务的生命周期看,已经由外围的厅堂机器人、在线客服、电话智能导航、柜面人脸识别等场景,逐渐渗透至产品开发、营销、风险管控、客户管理与客户服务等核心流程。中国工商银行早在2017年便成立了包括人工智能在内的七大创新实验室,2018年又建立了人工智能平台,可以实现自主构建覆盖营销、反欺诈、审批、贷后管理、运营等全生命周期的AI业务场景应用。
在保险行业,人工智能为前端营销、承保、核保、理赔等核心业务流程提供多样化支持,同时慢慢渗透至资产管理等环节。整体上看,人工智能在金融业的应用已经由早先的偏感知类向营销、反欺诈、风控、智能投顾等偏决策类的应用场景拓展。
继长尾信贷后,“大资管”已经成为人工智能渗透的又一领域。早在2014年,高盛就投资并开始部署一款由人工智能驱动的交易平台用以取代证券分析师,全球规模最大的对冲基金之一Citadel已经广泛地将机器学习技术用于量化投资策略的训练,如高频交易领域等。
人工智能已成为推动银行转型升级的主要动力。以传统的投顾业务为例,通过人工智能技术的应用,对传统投资理财的历史经验进行建模,用于客户资产配置优化;以银行风控合规体系建设为例,传统的银行风控合规体系依赖于合规、IT、人力、财务等中后台部门较多的高重复性、低价值人工工作的支持,人工智能技术的引入可以有效替代高重复性、低复杂度的工作,这类核心业务流程中存在大量可以使人工智能应用落地的场景,而且对于银行、保险、证券等金融机构而言具备一定的通用性。
(二)推动金融行业向数字普惠化演变
近年来,尤其是自2018年以来,国家出台了多项服务“三农”、推动乡村振兴、精准脱贫攻坚、优化小微企业融资环境的金融政策,鼓励普惠金融、产融结合、产业链金融发展,但政策落地面临一些现实的难题。一方面,小微企业管理成本高、业务效率低;另一方面,也是最为关键的,小微企业无法满足传统金融机构风险管理的要求,导致金融机构的金融服务无法惠及这些群体。
通过人工智能构建基于企业运营场景数据驱动的金融服务,为解决中小微企业“融资难、融资贵、持续发展”等问题提供了一条创新路径。
以智能供应链金融(见图2-1)为例,在依托供应链核心企业信用的基础上,实时掌握中小微企业的交易信息、订单信息及物流信息,通过系统和交易流程的设计严格管控其资金流,从而突破传统的对企业静态基础信息授信,转向对中小微企业真实优质的业务及交易授信。例如,中关村银行的AI供应链金融平台能够对供业链数据、企业数据、市场数据以及银行数据进行深度分析与实时计算监测,使银行及时获取企业资金需求,并精准认知企业经营能力与风险状态。

图2-1 智能供应链金融平台
通过人工智能分析,可以快速建立多维度的授信准入规则及依据订单分析预测的动态授信额度,企业准入后自动纳入实时贷中风控及智能贷后管理系统,实现中小微企业从前到后全流程的供应链内金融信贷智能管理。同时,基于企业数据结合企业业务发展诉求,为企业输出人工智能技术和应用能力,促进企业创新发展和转型升级。
人工智能的发展将促使金融行业的服务模式在未来发生巨大变化,触及更多尚未覆盖的群体,同时还可以降低金融机构的服务与运营成本,让客户获得更加优质且成本低廉的产品与服务,最终实现数字化普惠金融。
(三)人工智能引领监管科技潮流
监管科技是与金融监管、合规与风控相关的各种信息技术及其应用,既包括运用新技术提高对传统金融业的监管(合规)效率、降低监管(合规)成本,也包括运用新技术监管新业态(如互联网金融等)。
党中央、国务院高度重视“防范化解金融风险”,当前金融机构面临的风险正以隐蔽性、波动性和挑战性的特点展现,因此监管科技是未来金融科技发展的主要方向。在监管科技方面,人工智能的应用场景包括反洗钱、交易反欺诈、申请反欺诈、智能催收、智能进件审核、申请信用评分、逾期预警、差异化催收等业务全流程的风控和反欺诈场景。
1.反洗钱
从中国人民银行破获的洗钱案件情况来看,我国洗钱犯罪活动呈现“向不发达区域蔓延,涉众案件、职务犯罪案件增多,洗钱手段不断翻新”的新趋势。这些趋势为反洗钱工作带来了新的挑战。面对严峻的反洗钱形势,反洗钱监管工作愈加急迫和严格。
目前银行反洗钱工作的开展主要依赖反洗钱专家的经验规则。随着银行交易量的逐年增长,仅通过人工规则优化来减少可疑案件量,难以建立规则优化的长效机制。如何解决快速增长的交易量导致的案件激增和人力资源有限之间的矛盾,更准确、更高效地识别反洗钱可疑交易,成为各大银行急需解决的问题。
银行等金融机构预防、监控洗钱活动,以客户识别、大额交易和可疑交易报告以及记录保存等制度为核心内容,通过资金监测实现反洗钱工作目标。具体工作内容包括建立健全客户身份识别制度、客户身份资料和交易记录保存、大额交易识别和生成可疑交易报告等。
人工智能可以为金融机构的法律合规部门、反洗钱部门提供由人工智能机器学习算法驱动的反洗钱决策支持。结合金融机构现有的基于规则的反洗钱系统,为反洗钱业务部门提供案宗可疑率精准打分,再通过机器学习模型和模型可解释分析对可疑率打分模型进行一定的特征解释,支撑反洗钱案件的报告流程,从而解决案件激增和人力资源有限的矛盾。
从长期来看,模型不断迭代优化,其特征的提炼也可以反哺反洗钱规则库,迭代优化反洗钱规则体系,从而实现知识积累,并实现反洗钱审核闭环优化体系。
2.反欺诈
目前金融机构面临恶意欺诈、过度消费、重复授信等乱象,欺诈手段越来越专业化、产业化、隐蔽化、场景化。传统手段主要依靠人,人往往采取“抓大放小”的方式总结规则,难以覆盖长尾欺诈场景和手段,难以准确掌握新型欺诈手段的特征与规则,难以及时快速地洞察新型欺诈手段以应对欺诈行为的持续变化。因此,未来的趋势靠专家规则能捕获的欺诈极少。
人工智能可以实现端到端地解决各类欺诈和信用风险问题。通过专家规则和机器学习模型地恰当结合,能够实现各个业务流程中的智能风控并做出反欺诈决策。利用闭环的自学习机制和超高维的模型,及时调整以适应业务变化和欺诈手段变化,使客户从传统风控走向深度应用人工智能的智能风控。
参考文献
艾瑞咨询:《2018年中国人工智能行业研究报告》,2018。
德勤咨询:《中国人工智能产业白皮书》,2018。
杜宁、王志峰、沈筱彦、孟庆顺等:《监管科技:人工智能与区块链应用之大道》,中国金融出版社,2018。
宋占军:《AI在银行业的应用难点及破解之道》,《金融电子化》2017年第9期。
《预测2019:AI与未来工作》,https://blog.csdn.net/cf2suds8x8f0v/article/details/85043092。
CB Insights,“Artificial Intelligence Trends 2019”,2019.
“10 Breakthrough Technologies 2018”,https://www.technologyreview.com/lists/technologies/2018/.
[1] 杜宁,高级工程师,第四范式(北京)技术有限公司执行副总裁,中国互联网金融协会金融科技专业委员会副主任委员,中关村互联网金融研究院副理事长。杨颖,第四范式(北京)技术有限公司战略研究高级经理。
[2] 如《麻省理工科技评论》《2018年“全球十大突破性技术”》《预测2019:AI与未来工作》《2019年人工智能趋势报告》。
[3] Gartner:《2018年新兴技术成熟度曲线》,2018。
[4] 浪潮集团、IDC:《2018中国AI计算力发展报告》,2018。