JIMI成长的内部土壤
大数据
无论是从JIMI的工作原理还是它的核心技术来看,JIMI都是一个大数据应用的结果。JIMI的知识库由数亿条信息数据聚类而成; JIMI的数千个引擎模型,也是需要针对庞大数据计算分析而发挥作用的;而如果没有大量的客户画像数据,JIMI也无法引入神经网络技术从而实现高质量的客户识别。
因此,研发副总裁马松认为,JIMI的门槛就在于其背后的京东大数据。JIMI诞生时,京东就有8年自营电商交易和服务数据的积累,这些数据是JIMI最初成型的基础。而在JIMI的成长过程中,京东在自营、第三方平台电商以及金融等方面仍然在源源不断地产生数据。截至2016年3月,京东数据总容量突破100 PB(拍字节),每天新增超过1.5 PB数据,每天处理150亿行数据。据刘丹称,京东自营业务客服和第三方卖家客服每天跟客户的互动达到200万到300万次,产生2000万~3000万条消息。所有这些数据构成了JIMI成长的沃土。
京东大数据,按照马松的说法,是“中国电商领域最精准、价值链最长的数据”。比如,京东可以拿到其所有数十亿自营商品的详细商品信息,对于这些信息的挖掘和提取,让京东建成了商品画像。拥有商品画像后,JIMI能更准确地向客户推荐商品,比如对于一条裤子,JIMI能准确告诉客户其面料是什么,尺寸有多大。这样的服务方式,如果换成人工,只能是那些小网店的客服针对其店内有限商品才能做到的。京东的这些自营商品信息不仅是建立商品画像的基础,也是京东获得其平台上第三方卖家商品信息的对标信息。京东可以通过读图的方式识别出第三方卖家商品广告信息,然后再与同类自营商品进行信息对标,由此取得准确信息。而这些信息则丰富了京东的商品画像,从而让JIMI有更多、更详细的商品推荐选择。
以提升客户体验为目标的定位
极致客户体验是京东做零售所追求的终极目标,因此,定位于提升客户体验的JIMI,在京东就不是一个用来装饰点缀主业的小项目。按照京东数据与机器智能平台负责人杨洋的说法,京东研发JIMI,不仅仅是为了开发一个客服应答工具,而是力求能给客户一种精准的、人性化的服务,比如,当客户咨询购买商品时,JIMI尽可能给他(她)推荐一个最适合的商品,而不是给客户呈现一系列商品,让客户做选择题。后者更像一个搜索结果。
虽然JIMI最早诞生于搜索引擎,但在京东内部JIMI研发团队和搜索引擎团队还是完全分离的。“尽管我们在技术上有很多相似性,但实际业务场景还是有很多区别。”杨洋说,搜索引擎考虑的是商品转化率,因此能推荐一堆商品希望客户购买,而JIMI则是以满足客户需求为出发点,因此必须精准给出答案以解决用户的问题。为了达到这个目的,JIMI有时还会反问客户以进行需求甄别。由此,“JIMI用到的技术比搜索引擎更难。”
因为具有很高的战略定位,JIMI会被注入充分的资源去保持持续不断的优化和升级。比如,在JIMI诞生一年多后,京东就为它引入神经网络技术去替代传统算法技术。按照杨洋的说法,传统算法尽管仍然适用,但会很快碰到瓶颈,影响JIMI的性能发挥。“引入神经网络算法对JIMI来说,是一个影响全局的举动。”
而对于JIMI的知识库,JIMI研发团队也会投入资源去进行维护,而不是任由它自主生长。比如,他们开发一套知识过滤机制,将外界输入的诸如黄赌毒之类的信息或者“京东商品全免费”这类信息过滤掉,不让JIMI接触。微软机器人小冰曾经因为自生长而被外界教得满嘴脏话,以至于360公司董事长周鸿祎发微博称,希望和小冰的产品经理探讨设计改进思路,如果不改,问题很大。显然,如果这样的事发生在JIMI身上,那无疑会对京东品牌造成伤害。因此,JIMI团队在这方面十分小心。
研发管理
JIMI团队
JIMI研发团队隶属于京东成都研究院,是刘丹所负责的京东智能通讯部中专攻智能技术的研究团队(该部门除了JIMI还拥有的另外一个产品就是京东的即时聊天IM工具——京东咚咚,这个是JIMI的造血工厂),目前由杨洋负责带领,位于成都,与京东成都在线客服部门共享一个院落。这样的地理位置布局,也是为了JIMI团队与在线客服的协同工作。具有40人规模的JIMI研发团队下设6个小组,分别是测试组、应答与核心商业数据组、NLP与意图识别组、开放平台组、智能融合组和产品经理组。
测试组是负责整个JIMI质量测试的;应答和核心商业组负责应答引擎的开发和优化;NLP与意图识别组负责命名实体识别、意图识别和神经网络技术等;开放平台组负责将JIMI产品化后提供给外部客户使用;智能融合团队负责将JIMI跟京东即时通信产品咚咚融合成一套在线客服解决方案向外推广,同时,也负责智能分流技术的开发和完善;而产品经理团队就是负责整个JIMI产品的规划和落地。
整个研发过程就是由产品经理提出需求,然后各个技术团队根据需求完成研发,之后将各自的研发成果拼装成型并交给测试团队根据产品需求来测试。
JIMI的产品测试遵循AB机制,即让JIMI同时运行AB两套模型:一套模型是擂主,另一套是挑战者。两套模型各自分担50%的流量,如果挑战者运行效果好于擂主,那么,擂主就被淘汰;反之,则挑战失败。凭借这样的机制,保证JIMI能力被不断迭代并优化。不过,这样的过程,杨洋说对研发团队是一个尝试和挫折往复循环的历练,“辛辛苦苦做出来的东西,上去挑战不成功就意味着之前精力的浪费。但是,没有办法,只能马上返回来再研究其他算法,然后再去改进,再去挑战。”
对JIMI团队的管理
JIMI团队像京东其他团队一样,也要受到量化业绩指标的考核,比如多长时间内客户满意度要达到多少,客户接待量要达到多少。不过,杨洋说有些指标也是他们自下而上提供给领导的,或者说跟领导沟通的结果。领导之所以能接纳他们的意见,也是源于实践的证明。
比如,领导曾经让他们三个月之内将JIMI的客户满意度提升10个百分点,达到80%。按照杨洋给领导列示的清单,要达到这个目标,需要搞定2000个信息分类,而根据当时语料的准备状态,搞定这么多分类需要一年的时间。看到这样的清单,领导作出了让步,提出要在部分商品品类达到80%的满意度。不过,在完成这样一个被让步了的指标的过程中,领导也看到JIMI团队在竭尽全力地冲刺。本来JIMI团队的研发方式是针对某个问题按顺序分别尝试不同的方法,先采取A方法,达不成目标马上再采取B方法,这样可以避免资源无谓的耗费。但那次由于时间紧迫,他们不得不四五个方法同时试,投入全部人力没日没夜地加班。他们不仅自己冲刺,还要申请运维部门跟他们一起劳作。当时正常情况下,线下开发的软件要上线测试,一周只有两次机会,他们不得不申请运维人员帮他们每天上线测试。目睹了整个过程的艰辛和非常态化之后,领导对他们意见的接纳程度比之前高了许多。
除了用这样的行动为自己赢得相对合理的管理空间,JIMI团队还通过创新让自己能在大公司的框架下实现像小创业公司那样快速迭代产品。
比如,移动端JIMI必须跟着整个京东APP的步调来行动,后者每三个月迭代一次,JIMI也必须每三个月迭代一次。这样的迭代频率对JIMI研发团队来说风险太高,如果三个月新产品上去达不到效果,就得再等三个月,不仅时间成本很高,业绩指标也很难完成。情急之下, JIMI团队想到了移动端网页(m.jd.com)。这个网页的改动,是由服务提供端控制的,因此把JIMI嵌到移动端网页上,就能实现快速迭代,从而增加产品达标的成功率。
与其他团队资源共享
置身于京东的研发体系中,JIMI研发团队不需要孤军奋战。他们常常与其他团队共享信息、数据和技术。比如,他们跟搜索引擎团队就能共享数据,JIMI团队挖掘出来的关键词会分享给搜索引擎,而搜索引擎识别出来的信息也会分享给JIMI团队。同样,他们跟客户画像团队也保持着密切沟通,后者一有更新版本,JIMI团队就会立即拿来应用。
杨洋把这种沟通分享称为“互惠”,“我们彼此分享可以形成一种良性循环,共同把某些东西做得更好。”
定期分享是京东研发体系的惯例,某一个研发团队做出一些新成果时,就会召集大家开展交流。JIMI也有自己的分享品牌叫JIMI学院,JIMI学院会不定期到京东北京总部去分享自己的新成果。除了这种相对正式的分享外,京东不同研发团队成员之间也有各种沟通渠道,叮咚就是他们内部的一种即时沟通平台。
在京东,JIMI研发团队被定位于应用技术开发部门,即他们负责将技术转化成产品;而对于JIMI所涉及的前沿技术的研究,则由京东深层神经网络实验室来完成。因此,深层神经网络实验室的专家会定期拜访JIMI,跟JIMI研发团队一起分析JIMI可能的改进方向和预期提升效果,由此获得深层神经网络实验室的研究方向,这个实验室所采用的各种前沿技术,都是为这个既定的研究方向服务的。而这个研究成果最终会再返回到JIMI身上产生商业价值。因此,一般半年左右会请JIMI研发团队对专家们的研究成果做一次评估,以保证方向不偏。