1.2.3 机器学习、人工智能和数据挖掘的关系
机器学习是人工智能的一个分支,作为人工智能的核心技术和实现手段,通过机器学习的方法解决人工智能面对的问题。机器学习是通过一些让计算机可以自动“学习”的算法,对数据进行分析获得规律,然后利用规律对新样本进行预测。
机器学习是人工智能的核心技术,其中深度学习是机器学习的子集。深度学习的典型应用是选择图像、视频、声音或文本等多态数据训练模型,然后用模型做出预测。例如,博弈游戏系统(如深蓝)探索和优化未来的解空间(Solution Space),而深度学习则是在博弈游戏算法(如AlphaGo)的开发上付诸努力,取得了世人瞩目的成就。
下面以自动驾驶汽车研发为例,说明机器学习和人工智能的关系。要实现自动驾驶,就需要对交通标志进行识别。首先,应用机器学习算法对交通标志进行学习,数据集中包括大量的交通标志图片,使用卷积神经网络进行训练并生成模型。然后,自动驾驶系统使用摄像头,让模型实时识别交通标志,并不断进行验证、测试和调优,最终达到较高的识别精度。
当汽车识别出交通标志时,会针对不同的标志进行不同的操作。例如,遇到停车标志时,自动驾驶系统需要综合车速和车距来决定何时刹车,过早或过晚刹车都会危及行车安全。除此之外,人工智能技术还需要应用控制理论处理不同道路状况下的刹车策略,应用路径寻优算法导航,通过综合这些机器学习模型来产生自动化的行为。
数据挖掘和机器学习的关系越来越密切。数据挖掘是从大量的业务数据中挖掘隐藏的、有用的、正确的知识,促进决策的执行。数据挖掘的很多算法都来自机器学习和统计学,其中统计学关注理论研究并用于数据分析实践形成独立的学科,机器学习中有些算法借鉴了统计学理论,并在实际应用中进行优化,实现数据分析的目标。尽管演化计算、AlphaZero等少数机器学习算法使用的数据来自机器仿真,不是数据挖掘处理的真实业务数据,但大多数的机器学习和深度学习算法近年来逐渐跳出实验室,从实际的业务数据中学习模式,解决实际问题,从而推动了人工智能新的发展。数据挖掘和机器学习的交集越来越大,机器学习成为数据挖掘的重要支撑技术。