1.4 深度学习的应用
深度学习最早兴起于图像识别,在最近几年可以说是已经深入各行各业。深度学习在计算机视觉、语音识别、自然语言处理、机器人控制、生物信息、医疗、法律、金融、推荐系统、搜索引擎、电脑游戏和娱乐等领域均有应用。
图像识别——图像识别可以说是深度学习最早实现突破性成就的领域。如今计算机对图片的识别能力已经跟人类不相上下。我们把一张图片输入神经网络,经过网络的运算,最后可以得到图片的分类。如图1.15所示,我们可以看到,对于每一张图片,神经网络都给出了5个最有可能的分类,排在最上面的可能性最大。图1.15中的置信度表示的就是该图片的概率值。
图1.15 图像识别
目标检测——利用深度学习我们还可以识别图片中的特定物体,然后对该物体进行标注,如图1.16所示。
图1.16 目标检测[1]
人脸识别——深度学习还可以识别图像中的人脸,判断是男人还是女人,判断人的年龄,判断图像中的人是谁等,如图1.17所示。
图1.17 人脸识别
目标分割——目标分割可以识别出图中的物体,并且可以划分出物体的边界,如图1.18所示。
描述图片——把一张图片输入神经网络中,就可以输出对这张图片的文字描述,如图1.19所示。
图1.18 目标分割[2]
图1.19 图片描述
图片风格转换——利用深度学习实现一张图片加上另一张图片的风格,然后生成一张新的图片,如图1.20所示。
语音识别——深度学习还可以用来识别人说的话,把语音数据转换为文本数据,如图1.21所示。
文本分类——使用深度学习对多个文本进行分类,比如判断一个评论是好评还是差评,或者判断一篇新闻是属于娱乐新闻、体育新闻还是科技新闻,如图1.22所示。
图1.20 图片风格转换[3]
图1.21 语音识别
图1.22 文本分类
机器翻译——使用深度学习进行机器翻译,如图1.23所示。
图1.23 机器翻译
诗词生成——把一个诗词的题目传入神经网络,就可以生成一篇诗词,如图1.24所示,其就是AI写的一首诗。虽然这首诗有些看不太懂,但是已经“有内味了”。
图1.24 诗词生成
图像生成——深度学习还可以用来生成图片。比如我们可以打开网站https://make.girls.moe/#/,设置好动漫人物的头发颜色、头发长度、眼睛颜色、是否戴帽子等信息就可以生成符合条件的动漫人物,并且可以生成无数张不重复的照片,如图1.25所示。
图1.25 图像生成
这里只是列举了非常少量的例子,深度学习的已经逐渐深入各行各业,深入我们的生活中。