人工智能与机器学习初探
# 前言
人工智能、神经网络、机器学习、深度学习等等名词总是萦绕在耳边,但是起初对于它们并没有清晰的认识,恰逢研究机器学习的短文本分类任务,在此对这些名词进行解释和总结,强化记忆。
# 什么是人工智能(Artificial Intelligence)
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。
在笔者看来,人工智能即具有意识、自我、思维,能够自主思考的机器。实际上有强人工智能和弱人工智能之分,强人工智能具有自适应能力,可解决一些之前没有遇到过的问题,弱人工智能的机器具备观察和感知的能力,可以做到一定程度的理解和推理。如今的研究主要集中在后者,但是已取得重大突破。
人工智能的研究领域非常广泛,分支众多,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。机器学习是如今比较火的一个分支,而深度学习则是机器学习的分支。
# 什么是机器学习(Machine Learning)
机器学习是让机器“学习”的技术。与传统的为解决特定任务、硬编码的软件程序不同,机器学习使用大量的数据来“训练”,构建模型,从而“学习”如何完成任务,之后根据模型进行判断。
比如在文本分类任务中,给定大量的文本和它们对应的分类,经过训练得到模型,再次遇到一个文本时就可以给出分类,当然这个分类不一定正确,具体有准确率、精确率、召回率、F1值、ROC、AUC等指标来衡量一个方法的实际效果,从而不断优化算法、优化模型。
机器学习从学习方法上可以分为:监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。
传统的算法包括朴素贝叶斯、K最近邻(KNN)、决策树、随机森林(RF)、支持向量机(SVM)、逻辑回归等等,这些方法以及得到了长足的发展,现在每前进一步都异常艰难,直到深度学习算法的出现。
# 什么是深度学习(Deep Learning)
部分内容摘自知乎 (opens new window)
深度学习是用于建立、模拟人脑进行分析学习的神经网络,并模仿人脑的机制来解释数据的一种机器学习技术。它的基本特点是试图模仿大脑的神经元之间传递、处理信息的模式。
深度学习包括了卷积神经网络(CNN)和深度置信网络(DBN)。传统意义上的多层神经网络是只有输入层、隐藏层、输出层。其中隐藏层的层数根据需要而定,没有明确的理论推导来说明到底多少层合适。而深度学习中最著名的卷积神经网络CNN,在原来多层神经网络的基础上,加入了特征学习部分,这部分是模仿人脑对信号处理上的分级的。可见深度学习是神经网络的子集。
深度学习模型包括:卷积神经网络(CNN)、长短期记忆网络(LSTM),循环神经网络(RNN)等。
因为深度学习层数众多,计算量大,在引入GPU加速(如CUDA加速)之后训练的效率提高了很多。
据说实验室里的电脑都是2080Ti级别的。。。
# 总结
深度学习 ⊆ 机器学习 ⊆ 人工智能