零基础扫盲：什么是人工智能-白红宇的个人博客

发布日期：2021-06-29 04:23:28 浏览次数：2 分类：技术文章

本文共 7995 字，大约阅读时间需要 26 分钟。

原文地址：

让人焦虑的时代

物联网、云计算、大数据、人工智能，这些术语成为各大媒体这几年吹捧的热门词汇，包括最近很多商业大咖常说的赋能，AI给物联网赋能、新零售赋能啥的，更让人云里雾里。对于大部分人来说，基本上都是“知其名而不知其意”，在媒体的狂轰滥炸和资本追逐中，越来越多的商业术语和技术词汇被创造出来，让人感到焦虑，仿佛已经被时代抛弃、落伍的感觉。今天就参看网上相关资料，跟大家一起了解一下什么是人工智能。

人工智能浪潮从上世纪50年代开始，就已经搞了好几波了，但都没有搞起来。究其原因，还是硬件、软件等方面还不足以支撑人工智能的发展。如今，随着互联网和云计算的快速发展，GPU算力的快速提升，以及积累的大数据，再次把人工智能推到风口，这次能不能飞起来，还真不好说。

什么是人工智能呢？按照图灵机测试：如果一台机器它能像人类一样思考，那么它就是人类。比如索菲亚机器人，按照图灵机测试，她应该就是人类了，而且已经拿到了沙特户籍，是世界上第一个拿到户口的机器人：

除了索菲亚机器人，Google的AlphaGo也很有名，它自己学习下围棋，自学成才，战胜了世界围棋冠军。苹果手机的Siri，可以通过跟她对话，让她帮你查询天气、打开微信、打开QQ等，非常方便。上面这些其实都可以看作人工智能的具体应用，那这些智能产品到底是怎么实现的呢？人工智能到底是什么？

农场鸡的故事

以一个农场鸡的故事为例，来给大家解释什么是人工智能。

一个农场里养了500只鸡，其中有一只鸡特别聪明，被称为鸡群中的战斗鸡：科学家。这只鸡注意到一个现象：每天早上，养鸡场的食槽里会准时出现食物和水。作为一只鸡，它可能永远也想不明白人类为什么要饲养他，就像我们也许永远也想不明白人类为什么在这个宇宙中存在一样，有外星人吗？农场外面还有别的鸡群吗？鸡和人类一样有困惑，很焦灼。但是我们会观察啊，这只鸡也是一样，作为一个优秀的归纳法信徒，这只鸡并不急于得出结论，而是开始全面观察做记录：试图发现这个现象是否在不同的条件下都成立。

晴天时是这样，下雨时也是这样；星期一是这样，星期二也是这样；树叶发芽时是这样，树叶变黄时还是这样；天冷时是这样，天热时也是这样。每天的观察让它越来越兴奋，在这种鸡的心中，它感觉离真相越来越近。直到有一天，这只鸡再也没有观察到新的环境变化，而到了当天早上，鸡舍的门打开，它跑到食槽边，发现食物和水依然准时出现！

这只鸡太兴奋了，它当着所有的鸡自信地宣布：我预测，每天早上，食槽里的水和食物都会自动出现，我们再也不用担心饿死了！

经过好几天，小伙伴们都验证了这个预言，验证了这只鸡说得是对的，并把这只战斗鸡说的话当作真理：早起的鸡儿有食吃。大家都围着这只鸡兴奋地咯咯地叫着，惊动了农场主。农场主宰了这只鸡、并跟着买来的两瓶啤酒一起下了肚。

这只科学家，鸡群中的战斗鸡，于午饭时间，卒于农场。

在这个故事中，这只鸡也叫罗素鸡(Bertrand Russell’s chicken)：只对现象进行统计和归纳，而不对原因进行推理。

这其实跟我们目前主流的机器学习，特别是深度学习很相似，通过大量的数据、案例进行分析、总结、归纳，发现规律，并对新的事务进行预测、作出行动。这其实就是我们人工智能的概念了。

什么是人工智能？

在上面故事中，这只战斗鸡，其实就是一个人工智能实例。首先，它根据每天大量的观察、大量的数据去总结归纳为什么每天早上食槽里会自动出现水和食物这一现象，并得出结论的过程，其实就是人工智能通过大数据不断学习、总结规律并进一步对未来做出预测和指导的过程。

由于目前科学技术的局限，人类还无法搞清楚整个大脑的工作原理、工作流程，就像这只鸡无法想明白水和食物为什么会准时出现一样。如果我们想让机器跟我们一样思考，最简单的方法就是我们搞清楚大脑的工作原理，然后赋能给机器就可以了，但是目前我们还没搞清楚大脑自身原理，那怎么办？很简单，学学这只鸡呗，做一个忠实的归纳法信徒：依靠大量的数据，然后使用各种算法不断去分析、归纳、总结，找出规律，形成学习能力，进而通过“人工”达到“智能”的目的。

AI和大数据、云计算、物联网的关系

通过前面的学习，我们已经明白了：人工智能目前主流的方向：机器学习其实就是依靠大量的数据进行分析，发现一些隐藏的规律、现象、原理等，进而通过这些分析结果做出预测或指导行为，比如无人驾驶、自动医学诊断等。对数据的分析和处理需要大量的运算，早期的计算机算力不行，而且也没有现在互联网时代累积的大量数据，因此没有搞起来，现在不同了，互联网、物联网的快速发展，积累了大量的用户数据、传感器数据，而且GPU算力的提高，都为人工智能的这次浪潮奠定了基础。

图片来自知乎网友，侵删

人工智能不能孤立存在，需要大数据和强劲的计算力做支撑。人工智能、大数据、云计算和物联网的关系如上图所示：首先通过互联网和物联网积累了大量的用户数据、传感器数据(如温度、湿度等)，通过网络就汇聚成大数据样本。这些数据是人工智能的数据基础，数据收集好以后肯定得找个服务器存储起来。你可以自己买台电脑、购买各种软件和服务构建自己的服务器，然后再招一个运维人员负责管理维护这些设备。但是这样下来，就增加了很多额外的成本，那怎么办？很简单，租一个服务器就可以了。

云计算通俗点理解，就是一个服务器租赁平台，提供存储、计算等服务。你想搭建一个网站，如果还要自己购买电脑服务器、装各种正版软件、安全防护软件等，成本就大了去了。你直接到阿里云、腾讯云这些云计算平台购买服务就可以了：操作系统、各种数据库软件、服务都给你搭建好了。你购买了服务，分配给你一个账号，不必再操心这些软硬件问题，直接登录就可以使用。比如前几天刚刚上映的《流浪地球》，有大量的特效制作，渲染一个视频特效，如果在普通的电脑上可能需要几万个小时，而使用云计算平台，就可以很快完成，大大提升了工作效率。

云计算主要依靠虚拟化和分布式存储技术来实现。通过虚拟化，我们可以在一个服务器上虚拟出运行不同操作系统的各种虚拟机、虚拟出一个个硬件配置。对于用户来说，你花钱购买一个云虚拟主机实例，其他用户也购买一个云虚拟主机服务，各分配一个不同的账号，用户使用各自的账号登录享受服务，就感觉这台服务器就是自己的，其实很多虚拟主机可能运行在同一个物理服务器上。而通过分布式存储，我们可以将多台服务器连接起来，构成一个强大功能的云计算平台。这些服务器可能分布在不同的地方，但是通过分布式技术可以将它们组合关联在一起，协同工作。像微软云、Amazon、Google云计算、腾讯云、阿里云等云计算厂商光服务器可能就有上千上百万台，分布在全球的各个地方。像微软云的服务器据说放在海底，有助于散热，而苹果、腾讯云、阿里云等据说部分服务器放置在贵州的山洞里，那里常年低温，有助于散热、节省电力消耗。我们平时看的图片、下载的音乐、电影有很大一部分都是存储在海底、存储在这些山洞里。

海量的数据上传到云计算平台后，自然而言就需要对这些数据进行分析和挖掘了，这就是大数据要做的事情：将几千辆车的位置信息综合起来就可以分析出某条路段的交通拥挤状况，你使用滴滴打车时，使用大数据可以给你安排最近的车辆。

大数据是基于海量数据进行分析从而发现一些隐藏的规律、原理、现象等。而人工智能则是在大数据的基础上更进一步：不仅会分析数据、找出规律，还会根据分析结果做出预测和各种行动。如无人驾驶、医学自动诊断等。

什么是人工智能？

在上面《农场鸡的故事》中，这只鸡其实就是人工智能的一个实例：首先它是一只鸡，但是它可以通过学习、模仿人类的思考，通过大量的训练，变成了一只具备了学习思考能力的“智能鸡”。所谓人工智能，就是让机器像人类一样思考。按照图灵机测试的说法，如果机器能够像人类一样思考，那么它们就是人类。比如索菲亚机器人，世界上第一个拿到户口和身份证的机器人。

除此之外，另一个比较有名的是Google公司的AlphaGo，AlphaGo通过自己学习下围棋，不断地反复训练，提高技能，最终战胜了世界围棋冠军柯洁。

那如何让机器能够像人类一样思考呢? 很简单，为了解决某个特定问题，通过特定的算法和模型，对海量的数据进行分析，从而找出隐藏的规律、原理和现象，进而再针对新出现的环境和事务做出预测和行动。

图片来自网络

从上图可以看到，人工智能最核心就是算法。以大数据为基础，针对不同的问题，使用不同的AI算法和技术对大数据进行分析，找出规律。这些AI算法实现需要深厚的数学功底，如高等数学、概率论、数值分析等。如果你不懂底层的数学怎么办，不用担心，现在很多流行的AI框架已经把常用的算法封装成框架，对于应用开发者来说，可以不用关心底层的算法如何实现，直接通过这些框架接口再结合具体的技术，就可以开发出解决某个具体问题的人工智能应用，比如：能聊天的机器人、AI音箱、会下棋的机器人、能识别苹果的机器人等。

什么是机器学习？

一般来讲，为了解决某个特定问题，我们需要专门的AI算法和模型，传统的算法包括：决策树学习、推导逻辑规划、聚类、分类、回归、强化学习和贝叶斯网络等。其实这些还不算真正的“人工智能”，只能算是弱人工智能。而机器学习就是要让机器像人类一样思考、学习。机器学习与传统的为解决特定任务，特定的算法、软硬件程序不同，机器学习是用大量的数据来训练，通过各种算法从数据中学习如何完成任务、解决某个问题。一个机器就跟一个刚出生的婴儿一样，脑子里一片空白，除了哭和嘬奶头外，什么都不会，需要后天不断的学习、训练才能说话、唱歌、跳舞。

大脑的学习原理

人类的大脑褶皱皮层大约有300亿个神经元，每一个神经元可以通过突触与其它神经元进行连接。对于个人而言，不同的连接方式从而构成人类不同的记忆、情感、技能和主观经验。人与人之间的根本差别在于大脑皮层之间不同的神经元连接方式，连接越多越强，人的记忆、技能就越好。

以婴儿为例。刚出生的婴儿什么都不会，大脑还处于待开发状态，神经元之间的连接较少。如果我们想让婴儿识别什么是苹果、什么是桔子，就要不断反复地去教他、去训练。当婴儿看到苹果，并被告知：这是一个苹果时，大脑皮层的众多神经元中对红色敏感的神经元就会与对“苹果”这个声音敏感的神经元建立配对、连接、关联。通过不断反复地训练，这种连接就会加强，这种连接加强到一定程度，婴儿再看到苹果时，通过这种突触关联，就会想到“苹果”的发音，在通过其它连接，最后通过嘴巴发音：苹果。恭喜你，你的baby会认苹果了。这种连接在大脑中会不断加强、稳定，最终跟其他神经元连接一起。大脑在婴儿2~3岁的发育过程中会逐渐网络化，也是婴儿学习的黄金期。

神经元就像英文23个字母一样，通过不同的组合、连接就构成了心理图像的物体和行为，就好像字母可以组成一个满是单词的词典一样。什么是心理图像呢，黑暗中盯着你的手机屏幕，然后闭上眼，手机屏幕在你视网膜上的短暂停留就类似于心理图像。能力越强、记忆越好的人对于某一个事物构建的心理图像就越细腻。心理图像可以通过更多的神经突触串联在一起，组成任意数量的关联顺序(特别是做梦时)，进而形成世界观、情绪、性格以及行为规范。这就好像单词可以组成各种无限可能的句子、段落和章节一样。

人的学习和记忆过程，其实就是大脑皮层神经元之间不断建立连接、关联的过程。随着关联连接不断加强，你对某项技能的掌握也就越来越熟练、越来越精通。不同的神经元之间、心理图像之间互相关联构成一个巨大的神经网络。

人工神经网络

人工神经网络(ANN)，顾名思义，就是使用计算机程序来模拟大脑的神经网络。人工神经网络的本质是数据结构。这种人工神经网络对于特定的AI算法、AI模型而言，它的牛逼之处在于：它是一个通用的模型，像婴儿的大脑一样，可以学习任何东西：说话、唱歌、作曲、聊天、下棋、绘画、图形识别。

典型的人工神经网络是由数千个互连的人工神经元组成，它们按顺序堆叠在一起，构成一个层。然后以层的形式形成数百万个连接。人工神经网络与大脑的不同之处在于，在很多情况下，层仅通过输入和输出与它们之前和之后的神经元层互连，而大脑的互连是全方位的，神经元之间可以任意连接。

我们教婴儿认识苹果，可以通过各种各样的苹果(大的、小的、各种颜色的)来训练婴儿。同样的道理，我们训练人工神经网络，也是通过向其输入大量的标签数据，帮助它学习如何分析和解读数据、找出规律、最后输出分析结果。

由于人工智能和计算机技术的限制，以及人类还没完全搞清楚大脑的整个工作原理等原因，目前我们只能模拟出大脑的一部分。比如卷积神经网络(CNN，其实只是模拟了人类的视网膜神经网络)，可以用来实现图像识别，一个没有训练的CNN就像一个婴儿的大脑一样弱智，那我们该如何训练它呢？

神经网络的训练过程

卷积神经网络(CNN)，分为很多层，每个层对输入的数据进行分析，完成不同的功能。CNN通常有以下神经元层：

输入层：输入图像数据

卷积层：

激活层

池化层：

完全连接层

输出层：输出分析结果

输入层主要用来输入图像数据，卷积层用来分析输入的图片数据。卷积层中成千上万的神经元充当过滤器的功能，分别去搜寻识别输入图像数据的不同特征。比如有的神经元专注于识别苹果的“颜色”这一特征，有的神经元去识别苹果的“形状”这一特征，在卷积层中，没有价值的元素会被丢弃，有价值的特征元素被传输到下一层。

在激活层和池化层会对图像信息再一遍一遍地过滤和处理，具体细节不表，最后的处理结果就是图像被池化的特征。在完全连接层，这些图像被池化的特征，连接到表征神经网络正在学习识别的事物的输出节点(神经元)上。如果我们正在训练我们的神经网络去学习如何识别苹果和梨子，那么这个神经网络就有2个输出节点，一个用于苹果，一个用于桔子。苹果和桔子这两个工作节点都会对传输来的特征图进行投票，根据特征图判断这幅图片是苹果或桔子的概率。最后的输出结果可能就是：这幅图片90%的可能是一个苹果、10%的可能是一个桔子。

预测失败了怎么办？

前面已经讲过，刚开始神经网络是很弱智的，刚开始它的预测结果可能是：这图片10%的可能是一个苹果、90%的可能是一个桔子，这就跟我们的预期不符，需要不断调整，不断尝试，这个调整的过程称为“反向传播”，以增加下一次将这幅图像预测成苹果的概率。

反向传播将输出结果反馈到上一层的节点，告诉它反馈结果差了多少，然后该层再向上上层传递，直到它回到卷积层，重新不断调整，不断尝试，不断提高预测成功的概率，直到预测结果的成功概率不能再提升。这个过程我们就称为神经网络的训练过程。

神经网络的训练过程需要对海量的数据作为样本进行处理，需要大量的计算，因此一般都是在云上进行。

什么是深度学习？

2012年，人工智能科学家吴恩达教授，通过对人工智能进行训练，实现了让神经网络可以成功地识别猫。在吴教授的实验里，输入数据是一千万youtube视频当中的图像。吴教授的突破在于：将这些神经网络从基础上显著地增大了，层数变得非常多，而不是简单的4层，神经元也非常多。吴教授把这次实验定义为：深度学习(deep learning)，这里的深度是指神经网络变得更加复杂了，有更多的层。经过深度学习训练过的神经网络，在图像识别方面甚至比人类做得更好，识别正确率达到99%以上。

什么是边缘计算？

人工神经网络两个重要的工作就是：训练和推理。训练需要巨大的计算量，一般会放到云上进行，训练完毕后，在去结合具体问题做应用：推理。

在云上训练神经网络也有弊端：一是贵，二是对网络的依赖性高。比如汽车自动驾驶，当汽车钻入山洞、隧道等无线网络信号不太好的地方，就可能断网、有延迟等，这就给汽车自动驾驶带来了安全隐患。现在我们可以把一些训练工作放到汽车本地进行，这就是边缘计算的概念。边缘计算是指在靠近物或数据源头的一侧，采用网络、计算、存储、应用为一体的开发平台，就近提供最近端服务。其应用程序在边缘侧发起，产生更快的网络服务响应、满足行业的实时业务、安全与隐私保护等方面的基本需求。

比如现在手机处理器里就集成了支持AI运算的NPU/TPU等IP，支持本地边缘计算。还有物联网跟AI的结合应用等，物联网产生的数据可以直接在应用端完成训练和推理的过程。当然你也可以在云上训练，然后赋能给物联网，美名其曰：AI给物联网赋能；5G给物联网提供更快更低延时的网络服务，美名其曰：5G给物联网赋能；我打了你一巴掌，对你做了功，美名其曰：我给你赋能。AI+IOT、嵌入式人工智能也是人工智能的一个发展方向，为嵌入式、电子工程师带来新的工作机遇。

索菲亚骗局

人工智能目前发展到了什么程度呢？其实人工智能目前仍在很低级的阶段。一般做法应该是先攻克人类大脑工作原理，然后再进行模拟。但目前的人工智能和神经网络根本还是两回事。因此不要太迷信神经网络，它是很傻的方法，通过海量数据训练人工智能和神经网络应该是最后一步，或然率计算，让决策必须收敛在人工智能很重要。目前的神经元网络还在小孩级阶段，如果真要做到强人工智能可能还需要十年，可能很多技术在神经元网络之外正在发生。比如前面视频中的索菲亚机器人，其实并不是真正的人工智能。

目前人工智能机器人还做不到如此智能。索菲亚机器人本质就是一个带喇叭的木偶：在各种大会上的发言和采访的内容都是人工撰写的，外加主持人配合，然后用语音合成软件输出，被包装成“人工智能”的自主意识言论。

大堂机器人

包括现在网上很火的大堂机器人，对答如流，有的竟然还会说川话、方言，简直要逆天。

其实这也不是真正的人工智能，弱人工智能都算不上，还不如索菲亚。是真人在远程语言：机器人前面有个摄像头，真人在远程看着你傻笑，听着你说话，然后再用变音或者语音合成软件跟你聊天。沙特是把AI当人，这是把人当成AI......

未来的人工智能可能是什么样？

未来的人工智能，应该是强人工智能，在人类攻克自身大脑工作原理的基础上，然后进行模拟，甚至机器人会超过人类大脑，具有自主意识和主观性。当我们爱一个人，为什么不受控制，而且还可能会移情别恋？原因很简单，神经元将人类的爱保存为感知神经元的输出集合。这些输出来自一线神经元，一线神经元在接收到某种特定轮廓、光波、声波、气味或触感信号(你爱人被你卷积处理后的特征)时，会释放出自己的信号。这些描述爱的输出集合是一个维定的思维，一旦建立，作为某些单位化学神经强度集合的一部分，任意激发状态的感知神经元都可以激发其它感知神经元。没有一个神经元知道我们的爱人长什么样。相反，有大量神经元作为连接的稳定输出组合代表了我们的爱人。因为她重要，大脑会增加这些神经连接的神经化学强度，对于不重要的人或事物，神经连接的神经化学强度会越来越弱，直到最后像蜘蛛网一样烟消云散。这也就解释了：爱一个人是不受控制的，微观神经元的自主连接让我们爱上这个人，爱一个人也不是永恒的，随着新的连接的加强和旧的连接的减弱，移情别恋就会自然发生。主观性是每个人连接更高级神经元模式的独特方式，这些神经元就像脚手架，构建了我们人类的思想大厦、包括爱，一起构成了一个人的独特人格魅力。

小结：当机器人真正具备了人的智能时，也会产生爱，爱是最终形式的人工智能

参考资料：

1) 人工智障：你看懂的AI和智能无关

2）吃瓜群众一图看懂人工智能、物联网等技术的关系

3）终于搞清楚了，AI与大数据原来是这样的关系！

4）人工智能、机器学习和深度学习之间的区别和联系

5）一文看懂神经网络工作原理

6）Neural networks made so easy

7）《虚拟人》、《爱》、《人工智能的未来》

转载地址：https://blog.csdn.net/zhaixuebuluo/article/details/104028770 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：Linux进程间通信10分钟快速入门

下一篇：三招防范Ubuntu虚拟机崩溃

发表评论

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

让人焦虑的时代

农场鸡的故事

什么是人工智能？

AI和大数据、云计算、物联网的关系

什么是人工智能？

什么是机器学习？

大脑的学习原理

人工神经网络

神经网络的训练过程

预测失败了怎么办？

什么是深度学习？

什么是边缘计算？

索菲亚骗局

大堂机器人

未来的人工智能可能是什么样？

发表评论

最新留言

关于作者

推荐文章