人工智能需要什么基础?

近日《哈佛商业评论》撰文,就人工智能对经济、教育的影响展开了思考。在他们看来,人工智能的兴盛要求教育必须跟上步伐,这样才能让人们在未来受益。

近日《哈佛商业评论》撰文,就人工智能对经济、教育的影响展开了思考。在他们看来,人工智能的兴盛要求教育必须跟上步伐,这样才能让人们在未来受益。

对于我们这一代人,无人驾驶汽车、语音助手等人工智能科技或许令人惊奇。但下一代可能没有人会对此感到惊讶了。以后人工智能将不仅是一种工具,更多时候,它会变成你的同事,成为你生活中不可或缺的一部分。

我们的下一代将能够有效利用人工智能和大数据,认识到自身的局限性,完善人工智能平台和系统。而现在,我们就要帮助他们做好准备,也就是说,我们需要改进初级教育,优化中等教育的计算机科学教育。

看看现在的儿童是怎样使用人工智能和自动化技术的吧。

如果你对Siri说,“打开身着橙色连衣裙的明星照片,”不到一秒钟,手机上就会出现Taylor Swift的照片,现在这看起来像魔术,但显然并不是。工程师们在设计人工智能系统时,先将任务分解成许多小任务,找到针对每个小任务的解决方案,再让彼此之间产生联系。

以Siri为例,人工智能系统先将接收到的语音分成小的部分,并把它们发送到云端,然后分析每个部分的含义,再将分析结果转换成搜索请求。最后,对各种可能的解决方法进行筛选和排序。因为云端足够强大,这个过程只需要几微秒的时间。

人工智能系统并不像火箭科学那么复杂,但它需要各方面的知识,比如用于破解语音的波形分析、让机器识别裙子的机器学习知识、保护信息的加密设置等等。而且不少知识都相对基础,能够举一反三应用于许多程序。因此,这并不是一个天才在闭门造车。投身于人工智能科技的人必须具备组建团队、发挥各个成员的能力。而这些就是我们需要教给下一代的东西。

随着人工智能不断普及,我们需要将注意力转移到人类区别于人工智能的特质上——创造力、适应性和人际交往技能。

在初级教育阶段,我们需要重视培养学生解决问题的能力和团队合作意识。所幸,现在初级教育阶段已经在这方面有了较大的投入。

另一方面,不论哪个阶段,道德教育都应该得到更多的关注。很多时候,人工智能科技都会面临道德困境——比如怎样克服种族、民族和性别偏见,无人驾驶汽车如何平衡车主和行人的生命权益等——这就需要我们和工程师共同努力,不断优化人工智能的应用。

当今已经是数字时代,计算机科学变得与写作和数学同等重要。对于个人来说,不管是成为一名计算机科学家还是选择别的职业,编程技能都将有助于他们的职业发展。

现在,美国只有40%的学校开设了编程课程,而且教学的质量和规范性也参差不齐。参加计算机科学大学先修课程(AP)考试的学生数量近年来急剧增长。去年参加计算机科学大学先修课程A考试(APCS-A)的考生高达58,000人,但仍远远落后于参加微积分大学先修课程AB(APC-AB)考试的人数,而后者考生已达308,000人。而且,美国三分之一的州甚至没有将计算机科学课程计入学生的毕业学分。

令人沮丧的是,美国的计算机科学教育仍不及其他的发达国家。以色列已经把计算机科学纳入了大学预科课程,英国最近在计算机学校的项目上进展良好,而德国、俄罗斯也不断向前发展。奥巴马在2016年年度国情咨文中提到了计算机科学教育举措,这意味着美国朝着正确的方向迈出了迟来的一步。然而,由于川普政府削减预算,这个提案可能会搁浅。

加强高中阶段的计算机科学教育不但会让学生自身受益,也能鼓励更多学生——以及更多样的学生群体——未来选择计算机科学作为职业,进而推动计算机科学的发展。

去年秋天,卡内基梅隆大学的大一新生中,将近一半都是女学生,这种情况让人振奋。但同时,计算机科学领域仍然很难扩大女性和少数群体的比例。将聪明才智转化为计算机系统、在漫无边际的数据海洋里获得真知灼见,这些愿景都需要多样化的人才。

想要在计算机科学上保持领先地位,编程教学方法的改进亟不可待。老师在课堂上总是按照上世纪九十年代的方法来教编程。那时候,计算机科学的核心是代码的一些细节(想想Visual Basic)。如果你仍执着于这些细枝末节,或许会有所收获,但将落后于时代。显然,现在不应当如此。

编码是一项创造性活动,因此开发一些富有趣味又受人欢迎的编程课程是完全可行的。比如在纽约市,女童子军就参加了一个项目,女生学习使用Java语言创建和优化视频。这类活动不仅有趣,而且与孩子们的生活息息相关,因此受到孩子们的喜爱。难道学校不应该参考这样的案例吗?

对于九年级以上的学生,学校应当开设计算数学、计算艺术之类的选修课,帮助那些有兴趣又有天分的学生成长为计算机科学家。目前在美国,除了APCS-A备考需要的核心课程,很少有高中开设其他计算机相关的课程。虽然也有少数的例子——比如纽约市的Stuyvesant高中、弗吉尼亚州亚历山大市的Thomas Jefferson科学技术高中、达拉斯市的精英高中TAG,这些学校都拥有一批尽职尽责的教员团队,他们或是具备计算机科学的专业背景,或是接受过相关培训。

同时,高中数学这个学科也应当减少包括高等微积分在内的数学课程,减少重复性,增加与计算机科学直接相关的数学课程,比如数据学、概率论、图论和逻辑学。对于当今的人才,这些是最实用的技能。

接受过计算机科学培训的教师数量严重不足,这是当前美国学校面临的主要问题。在这方面,美国的科技公司已经有所表现。比如微软公司便资助了TEALS项目,将计算机从业人员与高中教师配对,提供每周互相交流的机会。但我们需要的是上千名教师来教授数百万的学生,为推动这一事业,仍需要更多的科技公司投入。而在学术层面,德克萨斯州立大学的Austin’s Uteach项目是为STEM学科教师提供培训的模范案例,如今该项目已拓展到哥伦比亚区和美国21个州的44所大学。

美国计算机科学教师协会在该领域一直是个先行者,他们已经开发了一个标准的框架以及一套临时标准。

总之,我们对下一代人工智能和大数据的投资必须是长期的,而这些投入终究会让所有人都受益。

IT 作为一门专业学科的存在归功于寻求从信息中获得竞争优势的公司。今天,组织充斥着数据,但处理和分析数据的技术往往难以跟上每台机器、应用程序和传感器发出的源源不断的遥测数据的洪流。

事实证明,对于基于结构化数据库的传统信息系统而言,非结构化数据的爆炸式增长尤其具有挑战性,这引发了基于机器学习和深度学习的新算法的开发。这反过来又导致组织需要为机器学习、深度学习和人工智能工作负载购买或构建系统和基础设施。

在今天的文章中,让我们概述能够使用 AI/机器学习和深度学习的基础架构电脑配置要求

这是因为几何扩展的非结构化数据集、机器学习 (ML) 和深度学习 (DL) 研究的激增以及旨在并行化和加速 ML 和 DL 工作负载的成倍强大的硬件之间的联系激发了对企业 AI 的兴趣应用程序。IDC 预测,到 2024 年 AI 将变得普遍,四分之三的组织都在使用 AI,其中 20% 的工作负载和 15% 的企业基础设施将用于基于 AI 的应用程序。

企业将在云上构建许多此类应用程序。但是,训练和馈送此类算法所需的大量数据、将数据移动并存储在云中的高昂成本以及对实时或近实时结果的需求,意味着许多企业 AI 系统将部署在私有的专用系统上。

在为人工智能增强的未来做准备时,IT 必须应对许多架构和部署选择。其中最主要的是人工智能加速硬件集群的设计和规范。由于其密度、可扩展性和灵活性,一种很有前景的选择是超融合基础设施 (HCI) 系统。虽然人工智能优化硬件的许多元素都高度专业化,但整体设计与更普通的超融合硬件非常相似。

大多数 AI 系统运行在 Linux VM 上或作为 Docker 容器运行。事实上,大多数流行的 AI 开发框架和许多示例应用程序都可以作为来自 Nvidia 和其他公司的预打包容器映像提供。

  • 计算机视觉,例如图像分类、对象检测(在图像或视频中)、图像分割和图像恢复;
  • 语音和自然语言处理、语音识别和语言翻译;
  • 基于先前的用户活动和参考提供评级和建议的个性化内容或产品的推荐系统;
  • 内容分析、过滤和审核;和

这些在各种行业中都有应用,例如:

  • 金融服务公司的欺诈分析和自动交易系统;
  • 在线零售个性化和产品推荐;
  • 物理安全公司的监控系统;和
  • 石油地质分析,用于天然气和采矿公司的资源开采。

一些应用程序,例如网络安全和 IT 运营自动化系统 (AIOps) 的异常检测,跨越多个行业,基于人工智能的功能被纳入各种管理和监控产品。

将有一个用于 AI 和 ML 模型训练的海量历史数据存储库,以及用于模型推理和预测分析的高速传入数据流。机器学习和人工智能的数据集可以达到数百 TB 到 PB,通常是非结构化格式,如文本、图像、音频和视频,但包括半结构化内容,如 Web 点击流和系统日志。这使得这些数据集适用于对象存储或 NAS 文件系统。

机器和深度学习算法以数据为基础。数据选择、收集和预处理,例如过滤、分类和特征提取,是影响模型准确性和预测价值的主要因素。因此,数据聚合(整合来自多个来源的数据)和存储是影响硬件设计的 AI 应用程序的重要元素。

数据存储和 AI 计算所需的资源通常不会同步扩展。因此,大多数系统设计将两者解耦,在 AI 计算节点中使用本地存储设计为足够大且足够快以提供算法。

机器和深度学习算法需要大量的矩阵乘法和累加浮点运算。这些算法可以并行执行矩阵计算,这使得 ML 和 DL 类似于像素着色和光线跟踪等图形计算,这些计算由图形处理器单元 (GPU)大大加速

但是,与 CGI 图形和图像不同,ML 和 DL 计算通常不需要双精度(64 位)甚至单精度(32 位)精度。这允许通过减少计算中使用的浮点位数来进一步提高性能。因此,尽管近十年来早期的深度学习研究使用了现成的 GPU 加速卡,但领先的 GPU 制造商英伟达已经建立了一条单独的数据中心 GPU 产品线,专为科学和人工智能工作负载量身定制。

AI 工作负载的典型服务器设计

  • 中央处理器: 负责操作 VM 或容器子系统,将代码分派到 GPU 并处理 I/O。当前产品使用第二代 Xeon Scalable Platinum 或 Gold 处理器,尽管使用第二代(罗马)AMD Epyc CPU 的系统正变得越来越流行。当前一代 CPU 增加了可显着加速 ML 和 DL 推理操作的功能,使其适用于利用先前使用 GPU 训练的模型的生产 AI 工作负载。
  • 网络: 由于 AI 系统通常聚集在一起以扩展性能,因此系统具有多个 10 gbps 或更高的以太网接口。有些还包括用于集群内通信的 InfiniBand 或专用 GPU (NVLink) 接口。
  • 存储 IOPS:在存储和计算子系统之间移动数据是 AI 工作负载的另一个性能瓶颈。所以大多数系统使用本地 NVMe 驱动器而不是 SATA SSD

GPU 一直是大多数 AI 工作负载的主力,英伟达通过 Tensor Cores、多实例 GPU(并行运行多个进程和 NVLink GPU 互连)等功能显着提高了它们的深度学习性能。然而,对速度和 效率的日益增长的需求 催生了大量新的人工智能处理器,如谷歌的 TPU、英特尔 Habana 人工智能处理器、Tachyum

企业可以通过选择正确的配置和系统组件,将任何超融合基础设施或高密度系统用于 AI。不过随着深度学习以及人工智能对电脑的要求越来越高,还是推荐大家选择呆猫云桌面轻松解决电脑配置瓶颈,轻松办公研究人工智能和深度学习。

呆猫云桌面后台可配置的CPU机器数量上不封顶,同时针对GPU机型呆猫设有天璇型、天玑型、天枢型三种选项,所有GPU机型皆配备NVIDIA专业级顶配显卡,在科学计算、渲染、游戏、办公等应用场景下的表现自不必说。

更多资讯,继续关注我吧,呆猫在手,轻松畅想高配电脑。

我要回帖

更多关于 零基础转行人工智能 的文章

 

随机推荐