作者都是各自领域经过审查的专家,并撰写他们有经验的主题. 我们所有的内容都经过同行评审,并由同一领域的Toptal专家验证.
Carolyn Deng, CFA的个人资料图片

Carolyn Deng, CFA

沃顿商学院MBA和CFA, Carolyn已经执行了20多个VC/PE交易, 管理着7亿美元的投资组合,目前正在筹集资金, 生长与M&一个专家.

专业知识

以前在

西太平洋银行
分享

执行概要

什么是人工智能?
  • 人工智能(AI), 可以简单地解释为机器展示的智能吗, 与人类和其他动物表现出的自然智力相反.
  • 机器学习是人工智能技术的一个子集, 深度学习是机器学习技术的一个子集.
  • 人工智能发展经历了三次重大浪潮. 第一次是在五六十年代, 第二次是在八九十年代, 第三个开始于十年前,并在2016年开始崭露头角(AlphaGo)。.
这波人工智能浪潮有什么特别之处?
  • 这波人工智能浪潮是由深度学习的增长和普及推动的.
  • 而深度学习技术早在60年代就出现了, 直到最近几年,所需的计算能力和数据才先进到足以支持大规模商业应用.
  • 深度学习如此令人兴奋的原因是, 简单地说, 深度学习允许比其他学习算法更强大的性能.
成功的人工智能应用的关键组件.
  • 人工智能应用程序需要解决一个定义良好的(具体的)和理想的(针对紧急和明确的客户痛点)问题. 面部识别, 机器翻译, 无人驾驶汽车, 搜索引擎优化, 是否所有的问题都定义得很好. 然而, 缺乏定义明确的理想问题是它难以产生的原因, 例如, 一般的清洁机器人.
  • 机器学习算法需要访问干净且标记良好的数据. 这项数据收集工作可能很困难,也可能很容易, 取决于您正在开发的商业应用程序.
  • 人工智能业务需要开发健壮且可扩展的算法. 为了实现这个目标, 有三点是必须具备的:大量标记良好的数据, 合适的人才, 并且相信深度学习是解决问题的正确技术.
  • 成功的人工智能应用需要大量的计算能力. 人工智能算法越先进(e.g. 深度学习(神经网络), 需要更多的计算能力, 手头的手术成本就越高.

在过去的几年里, 世界见证了对人工智能(AI)的兴趣激增。. 人工智能这个概念曾经主要局限于科幻题材,现在已经成为我们日常生活的一部分. 我们一直在新闻里读到它 视频 看起来很吓人的机器人随着 住宅区恐慌,并了解人工智能应用程序是如何渗透到最复杂的领域的 意想不到的领域 我们的日常生活. 但这是一种炒作吗?

可能是. 根据Gartner的数据 新兴技术的炒作周期, 包括AI PaaS(平台即服务)在内的民主化AI趋势, 通用人工智能, 自主驾驶, 深度学习, 都在曲线上的不同点上吗, 深度神经网络正处于膨胀预期的顶峰. 然而,我们每天也已经从人工智能中受益. 从Siri到Cortana再到Alexa,我们现在可以和智能助手交谈. 从谷歌的人工智能搜索引擎到Instagram的过滤器, 我们现在享受快捷的便利, 更切合我们需要的回应. 在人工智能创新蓬勃发展的中国,face++等公司 面部识别技术 正在为银行提供即时身份认证, 而TikTok等应用则向数百万青少年推送短视频(实际上吸引了相当多的人) 争议 这样做).

图表显示2018年新兴技术的炒作周期.

我个人认为,虽然确实有一些过度炒作的期望和企业, 人工智能是未来. 我创立了自己的早期人工智能创业公司,以抓住这个千载难逢的机会,参与到技术革命中来. 作为一名前风险投资人,我也在不断寻找人工智能领域的投资机会. I, 因此, 相信, 尽管周围的噪音不容否认, 人工智能投资的巨大激增也是有道理的.

但是考虑到这一点, 令我惊讶的是, 尤其是在投资界, 在认识上还有很大的差距. 投资者热衷于将资金投入工作, 但他们往往缺乏重要的基本知识, 在我看来, 必须是 有效的投资者 在这个空间里. 本文的目的是, 因此, 为有兴趣投资这一令人兴奋的领域的人士提供一些有用的背景和信息. 考虑到这个话题的广度, 我把我的想法分成了两部分, 第一篇旨在讨论开始人工智能之旅需要知道的一些基本元素——类似于101. 本系列的第二部分将更加实用,并将深入探讨如何评估人工智能投资以及不同的投资方式.

N.B. 这篇文章并不是技术性的. 它的目标是投资者和更广泛的金融界,因此非技术读者.

什么是人工智能?

实际上,人工智能有很多定义, 所以当我被要求给它下定义时,我通常会默认使用古老的维基百科, 哪一个。, 适用于非技术观众, 我认为提供了一个满意的定义:

人工智能(AI), 有时被称为机器智能, 智能是由机器展示的吗, 与人类和其他动物表现出的自然智力相反.

换句话说, 任何非自然智能都是“人工”智能, 不管它是如何实现的. 用于实现AI的技术包括if-then规则, 逻辑, 决策树, 回归, 还有机器学习,包括深度学习. 我最喜欢,也是最有趣的解释人工智能工作原理的工具之一是 这个视频 关于电脑是如何学习玩超级马里奥的.

当谈到人工智能时,你总是会听到这三个关键词:人工智能, 机器学习,以及深度学习. 它们有时可以互换使用,但它们是不同的. 简单地说,机器学习是人工智能技术的一个子集. 深度学习是机器学习技术的一个子集.

英伟达的博客 能很好地总结这三个术语之间的关系吗. 它还提供了人工智能发展的三波概览. 人工智能的第一波浪潮出现在50年代和60年代,当时出现了一些重大里程碑,比如IBM 701在跳棋游戏中战胜了跳棋大师罗伯特·尼利(Robert Nealey). 在80年代和90年代,深蓝在国际象棋上击败了人类大师卡斯帕罗夫. 2016年3月,AlphaGo击败了世界第一围棋选手李世石. 每次人工智能在游戏中击败人类大师,都会为人工智能引发一个新的炒作阶段. 然后,由于该技术无法提供满足公众期望的应用程序, 人工智能的炒作将变成人工智能的冬天, 随着投资和研究经费的减少.

图表显示了人工智能发展的不同阶段.

如前所述,机器学习是人工智能的一个子集. 根据 英伟达, 机器学习最基本的是“使用算法解析数据的实践”, 从中吸取教训, 然后对世界上的某件事做出决定或预测. 因此,与其用一组特定的指令来手工编写软件程序来完成特定的任务, 机器使用大量数据和算法进行“训练”,使其能够学习如何执行任务.“机器学习的一个非常常见的例子是垃圾邮件过滤器. 谷歌的垃圾邮件过滤器可以通过识别“王子”等触发词来识别垃圾邮件。, “尼日利亚”, 还有“奢侈手表”. 它还可以继续“学习”用户对垃圾邮件的手动分类. 例如, 谷歌的垃圾邮件过滤器漏掉了一封“向以下银行账户发送1000美元以获得这种独家抗癌药物”的电子邮件. 一旦用户将其标记为垃圾邮件, Gmail会分析该特定邮件中的所有关键字, “学会”处理包含“$1000”的组合词的电子邮件, “药物”, “银行账户”将成为垃圾邮件. 专业人员使用许多数学模型来进行机器学习.g. 回归,物流,贝叶斯网络,聚类.

这波人工智能浪潮有什么特别之处?

这一波人工智能浪潮是由受欢迎的 深度学习. 作为机器学习的一个子集,深度学习并不是最近才发明的. 事实上,根据 维基百科, 第一将军, 工作学习算法的监督, 深的。, 前馈, 多层感知器是由Alexey Ivakhnenko和Lapa在1965年发表的. 然而, 由于当时的计算能力和数据还不足以支持深度学习技术的大规模商业应用, 直到2006年杰弗里•辛顿等人发表了他们的 的论文,“深度信念网络的快速学习算法”.“尽管上世纪90年代和2000年上半年经历了人工智能寒冬, 一些学者, 包括深度学习领域的三位学术大师, 杰弗里•辛顿, Yann勒存, 和Yoshua Bengio, 继续致力于学术领域的深度学习. 计算能力的快速突破, 例如, 云计算和gpu, 再加上数字经济带来的大数据的可用性, 在过去的十年里,深度学习算法有可能实现吗. 例如,谷歌的自动驾驶汽车研究始于2009年.

从技术上讲,深度学习可以 定义为 作为“一类的” 机器学习 算法:

  • 使用多层次的级联 非线性处理 单位 特征提取 和转换. 每一层都使用前一层的输出作为输入.
  • 在监督下学习.g.(分类)和/或无监督(e.g.(模式分析)礼仪.
  • learn multiple levels of representations that correspond to different levels of abstraction; the levels form a hierarchy of concepts.”

与传统的机器学习相比,关键是“多层”. 例如,你如何区分猫和狗? 如果你要用机器学习, 您可能会提取出狗和猫的一些共同特征, 比如两只耳朵, 毛茸茸的脸, 眼睛与鼻子和嘴巴之间的距离, 等. 你可能会得到一个结果,说这张照片是50%的狗,50%的猫——不是很有用. 然而,使用深度学习,你甚至不知道猫和狗的区别特征是什么. 一只狗是, 但是机器, 通过多层创建新特性和数百(或数千)个统计模型, 会提供更精确的输出- e.g. 90%是狗,10%是猫. 下面的两个图表说明了神经网络是如何“学习”的。, 以及经典机器学习和神经网络之间的区别.

说明神经网络如何学习的图表以及经典机器学习和神经网络之间的区别.

读了上面的文章,读者可能会摸不着头脑,这是正确的. 但回到我们最初的目的:从投资者的角度来看, 深度学习有什么特别之处? 人们可以用各种更复杂的技术解释来回答这个问题, 但是简单地说, 下面左边的图表很好地说明了这一点:深度学习比其他学习算法提供了更强大的性能. 以语音识别为例进行详细说明 微软的博客 (下图右图):1988年最初的语音识别错误率为60-70%, 而使用深度学习的微软新系统只有6个.3% in 2014.

图像和两个图表显示了关于深度学习和语音识别单词错误率的历史进展的数据.

成功的人工智能应用的关键组件

我相信 机器学习(包括深度学习)产品的成功有四个关键组成部分:定义良好的理想问题, data, 该算法(s), 计算能力.

首先, 人工智能应用程序需要解决一个定义良好的(具体的)和理想的(针对紧急和明确的客户痛点)问题. 想想电脑在3种不同的AI浪潮中被教导玩的不同游戏:跳棋, 国际象棋, Go. 它们是非常明确的问题,因此对计算机来说更容易解决. 面部识别, 机器翻译, 无人驾驶汽车, 搜索引擎优化, 是否所有的问题都定义得很好. 然而, 缺乏定义良好的理想问题是它很难产生的原因, 例如, 一般的房屋清洁机器人. 简单的家务.g. 收集杯子和把衣服放进篮子里,需要解决太多的问题. 例如, 它要求机器识别需要捡起的物体(杯子), 脏衣服和不干净的衣服, 等.), 去哪里, 以及如何到达那里(避开家中的障碍物并前往所需的地点), 用所需的力量处理每件物品,以免打碎杯子或衣服, 等.

其次,开发机器学习算法需要 获取干净且标记良好的数据. 这是因为这些算法是通过向不同的统计模型提供大量标记良好的数据来构建的, 建立必要的预测关系. 这项数据收集工作可能很困难,也可能很容易, 取决于您正在开发的商业应用程序. 例如, 收集必要的数据,开发用于酿酒葡萄田的计算机视觉算法, 我的创业公司需要不同地点的不同品种的田间图像,更困难的是-不同的季节. 每个季节都是一年,需要几年的时间才能得到满意的产品. 相比之下,如果你想在中国开发一个好的面部识别算法,要收集e.g. 1000万张图片, 你只需要在北京繁忙的街道上设置一个星期的相机,任务就完成了. 另一个例子是中国排名第一的人工智能个性化新闻聚合器, Toutiao, 它了解你的个人新闻偏好,只向你显示与你最相关的新闻. 在这种情况下,收集数据又容易多了.g. 您在每个新闻类别中阅读的文章数量, 你在每篇文章上花费的时间, 等.

第三,人工智能业务需要发展 鲁棒和可扩展算法. 为了实现这个目标, 有三点是必须具备的:大量标记良好的数据(如上所述), 合适的人才, 并且相信深度学习是解决问题的正确技术. 人工智能业务需要合适的人才来开发必要的算法, 但这些都是高度专业化的, 昂贵的, 和稀缺. 例如, 当时我正在为我的创业公司招人, 我发现, 至少, 我需要数据科学家(通常是博士)来开发算法原型, 工程师设计框架, 程序员(TensorFlow, Python, C++ 等)将代码编写成可伸缩的程序,并由人将它们组合在一起(产品经理、用户体验、用户界面等)。.

另一个考虑是 计算能力. 为什么? 因为深度学习神经网络比其他人工智能方法需要更多的计算. 例如, 同样的任务是在图像中识别狗, 可能需要使用非深度学习算法来训练模型, 说, 给定1GB数据集的10个统计模型. 深度神经网络模型可能需要, 说, 1000个统计模型运行在100gb的数据集上. 使用网络的结果会更好,但所需的计算能力要大得多. 结果是, 这些模型不仅仅需要一台电脑(就像我们在个人电脑上做的那样)。, 而是每个GPU处理的分布式计算, 说, 5%的计算量, 这样20个gpu一起就可以处理所需的计算量. 这, 反过来, 意味着必须构建自己的GPU集群服务器或从AWS等平台租用计算能力. 来自云计算或您自己的服务器的计算能力是昂贵的, 虽然公平地说,计算的单位成本应该持续下降(按 摩尔定律).

结论

许多人认为,现在是看到人工智能突破和初创公司的最佳时机, 因为许多行业的数字化和互联网消费使得大量有目的地收集, 干净的组织, 可用数字数据. 英伟达的GPU和英特尔的FPGA的发展使得进行必要的计算变得更便宜和更快. 因此,当前的人工智能创新浪潮是由深度学习的重要进展推动的.

但是对于一个成功的人工智能应用来说, 一个人需要一个定义良好的理想问题, data, 算法, 以及强大的计算能力. 阅读本文的高管们正在考虑使用人工智能来增强他们的业务, 上面提到的四个关键组件也适用.

如何才能更多地了解人工智能? 有很多书,研讨会, Coursera课程,研究论文和组织,如 深度学习 了解人工智能. 因为本文的重点是为想要了解AI基础知识的投资者准备的, 我没有触及很多热门的人工智能话题,比如人工智能作为威胁的潜力, 行业未来展望, 人工智能的投资, 的优点和缺点 不同的算法 (e.g. CNN),原型vs. 扩展,主要的编程语言等. 在本系列的第2部分中, 我将深入探讨如何从投资者的角度评估人工智能公司.

了解基本知识

  • 哪些公司在人工智能领域领先?

    许多科技巨头都参与了人工智能:谷歌(Alphabet), 微软, 亚马逊, 苹果, IBM, 脸谱网, 等. 每家公司在不同方面都处于领先地位. 例如,谷歌的“深度思维”在突破性研究方面处于领先地位. 脸谱网早在其他公司之前就推出了面部识别技术.

  • 什么是人工智能服务?

    人工智能即服务是软件即服务(SaaS)的一个子集。. 人工智能即服务意味着一家公司可以授权其他公司开发的人工智能产品, 并为使用付费. 提供的服务包括模特培训, 计算能力, 以及现成的人工智能软件, 等.

  • 人工智能的重要性是什么?

    了解人工智能对每个人来说都很重要, 因为它已经被广泛应用于各种技术产品中, 并将继续改变我们未来的生活. 人工智能可以更好地完成许多任务, 快, 与手工处理相比,在更多的定制不同的用户.

就这一主题咨询作者或专家.
预约电话
Carolyn Deng, CFA的个人资料图片
Carolyn Deng, CFA

位于 新加坡,新加坡

成员自 2017年7月20日

作者简介

沃顿商学院MBA和CFA, Carolyn已经执行了20多个VC/PE交易, 管理着7亿美元的投资组合,目前正在筹集资金, 生长与M&一个专家.

Toptal作者都是各自领域经过审查的专家,并撰写他们有经验的主题. 我们所有的内容都经过同行评审,并由同一领域的Toptal专家验证.

专业知识

以前在

西太平洋银行

世界级的文章,每周发一次.

订阅意味着同意我们的 隐私政策

世界级的文章,每周发一次.

订阅意味着同意我们的 隐私政策

金融专家

加入总冠军® 社区.