人工智慧第二讲：深度学习 Deep Learning

禁闻网

翻墙必看的中共禁闻,禁网新闻,大陆新闻中国新闻解读评论,禁闻点击排行榜

交流评论、关注点赞

人工智慧第二讲：深度学习 Deep Learning

2019年11月15日 15:09 PDF版分享转发

来源 – 台湾海外网

人工智慧第二讲：深度学习 Deep LearningProfessor FRANK Y. SHIH, 施永强教授College of Computing Sciences, New Jersey Institute of Technology, Newark, NJ 07102 笔者在New Jersey Institute of Technology任职正教授三十年，曾经历电脑系系主任、NJIT全校教授升等暨终身聘任权的评监委员会主席、研究所所长、博士委员会主席、硕士委员会主席。获得多项美国国科会的研究奖金，美国航空太空总署、美国陆军、海军、空军及工业界（AT&T、IBM）的研究计画奖金，现担任十多个国际专业学术期刊的主编及副编，担任过许多国际学术研讨会的主席和委员。发表过逾两百五十多篇的学术研究论文，并着有六本专业的大学及研究所教科书。笔者於8/29/2018 受邀请在New Jersey Living Well Club演讲：人工智慧。因为反应热烈深受听众关切，续受邀请於10/30/2019 在 New Jersey Living Well Club演讲人工智慧第二讲：深度学习。希望透过我三十多年研究AI领域的经验介绍，能让大家对人工智慧更感兴趣，有正确的认知。以下是演讲的内容摘要：人工智慧的起源在1943年，由神经生理学家Warren McCulloch 和数学家Walter Pitts 建构脑神经运作模型。在1956年，由史丹佛大学教授John McCarthy 提出Artificial Intelligence (AI) 『人工智慧』一词。Intelligence 一词由拉丁文 legere 演变而来，是蒐集和组合，并从事选择、进而能了解和感受的意思。笔者的研究经验，早从1984年起，在美国Purdue University攻读博士学位，即从事Artificial Intelligence和Pattern Recognition的研究，博士毕业後在纽泽西州立理工大学担任教授，更扩大从事Robot Vision, Multimedia Data Security, Intelligent Watermarking, Steganography, Forensics等专门研究领域。迄今，着作了6本书，出版了250篇专业论文机器学习是将无明显秩序的数据转化为有价值的方法。也就是説机器学习的价值，乃是从数据中抽取规律并用来预测未来。机器学习的应用广泛，举凡：（一）分类问题：图像识别、垃圾邮件识别；（二）回归问题：股价预测、房价预测；（三）排序问题：电击率预估、推荐；（四）生成问题：图像生成、图像风格转换、图像文字描述生成。机器学习的方法可以分为两种：（一）符号式学习（Symbolic Learning）：将事例依其特徵以文字或符号方式表示，然後尝试取出其分类规则；（二）连结式学习（Connectionist Learning）：将事例的特徵用数值形式表示，然後用类神经网路的机制来学习其分类规则。深度学习早在1940 年代就有研究，并不是新颖的概念，它是机器学习（Machine Learning）的一种方法，是目前人工智慧的主流。它的最佳代表作包括击败世界棋王的 Google AlphaGo和夺得美国Jeopardy电视节目比赛冠军的 IBM Watson。常有人问：「要设计出比天才还厉害的电脑的人，一定要比天才还聪明，对不对？」答案是：不对。同样的，要建立一套深度学习的网路，其实没有想像中困难，只要有基本的了解，再搭配网路资源自己学习，就可以开始建立自己的深度学习网路。要怎麽做才能把大象放进冰箱？只需要三个步骤：「打开冰箱、放进大象、关上冰箱门。」同样的，深度学习只需要三个步骤：建立网路、设定目标、开始学习。深度学习本身就是函数集，神经网路就是一大堆函数的综合体。当我们丢进去一堆数值，整个网路就送出一堆数值，从这里面找出一个最好的结果，也就是机器运算出来的最佳解答，机器可以依此决定下一步要如何行动，人类也可以按照这个建议作因应决策。我们可以在深度学习的神经网路这个函数里加进各种变数，在电脑执行程式後，我们可以很快地看到结果，还可以告诉机器，这个结果是正确的还是错误的，并且来调整函数内容，来来回回渐近式地达到正确结果。这个过程，就是所谓的「学习」，经过大量资料的训练过程，最终机器就能找到一个最佳函数，得出最佳的答案了。图一显示人工神经元细胞（neuron）结构。由於生物神经元具有不同的突触性质和突触强度，所以对神经元的影响不同，我们用加权值来表示，其正负模拟了生物神经元中突出的兴奋和抑制，其大小则代表了突出的不同连接强度。由於累加性，我们对全部输入信号进行累加整合，相当於生物神经元中的膜电位。类神经网路模拟神经细胞的运作以达到类似学习功能，人脑约有一千亿个神经细胞，每个神经细胞约有一千根连结与其他神经细胞相连。因此，人脑中约有一百万亿根连结，形成一个高度连结网状的神经网路（图二）。学习过程可有逐步学习和批次学习。逐步学习是在每一训练样本，计算其加权值与门槛值的修正量後立即修改；批次学习则是在一个学习循环後，计算所有训练样本的加权值与门槛值的修正量後才修改。假设神经网路每一层有1000个神经元细胞，那每一层中间就有100万个权值，叠加越多层越可怕，这怎麽会简单？如果所有的权值都要人们去设定，那就不叫做「机器学习」了，在神经网路里的千百万个数值，都是机器自己学出来的，由人类定义学习规则和提供大量的学习资料，告诉机器什麽答案是对的，机器就会自己去调整权值来做出正确的判断。在深度学习中有很多模型可辨识图像，基本的作法跟人脑很像，第一层先处理线条，由小区域慢慢组合成一些形状，最後看整个大区域，就能判读出图形的内容。以 AlphaGo 为例，当团队设定好神经网路後，将大量的棋谱资料送入，让 AlphaGo 学习下围棋的方法，最後它就能判断棋盘上的各种状况，并根据对手的落子做出相对回应。AlphaGo 虽然下围棋很高竿，但拿它的神经网路去开车就不行了。深度学习并不是万能的，它只能针对某种特定需要来设计，它的各种应用都才开始而已，还有很多领域需要人们去开发、设计、发展、测试。现今所有企业都可以称为「AI公司」或「科技公司」，在2000年有「网路企业」如Yahoo、Google，今天没有这种说法。10几年前有所谓的「互联网产业」，但今天我们都称为「智慧+」产业，如智慧制造、智慧医疗。10几年後，我们会把「智慧」两个字省略。如今AI对产业的冲击，涵盖各行各业，从传产到科技，从蓝领到白领。张忠谋表示，未来25年内，很多职业将被AI取代；导致失业率增加。李开复表示，未来30年，将有45%的工作被人工智慧取代。张忠谋更说，现在的年轻人，辛苦念书20多年，却要小心工作被 AI 取代。李开复预测未来40种工作受到AI影响的情况，分成4大类，每类各有10种。1. 「名存实亡」: 很快会被淘汰，如电话行销员、电话接线员、收银员、速食店员等2. 「抱火卧薪」: 看似安全，实则危机四伏，如保全人员、卡车司机、记帐员、市场研究等。3. 「有惊无险」: 看似危险但其实很难被取代的工作，如清洁工、保母、养老护理员、导游4. 「高枕无忧」: 包括医疗护理人员、小说家、电脑工程师、老师和管理者（真正的领导者）。另外人工智慧对太空船有相当的贡献，当初美国太空总署〈NASA〉的卡西尼号太空船〈CASSINI〉，运用人工智慧设备，其生存机会大於一般的太空船。其原因在於遇到状况时，CASSINI能够自行处理。宇宙是如此的浩瀚，在遥远行星中的太空任务中，人类无法忍受长达数十年的星际探险，更不可能在不适合人类生存的星体进行任务。因此具备智慧的人工探险家将可替代人类来达成这些不可能的任务。总而言之，人工智慧的研究乃在利用电脑来模拟人的智慧，有关人类智慧的探讨、人类智慧的运作、与设计智慧型系统的研究，均包含在人工智慧的领域里。因此与人工智慧相关的研究领域甚广，除资讯科学外，尚包含：心理学、语言学、神经学、逻辑学、哲学、认知科学、生物学……等等。在现代的电脑中，处处可以看到人工智慧的应用，让电脑变的更有智慧。

喜欢、支持，请转发分享↓Follow Us 责任编辑：叶华

交流评论、关注点赞

人工智慧第二讲：深度学习 Deep Learning

热门禁书