交流评论、关注点赞

  • Facebook Icon脸书专页
  • telegram Icon翻墙交流电报群
  • telegram Icon电报频道
  • RSS订阅禁闻RSS/FEED订阅

人工智慧第二讲:深度学习 Deep Learning

2019年11月15日 15:09 PDF版 分享转发

来源 – 台湾海外网

第二讲:深度学习 Deep LearningProfessor FRANK Y. SHIH, 施永强教授College of Computing Sciences, New Jersey Institute of Technology, Newark, NJ 07102     笔者在New Jersey Institute of Technology任职正教授三十年,曾经历系系主任、NJIT全校教授升等暨终身聘任权的评监委员会主席、研究所所长、博士委员会主席、硕士委员会主席。获得多项国科会的研究奖金,美国航空太空总署、美国陆军、海军、空军及工业界(AT&T、IBM)的研究计画奖金,现担任十多个国际专业学术期刊的主编及副编,担任过许多国际学术研讨会的主席和委员。发表过逾两百五十多篇的学术研究论文,并着有六本专业的大学及研究所教科书。笔者於8/29/2018 受邀请在New Jersey Living Well Club演讲:人工智慧。因为反应热烈深受听众关切,续受邀请於10/30/2019 在 New Jersey Living Well Club演讲人工智慧第二讲:深度学习。希望透过我三十多年研究AI领域的经验介绍,能让大家对人工智慧更感兴趣,有正确的认知。以下是演讲的内容摘要:     人工智慧的起源在1943年,由神经生理学家Warren McCulloch 和 数学家Walter Pitts 建构脑神经运作模型。在1956年,由史丹佛大学教授John McCarthy 提出Artificial Intelligence (AI) 『人工智慧』一词。Intelligence 一词由拉丁文 legere 演变而来,是蒐集和组合,并从事选择、进而能了解和感受的意思。笔者的研究经验,早从1984年起,在美国Purdue University攻读博士学位,即从事Artificial Intelligence和Pattern Recognition的研究,博士毕业後在纽泽西州立理工大学担任教授,更扩大从事Robot Vision, Multimedia Data Security, Intelligent Watermarking, Steganography, Forensics等专门研究领域。迄今,着作了6本书,出版了250篇专业论文     机器学习是将无明显秩序的数据转化为有价值的方法。也就是説机器学习的价值,乃是从数据中抽取规律并用来预测未来。机器学习的应用广泛,举凡:(一)分类问题 : 图像识别、垃圾邮件识别;(二)回归问题:股价预测、房价预测;(三)排序问题:电击率预估、推荐;(四)生成问题:图像生成、图像风格转换、图像文字描述生成。机器学习的方法可以分为两种:(一)符号式学习(Symbolic Learning):将事例依其特徵以文字或符号方式表示,然後尝试取出其分类规则;(二)连结式学习(Connectionist Learning):将事例的特徵用数值形式表示,然後用类神经网路的机制来学习其分类规则。     深度学习早在1940 年代就有研究,并不是新颖的概念,它是机器学习(Machine Learning)的一种方法,是目前人工智慧的主流。它的最佳代表作包括击败世界棋王的 Google AlphaGo和夺得美国Jeopardy电视节目比赛冠军的 IBM Watson。常有人问:「要设计出比天才还厉害的电脑的人,一定要比天才还聪明,对不对?」答案是:不对。同样的,要建立一套深度学习的网路,其实没有想像中困难,只要有基本的了解,再搭配网路资源自己学习,就可以开始建立自己的深度学习网路。     要怎麽做才能把大象放进冰箱?只需要三个步骤:「打开冰箱、放进大象、关上冰箱门。」同样的,深度学习只需要三个步骤:建立网路、设定目标、开始学习。深度学习本身就是函数集,神经网路就是一大堆函数的综合体。当我们丢进去一堆数值,整个网路就送出一堆数值,从这里面找出一个最好的结果,也就是机器运算出来的最佳解答,机器可以依此决定下一步要如何行动,人类也可以按照这个建议作因应决策。我们可以在深度学习的神经网路这个函数里加进各种变数,在电脑执行程式後,我们可以很快地看到结果,还可以告诉机器,这个结果是正确的还是错误的,并且来调整函数内容,来来回回渐近式地达到正确结果。这个过程,就是所谓的「学习」,经过大量资料的训练过程,最终机器就能找到一个最佳函数,得出最佳的答案了。     图一显示人工细胞(neuron)结构。由於生物神经元具有不同的突触性质和突触强度,所以对神经元的影响不同,我们用加权值来表示,其正负模拟了生物神经元中突出的兴奋和抑制,其大小则代表了突出的不同连接强度。由於累加性,我们对全部输入信号进行累加整合,相当於生物神经元中的膜电位。类神经网路模拟神经细胞的运作以达到类似学习功能,人脑约有一千亿个神经细胞,每个神经细胞约有一千根连结与其他神经细胞相连。因此,人脑中约有一百万亿根连结,形成一个高度连结网状的神经网路(图二)。学习过程可有逐步学习和批次学习。逐步学习是在每一训练样本,计算其加权值与门槛值的修正量後立即修改;批次学习则是在一个学习循环後,计算所有训练样本的加权值与门槛值的修正量後才修改。     假设神经网路每一层有1000个神经元细胞,那每一层中间就有100万个权值,叠加越多层越可怕,这怎麽会简单?如果所有的权值都要人们去设定,那就不叫做「机器学习」了,在神经网路里的千百万个数值,都是机器自己学出来的,由人类定义学习规则和提供大量的学习资料,告诉机器什麽答案是对的,机器就会自己去调整权值来做出正确的判断。在深度学习中有很多模型可辨识图像,基本的作法跟人脑很像,第一层先处理线条,由小区域慢慢组合成一些形状,最後看整个大区域,就能判读出图形的内容。     以 AlphaGo 为例,当团队设定好神经网路後,将大量的棋谱资料送入,让 AlphaGo 学习下围棋的方法,最後它就能判断棋盘上的各种状况,并根据对手的落子做出相对回应。AlphaGo 虽然下围棋很高竿,但拿它的神经网路去开车就不行了。深度学习并不是万能的,它只能针对某种特定需要来设计,它的各种应用都才开始而已,还有很多领域需要人们去开发、设计、发展、测试。     现今所有企业都可以称为「AI公司」或「科技公司」,在2000年有「网路企业」如Yahoo、Google,今天没有这种说法。10几年前有所谓的「互联网产业」,但今天我们都称为「智慧+」产业,如智慧制造、智慧医疗。10几年後,我们会把「智慧」两个字省略。如今AI对产业的冲击,涵盖各行各业,从传产到科技,从蓝领到白领。张忠谋表示,未来25年内,很多职业将被AI取代;导致失业率增加。李开复表示,未来30年,将有45%的工作被人工智慧取代。张忠谋更说,现在的年轻人,辛苦念书20多年,却要小心工作被 AI 取代。     李开复预测未来40种工作受到AI影响的情况,分成4大类,每类各有10种。1.    「名存实亡」: 很快会被淘汰,如电话行销员、电话接线员、收银员、速食店员等2.    「抱火卧薪」: 看似安全,实则危机四伏,如保全人员、卡车司机、记帐员、市场研究等。3.    「有惊无险」: 看似危险但其实很难被取代的工作,如清洁工、保母、养老护理员、导游4.    「高枕无忧」: 包括医疗护理人员、小说家、电脑工程师、老师和管理者(真正的领导者)。     另外人工智慧对太空船有相当的贡献,当初美国太空总署〈NASA〉的卡西尼号太空船〈CASSINI〉,运用人工智慧设备,其生存机会大於一般的太空船。其原因在於遇到状况时,CASSINI能够自行处理。宇宙是如此的浩瀚,在遥远行星中的太空任务中,人类无法忍受长达数十年的星际探险,更不可能在不适合人类生存的星体进行任务。因此具备智慧的人工探险家将可替代人类来达成这些不可能的任务。     总而言之,人工智慧的研究乃在利用电脑来模拟人的智慧,有关人类智慧的探讨、人类智慧的运作、与设计智慧型系统的研究,均包含在人工智慧的领域里。因此与人工智慧相关的研究领域甚广,除资讯科学外,尚包含:心理学、语言学、神经学、逻辑学、哲学、认知科学、生物学……等等。在现代的电脑中,处处可以看到人工智慧的应用,让电脑变的更有智慧。

喜欢、支持,请转发分享↓Follow Us 责任编辑:叶华