普适机器学习PervasiveMachineLearning

上传人:沈*** 文档编号:216929890 上传时间:2023-06-09 格式:PPT 页数:24 大小:926.50KB
收藏 版权申诉 举报 下载
普适机器学习PervasiveMachineLearning_第1页
第1页 / 共24页
普适机器学习PervasiveMachineLearning_第2页
第2页 / 共24页
普适机器学习PervasiveMachineLearning_第3页
第3页 / 共24页
资源描述:

《普适机器学习PervasiveMachineLearning》由会员分享,可在线阅读,更多相关《普适机器学习PervasiveMachineLearning(24页珍藏版)》请在装配图网上搜索。

1、普适机器学习普适机器学习(Pervasive Machine Learning)周志华周志华http:/ 器器 学学 习习机器学习的重要性美国航空航天局JPL实验室的科学家在Science(2001年9月)上撰文指出:机器学习对科学研究的整个过程正起到越来越大的支持作用,该领域在今后的若干年内将取得稳定而快速的发展机器学习的重要性入侵检测:是否是入侵?是何种入侵?如何检测?历史数据:以往的正常访问模式及其表现、以往的入侵模式及其表现对当前访问模式分类这是一个典型的机器学习问题常用技术:神经网络 决策树支持向量机 贝叶斯分类器k近邻 序列分析 聚类 例子1:网络安全常用技术:神经网络 支持向量机

2、隐马尔可夫模型贝叶斯分类器 k近邻决策树 序列分析 聚类 例子2:生物信息学例子3:搜索引擎Google的成功,使得Internet搜索引擎成为一个新兴的产业不仅有众多专营搜索引擎的公司出现(例如专门针对中文搜索的就有慧聪、百度等),而且Microsoft等巨头也开始投入巨资进行研发Google掘到的第一桶金,来源于其创始人Larry Page和Sergey Brin提出的PageRank算法机器学习技术正在支撑着各类搜索引擎(尤其是贝叶斯学习技术)美国的PAL计划DARPA 2003年 开 始 启 动 PAL(Perceptive Assistant that Learns)计划5年期,首期

3、(1-1.5年)投资2千9百万美元以机器学习为核心的计划(涉及到AI的其他分支,如知识表示和推理、自然语言处理等);包含2个子计划目标:“is expected to yield new technology of significant value to the military,business,and academic sectors”“develop software that will help decision-makers manage their complex worlds of multiple simultaneous tasks and unexpected event

4、s”RADAR(Reflective Agents with Distributed Adaptive Reasoning),承担单位为CMU,首期7百万美元目标:“the system will help busy managers to cope with time-consuming tasks”“RADAR must learn by interacting with its human master and by accepting explicit advice and instruction”美国的PAL计划:RADAR子计划CALO(Cognitive Agent that L

5、earns and Observes),承担单位为SRI,首期2千2百万美元除SRI外,这个子计划的参加单位有20家:Boeing,CMU,Dejima Inc.,Fetch Tech Inc.,GATech,MIT,Oregon HSU,Stanford,SUNY-Stony Brook,UC Berkeley,UMass,UMich,UPenn,Rochester,USC,UT Austin,UW,Yale,CALO无疑是PAL中更核心的部分美国的PAL计划:CALO子计划(1)美国的PAL计划:CALO子计划(2)目标:“the name CALO was inspired by the

6、 Latin word calonis,which means soldiers assistant”“the CALO software,which will learn by working with and being advised by its users,will handle a broad range of interrelated decision-making tasks It will have the capability to engage in and carry out routine tasks,and to assist when the unexpected

7、 happens”从CALO的目标来看,DARPA已经开始把机器学习技术的重要性放到了国家安全的角度来考虑美国的PAL计划:CALO子计划(3)历史回顾(1)下述事件(大致)标志着机器学习正式成为一个学科u1983年,R.S.Michalski等人撰写机器学习:通往人工智能的途径一书u1986年,Machine Learning杂志创刊与人工智能乃至计算机科学中很多其他分支学科相比,机器学习还非常年轻、很不成熟以Tom Mitchell的经典教科书(McGraw Hill出版社,1997)为例,很难看到基础学科(例如数学、物理学)教科书中那种贯穿始终的体系,也许会让人感到这不过是不同方法和技术

8、的堆砌历史回顾(2)主要范式的发展:u80年代中叶以前:符号主义,代表:ILP受到传统人工智能研究的深刻影响,以逻辑推理为基础u80年代中叶至90年代初:连接主义,代表:NN对传统人工智能的批评:“看上去漂亮,但解决不了实际问题”对上述批评,AI的不同分支学科实际上都做出了自己的回应,ML的回应是连接主义受到重视NN并不漂亮(至少在理论体系上远远没有ILP那么漂亮),但解决了很多实际问题历史回顾(3)u90年代中叶至今:统计学习,代表:SVMNN虽然解决了不少问题,但解决问题时的“试错性”引来了“trick”的批评作为回应,统计学习开始占据支配地位。虽然SVM仍然有“试错性”,但毕竟在理论基础

9、上比NN漂亮得多(实际上,统计学习与连接主义一脉相承)u现在:?统计学习并不是万能的,有很多问题不能解决(或不能很好地解决),例如结构化数据的学习作为回应,以逻辑为基础的符号主义与统计学习的结合开始受到重视从主要范式的发展可以看出,ML实际上是一个应用驱动的学科,其根本的驱动力是“更多、更好地解决实际问题”由于近20年的飞速发展,机器学习已经具备了一定的解决实际问题的能力,似乎逐渐开始成为一种基础性、透明化的“支持技术、服务技术”基础性:在众多的学科领域都得以应用(“无所不在”)透明化:用户看不见机器学习,看见的是防火墙、生物信息、搜索引擎;(“无所不在”)“机器更好用了”(正如CALO的一些

10、描述:“you wont leave home without it”;”embodied as a software environment that transcends workstations,PDAs,cell phones,”)似乎的趋势“普适机器学习”作为支持和服务技术的“普适机器学习”带来了挑战和机遇:出现了很多被传统ML研究忽视、但非常重要且尚无好的解决方案的问题(下面将以医疗和金融为代表来举几个例子)ML支持和服务的学科领域越多,新问题越多ML与众多学科领域产生了交叉,而交叉领域正是大有可为处挑战与机遇医疗:以乳腺癌诊断为例,“将病人误诊为健康人的代价”与“将健康人误诊为病

11、人的代价”是不同的金融:以信用卡盗用检测为例,“将盗用误认为正常使用的代价”与“将正常使用误认为盗用的代价”是不同的传统的ML技术基本上只考虑同一代价如何处理代价敏感性?在教科书中找不到现成的答案,例如:Tom Mitchell,Machine Learning,McGraw-Hill,1997Nils J.Nilsson,Introduction to Machine Learning,draft 1996-2004例子1:代价敏感医疗:以乳腺癌诊断为例,“健康人”样本远远多于“病人”样本金融:以信用卡盗用检测为例,“正常使用”样本远远多于“被盗用”样本传统的ML技术基本上只考虑平衡数据如何

12、处理数据不平衡性?在教科书中找不到现成的答案例子2:不平衡数据医疗:以乳腺癌诊断为例,需要向病人解释“为什么做出这样的诊断”金融:以信用卡盗用检测为例,需要向保安部门解释“为什么这是正在被盗用的卡”传统的ML技术基本上只考虑泛化不考虑理解如何处理可理解性?在教科书中找不到现成的答案例子3:可理解走向普适机器学习 把机器学习真正当成一种支持技术、服务技术,考虑不同学科领域对机器学习的需求,找出其中具有共性的、必须解决的问题,并进而着手研究一方面可以促进和丰富ML本身的发展,另一方面可以促进使用ML技术的学科领域本身的发展作为“应用基础”,与“ML应用”有根本的区别:基础性:不是直接做应用,而是做“更广泛的应用”或“更成功的应用”所需要的方法和技术广泛性:重点不是去解决单一应用所面临的问题,而是要解决众多应用领域所面临的共性问题致谢应明生教授:与基础科学教科书的比较王珏教授:多次富有启发性的讨论请各位专家 批评指正!

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!