光华讲坛——社会名流与企业家论坛第6596期
主题:Efficient Surgical Tool Recognition via HMM-Stabilized Deep Learning——Wise Integration of Statistical Learning and Deep Learning may Make a Difference通过HMM稳定深度学习高效识别外科工具——统计学习与深度学习的明智融合或许有所不同
主讲人:清华大学 邓柯副教授
主持人:西南财经大学 常晋源教授
时 间:10月13日 14:00—15:00
举办地点:西南财经大学光华校区光华楼1003会议室
主办单位:数据科学与商业智能联合实验室 统计学院 科研处
主讲人简介:
邓柯是清华大学统计学研究中心长聘副教授,主要从事统计学理论和方法的研究,并致力于推动数据科学与生物医学、人工智能、人文社科的交叉。他2008年获得北京大学统计学博士学位,同年进入哈佛大学统计系从事研究工作,历任博士后、副研究员,2013年加入清华大学工作至今。2014年入选国家高层次人才计划青年项目,2016年获“科学中国人年度人物”荣誉称号,2018年受聘北京智源人工智能研究院担任数理基础方向的“智源研究员”。他在统计学、数据科学知名期刊和会议发表论文五十余篇,主持多项国家自然科学基金、国家社科基金及北京市自然科学基金项目。他在中文文本分析和数字人文方面的研究工作获得获国际华人数学家大会(ICCM)和中国数字人文大会的最佳论文奖,他在生物信息学方面的研究工作获得教育部高校科学研究优秀成果奖自然科学奖一等奖。他是国际计算统计学会亚太地区分会理事、中国现场统计研究会计算统计分会理事长、中国青年统计学家协会副会长、中国人工智能学会智慧医疗专业委员会副主任委员、国家抗肿瘤药物临床应用专家委员会委员,还担任国际统计学杂志Statistica Sinica副主编,以及《数字人文》、《应用概率统计》、《应用数学与力学》、《统计与精算》等期刊的编委。
内容简介:
The great success of large deep learning models in various applications in recent years have encouraged many researchers to seek improved performance by utilizing larger models and bigger data in practical problems involving unstructured data, leading to increasingly obvious psychological implications to pursuit large models everywhere. However, the fundamental principle of statistical modelling tells us that an over-flexible large model without a clear focus on the unique features of the problem of interest would often lead to inefficient utilization of data and sub-optimal results. In this talk, we will provide an example, in the context of surgical tool recognition, that complex deep learning models can be defeated by simple statical approaches once we can wisely integrate statistical learning and deep learning. We hope this study could inspire more research efforts on developing advanced statistical models and approaches for analyzing complex unstructured data.
近年来,大规模深度学习模型在各种应用中取得的巨大成功鼓励了许多研究人员通过利用更大的模型和更多的数据来提高性能,特别是在涉及非结构化数据的实际问题中,追求大模型已经变得越来越明显。然而,统计建模的基本原则告诉我们,一个过于灵活的大型模型,如果没有清晰地关注问题的独特特征,往往会导致数据的低效利用和次优结果。这次讲座将以外科工具识别为例,展示了一旦我们能够明智地将统计学习与深度学习相结合,复杂的深度学习模型就可能被简单的统计方法击败。希望这项研究能够激发更多关于开发高级统计模型和方法来分析复杂非结构化数据的研究工作。