开始日期: 2024-07-20
课时安排: 7周在线小组科研学习+5周不限时论文指导学习
适合人群
适合年级 (Grade): 大学生及以上
适合专业 (Major): 对人工智能、机器学习、深度学习、计算机科学、计算机工程、数据科学、通信以及交叉学科和方向感兴趣的学生;
学生需要具备微积分及线性代数基础,至少有一门编程语言的深度学习与计算机视觉算法实现经历;
建议选修: Python编程与数据处理
导师介绍
Ioannis
卡内基梅隆大学 (CMU)终身教授&招生委员会成员
Ioannis导师现任卡内基梅隆大学计算机科学学院机器人研究院终身教授及招生委员会成员。导师在哈佛大学工程与应用科学学院获得博士学位,师从Todd Zickler教授。Ioannis教授的工作聚焦计算成像,提出了以创新的,意想不到的和有意义的方式将成像(光学,传感器,照明)和计算(基于物理的建模和渲染,逆向算法,学习)结合在一起的系统。导师研究兴趣的具体问题包括围绕墙壁或通过皮肤成像、轻量级深度传感、材料采集、自适应成像、高效渲染以及基于物理的模拟、学习和光学的集成。
任职学校
卡内基梅隆大学(CMU)始建于1900年,是世界范围内颇负盛名的私立研究型大学,拥有世界历史最悠久的计算机学院之一,位列CSRankings排名世界第一,U.S. News计算机本科及硕士项目与斯坦福大学,麻省理工学院,加州大学伯克利分校并列全美第一。“截至2019年3月,学校的教员和校友中共有20人获得诺贝尔奖,13人获得图灵奖,22人获评美国艺术与科学院院士,19人进入美国科学促进会,72人入选美国国家学院。卡内基梅隆大学是美国四大计算机名校之一,连续多年问鼎全球计算机专业排名第一。
项目背景
1956年达特茅斯会议以来,人工智能已走过60年的风风雨雨,期间历经两次繁荣与低谷,喧嚣与沉寂。千禧年后,大数据的蓬勃发展和算力的指数级增长赋予了深度学习新的生机。深度学习如破竹之势将机器辅助功能变为可能,让人工智能在各个应用领域实现落地。其中,人工智能一个重要的研究方面就是计算机视觉。“计算机视觉是一门研究如何使机器‘看’的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量,其本质是模拟人类的感知与观察的一个过程。”据国金证券发布的调研报告称,计算机视觉是AI领域应用场景最丰富、商业化价值最大的领域,占中国AI市场的34.9%,排名第一。目前,相关技术已经在金融、自动驾驶、医疗、安防、互动娱乐等多个应用场景落地。计算机视觉背后的深度学习知识有哪些?如何将这些知识与实践相结合?
项目介绍
项目涵盖计算机视觉领域的常用深度学习方法和前沿技术,比如生成模型、计算机视觉API、AutoML Vision。项目结束后,学生将完成两页Jupyter Notebook形式的报告,创建计算机视觉应用程序部署在边缘推理平台,进行成果展示。学生将能够从头开始建立计算机视觉模型,完成指定场景应用。
个性化研究课题参考:
基于计算机视觉的动态手势识别
应用计算机视觉对果蔬表面缺陷的判别研究
深度测量及物体三维模拟重构
导师二介绍
W
武汉大学终身教授&博士生导师
英国伦敦大学博士爱尔兰都柏林城市大学外聘博士生导师
近10年发表包括在 IEEE TIP内的国际学术期刊50多篇
项目大纲
纬度转换 2D Transformations
边缘检测与图像拼接 Homography Estimation
单视图几何 Single View Geometry
姿态估计和极线几何 Pose Estimation and Epipolar Geometry
内核矩阵估计 Fundamental Matrix Estimation
学术研讨1:教授与各组学生探讨并评估个性化研究课题可行性,帮助学生明晰后续科研思路 Research Workshop I
学术研讨2:学生将在本周课前完成程序设计原型(prototype)及伪代码(Pseudocode),教授将根据各组进度进行个性化指导,确保学生优质的终期课题产出 Research Workshop II
项目成果展示 Final Presentation
项目收获
7周在线小组科研学习+5周不限时论文指导学习 共125课时
项目报告
优秀学员获主导师Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)
结业证书
成绩单