开始日期: 2024-02-17
课时安排: 7周在线小组科研学习+5周不限时论文指导学习
适合人群
适合年级 (Grade): 高中生/大学生
适合专业 (Major): 计算机科学、计算机工程、数据科学、数据处理、机器学习、深度学习等专业或对上述专业感兴趣的学生
学生需要具备微积分或线性代数基础,熟练使用Python进行数据处理
导师介绍
Mark
麻省理工学院 (MIT)终身教授
Mark导师现任麻省理工学院(MIT)终身教授,曾获素有“诺贝尔风向标”美誉的美国斯隆研究奖、国际最具声望的博士后奖励Hubble Fellow,并在多个年份获得Web of Science高被引学者称号。
Mark导师的研究兴趣聚焦机器学习、数据科学、人工智能、宇宙物理等,善于利用高性能超级计算机强大的数据处理能力进行数值模拟,训练机器学习和深度学习模型,借助机器学习与数据科学技术分析模拟数据。
Prof. Mark is an Associate Professor at MIT whose research interests span topics such as astrophysics, machine learning, data science, and artificial intelligence. He makes extensive use of numerical simulations using state-of-the-art high-performance supercomputers around the world. He also employs machine learning and data science techniques to analyze simulation data.
任职学校
麻省理工学院(MIT)创立于1861年,是世界著名私立研究型大学,在计算机科学方向享有盛誉,在2020年U.S.News世界大学排名综排位列第二、计算机工程CE专排蝉联首位。学校孕育了90位诺贝尔奖得主、59位美国国家科学奖章获得者,以及75位麦克阿瑟奖获得者。
项目背景
大数据的本质是海量的、多维度、多形式的数据。所以,在大数据面前,以往的数据处理方式无法快速、高效的达成既定目标,而人工智能技术借助机器学习与深度学习算法,更加灵活,并且可以根据不同的训练数据拥有自优化能力,从而使运算量显著增加。
“人工智能”与“大数据”的完美结合将改变我们的日常生活,也即将成为各领域研究发展方向的变革工具。项目将在来自计算机专业排名前列的麻省理工学院的终身教授的指导下进行,旨在介绍常用机器学习和数据科学理论,以及当下最受欢迎的Python编程语言,引导学生探讨不同的机器学习理论和实际应用,为高阶学习打下坚实基础。
项目介绍
项目旨在全面介绍机器学习和数据科学领域中的多种前沿算法及其应用,课程中将逐步指导学生学习机器学习的两个主要类别——分类与聚类,内容涵盖初始研发动机与数学理论,并最后用Python编程实现。学生将在项目结束时,自选如Tensorflow/Pytorch/Pycharm等主流框架中其一和实际生活生产中的待优化问题,使用Python开发机器学习应用,提交项目个性化研究课题报告,进行成果展示。The course will give comprehensive introduction to the field of machine learning and data science. We will cover two main categories of machine learning, step by step guiding the students to learn the algorithms from the motivation to the theory, and finally to the implementation. One can take this course as a simple overview of machine learning. However, for those who are interested in the in-depth analysis of machine learning, this course’s abundant content is also a great choice.
项目大纲
机器学习中的数学理论:向量微积分、线性代数与概率论 Introduction to Machine Learning and Math Preliminary
回归模型及其优化方法 Regression Methods:Linear Regression, Polynomial Regression: importance of regularization;Ridge Regression & LASSO RegressionClassification Methods
分类模型 Categorization of classification problems; Binary Classification: Perceptron, Logistic Regression, and SVM;Multi-Class Classification
神经网络架构与反向传播算法 Components of Neural Networks; Back-Propagation Algorithm; Optimizers of NN; Advanced Architectures of NN, including CNN & RNN
非监督式学习与大数据降维 Unsupervised Learning including clustering and dimensionality reduction
学术研讨1:教授与各组学生探讨并评估个性化研究课题可行性,帮助学生明晰后续科研思路 Final Project Preparation Session I
学术研讨2:学生将在本周课前完成程序设计原型(prototype)及伪代码(Pseudocode),教授将根据各组进度进行个性化指导,确保学生优质的终期课题产出 Final Project Preparation Session II
项目成果展示 Final Presentation
论文指导 Project Deliverables Tutoring
项目收获
7周在线小组科研学习+5周不限时论文指导学习 共125课时
项目报告
优秀学员获主导师Reference Letter
EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)
结业证书
成绩单