授课语言

中文

当前课程费用

20,410

位置

上海

X ACADEMY
全球开拓者峰会
-


2024.07.25 - 08.07

主修课 X-Core

人工智能前沿技术课程(计算机视觉方向)

Artificial Intelligence and Emerging Technologies(Computer Vision)

COURSE INTRO

课程简介 01

COURSE INTRO

课程简介 01

计算机视觉这个眼下人工智能最热门的领域之一,正在经历一场前所未有的变革。相关算法和软件的开发,如 Stable Diffusion 和 Midjourney 等工具的出现,标志着我们能以全新的方式处理和理解图像数据。这些技术不仅在艺术创作和娱乐产业中引起了巨大的兴趣,也为科学研究、医疗诊断、自动驾驶车辆,甚至是安全监控等众多领域打开了新的应用前景。

「TechX 人工智能前沿技术课程(计算机视觉方向)」将带你深入探讨人工智能与计算机视觉的基本概念、关键技术、以及最前沿的应用。我们将详细介绍机器学习和深度学习的基本原理,并带大家了解包括图像的获取、表示和预处理的图像处理基础,继而学习和实践如何利用计算机视觉算法进行图像分类、物体检测、姿态识别以及场景理解。在课程的后半段我们将聚焦于生成模型和多模态学习,来帮助大家更好的认知当前计算机视觉的前沿技术。


*「TechX 人工智能前沿技术课程」将涵盖人工智能基本知识与数据处理技术,并在此基础上根据时下热门前沿领域分为三个侧重方向,分别为计算机视觉、数据科学、自然语言处理方向。在 X-Portal 上进行申请并选择课程志愿时,你只需选择「TechX 人工智能前沿技术课程」作为第一志愿。在被正式录取并确认出席后,你将收到一份课程意向与基础调查问卷用于进一步收集你的个人兴趣与专业背景,以确定最终的课程方向。

计算机视觉这个眼下人工智能最热门的领域之一,正在经历一场前所未有的变革。相关算法和软件的开发,如 Stable Diffusion 和 Midjourney 等工具的出现,标志着我们能以全新的方式处理和理解图像数据。这些技术不仅在艺术创作和娱乐产业中引起了巨大的兴趣,也为科学研究、医疗诊断、自动驾驶车辆,甚至是安全监控等众多领域打开了新的应用前景。

「TechX 人工智能前沿技术课程(计算机视觉方向)」将带你深入探讨人工智能与计算机视觉的基本概念、关键技术、以及最前沿的应用。我们将详细介绍机器学习和深度学习的基本原理,并带大家了解包括图像的获取、表示和预处理的图像处理基础,继而学习和实践如何利用计算机视觉算法进行图像分类、物体检测、姿态识别以及场景理解。在课程的后半段我们将聚焦于生成模型和多模态学习,来帮助大家更好的认知当前计算机视觉的前沿技术。


*「TechX 人工智能前沿技术课程」将涵盖人工智能基本知识与数据处理技术,并在此基础上根据时下热门前沿领域分为三个侧重方向,分别为计算机视觉、数据科学、自然语言处理方向。在 X-Portal 上进行申请并选择课程志愿时,你只需选择「TechX 人工智能前沿技术课程」作为第一志愿。在被正式录取并确认出席后,你将收到一份课程意向与基础调查问卷用于进一步收集你的个人兴趣与专业背景,以确定最终的课程方向。

COURSE OUTCOME

课程产出 02

COURSE OUTCOME

课程产出 02

 课程结束时,你将有机会运用所学,完成以下其中一种类型的产出,例如:


  • 一个将计算机视觉技术用于解决实际生产、生活的系统或软件,如:

    • 将摄影照片转化为中国山水画的 AI 工具

    • 大堡礁附近海域海星追踪系统

    • 自动祛除法令纹的美颜 APP

    • 基于眼底图像的青光眼诊断平台古画人物开口说话 demo

      ......

  • 进行一次人工智能科研全流程,包括课题选择、模型与算法选择与设计、结果分析等,并最终完成一篇计算机视觉算法或应用研究的学术论文或 Research Proposal,为未来的学术研究打好基础。


*最终产出的类型与内容,以探索者在参与顶点项目 X-Capstone 后的成品为准

 课程结束时,你将有机会运用所学,完成以下其中一种类型的产出,例如:


  • 一个将计算机视觉技术用于解决实际生产、生活的系统或软件,如:

    • 将摄影照片转化为中国山水画的 AI 工具

    • 大堡礁附近海域海星追踪系统

    • 自动祛除法令纹的美颜 APP

    • 基于眼底图像的青光眼诊断平台古画人物开口说话 demo

      ......

  • 进行一次人工智能科研全流程,包括课题选择、模型与算法选择与设计、结果分析等,并最终完成一篇计算机视觉算法或应用研究的学术论文或 Research Proposal,为未来的学术研究打好基础。


*最终产出的类型与内容,以探索者在参与顶点项目 X-Capstone 后的成品为准

COURSE CONTENTS

课程内容 03

COURSE CONTENTS

课程内容 03

01 数据的探索

理论:课程安排介绍;数据科学基础概念、数据预处理、数据可视化、数据分析、数据挖掘与建模;

Lab:完成课程所需环境配置,学习/回顾 Python 基础知识。


02 人工智能历史与概念与机器学习基础

理论:人工智能的历史、现状与未来;图灵测试和达特茅斯会议;机器学习概念;监督学习与无监督学习

Lab: 使用 scikit-learn 库完成波士顿房价预测


03 机器学习的原理和方法

理论:机器学习工作流回归与分类任务;机器学习经典算法;集成学习

Lab: 使用 scikit-learn 库完成鸢尾花分类;尝试使用 scikit-learn 库进行手写数字识别。  


04 深度学习的原理和方法

理论:神经网络的概念;深度学习、神经科学与认知科学;深度学习的原理和方法

Lab: 学习 PyTorch 深度学习框架;搭建一个简单神经网络(多层感知机)。  


05 计算机视觉任务  

理论:计算机视觉七十年:从 Summer Vision Project 到 OpenAI Sora ;人类的视觉系统;相机模型、成像原理与色彩理论;数字图像的储存形式;图像预处理;图像滤波和滤波器;几何、颜色和运动特征

Lab:学习使用直方图均衡化操作实现图像对比度调节,使用 Canny 检测算子找到图像中物体的边缘;智能小车循线运动实验。


06 基于深度学习的计算机视觉

理论:卷积神经网络 (CNN) 原理;经典卷积神经网络结构;特征可视化;图像分类和检索

Lab: 使用 PyTorch 深度学习框架搭建、训练一个自己的 CNN 模型,使模型能够区分两种不同的目标。


07 计算机视觉任务(一)

理论:物体检测;图像分割;目标跟踪;人体姿态估计

Lab: 学习使用 You Only Look Once (YOLO) 系列模型实现行人检测和追踪;学习使用 MIT Labelme 软件制作目标检测数据集;对体育赛事视频中运动员进行姿态估计。


08 计算机视觉任务  (二)

理论:生成任务的概念;图像去噪、修复方法;图像风格迁移;生成对抗网络(GAN)模型

Lab:使用 GAN 模型完成一项图像转换任务,如完成老电影画质修复或将普通的风景照转变成梵高风格画作。


09 多模态生成式人工智能  

理论:文字生成图像/视频的原理;AIGC 工具学习:用 Midjourney 和 Runway 生成图像/视频;OpenAI Sora原理:Transformer 和扩散模型

Lab:使用合适的提示词在 Midjourney 和 Runway 中生成图像和视频;尝试制作自己的文本生成视频工具。

01 数据的探索

理论:课程安排介绍;数据科学基础概念、数据预处理、数据可视化、数据分析、数据挖掘与建模;

Lab:完成课程所需环境配置,学习/回顾 Python 基础知识。


02 人工智能历史与概念与机器学习基础

理论:人工智能的历史、现状与未来;图灵测试和达特茅斯会议;机器学习概念;监督学习与无监督学习

Lab: 使用 scikit-learn 库完成波士顿房价预测


03 机器学习的原理和方法

理论:机器学习工作流回归与分类任务;机器学习经典算法;集成学习

Lab: 使用 scikit-learn 库完成鸢尾花分类;尝试使用 scikit-learn 库进行手写数字识别。  


04 深度学习的原理和方法

理论:神经网络的概念;深度学习、神经科学与认知科学;深度学习的原理和方法

Lab: 学习 PyTorch 深度学习框架;搭建一个简单神经网络(多层感知机)。  


05 计算机视觉任务  

理论:计算机视觉七十年:从 Summer Vision Project 到 OpenAI Sora ;人类的视觉系统;相机模型、成像原理与色彩理论;数字图像的储存形式;图像预处理;图像滤波和滤波器;几何、颜色和运动特征

Lab:学习使用直方图均衡化操作实现图像对比度调节,使用 Canny 检测算子找到图像中物体的边缘;智能小车循线运动实验。


06 基于深度学习的计算机视觉

理论:卷积神经网络 (CNN) 原理;经典卷积神经网络结构;特征可视化;图像分类和检索

Lab: 使用 PyTorch 深度学习框架搭建、训练一个自己的 CNN 模型,使模型能够区分两种不同的目标。


07 计算机视觉任务(一)

理论:物体检测;图像分割;目标跟踪;人体姿态估计

Lab: 学习使用 You Only Look Once (YOLO) 系列模型实现行人检测和追踪;学习使用 MIT Labelme 软件制作目标检测数据集;对体育赛事视频中运动员进行姿态估计。


08 计算机视觉任务  (二)

理论:生成任务的概念;图像去噪、修复方法;图像风格迁移;生成对抗网络(GAN)模型

Lab:使用 GAN 模型完成一项图像转换任务,如完成老电影画质修复或将普通的风景照转变成梵高风格画作。


09 多模态生成式人工智能  

理论:文字生成图像/视频的原理;AIGC 工具学习:用 Midjourney 和 Runway 生成图像/视频;OpenAI Sora原理:Transformer 和扩散模型

Lab:使用合适的提示词在 Midjourney 和 Runway 中生成图像和视频;尝试制作自己的文本生成视频工具。

PREREQUISITES

前置要求 04

PREREQUISITES

前置要求 04

无硬性要求,但如果你已初步掌握线性代数、微积分、统计、概率论、基础 Python 编程等知识更佳。


*预习阶段导师与学术领袖将帮助你完成前置要求的学习

无硬性要求,但如果你已初步掌握线性代数、微积分、统计、概率论、基础 Python 编程等知识更佳。


*预习阶段导师与学术领袖将帮助你完成前置要求的学习

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"

Haiyi Jin 探索者
复旦大学

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"



Haiyi Jin 探索者
复旦大学

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"

Haiyi Jin 探索者
复旦大学

MENTORS

课程导师 05

MENTORS

课程导师 05

陶祎 Yi

2021 - 2024 学术导师

麻省理工学院 UV 首席技术主席 & 中国地区执行主席

哈尔滨工业大学 讲师 助理研究员


麻省理工学院 UV 新型智慧城市项目任职中国地区执行主席和首席信息科学技术主席,哈尔滨工业大学人工智能研究院任职特任助理研究员,微软认证培训教师。任 X ACADEMY 2023 TechX 筹备人、导师。研究方向为计算机视觉(多目标跟踪、人体姿态估计、多模态)、机器人、智慧城市。曾开设多门面向本科生、研究生的计算机基础、计算机编程、数据科学入门、人工智能基础、进阶计算机视觉等课程。也曾经在 TechX 2021、TechX 2022 担任计算机视觉课程导师。

陶祎 Yi

2021 - 2024 学术导师

麻省理工学院 UV 首席技术主席 & 中国地区执行主席

哈尔滨工业大学 讲师 助理研究员


麻省理工学院 UV 新型智慧城市项目任职中国地区执行主席和首席信息科学技术主席,哈尔滨工业大学人工智能研究院任职特任助理研究员,微软认证培训教师。任 X ACADEMY 2023 TechX 筹备人、导师。研究方向为计算机视觉(多目标跟踪、人体姿态估计、多模态)、机器人、智慧城市。曾开设多门面向本科生、研究生的计算机基础、计算机编程、数据科学入门、人工智能基础、进阶计算机视觉等课程。也曾经在 TechX 2021、TechX 2022 担任计算机视觉课程导师。

ACADEMIC LEADS

课程助教 06

ACADEMIC LEADS

课程助教 06

蒋峻涛 Gavin

2023 - 2024 学术助教

浙江大学 博士在读,纽约大学 电子工程硕士,IEEE UV 2024 程序主席

主要研究方向为计算机视觉、医学图像和视频分析、 AIGC 等,曾在 MICCAI、科大讯飞开发者大赛、Kaggle 上获得多项人工智能赛事奖项,组织“Vision Meets Algae”藻类目标检测系列赛事,已发表多篇期刊与国际会议论文,并担任 IEEE RAL 和 ICRA 等期刊会议审稿人。



古天骏 Grady

2023 - 2024 学术助教

华东师范大学 硕士在读

华东师范大学&上海交通大学 Digital Media & Computer Vision(DMCV) Lab 成员,主要研究方向为 Large Vision Model、Few shot、 AIGC、Computer Vision,目前在百度从事 AIGC 大模型算法实习,本科期间共获得国家级奖项 6 项,省部级 8 项,校级奖项十余项,并作为全校唯一本科生以第一作者身份发表论文至 CCF CAD/CD 26大会,目前所进行的 SSL Segment 工作也刷新了单模态分割的一项 SOTA。业余兴趣为篮球、说唱、电子竞技。

蒋峻涛 Gavin

2023 - 2024 学术助教

浙江大学 博士在读,纽约大学 电子工程硕士,IEEE UV 2024 程序主席

主要研究方向为计算机视觉、医学图像和视频分析、 AIGC 等,曾在 MICCAI、科大讯飞开发者大赛、Kaggle 上获得多项人工智能赛事奖项,组织“Vision Meets Algae”藻类目标检测系列赛事,已发表多篇期刊与国际会议论文,并担任 IEEE RAL 和 ICRA 等期刊会议审稿人。



古天骏 Grady

2023 - 2024 学术助教

华东师范大学 硕士在读

华东师范大学&上海交通大学 Digital Media & Computer Vision(DMCV) Lab 成员,主要研究方向为 Large Vision Model、Few shot、 AIGC、Computer Vision,目前在百度从事 AIGC 大模型算法实习,本科期间共获得国家级奖项 6 项,省部级 8 项,校级奖项十余项,并作为全校唯一本科生以第一作者身份发表论文至 CCF CAD/CD 26大会,目前所进行的 SSL Segment 工作也刷新了单模态分割的一项 SOTA。业余兴趣为篮球、说唱、电子竞技。

授课语言

中文

当前课程费用

20,410

位置

上海

X ACADEMY
全球开拓者峰会
-


2024.07.25 - 08.06

位置

上海

授课语言

中文

当前课程费用

20,410

X ACADEMY
全球开拓者峰会
-


2024.07.25 - 08.07

常见问题 FAQ

主修课师生比怎么样?

在每一年的 X ACADEMY 暑期项目中,导师 + 助教与探索者数量的比例为 1 : 5,每门课程将会有 1 - 2 名导师及 2 - 5 位课程助教(学术领袖),相比于传统的大班课,你将得到更为充足的交流和学习机会。

听说 X ACADEMY 的主修课非常硬核,开课时会不会跟不上?

在 X ACADEMY 我只能学习一门主修课程吗?

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. | 沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. |

沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. |

沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.