授课语言

中文

当前课程费用

20,410

位置

上海

X ACADEMY
全球开拓者峰会
-


2024.07.25 - 08.07

主修课 X-Core

人工智能与计算机视觉

Artificial Intelligence and Computer Vision

COURSE INTRO

课程简介 01

COURSE INTRO

课程简介 01

计算机视觉这个眼下人工智能最热门的领域之一,正在经历一场前所未有的变革。相关算法和软件的开发,如 Stable Diffusion 和 Midjourney 等工具的出现,标志着我们能以全新的方式处理和理解图像数据。这些技术不仅在艺术创作和娱乐产业中引起了巨大的兴趣,也为科学研究、医疗诊断、自动驾驶车辆,甚至是安全监控等众多领域打开了新的应用前景。

「TechX 人工智能与计算机视觉」将带你深入探讨计算机视觉的基本概念、关键技术、以及最前沿的应用。我们将从包括图像的获取、表示和预处理的图像处理基础开始,继而学习和实践如何利用算法进行特征检测、图像分类、模式识别以及场景理解。在课程的后半段我们将聚焦于预训练模型和多模态学习,来帮助大家更好的认知当前计算机视觉的前沿技术。

计算机视觉这个眼下人工智能最热门的领域之一,正在经历一场前所未有的变革。相关算法和软件的开发,如 Stable Diffusion 和 Midjourney 等工具的出现,标志着我们能以全新的方式处理和理解图像数据。这些技术不仅在艺术创作和娱乐产业中引起了巨大的兴趣,也为科学研究、医疗诊断、自动驾驶车辆,甚至是安全监控等众多领域打开了新的应用前景。

「TechX 人工智能与计算机视觉」将带你深入探讨计算机视觉的基本概念、关键技术、以及最前沿的应用。我们将从包括图像的获取、表示和预处理的图像处理基础开始,继而学习和实践如何利用算法进行特征检测、图像分类、模式识别以及场景理解。在课程的后半段我们将聚焦于预训练模型和多模态学习,来帮助大家更好的认知当前计算机视觉的前沿技术。

COURSE OUTCOME

课程产出 02

COURSE OUTCOME

课程产出 02

 课程结束时,你将有机会运用所学,完成以下其中一种类型的产出,例如:

  • 一个将计算机视觉技术用于解决实际生产、生活的系统或软件,如:

    • 将摄影照片转化为中国山水画的 AI 工具

    • 大堡礁附近海域海星追踪系统

    • 自动祛除法令纹的美颜 APP

    • 基于眼底图像的青光眼诊断平台古画人物开口说话 demo

      ......

  • 进行一次人工智能科研全流程,包括课题选择、模型与算法选择与设计、结果分析等,并最终完成一篇计算机视觉算法或应用研究的学术论文或 Research Proposal,为未来的学术研究打好基础。


*最终产出的类型与内容,以探索者在参与顶点项目 X-Capstone 后的成品为准

 课程结束时,你将有机会运用所学,完成以下其中一种类型的产出,例如:

  • 一个将计算机视觉技术用于解决实际生产、生活的系统或软件,如:

    • 将摄影照片转化为中国山水画的 AI 工具

    • 大堡礁附近海域海星追踪系统

    • 自动祛除法令纹的美颜 APP

    • 基于眼底图像的青光眼诊断平台古画人物开口说话 demo

      ......

  • 进行一次人工智能科研全流程,包括课题选择、模型与算法选择与设计、结果分析等,并最终完成一篇计算机视觉算法或应用研究的学术论文或 Research Proposal,为未来的学术研究打好基础。


*最终产出的类型与内容,以探索者在参与顶点项目 X-Capstone 后的成品为准

COURSE CONTENTS

课程内容 03

COURSE CONTENTS

课程内容 03

01 走近计算机视觉 

理论:计算机视觉七十年:从 Summer Vision Project 到 OpenAI Sora;人类的视觉系统;相机模型、成像原理与色彩理论;数字图像的储存形式  

Lab:完成课程所需环境配置,学习/回顾 Python 基础知识,使用 OpenCV 库完成简单的图像操作,并探索 RGB 色彩空间。  


02 计算机视觉基础  

理论:图像预处理;图像滤波和滤波器;几何、颜色和运动特征  

Lab:学习使用直方图均衡化操作实现图像对比度调节,使用 Canny 检测算子找到图像中物体的边缘;选择一种滤波器实现超声医学图像去噪;智能小车循线运动实验。  


03 基于传统机器学习的计算机视觉  

理论:机器学习原理;机器学习经典算法;基于传统机器学习的计算机视觉  

Lab:使用 sklearn 库完成鸢尾花分类;使用支持向量机算法进行猫狗分类。  


04 基于深度学习的计算机视觉  

理论:深度学习基础卷积神经网络(CNN)  

Lab:学习 PyTorch 深度学习框架的基本使用。  


05 计算机视觉任务  

理论:图像分类和检索;不同卷积神经网络结构;特征可视化  

Lab:使用 PyTorch 深度学习框架搭建、训练一个自己的 CNN 模型,从而使模型能够区分两种不同的目标。  


06 计算机视觉任务  

理论:目标检测;图像分割  

Lab:学习使用 You Only Look Once (YOLO) 系列模型实现行人检测;学习使用 MIT Labelme 软件制作目标检测数据集;尝试从头训练一个自己的目标检测模型。  


07 计算机视觉任务  

理论:目标跟踪;人体姿态估计  

Lab:学习使用 YOLO v8 模型,对一段视频中的多个目标(如行人)进行跟踪;对赛事视频中运动员进行姿态估计。  


08 计算机视觉任务  

理论:生成任务;图像去噪、修复;图像风格迁移;生成对抗网络(GAN)模型  

Lab:使用 GAN 模型完成一项图像转换任务,如完成老电影修复或将普通的风景照转变成梵高画作。  


09 多模态生成式人工智能  

理论:文字生成图像/视频的原理AIGC工具学习:用 Midjourney 和 Runway 生成图像/视频;OpenAI Sora原理:Transformer 和扩散模型  

Lab:使用合适的提示词在 Midjourney 和 Runway 中生成图像和视频;尝试制作自己的 Sora —— 文本生成视频工具。

01 走近计算机视觉 

理论:计算机视觉七十年:从 Summer Vision Project 到 OpenAI Sora;人类的视觉系统;相机模型、成像原理与色彩理论;数字图像的储存形式  

Lab:完成课程所需环境配置,学习/回顾 Python 基础知识,使用 OpenCV 库完成简单的图像操作,并探索 RGB 色彩空间。  


02 计算机视觉基础  

理论:图像预处理;图像滤波和滤波器;几何、颜色和运动特征  

Lab:学习使用直方图均衡化操作实现图像对比度调节,使用 Canny 检测算子找到图像中物体的边缘;选择一种滤波器实现超声医学图像去噪;智能小车循线运动实验。  


03 基于传统机器学习的计算机视觉  

理论:机器学习原理;机器学习经典算法;基于传统机器学习的计算机视觉  

Lab:使用 sklearn 库完成鸢尾花分类;使用支持向量机算法进行猫狗分类。  


04 基于深度学习的计算机视觉  

理论:深度学习基础卷积神经网络(CNN)  

Lab:学习 PyTorch 深度学习框架的基本使用。  


05 计算机视觉任务  

理论:图像分类和检索;不同卷积神经网络结构;特征可视化  

Lab:使用 PyTorch 深度学习框架搭建、训练一个自己的 CNN 模型,从而使模型能够区分两种不同的目标。  


06 计算机视觉任务  

理论:目标检测;图像分割  

Lab:学习使用 You Only Look Once (YOLO) 系列模型实现行人检测;学习使用 MIT Labelme 软件制作目标检测数据集;尝试从头训练一个自己的目标检测模型。  


07 计算机视觉任务  

理论:目标跟踪;人体姿态估计  

Lab:学习使用 YOLO v8 模型,对一段视频中的多个目标(如行人)进行跟踪;对赛事视频中运动员进行姿态估计。  


08 计算机视觉任务  

理论:生成任务;图像去噪、修复;图像风格迁移;生成对抗网络(GAN)模型  

Lab:使用 GAN 模型完成一项图像转换任务,如完成老电影修复或将普通的风景照转变成梵高画作。  


09 多模态生成式人工智能  

理论:文字生成图像/视频的原理AIGC工具学习:用 Midjourney 和 Runway 生成图像/视频;OpenAI Sora原理:Transformer 和扩散模型  

Lab:使用合适的提示词在 Midjourney 和 Runway 中生成图像和视频;尝试制作自己的 Sora —— 文本生成视频工具。

PREREQUISITES

前置要求 04

PREREQUISITES

前置要求 04

无硬性要求,希望你对学习保持热情,但如果你拥有基础 Python 编程等知识更佳。


*预习阶段导师与学术领袖将帮助你完成前置要求的学习

无硬性要求,希望你对学习保持热情,但如果你拥有基础 Python 编程等知识更佳。


*预习阶段导师与学术领袖将帮助你完成前置要求的学习

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"

Haiyi Jin 探索者
复旦大学

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"



Haiyi Jin 探索者
复旦大学

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"

Haiyi Jin 探索者
复旦大学

MENTORS

课程导师 05

MENTORS

课程导师 05

陶祎 Yi

2021 - 2024 学术导师

麻省理工学院 UV 首席技术主席 & 中国地区执行主席

哈尔滨工业大学 讲师 助理研究员


麻省理工学院 UV 新型智慧城市项目任职中国地区执行主席和首席信息科学技术主席,哈尔滨工业大学人工智能研究院任职特任助理研究员,微软认证培训教师。任 X ACADEMY 2023 TechX 筹备人、导师。研究方向为计算机视觉(多目标跟踪、人体姿态估计、多模态)、机器人、智慧城市。曾开设多门面向本科生、研究生的计算机基础、计算机编程、数据科学入门、人工智能基础、进阶计算机视觉等课程。也曾经在 TechX 2021、TechX 2022 担任计算机视觉课程导师。

陶祎 Yi

2021 - 2024 学术导师

麻省理工学院 UV 首席技术主席 & 中国地区执行主席

哈尔滨工业大学 讲师 助理研究员


麻省理工学院 UV 新型智慧城市项目任职中国地区执行主席和首席信息科学技术主席,哈尔滨工业大学人工智能研究院任职特任助理研究员,微软认证培训教师。任 X ACADEMY 2023 TechX 筹备人、导师。研究方向为计算机视觉(多目标跟踪、人体姿态估计、多模态)、机器人、智慧城市。曾开设多门面向本科生、研究生的计算机基础、计算机编程、数据科学入门、人工智能基础、进阶计算机视觉等课程。也曾经在 TechX 2021、TechX 2022 担任计算机视觉课程导师。

ACADEMIC LEADS

课程助教 06

ACADEMIC LEADS

课程助教 06

蒋峻涛 Gavin

2023、2024 学术助教

浙江大学 博士在读

纽约大学 电子工程硕士

IEEE UV 2024 程序主席


浙江大学博士生在读,纽约大学电子工程硕士,IEEE UV 2024 程序主席,主要研究方向为计算机视觉、医学图像和视频分析、 AIGC 等,曾在 MICCAI、科大讯飞开发者大赛、Kaggle 上获得多项人工智能赛事奖项,组织“Vision Meets Algae”藻类目标检测系列赛事,已发表多篇期刊与国际会议论文,并担任 IEEE RAL 和 ICRA 等期刊会议审稿人。



古天骏 Grady

2023、2024 学术助教

华东师范大学 硕士在读


华东师范大学&上海交通大学 Digital Media & Computer Vision(DMCV) Lab 成员,主要研究方向为 Large Vision Model、Few shot、 AIGC、Computer Vision,目前在百度从事 AIGC 大模型算法实习,本科期间共获得国家级奖项 6 项,省部级 8 项,校级奖项十余项,并作为全校唯一本科生以第一作者身份发表论文至 CCF CAD/CD 26大会,目前所进行的 SSL Segment 工作也刷新了单模态分割的一项 SOTA。业余兴趣为篮球、说唱、电子竞技。

蒋峻涛 Gavin

2023、2024 学术助教

浙江大学 博士在读

纽约大学 电子工程硕士

IEEE UV 2024 程序主席


浙江大学博士生在读,纽约大学电子工程硕士,IEEE UV 2024 程序主席,主要研究方向为计算机视觉、医学图像和视频分析、 AIGC 等,曾在 MICCAI、科大讯飞开发者大赛、Kaggle 上获得多项人工智能赛事奖项,组织“Vision Meets Algae”藻类目标检测系列赛事,已发表多篇期刊与国际会议论文,并担任 IEEE RAL 和 ICRA 等期刊会议审稿人。



古天骏 Grady

2023、2024 学术助教

华东师范大学 硕士在读


华东师范大学&上海交通大学 Digital Media & Computer Vision(DMCV) Lab 成员,主要研究方向为 Large Vision Model、Few shot、 AIGC、Computer Vision,目前在百度从事 AIGC 大模型算法实习,本科期间共获得国家级奖项 6 项,省部级 8 项,校级奖项十余项,并作为全校唯一本科生以第一作者身份发表论文至 CCF CAD/CD 26大会,目前所进行的 SSL Segment 工作也刷新了单模态分割的一项 SOTA。业余兴趣为篮球、说唱、电子竞技。

授课语言

中文

当前课程费用

20,410

位置

上海

X ACADEMY
全球开拓者峰会
-


2024.07.25 - 08.06

位置

上海

授课语言

中文

当前课程费用

20,410

X ACADEMY
全球开拓者峰会
-


2024.07.25 - 08.07

常见问题 FAQ

主修课师生比怎么样?

在每一年的 X ACADEMY 暑期项目中,导师 + 助教与探索者数量的比例为 1 : 5,每门课程将会有 1 - 2 名导师及 2 - 5 位课程助教(学术领袖),相比于传统的大班课,你将得到更为充足的交流和学习机会。

听说 X ACADEMY 的主修课非常硬核,开课时会不会跟不上?

在 X ACADEMY 我只能学习一门主修课程吗?

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. | 沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. |

沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. |

沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.