授课语言

中文

常规申请费用

23,930

位置

上海

X ACADEMY
全球开拓者峰会
-


2025.07.23 - 08.05

主修课 X-Core

主修课 X-Core

主修课 X-Core

人工智能前沿技术课程(计算机视觉方向)

Artificial Intelligence and Emerging Technologies(Computer Vision)

COURSE INTRO

课程简介 01

COURSE INTRO

课程简介 01

计算机视觉作为当前最热门的人工智能领域之一,正经历着前所未有的变革。新兴算法和工具(如 DALL·E 3 和 Runway)的出现,让我们能够以全新的方式处理和理解图像数据。这些技术不仅在艺术创作和娱乐领域引发了广泛关注,还为科学研究、医疗诊断、自动驾驶和安全监控等多领域应用开辟了全新的可能。


「TechX 人工智能前沿技术课程(计算机视觉方向)」将带你深入了解计算机视觉的基础概念、核心技术及前沿应用。课程从图像获取、表示和预处理的基础入手,逐步探索特征检测、图像分类、模式识别和场景理解的算法与实践。在后续学习中,我们将重点研究预训练模型和多模态模型,以更好地理解计算机视觉领域的最新进展。最终,课程将带领你应用所学知识对计算机视觉最新技术进行讨论和研究,并以科研海报、幻灯片展示成果,或完成一个结合计算机视觉技术的实际项目,如简易图片生成器或多模态数据处理应用



*「TechX 人工智能前沿技术课程」将涵盖人工智能基本知识与数据处理技术,并在此基础上根据时下热门前沿领域分为三个侧重方向,分别为计算机视觉、数据科学、多模态学习方向。在 X-Portal 上进行申请并选择课程志愿时,你只需选择「TechX 人工智能前沿技术课程」作为第一志愿。在被正式录取并确认出席后,你将收到一份课程意向与基础调查问卷用于进一步收集你的个人兴趣与专业背景,以确定最终的课程方向。

计算机视觉作为当前最热门的人工智能领域之一,正经历着前所未有的变革。新兴算法和工具(如 DALL·E 3 和 Runway)的出现,让我们能够以全新的方式处理和理解图像数据。这些技术不仅在艺术创作和娱乐领域引发了广泛关注,还为科学研究、医疗诊断、自动驾驶和安全监控等多领域应用开辟了全新的可能。


「TechX 人工智能前沿技术课程(计算机视觉方向)」将带你深入了解计算机视觉的基础概念、核心技术及前沿应用。课程从图像获取、表示和预处理的基础入手,逐步探索特征检测、图像分类、模式识别和场景理解的算法与实践。在后续学习中,我们将重点研究预训练模型和多模态模型,以更好地理解计算机视觉领域的最新进展。最终,课程将带领你应用所学知识对计算机视觉最新技术进行讨论和研究,并以科研海报、幻灯片展示成果,或完成一个结合计算机视觉技术的实际项目,如简易图片生成器或多模态数据处理应用



*「TechX 人工智能前沿技术课程」将涵盖人工智能基本知识与数据处理技术,并在此基础上根据时下热门前沿领域分为三个侧重方向,分别为计算机视觉、数据科学、多模态学习方向。在 X-Portal 上进行申请并选择课程志愿时,你只需选择「TechX 人工智能前沿技术课程」作为第一志愿。在被正式录取并确认出席后,你将收到一份课程意向与基础调查问卷用于进一步收集你的个人兴趣与专业背景,以确定最终的课程方向。

COURSE OUTCOME

课程产出 02

COURSE OUTCOME

课程产出 02

 课程结束时,你将有机会运用所学,完成以下其中一种类型的产出,例如:


  • 一个将计算机视觉技术用于解决实际生产、生活的系统或软件,如:

    • 将摄影照片转化为中国山水画的 AI 工具

    • 大堡礁附近海域海星追踪系统

    • 自动祛除法令纹的美颜 APP

    • 基于眼底图像的青光眼诊断平台古画人物开口说话 demo

      ......

  • 进行一次人工智能科研全流程,包括课题选择、模型与算法选择与设计、结果分析等,并最终完成一篇计算机视觉算法或应用研究的学术论文或 Research Proposal,为未来的学术研究打好基础。


*最终产出的类型与内容,以探索者在参与顶点项目 X-Capstone 后的成品为准

 课程结束时,你将有机会运用所学,完成以下其中一种类型的产出,例如:


  • 一个将计算机视觉技术用于解决实际生产、生活的系统或软件,如:

    • 将摄影照片转化为中国山水画的 AI 工具

    • 大堡礁附近海域海星追踪系统

    • 自动祛除法令纹的美颜 APP

    • 基于眼底图像的青光眼诊断平台古画人物开口说话 demo

      ......

  • 进行一次人工智能科研全流程,包括课题选择、模型与算法选择与设计、结果分析等,并最终完成一篇计算机视觉算法或应用研究的学术论文或 Research Proposal,为未来的学术研究打好基础。


*最终产出的类型与内容,以探索者在参与顶点项目 X-Capstone 后的成品为准

POTENTIAL OPPORTUNITIES

发展方向 03

POTENTIAL OPPORTUNITIES


发展方向 03

计算机科学家、数据科学家、算法工程师、机器人和自动驾驶工程师、视觉和多媒体艺术家、精准医疗医生、结构生物学家

对计算机视觉技术感兴趣,希望深入探索如何使计算机通过图像和视频理解世界,以及如何利用多模态生成式人工智能创造新质内容;充满好奇心与热情,希望通过计算机拓宽感知边界,探索未知领域。

计算机科学家、数据科学家、算法工程师、机器人和自动驾驶工程师、视觉和多媒体艺术家、精准医疗医生、结构生物学家

对计算机视觉技术感兴趣,希望深入探索如何使计算机通过图像和视频理解世界,以及如何利用多模态生成式人工智能创造新质内容;充满好奇心与热情,希望通过计算机拓宽感知边界,探索未知领域。

COURSE CONTENTS

课程内容 04

COURSE CONTENTS

课程内容 04

01 计算机视觉历史与概念

  • 理论:计算机视觉七十年:从 Summer Vision Project 到 OpenAI Sora ;人类的视觉系统;相机模型、成像原理与色彩理论;数字图像的储存形式;图像预处理;图像滤波和滤波器;几何、颜色和运动特征


02 计算机视觉基础

  • 理论:图像预处理;图像滤波和滤波器;几何、颜色和运动特征

  • Lab: 学习使用直方图均衡化操作实现图像对比度调节,使用 Canny 检测算子找到图像中物体的边缘;智能小车循线运动实验。


03 人工智能历史与概念

  • 理论:人工智能的历史、现状与未来;图灵测试和达特茅斯会议;机器学习概念;监督学习与无监督学习

  • Lab: 使用机器学习算法完成波士顿房价预测。


04 机器学习的原理和方法

  • 理论:机器学习工作流回归与分类任务;机器学习经典算法;集成学习

  • Lab: 使用机器学习算法完成鸢尾花分类;尝试使用机器学习算法进行手写数字识别。


05 深度学习的原理和方法

  • 理论:神经网络的概念;深度学习、神经科学与认知科学;深度学习的原理和方法

  • Lab: 学习 PyTorch 深度学习框架;搭建一个简单神经网络(多层感知机)。


06 基于深度学习的计算机视觉

  • 理论:卷积神经网络 (CNN) 原理;经典卷积神经网络结构;特征可视化;图像分类和检索

  • Lab: 使用 PyTorch 深度学习框架搭建、训练一个自己的 CNN 模型,使模型能够区分两种不同的目标。


07 计算机视觉任务(一)

  • 理论:物体检测;图像分割;目标跟踪;人体姿态估计

  • Lab: 学习使用 You Only Look Once (YOLO) 系列模型实现行人检测和追踪;学习使用 MIT Labelme 软件制作目标检测数据集;对体育赛事视频中运动员进行姿态估计。


08 计算机视觉任务(二)

  • 理论:生成任务的概念;图像去噪、修复方法;图像风格迁移;生成对抗网络(GAN)模型

  • Lab: 使用 GAN 模型完成一项图像转换任务,如完成老电影画质修复或将普通的风景照转变成梵高风格画作。


09 多模态生成式人工智能

  • 理论:文字生成图像/视频的原理;AIGC 工具学习:用 Midjourney 和 Runway 生成图像/视频;Transformer 和扩散模型

  • Lab: 使用合适的提示词在 Midjourney 和 Runway 中生成图像和视频;尝试制作自己的文本生成视频工具。

01 计算机视觉历史与概念

  • 理论:计算机视觉七十年:从 Summer Vision Project 到 OpenAI Sora ;人类的视觉系统;相机模型、成像原理与色彩理论;数字图像的储存形式;图像预处理;图像滤波和滤波器;几何、颜色和运动特征


02 计算机视觉基础

  • 理论:图像预处理;图像滤波和滤波器;几何、颜色和运动特征

  • Lab: 学习使用直方图均衡化操作实现图像对比度调节,使用 Canny 检测算子找到图像中物体的边缘;智能小车循线运动实验。


03 人工智能历史与概念

  • 理论:人工智能的历史、现状与未来;图灵测试和达特茅斯会议;机器学习概念;监督学习与无监督学习

  • Lab: 使用机器学习算法完成波士顿房价预测。


04 机器学习的原理和方法

  • 理论:机器学习工作流回归与分类任务;机器学习经典算法;集成学习

  • Lab: 使用机器学习算法完成鸢尾花分类;尝试使用机器学习算法进行手写数字识别。


05 深度学习的原理和方法

  • 理论:神经网络的概念;深度学习、神经科学与认知科学;深度学习的原理和方法

  • Lab: 学习 PyTorch 深度学习框架;搭建一个简单神经网络(多层感知机)。


06 基于深度学习的计算机视觉

  • 理论:卷积神经网络 (CNN) 原理;经典卷积神经网络结构;特征可视化;图像分类和检索

  • Lab: 使用 PyTorch 深度学习框架搭建、训练一个自己的 CNN 模型,使模型能够区分两种不同的目标。


07 计算机视觉任务(一)

  • 理论:物体检测;图像分割;目标跟踪;人体姿态估计

  • Lab: 学习使用 You Only Look Once (YOLO) 系列模型实现行人检测和追踪;学习使用 MIT Labelme 软件制作目标检测数据集;对体育赛事视频中运动员进行姿态估计。


08 计算机视觉任务(二)

  • 理论:生成任务的概念;图像去噪、修复方法;图像风格迁移;生成对抗网络(GAN)模型

  • Lab: 使用 GAN 模型完成一项图像转换任务,如完成老电影画质修复或将普通的风景照转变成梵高风格画作。


09 多模态生成式人工智能

  • 理论:文字生成图像/视频的原理;AIGC 工具学习:用 Midjourney 和 Runway 生成图像/视频;Transformer 和扩散模型

  • Lab: 使用合适的提示词在 Midjourney 和 Runway 中生成图像和视频;尝试制作自己的文本生成视频工具。

PREREQUISITES

前置要求 05

PREREQUISITES

前置要求 05

线性代数,微积分,统计基础,熟悉 Python 语法,有机器学习基础。


*预习阶段导师与学术领袖将帮助你完成前置要求的学习

线性代数,微积分,统计基础,熟悉 Python 语法,有机器学习基础。


*预习阶段导师与学术领袖将帮助你完成前置要求的学习

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"

Haiyi Jin 探索者
复旦大学

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"



Haiyi Jin 探索者
复旦大学

"XA 给我自己带来了什么, CS 素养的提高自是不必说,我更感谢的是,能让我遇到最顶尖最优秀的一批同龄人。我见到了活生生的 MIT,CIT 学生,请教了无所不能 debug 的助教,也收获了一堆桌游好友。或许说自己的梦想是改变世界是会被人笑话的,但 XA 给了我把梦想化为现实的底气。

这条路好长,去的地方有诗和理想。昨天留下的一滩泪和汗,造就现在的我越倔强越勇敢。这是 XA 带给我教会我的:我们永远都还可以更勇敢一点。"

Haiyi Jin 探索者
复旦大学

MENTORS

往届导师 06

MENTORS

课程导师 06

陶祎 Yi

2021 - 2024 学术导师

麻省理工学院 UV 首席技术主席 & 中国地区执行主席

哈尔滨工业大学 讲师 助理研究员

麻省理工学院 UV 新型智慧城市项目任职中国地区执行主席和首席信息科学技术主席,哈尔滨工业大学人工智能研究院任职特任助理研究员,微软认证培训教师。任 X ACADEMY 2023 TechX 筹备人、导师。研究方向为计算机视觉(多目标跟踪、人体姿态估计、多模态)、机器人、智慧城市。曾开设多门面向本科生、研究生的计算机基础、计算机编程、数据科学入门、人工智能基础、进阶计算机视觉等课程。也曾经在 TechX 2021、TechX 2022、TechX 2024 担任计算机视觉课程导师。

陶祎 Yi

2021 - 2024 学术导师

麻省理工学院 UV 首席技术主席 & 中国地区执行主席

哈尔滨工业大学 讲师 助理研究员

麻省理工学院 UV 新型智慧城市项目任职中国地区执行主席和首席信息科学技术主席,哈尔滨工业大学人工智能研究院任职特任助理研究员,微软认证培训教师。任 X ACADEMY 2023 TechX 筹备人、导师。研究方向为计算机视觉(多目标跟踪、人体姿态估计、多模态)、机器人、智慧城市。曾开设多门面向本科生、研究生的计算机基础、计算机编程、数据科学入门、人工智能基础、进阶计算机视觉等课程。也曾经在 TechX 2021、TechX 2022、TechX 2024 担任计算机视觉课程导师。

ACADEMIC LEADS

往届助教 07

ACADEMIC LEADS

课程助教 07

蒋峻涛 Gavin

2023 - 2024 学术助教

浙江大学 博士在读

纽约大学 电子工程硕士

IEEE UV 2024 程序主席

主要研究方向为计算机视觉、医学图像和视频分析、 AIGC 等,曾在 MICCAI、科大讯飞开发者大赛、Kaggle 上获得多项人工智能赛事奖项,组织“Vision Meets Algae”藻类目标检测系列赛事,已发表多篇期刊与国际会议论文,并担任 IEEE RAL 和 ICRA 等期刊会议审稿人。



裘嘉豪 Charles

2024 学术助教

普林斯顿博士在读

上海交通大学 ECE 与密西根大学安娜堡分校 CS 双本科毕业

本科阶段曾获得国家奖学金,并发表自动驾驶和自然语言处理相关论文两篇。目前研究领域涉及大语言模型和 AI4Science。多篇论文发表于 ICML,EMNLP,AAAI 等会议。爱好做饭与美食鉴赏、健身、看脱口秀。



程天越 Tianyue

2021 学术助教

加州大学伯克利分校 电子工程与计算机专业

曾获 USACO Gold。Kaggle 数据科学平台竞赛排名全球前1%。在强化学习游戏 Halite 和康奈尔大学鸟类叫声识别比赛分别获全球前3%和5%。在人体肾脏肾小球识别、COVID-19 mRNA 疫苗的降解预测、心肺功能下降预测比赛中获前30%。高中就读于北京四中国际校区。校计算机社团社长,发表有关治疗新冠肺炎药物生成模型的论文。现阶段对强化学习感兴趣。

蒋峻涛 Gavin

2023 - 2024 学术助教

浙江大学 博士在读

纽约大学 电子工程硕士

IEEE UV 2024 程序主席

主要研究方向为计算机视觉、医学图像和视频分析、 AIGC 等,曾在 MICCAI、科大讯飞开发者大赛、Kaggle 上获得多项人工智能赛事奖项,组织“Vision Meets Algae”藻类目标检测系列赛事,已发表多篇期刊与国际会议论文,并担任 IEEE RAL 和 ICRA 等期刊会议审稿人。



裘嘉豪 Charles

2024 学术助教

普林斯顿博士在读

上海交通大学 ECE 与密西根大学安娜堡分校 CS 双本科毕业

本科阶段曾获得国家奖学金,并发表自动驾驶和自然语言处理相关论文两篇。目前研究领域涉及大语言模型和 AI4Science。多篇论文发表于 ICML,EMNLP,AAAI 等会议。爱好做饭与美食鉴赏、健身、看脱口秀。



程天越 Tianyue

2021 学术助教

加州大学伯克利分校 电子工程与计算机专业

曾获 USACO Gold。Kaggle 数据科学平台竞赛排名全球前1%。在强化学习游戏 Halite 和康奈尔大学鸟类叫声识别比赛分别获全球前3%和5%。在人体肾脏肾小球识别、COVID-19 mRNA 疫苗的降解预测、心肺功能下降预测比赛中获前30%。高中就读于北京四中国际校区。校计算机社团社长,发表有关治疗新冠肺炎药物生成模型的论文。现阶段对强化学习感兴趣。

授课语言

中文

当前课程费用

23,930

位置

上海

X ACADEMY
全球开拓者峰会
-


2024.07.25 - 08.06

位置

上海

授课语言

中文

当前课程费用

23,930

X ACADEMY
全球开拓者峰会
-


2024.07.25 - 08.07

常见问题 FAQ

主修课师生比怎么样?

主修课师生比怎么样?

主修课师生比怎么样?

听说 X ACADEMY 的主修课非常硬核,开课时会不会跟不上?

听说 X ACADEMY 的主修课非常硬核,开课时会不会跟不上?

听说 X ACADEMY 的主修课非常硬核,开课时会不会跟不上?

在 X ACADEMY 我只能学习一门主修课程吗?

在 X ACADEMY 我只能学习一门主修课程吗?

在 X ACADEMY 我只能学习一门主修课程吗?

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. | 沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. |

沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.

© 2024 | 上海得斯教育科技有限公司 | 成立于 2016. |

沪ICP备2021004001号-6

OUR CIVILIZATION WAS BUILT ON TECHNOLOGY. OUR CIVILIZATION IS BUILT ON TECHNOLOGY. TECHNOLOGY IS THE GLORY OF HUMAN AMBITION AND ACHIEVEMENT, THE SPEARHEAD OF PROGRESS, AND THE REALIZATION OF OUR POTENTIAL. FOR HUNDREDS OF YEARS, WE PROPERLY GLORIFIED THIS – UNTIL RECENTLY. WE, AT X ACADEMY, ARE HERE TO REVITALIZE THAT SPIRIT. TO US, THE FUTURE IS A CANVAS OF VAST POSSIBILITY, PAINTED WITH THE BRUSHES OF INNOVATION, CREATIVITY, AND OPTIMISM. WE BELIEVE IN A FUTURE WHERE TECHNOLOGY CONTINUES TO BE THE BACKBONE OF ADVANCEMENT, NOT JUST IN MATERIAL TERMS BUT AS A MEANS TO ELEVATE HUMAN EXPERIENCE AND CONSCIOUSNESS. WE ARE THE FUTURE OPTIMISTS, THE DREAMERS, THE MAKERS, AND THE DOERS. WE STAND READY TO COLLABORATE, TO INNOVATE, AND TO BUILD A BETTER TOMORROW WITH YOU. JOIN US, AS WE EMBARK ON THIS JOURNEY TO IGNITE THE FLAMES OF PROGRESS AND TO CHERISH THE TECHNOLOGY THAT MAKES IT POSSIBLE. IT IS TIME, ONCE AGAIN, TO RAISE THE TECHNOLOGY FLAG. IT IS TIME TO BE TECHNO-OPTIMISTS. WITH X ACADEMY, LET'S BUILD A BRIGHTER FUTURE TOGETHER.