系列解读:深度时空视觉表征学习方法及应用

百家 作者:机器之心 2022-12-19 16:06:22

机器之心知识站与国际顶尖实验室及研究团队合作,将陆续推出系统展现实验室成果的系列技术直播,作为深入国际顶尖团队及其前沿工作的又一个入口。赶紧点击「阅读原文」关注起来吧!

视觉表征学习是人工智能领域的一个重要分支,它也是大部分计算机视觉与多媒体任务的基石。近几年受自然语言处理领域 Transformer 结构的启发,视觉表征学习的网络架构也从传统卷积神经网络(CNN)演变到 Vision Transformer 的设计范式。此外,得益于无监督、自监督机器学习的技术发展,视觉表征学习的训练模式逐渐摆脱了对大量人工标注数据的严重依赖,涌现出一系列高性能的自监督视觉表征学习技术。因此本次分享将由京东科技视觉技术创新团队的四位研究员分别介绍深度时空视觉表征学习(图像、视频及 3D 视觉)在网络架构和自监督训练模式这两个维度上的一系列技术创新,例如针对图像和视频表征学习的高性能 Transformer 结构(CoTNet、Wave-ViT、Dual-ViT、SIFA、DTF)。


12 月 20 日,来自京东科技视觉技术创新团队的 4 位嘉宾将带来线上分享,详情如下:


12 月 20 日 19:00-21:00

主题一:图像表征学习方法及应用
分享嘉宾:潘滢炜,京东科技视觉技术创新团队资深研究员,谷歌学术引用率 5000 余次,曾获微软学者奖学金、ACM SIGMM China 最佳博士论文奖和新星奖、ACM Multimedia 最佳演示系统奖和最佳开源项目奖。

主题二:自监督表征学习方法及应用
分享嘉宾:亚龙,京东科技视觉技术创新团队资深研究员。在人工智能、计算机视觉领域国际会议如 CVPR, ICCV, ICLR, AAAI 等发表论文 20 余篇,并获得 ACM MM 图像检索、CVPR 细粒度图像识别等多项竞赛冠军。

主题三:视频表征学习方法及应用
分享嘉宾:邱钊凡,京东科技视觉技术创新团队研究员,主要研究兴趣是视频内容理解、多媒体数据分析和多媒体内容检索等方向,在相关领域国际会议上发表论文 20 余篇,谷歌学术引用率三千余次,曾获微软学者奖学金、ACM SIGMM China 最佳博士论文奖。

主题四:3D视觉表征学习方法及应用
分享嘉宾:蔡琪,京东科技视觉技术创新团队研究员,在 CVPR、NeurIPS、TIP 等会议期刊发表多篇无监督学习、目标检测相关论文,曾获得 VisDA 跨域目标检测、SAPIEN ManiSkill 2021 机械臂比赛等多项竞赛冠军,相关研究工作在物流场景中落地应用。

加群看直播
直播间关注机器之心机动组视频号,北京时间 12 月 20 日 19:00 开播。
交流群:本次直播设有 QA 环节,欢迎加入本次直播交流群探讨交流。

如群已超出人数限制,请添加机器之心小助手:syncedai2、syncedai3、syncedai4 或 syncedai5,备注「视觉表征」即可加入。
如果你也有最新工作希望分享或提交你感兴趣的内容方向,随时告诉我们吧:https://jiqizhixin.mikecrm.com/fFruVd3
机器之心 · 机动组
机动组是机器之心发起的人工智能技术社区,聚焦于学术研究与技术实践主题内容,为社区用户带来技术线上公开课、学术分享、技术实践、走近顶尖实验室等系列内容。机动组也将不定期举办线下学术交流会与组织人才服务、产业技术对接等活动,欢迎所有 AI 领域技术从业者加入。

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接