计算机视觉必读论文:从经典到前沿
- 一、前言
- 二、经典论文解读
-
- 2.1 图像分类
-
- 2.1.1 《ImageNet Classification with Deep Convolutional Neural Networks》(AlexNet)
- 2.1.2 《Very Deep Convolutional Networks for Large-Scale Image Recognition》(VGGNet)
- 2.1.3 《Going Deeper with Convolutions》(GoogLeNet)
- 2.2 目标检测
-
- 2.2.1 《Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation》(R-CNN)
- 2.2.2 《Fast R-CNN》
- 2.2.3 《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》
- 2.3 图像分割
-
- 2.3.1 《U-Net: Convolutional Networks for Biomedical Image Segmentation》
- 2.3.2 《Deep Residual Learning for Image Recognition》(ResNet)在分割中的应用
- 三、前沿论文解读
-
- 3.1 Transformer 在计算机视觉中的应用
-
- 3.1.1 《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》(ViT)
- 3.1.2 《Swin Transformer: Hierarchical Vision Transformer using Shifted Windows》
- 3.2 生成式模型
-
- 3.2.1 《Generative Adversarial Nets》(GAN)
- 3.2.2 《DALL·E: Creating Images from Text》
- 3.3 自监督学习
-
- 3.3.1 《SimCLR: A Simple Framework for Contrastive Learning of Visual Representations》
- 四、总结与展望
-
- 4.1 总结
- 4.2 展望
- 联系博主
计算机视觉必读论文:从经典到前沿
,人工智能,计算机视觉,大模型,AI,计算机视觉作为人工智能领域的重要分支,旨在让计算机理解和解释图像或视频中的内容,模拟人类视觉系统的功能。其应用领域极为广泛,涵盖了安防监控、自动驾驶、医疗影像分析、工业检测、智能零售等多个方面。在安防监控中,计算机视觉可实现实时的目标检测与跟踪,识别异常行为,为公共安全提供有力保障;在自动驾驶领域,它帮助车辆感知周围环境,识别道路、行人、其他车辆等物体,实现安全可靠的行驶。随着技术的不断发展,计算机视觉的应用场景还在持续拓展,对社会发展和人们的生活产生着深远影响。
一、前言
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替