中文搜索引擎指南网
标题:
MS COCO - 大规模计算机视觉数据集
[打印本页]
作者:
sowang
时间:
昨天 20:46
标题:
MS COCO - 大规模计算机视觉数据集
MS COCO 数据集
MS COCO(Microsoft Common Objects in Context)是由微软于2014年发布并维护的大规模计算机视觉数据集。与 ImageNet 侧重“识别是什么”不同,COCO 更强调“在复杂日常场景中的上下文理解”。
官网地址:
官方网站:
https://cocodataset.org/
核心特色:
复杂场景与多目标:包含超过33万张图像和150万个目标实例,平均每张图像包含约7.2个目标,场景复杂且目标密集。
精细的像素级标注:不仅提供边界框,还提供每个对象实例的像素级分割掩码(Segmentation Mask)。
多任务支持:除了目标检测,还支持实例分割、全景分割、图像字幕生成(每张图5段自然语言描述)、人体关键点检测(25万人)等。
类别体系:包含80个常见目标类别(Things,如人、车、动物)和91个背景/材料类别(Stuff,如天空、草地、道路)。
适用场景:
目标检测(Object Detection):目前工业界和学术界最权威的目标检测基准。
实例分割与全景分割(Instance/Panoptic Segmentation):用于精确抠图和场景理解。
人体姿态估计(Keypoint Detection):识别人的关节和骨骼关键点。
图像描述生成(Image Captioning):训练 AI 理解图像内容并生成自然语言描述。
欢迎光临 中文搜索引擎指南网 (http://www.sowang.com/bbs/)
Powered by Discuz! X3.2