voc数据集格式转化为coco voc格式的数据集



文章插图
voc数据集格式转化为coco voc格式的数据集

文章插图
近日,在国际顶级的计算机视觉竞赛 Pattern Analysis, Statistical Modeling and Computational Learning(PASCAL VOC)挑战赛目标检测 comp4 赛道上,创新奇智 (AInnovation) 研发的 AInnoDetection 目标检测算法在 20 项的评测指标中,取得 10 项指标排名第一的成绩,超越众多国内外知名人工智能企业和高校人工智能实验室,夺得大赛冠军 。
PASCAL VOC 挑战赛是视觉对象的分类识别和检测的基准测试比赛 。该赛事是世界最权威的三大计算机视觉挑战赛之一,数据集标注质量高、场景复杂、目标多样、检测难度大、数据量小但是场景丰富,相比
ImageNet
等更加考验人工智能算法的设计和创新能力 。如今,PASCAL VOC 挑战赛和其所使用的数据集已经成为目标检测领域普遍接受的标准,一年一度的挑战赛成为了国内外团队角逐实力的赛场 。今年有全球近百支专业队伍参加挑战赛 。参赛团队包括 Google、Microsoft、CMU、清华大学、阿里巴巴、腾讯、搜狗、Yi+、平安科技等国内外知名图像领域的顶尖队伍 。
目标检测
是图像领域三大基本任务之一 。任务要求算法在给定图像中精确定位物体的位置,并标注出被定位物体的类别 。因此,算法首先需要确定图像中物体位置,然后对已定位的物体进行分类 。
目标检测的难点在于,图像中的目标大小、位置、姿态等不确定,同一图像中可能有多个目标 。这些问题给算法准确检测目标带来了挑战 。
在 Pascal VOC 的数据集中,算法识别难度更高 。首先,图像中的目标分属数十个类别,包括人类、动物、交通工具、室内物体等,目标种类数量较多 。其次,数据集较小,模型难以通过大量数据训练提升表现 。此外,图像包含多个室内外场景,单个图像中的内容多变,目标数量和种类丰富,这对算法在多种场景下准确检测多个目标提出了更高要求 。