图像数据拆分格式
Contents
图像数据拆分格式#
介绍 Coovally 中不同格式的数据集拆分之后的目录结构。下面从VOC、COCO、YOLO等具体格式详细介绍。
VOC格式数据集#
Coovally平台对上传的VOC格式数据集拆分后的目录层级结构如下:
├── Annotations
│ ├── cat_example.xml
│ ├── dog_example.xml
├── ImageSets
│ ├── Main
│ ├── train.txt
│ ├── val.txt
│ ├── test.txt
├── JPEGImages
│ ├── cat_example.jpg
│ ├── dog_example.jpg
拆分目录层级结构
其中:
annotations文件夹下包含所有图片的标签文件(.xml格式),xml文件中的内容如下所示:
<annotation>
<folder>catsvsdogs</folder>
<filename>cat_example.jpg</filename> //标签对应的图像文件名
<path>D:\catsvsdogs\images\cat_example.jpg</path> //图片地址
<source>
<database>Unknown</database>//图像来源(不重要)
</source>
<size> //图像尺寸
<width>2592</width> //长
<height>1944</height> //宽
<depth>3</depth> //通道数
</size>
<segmented>0</segmented> //是否用于分割,默认选0
<object>
<name>cat</name> //第一个对象的类别
<pose>Unspecified</pose>//默认为Unspecified
<truncated>0</truncated>//默认为0
<difficult>0</difficult>//默认为0
<bndbox> //bounding-box位置
<xmin>100</xmin> //bbx左上角x坐标
<ymin>100</ymin> //bbx左上角y坐标
<xmax>200</xmax> //bbx右下角x坐标
<ymax>200</ymax> //bbx右下角y坐标
</bndbox>
</object>
<object>
<name>cat</name> //第二个对象的类别
<pose>Unspecified</pose>//默认为Unspecified
<truncated>0</truncated>//默认为0
<difficult>0</difficult>//默认为0
<bndbox> //bounding-box位置
<xmin>300</xmin> //bbx左上角x坐标
<ymin>300</ymin> //bbx左上角y坐标
<xmax>400</xmax> //bbx右下角x坐标
<ymax>400</ymax> //bbx右下角y坐标
</bndbox>
</object>
</annotation>
JPEGImages文件夹下包含所有图片数据(.jpg、.png等)
ImageSets文件夹下的Main文件夹中,包含拆分后的训练集、验证集、测试集txt文件,txt文件中的内容如下所示:
cat_example1
dog_example1
...
注:拆分后的txt文件中的内容,只包含图片的名称,不包含后缀信息。
COCO格式数据集说明#
Coovally平台对上传的COCO格式数据集拆分后的目录层级结构如下:
├── annotations
│ ├── train.json
│ ├── val.json
│ ├── test.json
├── images
│ ├── train
│ ├── cat_example1.jpg
│ ├── dog_example1.jpg
│ ├── val
│ ├── cat_example2.jpg
│ ├── dog_example2.jpg
│ ├── test
│ ├── cat_example3.jpg
│ ├── dog_example3.jpg
拆分目录层级结构
其中:
annotations文件夹下包含拆分后的训练集、验证集、测试集标签文件(.json格式),json文件中的内容如下所示:
{
"images": [
{
"file_name": "cat_example.jpg",
"height": 1400,
"width": 1600,
"id": 1
},
{
"file_name": "dog_example.jpg",
"height": 1400,
"width": 1600,
"id": 2
}
],
"annotations": [
{
"segmentation": [
[
333.0,
72.0,
426.0,
72.0,
426.0,
159.0,
333.0,
159.0
]
],
"area": 8091.0,
"iscrowd": 0,
"image_id": 1,
"bbox": [
333.0,
72.0,
93.0,
87.0
],
"category_id": 1,
"id": 1,
"ignore": 0
}
]
"categories": [
{
"name": "cat",
"id": 1
},
{
"name": "dog",
"id": 2
}
]
}
images文件夹下包含拆分后的训练集、验证集、测试集文件夹
train、val、test文件夹中包含对应的图片数据(.jpg、.png等)
YOLO数据集格式说明#
Coovally平台对上传的YOLO格式数据集拆分后的目录层级结构如下:
├── images
│ ├── train
│ ├── cat_example1.jpg
│ ├── dog_example1.jpg
│ ├── val
│ ├── cat_example2.jpg
│ ├── dog_example2.jpg
│ ├── test
│ ├── cat_example3.jpg
│ ├── dog_example3.jpg
├── labels
│ ├── train
│ ├── cat_example1.txt
│ ├── dog_example1.txt
│ ├── val
│ ├── cat_example2.txt
│ ├── dog_example2.txt
│ ├── test
│ ├── cat_example3.txt
│ ├── dog_example3.txt
拆分目录层级结构
其中:
images文件夹下包含拆分后的训练集、验证集、测试集子图片文件夹,train、val、test子图片文件夹中包含对应的图片数据(.jpg、.png等)
labels文件夹下包含拆分后的训练集、验证集、测试集子标签文件夹,train、val、test子标签文件夹中包含对应的标签数据(.txt格式),txt文件中的内容如下所示:
0 0.47800000000000004 0.4331550802139037 0.456 0.42780748663101603
YOLO-SEG数据集格式说明#
Coovally平台对上传的YOLO-SEG格式数据集拆分后的目录层级结构如下:
├── images
│ ├── train
│ ├── cat_example1.jpg
│ ├── dog_example1.jpg
│ ├── val
│ ├── cat_example2.jpg
│ ├── dog_example2.jpg
│ ├── test
│ ├── cat_example3.jpg
│ ├── dog_example3.jpg
├── labels
│ ├── train
│ ├── cat_example1.txt
│ ├── dog_example1.txt
│ ├── val
│ ├── cat_example2.txt
│ ├── dog_example2.txt
│ ├── test
│ ├── cat_example3.txt
│ ├── dog_example3.txt
拆分目录层级结构
其中:
images文件夹下包含拆分后的训练集、验证集、测试集子图片文件夹,train、val、test子图片文件夹中包含对应的图片数据(.jpg、.png等)
labels文件夹下包含拆分后的训练集、验证集、测试集子标签文件夹,train、val、test子标签文件夹中包含对应的标签数据(.txt格式),txt文件中的内容如下所示:
0 0.3025 0.3085 0.3286 0.2727 0.3448 0.2502 0.377 0.2133 0.4081 0.1918 0.4407 0.1734 0.4721 0.1617 0.5005 0.1555 0.5301 0.1478 0.5519 0.1484 0.578 0.1489 0.5995 0.154 0.6133 0.1606 0.636 0.1714 0.6509 0.1831 0.664 0.1934 0.677 0.2077 0.6912 0.2217 0.7056 0.2356 0.6893 0.2522 0.6759 0.2696 0.6522 0.3076 0.6428 0.3232 0.6319 0.3412 0.62 0.3578 0.606 0.3796 0.5959 0.3981 0.585 0.4118 0.5767 0.4237 0.5678 0.4345 0.5589 0.4459 0.5493 0.4587 0.5438 0.4724 0.5387 0.4805 0.5328 0.4949 0.5271 0.5001 0.4941 0.4956 0.4818 0.4909 0.4623 0.4847 0.4472 0.4805 0.43 0.4741 0.4099 0.4646 0.3783 0.4563 0.3557 0.4459 0.3398 0.439 0.3199 0.435 0.2991 0.4274 0.2845 0.4232 0.2767 0.4215 0.2799 0.4061 0.2822 0.3931 0.2819 0.3801 0.2815 0.372 0.2815 0.3628 0.2863 0.35 0.29 0.3403 0.2945 0.3334 0.2954 0.3277 0.2994 0.3204
1 0.276 0.4208 0.2856 0.4234 0.2996 0.4277 0.3183 0.4343 0.3385 0.4414 0.3549 0.448 0.3779 0.4573 0.4101 0.4663 0.4303 0.475 0.4485 0.481 0.4621 0.4855 0.4818 0.4911 0.4973 0.4968 0.5277 0.5037 0.5362 0.5205 0.5405 0.5345 0.5438 0.5468 0.5456 0.5577 0.5488 0.566 0.5499 0.5776 0.5522 0.5863 0.5557 0.597 0.5557 0.5989 0.5604 0.6112 0.5616 0.6181 0.5662 0.6306 0.5694 0.641 0.5723 0.6496 0.5753 0.6621 0.5785 0.6706 0.5811 0.6863 0.5857 0.6984 0.5897 0.7137 0.5939 0.7275 0.5975 0.7388 0.6 0.7481 0.6033 0.7602 0.6079 0.777 0.6103 0.7841 0.6115 0.789 0.6131 0.7971 0.6151 0.8078 0.6165 0.8165 0.6177 0.8246 0.6122 0.8279 0.6079 0.8307 0.601 0.8343 0.5984 0.8402 0.5973 0.8409 0.5889 0.8452 0.584 0.8459 0.5781 0.8464 0.5682 0.8485 0.557 0.8532 0.5508 0.8554 0.5364 0.8582 0.53 0.8599 0.5202 0.8615 0.5046 0.8627 0.4968 0.8625 0.4843 0.8625 0.4776 0.8618 0.4723 0.8599 0.4621 0.8584 0.4559 0.8558 0.4492 0.8518 0.439 0.8478 0.4316 0.8442 0.4239 0.84 0.4138 0.834 0.408 0.8317 0.395 0.826 0.3815 0.816 0.3749 0.8108 0.3625 0.7985 0.3549 0.7886 0.3451 0.7753 0.3362 0.7649 0.3282 0.7549 0.324 0.7441 0.3133 0.7265 0.3026 0.71 0.2932 0.6886 0.2881 0.6692 0.2804 0.6557 0.2748 0.6406 0.2691 0.6254 0.2685 0.6178 0.2682 0.6084 0.2657 0.5979 0.2657 0.5913 0.2648 0.5847 0.2645 0.5759 0.2643 0.5686 0.2641 0.561 0.2629 0.5532 0.2623 0.5423 0.2623 0.5312 0.262 0.5219 0.2609 0.5094 0.2629 0.4994 0.2616 0.4895 0.2637 0.4791 0.2673 0.466 0.2717 0.4568 0.2737 0.4483 0.2753 0.439
2 0.6424 0.8108 0.6335 0.8149 0.6286 0.8182 0.6204 0.8232 0.6186 0.8232 0.6165 0.8156 0.6168 0.8075 0.6127 0.7909 0.611 0.7827 0.6088 0.7722 0.6067 0.7616 0.6032 0.7538 0.5991 0.7419 0.5937 0.7258 0.5902 0.7126 0.5872 0.7 0.5856 0.6901 0.5827 0.677 0.5808 0.6661 0.5783 0.6593 0.5751 0.6491 0.5726 0.6394 0.5689 0.6344 0.5662 0.624 0.5646 0.6195 0.5632 0.6129 0.5593 0.601 0.5589 0.5982 0.5575 0.5897 0.5547 0.5816 0.5502 0.5714 0.5485 0.566 0.5456 0.5567 0.5417 0.5444 0.5408 0.535 0.539 0.5238 0.5337 0.5099 0.5291 0.4987 0.549 0.4665 0.5619 0.445 0.5765 0.431 0.5783 0.4227 0.5893 0.4073 0.5948 0.3978 0.6001 0.3893 0.6079 0.3787 0.6113 0.3734 0.6163 0.3656 0.6243 0.3517 0.6367 0.3379 0.6401 0.3287 0.6476 0.315 0.663 0.2979 0.6714 0.2837 0.6809 0.2733 0.6891 0.2614 0.6957 0.2517 0.7035 0.2423 0.7072 0.2399 0.7118 0.246 0.7163 0.2531 0.7227 0.2593 0.7266 0.2652 0.7381 0.2745 0.739 0.2756 0.7515 0.2903 0.7527 0.2941 0.7603 0.3048 0.7644 0.3126 0.7696 0.3247 0.7719 0.3287 0.7772 0.3446 0.7838 0.3635 0.7861 0.3829 0.7898 0.3988 0.7934 0.4144 0.7975 0.4334 0.801 0.4566 0.804 0.4821 0.8031 0.499 0.8035 0.5125 0.8017 0.5385 0.7999 0.5608 0.7964 0.5854 0.7941 0.5939 0.7925 0.6036 0.7907 0.6152 0.7886 0.6204 0.788 0.6259 0.7889 0.6304 0.7866 0.633 0.7852 0.638 0.7829 0.6498 0.7822 0.6519 0.7795 0.6593 0.7776 0.6673 0.7765 0.6711 0.7749 0.6756 0.771 0.6827 0.7676 0.6889 0.7658 0.6957 0.7626 0.7033 0.7559 0.7033 0.7541 0.7152 0.7513 0.7204 0.7472 0.727 0.7452 0.7291 0.7417 0.7339 0.7378 0.7365 0.7326 0.7481 0.7316 0.749 0.7261 0.7568 0.7218 0.7625 0.7207 0.7651 0.7161 0.7701 0.7104 0.7734 0.7001 0.7846 0.6822 0.7985 0.6751 0.8023 0.6671 0.8097 0.6577 0.8127 0.6504 0.8137
ImageNet格式数据集#
Coovally平台对上传的ImageNet格式数据集拆分后的目录层级结构如下:
├── meta
│ ├── train.txt
│ ├── val.txt
│ ├── test.txt
├── train
│ ├── cat
│ │ ├── cat_example_1.jpg
│ │ └── cat_example_2.jpg
│ └── dog
│ ├── dog_example_1.jpg
│ └── dog_example_2.jpg
├── val
│ ├── cat
│ │ ├── cat_example_3.jpg
│ │ └── cat_example_4.jpg
│ └── dog
│ ├── dog_example_3.jpg
│ └── dog_example_4.jpg
├── test
│ ├── cat
│ │ ├── cat_example_5.jpg
│ │ └── cat_example_6.jpg
│ └── dog
│ ├── dog_example_5.jpg
│ └── dog_example_6.jpg
└── meta.json
拆分目录层级结构
其中:
meta文件夹下包含拆分后的训练集、验证集、测试集txt文件,txt文件中的内容如下所示:
cat/cat_example_1.jpg 0
dog/dog_example_1.jpg 1
...
train、val、test文件夹,分别对应训练集、验证集、测试集。每个文件夹下,包含具体的类别子文件夹,及对应的图片数据
meta.json文件格式如下:
{
"img_count": 4,
"label_count": 2,
"label2id": {
"cat": 0,
"dog": 1
},
"id2label": {
"0": "cat",
"1": "dog"
}
}
各个字段的含义:
img_count 图片总数量
label_count 标签类别数量
label2id 标签到id的映射
id2label id到标签的映射
ICDAR数据集格式说明#
Coovally平台当前支持ICDAR2015格式的数据集,平台对上传的ICDAR格式数据集转成COCO格式后进行拆分。拆分后的目录层级结构如下:
├── annotations
│ ├── train.json
│ ├── val.json
│ ├── test.json
├── images
│ ├── train
│ ├── train_IMG_0001.jpg
│ ├── train_IMG_0002.jpg
│ ├── val
│ ├── val_IMG_0001.jpg
│ ├── val_IMG_0002.jpg
│ ├── test
│ ├── test_IMG_0001.jpg
│ ├── test_IMG_0002.jpg
拆分目录层级结构
其中:
annotations文件夹下包含拆分后的训练集、验证集、测试集标签文件(.json格式),json文件中的内容如下所示:
{
"images": [
{
"file_name": "train_IMG_0001.jpg",
"height": 1400,
"width": 1600,
"id": 1
}
],
"annotations": [
{
"segmentation": [
[
333.0,
72.0,
426.0,
72.0,
426.0,
159.0,
333.0,
159.0
]
],
"area": 8091.0,
"iscrowd": 0,
"image_id": 1,
"bbox": [
333.0,
72.0,
93.0,
87.0
],
"category_id": 0,
"id": 1,
"ignore": 0
}
]
"categories": [
{
"name": "text",
"id": 0
}
]
}
images文件夹下包含拆分后的训练集、验证集、测试集文件夹
train、val、test文件夹中包含对应的图片数据(.jpg、.png等)
OCRDataset数据集格式说明#
Coovally平台对上传的OCRDataset格式数据集拆分后的目录层级结构如下:
├── annotations
│ ├── train.txt
│ ├── val.txt
│ ├── test.txt
├── images
│ ├── train
│ ├── train_word_1.png
│ ├── train_word_2.png
│ ├── val
│ ├── val_word_1.png
│ ├── val_word_2.png
│ ├── test
│ ├── test_word_1.png
│ ├── test_word_2.png
拆分目录层级结构
其中:
annotations文件夹下包含拆分后的训练集、验证集、测试集标签文件(.txt格式),txt文件中的内容如下所示:
train_word_1.png Genaxis
train_word_2.png [06]
...
images文件夹下包含拆分后的训练集、验证集、测试集文件夹
train、val、test文件夹中包含对应的图片数据(.jpg、.png等)
DOTA数据集格式说明#
Coovally平台对上传的DOTA格式数据集拆分后的目录层级结构如下:
├── images
│ ├── train
│ ├── cat_example1.jpg
│ ├── dog_example1.jpg
│ ├── val
│ ├── cat_example2.jpg
│ ├── dog_example2.jpg
│ ├── test
│ ├── cat_example3.jpg
│ ├── dog_example3.jpg
├── labels
│ ├── train
│ ├── cat_example1.txt
│ ├── dog_example1.txt
│ ├── val
│ ├── cat_example2.txt
│ ├── dog_example2.txt
│ ├── test
│ ├── cat_example3.txt
│ ├── dog_example3.txt
拆分目录层级结构
其中:
images文件夹下包含拆分后的训练集、验证集、测试集子图片文件夹,train、val、test子图片文件夹中包含对应的图片数据(.jpg、.png等)
labels文件夹下包含拆分后的训练集、验证集、测试集子标签文件夹,train、val、test子标签文件夹中包含对应的标签数据(.txt格式),txt文件中的内容如下所示:
x1, y1, x2, y2, x3, y3, x4, y4, category, 1
x1, y1, x2, y2, x3, y3, x4, y4, category, 0
...