๋ณธ ํ๋ก์ ํธ๋ ํ๋ ์ฌํ์ ์ฐ๋ ๊ธฐ ์ฒ๋ฆฌ ๋ฌธ์ ์ ํ๊ฒฝ ์๊ธฐ์ ๋์ํ๊ธฐ ์ํด 2์ฐจ์ ์ด๋ฏธ์ง ๊ธฐ๋ฐ์ ์ฐ๋ ๊ธฐ ๋ถ๋ฅ ๋ชจ๋ธ์ ๊ฐ๋ฐ์ ๋ชฉํ๋ก ํจ. EDA๋ฅผ ํตํด ๋ฐ์ดํฐ ํ์ง ๋ฐ ํด๋์ค ๊ฐ ๋ถ๊ท ํ ๋ฌธ์ ๋ฅผ ํ์ ํจ. ์ด๋ฅผ ํด๊ฒฐํ๊ณ ์ ์ ๋ต์ ํ์ต ๋ฐ์ดํฐ ๋ถ๋ฅ, ๋ฐ์ดํฐ ์ ์ , ๋ฐ์ดํฐ ์ฆ๊ฐ, ์ดํด์๋, ๋๋ธ๋ฌ๋ง, ํด๋์ค ์ฌ๋ถ๋ฅ, ๋ค์ํ ๋ชจ๋ธ ํ์ต ๋ฐ ์์๋ธ ๋ฑ์ ์ ๋ต ์๋ฆฝ ํ ๊ฐ ์คํ์ ํ์์ ์ผ๋ก ์ํ ํ ๊ฐ ์ ๋ต์ ๋ํ ๊ฒฐ๊ณผ๋ฅผ ๋น๊ต ๋ถ์ํจ. ์ด ์ค ๊ฐ์ฅ ์ ์๋ฏธํ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ๋ต์ ์ต์ข ์ ์ผ๋ก ์ ์ฉํ์ฌ ์ต์ข 2์์ ์ฑ์ ์ ๊ฑฐ๋ .
- Images & Size : (Train), 4871 (Test), (1024, 1024)
- classes : General trash, Paper, Paper pack, Metal, Glass, Plastic, Styrofoam, Plastic bag, Battery, Clothing
๊น๋ฏผ์ค |
๊น์ฑ์ |
๋ฐฐ์ข ์ฑ |
๋ฐ์ฐฌ์ข |
์กฐ๋ช ํ |
์ต์ํ |
Name | Roles |
---|---|
Common | EDA, Data Relabeling, SGK-Fold, ๋ชจ๋ธ ํ์ต, ์์ด๋์ด ๊ฒ์ฆ |
๊น๋ฏผ์ค | MMDetection ๋ชจ๋ธ baseline ์์ฑ, ๋ชจ๋ธ ์คํ ๋ฐ ํ๊ฐ |
๊น์ฑ์ | Deblurring, Super Resolution |
๋ฐฐ์ข ์ฑ | ํ๋ก์ ํธ ๊ธฐํ, General class reclassifcation, Super Resolution |
๋ฐ์ฐฌ์ข | Framework ๋ณ Baseline ์์ฑ, RandAugment ์คํ, ๋ชจ๋ธ ์คํ ๋ฐ ํ๊ฐ |
์กฐ๋ช ํ | wandb ์ธํ , General trash class reclassification |
์ต์ํ | MMDetection ๋ชจ๋ธ ์คํ, Augmentation ์คํ, Ensemble ์คํ |
- Language: Python 3.10
- Hardwares: Intel(R) Xeon(R) Gold 5120, Tesla V100-SXM2 32GB ร 6
- Framework: Pytorch, Detectron2 v0.6, Ultralytics v8.1, MMDetection v3.3.0
- Cowork Tools: Github, Weight and Bias, Notion, Discord, Zoom, Google calendar
- Labeling Tool: Supervisely
- ์ ์ฒด ๋ฐ์ดํฐ์์ Paper, Plastic bag, General trash๊ฐ ๋์ ๋น์จ์ ์ฐจ์งํ๊ณ ์์ผ๋ฉฐ ๋ฐ์ดํฐ์ ๋ถํฌ๊ฐ ๋ถ๊ท ํ์ ์ด๋ฃธ
- ๊ฐ ํด๋์ค ๋ณ ๊ฐ์ฒด์ ํฌ๊ธฐ ๋ถํฌ๋ ์์ ์์ผ๋ก ํฐ ๊ฐ์ฒด๋ก ๊ฐ ์๋ก ์ค์ด๋ฆ
- ์ด๋ฏธ์ง ์์ ๊ฐ์ฒด๋ค์ด ์ด๋ฏธ์ง์ ์ค์ฌ๋ถ์ ์ฃผ๋ก ์์นํ๊ณ ์์
- ๋ฐ์ดํฐ ์๊ฐํ๋ฅผ ํตํด ๋ค์์ ๋ ์ด๋ธ ์ค๋ฅ๊ฐ ๋ฐ๊ฒฌ๋์ด Supervisely๋ฅผ ํ์ฉํด ๋ฐ์ดํฐ ๋ ์ด๋ธ ์์ ํ ์คํ ์งํ
- ์คํ ๊ฒฐ๊ณผ ์์ ํ ๋ฐ์ดํฐ์ ์ด ๊ธฐ์กด์ ๋ฐ์ดํฐ์ ๋ณด๋ค ๋ฎ์ ์ฑ๋ฅ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์
- ์ด๋ Test dataset๊ณผ train dataset ๋ชจ๋ ์ ์ฌํ ์ค๋ฅ ๊ฒฝํฅ์ฑ์ ๊ฐ์ง๋ ๊ฒ์ผ๋ก ์ถ์ ๋์ด ์์ ํ์ง ์์ Original dataset์ผ๋ก ์ดํ ์คํ์ ์งํ
Dataset | Model | Backbone | mAP_50(Val) | mAP_50(Test) |
---|---|---|---|---|
Original | Dino | Swin-l | 0.716 | 0.6938 |
Relabeled | Dino | Swin-l | 0.582 | 0.6488 |
- EDA๋ฅผ ํตํด General Trash ํด๋์ค ์ด๋ฏธ์ง๋ค์ด ๋ค์ํ ๊ฐ์ฒด๋ก ์ด๋ฃจ์ด์ ธ ์์์ ๋ฐ๊ฒฌ
- General Trash ํด๋์ค๋ฅผ 10๊ฐ์ ํด๋์ค๋ก ์ถ๊ฐ ๋ถ๋ฅํ์ฌ ์ด20๊ฐ์ ํด๋์ค๋ก ์ด๋ฃจ์ด์ง Class-20 ๋ฐ์ดํฐ์ ์ผ๋ก ์ฌ๊ตฌ์ฑํจ
- Class-20์ General trash ํด๋์ค ์ค ๋์ mAP๋ฅผ ๋ณด์ธ 3๊ฐ์ ํด๋์ค๋ฅผ ์ ์ ํด 12๊ฐ์ ํด๋์ค๋ก ์ด๋ฃจ์ด์ง Class-12, 13๊ฐ์ ํด๋์ค๋ก ์ด๋ฃจ์ด์ง Class-13 ๋ฐ์ดํฐ์ ์ผ๋ก ์ฌ๊ตฌ์ฑํจ
- ์คํ ๊ฒฐ๊ณผ ํด๋์ค๋ฅผ ์ถ๊ฐํ์ฌ ๊ฒ์ถํ ๊ฒฝ์ฐ๋ณด๋ค ๊ธฐ์กด์ Original ์ฑ๋ฅ๊ณผ ๋น์ทํ๊ฑฐ๋ ๋ฎ์
- ์ด๋ General class์ ๋ค์ํ ์ข ๋ฅ์ ๊ฐ์ฒด๋ค์ด ์์์๋ ๋ถ๊ตฌํ๊ณ ๋ชจ๋ธ์ด ์ถฉ๋ถํ ํ์ต ๋ฐ ์ถ๋ก ์ด ๊ฐ๋ฅํ ๊ฒ์ผ๋ก ํ๋จ
Dataset | Model | Backbone | Epochs | mAP_50(Test) |
---|---|---|---|---|
Original | Dino | Swin-l | 23 | 0.717 |
Class-20 | Dino | Swin-l | 23 | 0.679 |
Class-12 | Dino | Swin-l | 23 | 0.673 |
Class-13 | Dino | Swin-l | 23 | 0.711 |
- EDA๋ฅผ ํตํด Train ๋ฐ Test dataset์ blur image ๋ค์ ๋ฐ๊ฒฌํจ
- ์ด๋ฅผ ๋ถ๋ฅ ํ ๊ฒฐ๊ณผ Train 21.89% Test 22.02% blurred image ์กด์ฌํจ
- ์ด๋ค์ deblurr๋ฅผ ํตํด ๋ณด์ ํ ํ์ต์ ์ฌ์ฉํ์์ผ๋ ์ ์๋ฏธํ ์ฑ๋ฅ ํฅ์ ์์
Dataset | Model | Backbone | mAP_50(Val) | mAP_50(Test) |
---|---|---|---|---|
Original | Dino | Swin-l | 0.716 | 0.6938 |
Deblurred | Dino | Swin-l | 0.704 | 0.6825 |
- EDA๋ฅผ ํตํด ์๊ณ ํ๋ฆฟํ ์ด๋ฏธ์ง๋ค์ ๋ค์ ๋ฐ๊ฒฌํจ
- Enhanced Deep Residual Networks for Single Image Super-Resolution์ ์ ์๋ SR ๊ธฐ๋ฒ์ ์ ์ฉํ์ฌ 2๋ฐฐ ํด์๋์ ์ด๋ฏธ์ง๋ก ๋ณํํจ
- ํด๋น ์ด๋ฏธ์ง๋ฅผ Center-crop ๋๋ Multi-crop ์ํํ ๋ค ์ด๋ฅผ ๊ธฐ์กด ๋ฐ์ดํฐ์ ๊ณผ ํฉ๊ป ํ์ต ๋ฐ์ดํฐ๋ก ํ์ฉํจ
- ์คํ ๊ฒฐ๊ณผ 1๊ฐ์ ์ด๋ฏธ์ง๋ง ์ถ๊ฐ๋ก ์ฌ์ฉํ๋ Center-crop์ ๋นํด 4๋ฐฐ์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ Multi-crop ๋ฐฉ์์์ ๋์ ์ฑ๋ฅ ๊ฐ์ ์ ํ์ธํ ์ ์์
Dataset | Model | Backbone | Epoch | mAP_50(Val) | mAP_50(Test) |
---|---|---|---|---|---|
Original | DINO | Swin-l | 20 | 0.731 | 0.7172 |
Original+SR(Center-Crop) | DINO | Swin-l | 25 | 0.802 | 0.721 |
Original+SR(Multi-Crop) | DINO | Swin-l | 25 | 0.817 | 0.7398 |
- ๊ฐ์ฒด๋ค์ ํฌ๊ธฐ ๋ฐ ์์น๋ฅผ ๊ณ ๋ คํ์ ๋ RandomResize, RandomCrop, RandomAugment ๋ฐฉ๋ฒ์ ์ ์ฉํ์ ๋ ์ฑ๋ฅ ๊ฐ์ ์ ๊ธฐ๋ํจ
- ํ์ต์ ๋ชจ๋ธ์ ์ผ๋ฐํ๋ฅผ ๋์ด๊ธฐ ์ํ ๋ฐฉ๋ฒ์ผ๋ก ๋ค์ํ ์ฆ๊ฐ ๊ธฐ๋ฒ์ ์ ์ฉํ ๋ค, ์ฌ๋ฌ ํ๊ฐ ์งํ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ฆ๊ฐ ๊ธฐ๋ฒ์ ์ ์ ํจ
- ๊ธฐํํ์ ๋ณํ์ ์ ์ฉํ ๊ฒฝ์ฐ IoU ์๊ณ๊ฐ์ ๋ฐ๋ผ mAP๊ฐ ํฌ๊ฒ ๋ฌ๋ผ์ง๋ ๊ฒฝํฅ์ ๋ณด์ฌ์ค
- ์์ ๋ณํ์ ๋ํ RandAugment ๊ธฐ๋ฒ์ ์ ์ฉํ ๊ฒฐ๊ณผ ๊ฐ๊ฑดํ๊ณ ๋์ ์ฑ๋ฅ ํฅ์์ ๋ณด์ฌ์ค
Augmentation | Info | mAP_50(Val) |
---|---|---|
None | - | 0.554 |
RandomCrop | RandomCrop | 0.565 |
RandomCenterCropPad | CenterCrop + pad | 0.568 |
RandomAffine | Geometric transformation | 0.561 |
PhotoMetricDistortion | Color Jitter | 0.564 |
RandAugment | Color transformation | 0.571 |
- 1-stage, 2-stage ๋ชจ๋ธ๋ถํฐ ๋ ๊ฑฐ์ ๋ฐ ์ต์ ๋ชจ๋ธ์ ํ์ฉํจ
- YOLO ๋ฑ์ 1-stage ๋ชจ๋ธ์ ๊ฒฝ์ฐ ๋ฎ์ ๊ฐ์ฒด ๊ฒ์ถ ์ฑ๋ฅ์ ๋ณด์
- ์ต๊ทผ ์ฐ๊ตฌ๋ก ์ ์๋ DINO, Co-Detr๊ณผ ๊ฐ์ ๋ชจ๋ธ๋ค์ ํ์ต ๋ฐ ํ๊ฐํจ
Frameworks : Detectron2 v0.6, Ultralytics v8.1, mmDetection v3.3.0
- Confusion Matrix๋ก ๋ชจ๋ธ๋ณ ํน์ง์ ํ์ ํ์ฌ ๋ชจ๋ธ ์กฐํฉ์ ํ๋จํจ
- WBF (Weighted Box Fusion) ๊ธฐ๋ฒ ์ ์ฉ ํ์์ผ๋ ์ ์๋ฏธํ ์ฑ๋ฅ ํฅ์ ์์
- ๋จ์ผ ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์์๋ธ ๊ธฐ๋ฒ๋ณด๋ค ๋์
Models | Average mAP_50(Val) | Ensemble mAP_50(Test) |
---|---|---|
YOLO + Cascade (R50 + ConvNeXt) | 0.5123 | 0.6061 |
DINO + DDQ + Co-detr | 0.6761 | 0.5911 |