๋ผ๋ ์ฐ๋ฆฌ ๋ชธ์ ๊ตฌ์กฐ์ ๊ธฐ๋ฅ์ ์ค์ํ ์ํฅ์ ๋ฏธ์น๊ธฐ ๋๋ฌธ์, ์ ํํ ๋ผ ๋ถํ ์ ์๋ฃ ์ง๋จ ๋ฐ ์น๋ฃ ๊ณํ์ ๊ฐ๋ฐํ๋ ๋ฐ ํ์์ ์ด๋ค. Bone Segmentation์ ์ธ๊ณต์ง๋ฅ ๋ถ์ผ์์ ์ค์ํ ์์ฉ ๋ถ์ผ ์ค ํ๋๋ก, ํนํ, ๋ฅ๋ฌ๋ ๊ธฐ์ ์ ์ด์ฉํ ๋ผ Segmentation์ ๋ง์ ์ฐ๊ตฌ๊ฐ ์ด๋ฃจ์ด์ง๊ณ ์์ผ๋ฉฐ, ๋ค์ํ ๋ชฉ์ ์ผ๋ก ๋์์ ์ค ์ ์๋ค.
- ์ง๋ณ ์ง๋จ : ์ ๋ผ ๋ณํ, ๊ณจ์ ๋ฑ ์ด์ ํ์ง
- ์์ ๊ณํ : ๋ผ ๊ตฌ์กฐ ๋ถ์์ ํตํ ์์ ๋ฐฉ์ ๊ฒฐ์
- ์๋ฃ ์ฅ๋น ์ ์ : ์ธ๊ณต ๊ด์ , ์ํ๋ํธ ๋ฑ์ ๋ง์ถค ์ ์
- ์๋ฃ ๊ต์ก : ๋ผ ๊ตฌ์กฐ ํ์ต ๋ฐ ์์ ์๋ฎฌ๋ ์ด์
๊น๋ํ |
๋ฐ์ค์ค |
๊นํ์ง |
์ค์์ |
์ ์ง์ค |
- ๊ตฌ์ฑ : ์ด 2048x2048 ํด์๋์ X-ray ์ด๋ฏธ์ง๋ก ๊ตฌ์ฑ๋ ๋ฐ์ดํฐ์ , ์์ ๋ชจ๋ ํฌํจ
- ํด๋์ค : 29๊ฐ์ ์ ๋ผ ๋ ์ด๋ธ ํฌํจ
- ๊ตฌ์กฐ : ๋ชจ๋ ๋ฐ์ดํฐ๊ฐ ์ข์ฐ ์์ผ๋ก ์์ ์ด๋ฃธ
- ID363 ๋ฐ์ดํฐ๋ ์ ์ธ์๋ฆฌ(๋ฐ์ง)๋ฅผ ์ฐฉ์ฉํ๊ณ ์์
- ์ผ๋ถ ๋ฐ์ดํฐ(ID274~321)๋ ์ผ๋ฐ์ ์ธ ์ ์์ธ์ ๋ค๋ฅธ ํฌ์ฆ๋ฅผ ์ทจํ ๋ฐ์ดํฐ
- ์๋ฑ ๋ผ(Trapezoid, Pisiform ๋ฑ) ๊ฐ ๊ฒน์นจ์ด ๋ฐ์ํ๋ฉฐ, ํด๋น ํด๋์ค์ ์ ํ๋๊ฐ ๋ค๋ฅธ ํด๋์ค๋ณด๋ค ๋ฎ์(Val acc 0.90)
- ์๊ฐ๋ฝ ๋ ๋ถ๋ถ (f1, f4, f8, ,f12, f16) ์ฑ๋ฅ์ด ๋ฎ์ (Val acc 0.95)
- ์์ด ํ์ด์ง ๋ฐ์ดํฐ๋ฅผ ๋์ํ๊ธฐ ์ํด Rotate ์ฆ๊ฐ (limit=15,30) ์ผ๋ก ์ ์ฉ
- ์๋ฑ ๋ถ๋ถ์ Cropํ์ฌ ๋ชจ๋ธ์ด ํด๋น ์์ญ์ ์ง์ค์ ์ผ๋ก ํ์ตํ ์ ์๋๋ก ๋ฐ์ดํฐ ์ ์ฒ๋ฆฌ ๋ฐ ํ์ต ๊ณผ์ ์ค๊ณ
- ํด๋์ค ๊ฐ ๊ฒฝ๊ณ ๊ฐ์ ์ ์ํด ElasticTransform ์ถ๊ฐ ์ฆ๊ฐ ์ ์ฉ
- ์๊ณ ๊ฒน์น๋ ํด๋์ค์ ์ฑ๋ฅ ํฅ์์ ์ํด ์ด๋ฏธ์ง ํฌ๊ธฐ๋ฅผ 512์์ 1024, 2048๋ก ์ ์ง์ ์ผ๋ก ํ๋ํ๋ฉฐ ํ์ต์ ์งํ
๋ชจ๋ธ | Image size | Epoch | Time | Score |
---|---|---|---|---|
Unet | 512 | 100 | 3.5 h | 93.72 % |
Unet++ | 512 | 100 | 4.3 h | 95.01 % |
์์ 2๊ฐ ๋ชจ๋ธ ๊ฐ ์ฑ๋ฅ ์ฐจ์ด๋ ์ฝ 0.2%๋ก ์ฐจ์ด๊ฐ ์์์ผ๋ฉฐ, ํ์ต ์๊ฐ ์ญ์ ์ฝ 40๋ถ ์ฐจ์ด์ ๋ถ๊ณผํ์ฌ Base ๋ชจ๋ธ๋ก UNet++์ ์ ์ ํ๊ณ ๋ค์ํ ์คํ์ ์งํํ๋ค. ๋ฐ๋ฉด, ๋ค๋ฅธ ๋ชจ๋ธ(Segformer, Convnext, DeepLab3v+)๋ค์ ํ์ต ์๊ฐ์ด 6~7์๊ฐ ์ ๋ ์์๋์ด Base ๋ชจ๋ธ์์ ์ ์ธํ์๋ค.
Base UNet++ ๋ชจ๋ธ์ ๊ธฐ์ค์ผ๋ก Augmentation ๊ธฐ๋ฒ์ ํ๋์ฉ ๋ณ๊ฒฝํ๋ฉฐ ๋จ๊ณ์ ์ผ๋ก ์คํ
Augmentation | Condition | Epoch | Score | Result |
---|---|---|---|---|
Base | Base | 100 | 95.08 % | Base |
HorizontalFlip | p=0.5 | 100 | 95.33 % | 0.25 % ์์น |
GaussianBlur | blur_limit=(3, 7), sigma_limit=(0.1, 2), p=0.5 | 100 | 95.61 % | 0.32 % ์์น |
ElasticTransform | alpha=1, sigma=50, p=0.5 | 100 | 95.43 % | 0.35 % ์์น |
GridDistortion | ratio=0.4, random_offset=False, holes_number_x=12, holes_number_y=12, p=0.2 | 100 | 95.42 % | 0.34 % ์์น |
Rotate | limit=30, p=0.3 | 100 | 95.28 % | 0.20 % ์์น |
CLAHE | clip_limit=(1, 4), tile_grid_size=(8, 8), p=0.5 | 100 | 95.33 % | 0.25 % ์์น |
RandomBrightnessContrast | brightness_limit=(0.0, 0.3), contrast_limit=0.3, p=0.5 | 100 | 95.10 % | 0.02 % ์์น |
GridDropout | distort_limit=0.2, p=0.4 | 100 | 95.10 % | 0.02 % ์์น |
์ต์ข ์ ์ผ๋ก ์ฑ๋ฅ์ด ์์นํ Augmentation ๊ธฐ๋ฒ์ ์ฑํํ ๋ค, ์ถ๊ฐ์ ์ธ ์คํ์ ์ด์ด๊ฐ๋ค.
EDA ๊ณผ์ ์์ ๋ฐ๊ฒฌ๋ ๋ฌธ์ ์ ์ธ ์๋ฑ ๋ผ ์์ญ์ ์ฑ๋ฅ ์ ํ๋ฅผ ๊ฐ์ ํ๊ธฐ ์ํด CenterCrop, RandomCrop, RandomResizedCrop ๋ฑ์ Crop ๊ธฐ๋ฐ ๊ธฐ๋ฒ์ ์ฌ์ฉํ์ฌ ํ์ต์ ์๋ํ๋ค. ๊ทธ๋ฌ๋, ์ด๋ฌํ ๋ฐฉ์์ ์คํ๋ ค ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์๋ค.
์ด์ ๋ฐ๋ผ, ์๋ก์ด ์ ๊ทผ์ผ๋ก Sliding Window์ Image Crop์ ์ ์ฉํ์ฌ ํ์ต์ ์งํํ๋ค. Sliding Window๋ ์ด๋ฏธ์ง๋ฅผ ํ์ผ๋ก ๋ถํ ํด ํ์ตํ๊ณ , Image Crop์ ์๋ฑ ์ค์ฌ์ผ๋ก ํน์ ์์ญ์ ์๋ผ ํ์ต์ ์ง์คํ๋๋ก ํ์ฌ ์ฑ๋ฅ ํฅ์์ ๋๋ชจํ๋ค.
๊ธฐ์กด์ Crop ๊ธฐ๋ฐ Augmentation์ ์ฑ๋ฅ์ด ์ ํ๋๋ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์๊ณ , ์๋ฑ ๋ผ์ ์ ํ๋ ํฅ์์ ๋ชฉํ๋ก ์๋ก์ด ๋ฐฉ์์ Crop ๊ธฐ๋ฒ์ ๋์ ํ์ฌ ์คํ์ ์งํํ๋ค.
Sliding Window
- Datasets์ ๋ง๋ค ๋, ์ด๋ฏธ์ง๋ฅผ ๋ถ๋ฌ์ Tile(512x512, Stride 256)์ ์์ฑ
- ์ด ์ค ํ์ตํ ์ ์๋ ๋ถ๋ถ์ด 10% ๋ฏธ๋ง์ผ ๊ฒฝ์ฐ ์ ์ธ
- ๋ฉ๋ชจ๋ฆฌ ํ๊ณ(OOM) ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ด๋ฏธ์ง๋ฅผ 3๊ฐ์ ํํธ๋ก ๋ถํ ํ์ฌ ํ์ต
- Inference ๋จ๊ณ์์ธ๋ ๋์ผํ๊ฒ ์ด๋ฏธ์ง๋ฅผ Tileํ ํ์ฌ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ์ถ๋ ฅ
๊ฒฐ๊ณผ
Model | result |
---|---|
BaseModel | 94.09 % |
SlidingWindow | 86.16 % |
์ฑ๋ฅ์ด ํฌ๊ฒ ๋จ์ด์ง ์์ธ์ผ๋ก๋ ์ด๋ฏธ์ง ๊ฐ ์ฐจ์ด๊ฐ ํฐ ๋ฐ์ดํฐ ํน์ฑ, ์ถฉ๋ถํ Epoch ํ์ต ๋ถ์กฑ, ๊ทธ๋ฆฌ๊ณ ์ด๋ฏธ์ง๋ฅผ 3ํํธ๋ก ๋๋์ด ํ์ตํ ๋ฐฉ์์ ํ๊ณ๊ฐ ์ฃผ์ ์์ธ์ผ๋ก ๋ถ์๋๋ค.
Image Crop ํ์ต ํ ๊ฒฐ๊ณผ ์ ์ฉ
- ์๋ฑ ๋ผ์ ์์น๋ฅผ ์ ํํ ์๋ณํ์ฌ ํด๋น ์์ญ์ ์ขํ๋ฅผ ๊ตฌํจ
- ์๋ฑ ๋ผ๊ฐ ํฌํจ๋ ๋ฒ์๋ฅผ ๊ธฐ์ค์ผ๋ก Train ์ด๋ฏธ์ง๋ฅผ 512x512 ํฌ๊ธฐ๋ก ์๋ผ ํ์ต ๋ฐ์ดํฐ ์์ฑ
- ์๋ฑ ๋ผ ์์ญ๋ง์ ์ง์ค์ ์ผ๋ก ํ์ตํ์ฌ ์ฑ๋ฅ ํฅ์ ๋๋ชจ
- Pseudo Labeling ๊ฒฐ๊ณผ๋ฅผ ํ์ฉํ์ฌ Test ์ด๋ฏธ์ง์์๋ ์๋ฑ ์์ญ๋ง ๋์ค๋๋ก 512x512 ํฌ๊ธฐ๋ก Crop
- Inference๋ฅผ ํ ํ ํ์ต๋ ์๋ฑ ๋ผ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ธฐ์กด ๋ชจ๋ธ์ ์๋ฑ ๋ผ ์์ธก ๊ฒฐ๊ณผ๋ฅผ ๋์ฒด
์ ์ฉ ๋ชจ๋ธ UNet++, SegFormer B4, ConvNext XL์ Augmentation์ ๊ฒฐํฉํ์ฌ ์ต์ข ํ์ต ๋ฐ ํ๊ฐ๋ฅผ ์งํ.
๊ฒฐ๊ณผ
Model | result |
---|---|
BaseModel | 97.45 % |
Crop Change | 97.54 % |
Crop ํ ํ์ตํ ์ด๋ฏธ์ง ๊ฒฐ๊ณผ๋ก ๋์ฒดํ ๊ฒฐ๊ณผ ์ฑ๋ฅ์ด ์ฆ๊ฐํ์์์ ์ ์ ์์๋ค.
Pseudo Labeling์ ํ์ฉํด ๋ ์ด๋ธ์ด ์๋ ๋ฐ์ดํฐ๋ฅผ ํ์ต ๋ฐ์ดํฐ๋ก ์ถ๊ฐํ์ฌ ๋ชจ๋ธ์ ์ผ๋ฐํ ์ฑ๋ฅ๊ณผ ์ ํ๋๋ฅผ 0.27% ํฅ์์์ผฐ๋ค.
Model | result |
---|---|
BaseModel | 97.00 % |
PseudoModel | 97.27 % |
๋ฉ๋ชจ๋ฆฌ ๋ฌธ์ ํด๊ฒฐ
- AMP(FP16 + FP32)๋ฅผ ํ์ฉํด CUDA ๋ฉ๋ชจ๋ฆฌ ์ ํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐ
- AMP๋ ๋ชจ๋ธ ์ฑ๋ฅ ์ ํ ์์ด ์ฐ์ฐ ์๋๋ฅผ ๋์ด๊ณ ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ฑ์ ๊ฐ์ ํ์ฌ ์์ ์ ์ธ ํ์ต์ ๊ฐ๋ฅํ๊ฒ ํจ
ํด์๋์ ๋ฐ๋ฅธ ์ฑ๋ฅ ํฅ์
- ํด์๋๋ฅผ ๋์ผ์๋ก ์ฑ๋ฅ์ด ํฌ๊ฒ ํฅ์๋จ์ ํ์ธ
- SegFormer B4, ConvNext ๋ฑ ๋ฌด๊ฑฐ์ด ๋ชจ๋ธ์ 2048 ํด์๋์์ OOM ๋ฐ์, 1024 ํด์๋๋ก ์ ํ
- SegFormer B0์ ๊ฐ์ ๊ฐ๋ฒผ์ด ๋ชจ๋ธ์ 2048 ํด์๋์์ ๋ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์
์ต์ข ํ์ต ์ ๋ต
- 2048 ํด์๋ ํ์ต ๊ฐ๋ฅ ๋ชจ๋ธ: 2048 ํด์๋๋ก ํ์ต
- OOM ๋ฐ์ ๋ชจ๋ธ: 1024 ํด์๋๋ก ํ์ต
๊ฒฐ๊ณผ ์์ฝ
- 2048 ํด์๋๋ฅผ ์ ์ฉํ ๊ฐ๋ฒผ์ด ๋ชจ๋ธ์ด ์ฑ๋ฅ ํฅ์์ ๊ฐ์ฅ ์ค์ํ ์์๋ก ํ์ธ
- DeepLabV3+ ์ฑ๋ฅ:
Model | Image size | Result |
---|---|---|
DeepLabV3+ | 512 | 95.50 % |
DeepLabV3+ | 1024 | 96.63 % |
DeepLabV3+ | 2048 | 97.07 % |
๋ฌธ์
- ํฐ ๋ผ์ ๋นํด ์์ ๋ผ๋ฅผ ์ ํํ ์์ธกํ์ง ๋ชปํ๋ ๋ฌธ์ ๊ฐ ์ง์๋จ.
- BCE Loss๋ ํฝ์ ๋จ์ ๋ถ๋ฅ์ ์ ์ฉํ์ง๋ง ์์ ๊ฐ์ฒด ํ์ง์๋ ํ๊ณ๊ฐ ์์.
๊ฐ์ค ๋ฐ ์ ๊ทผ
- Dice Loss: ์ ๋ฐ๋์ ์ฌํ์จ ์ต์ ํ.
- Focal Loss: ์ด๋ ค์ด ์ํ(์์ ๊ฐ์ฒด)์ ๊ฐ์ค์น๋ฅผ ๋ถ์ฌํ์ฌ ํ์ง ์ฑ๋ฅ ํฅ์ ๊ธฐ๋.
- Focal+Dice ์กฐํฉ: ๋ ์์ค ํจ์์ ๊ท ํ์ ๋ง์ถฐ ์ฑ๋ฅ ๊ฐ์ ๋๋ชจ.
- Focal4+Dice6 ์กฐ์ : Focal Loss์ ๊ณผ๋ํ ๊ฐ์ค์น๋ฅผ ์ํํ์ฌ ๋ค๋ฅธ ํฝ์ ํ์ต ์ฝํ ๋ฌธ์ ํด๊ฒฐ.
๊ฒฐ๊ณผ (UNet3+ ๊ธฐ์ค)
BCE | 95.42 % |
---|---|
BCE+Dice | 95.35 % |
Focal+Dice | 95.32 % |
Focal4+Dice6 | 95.57 % |
๊ฒฐ๊ณผ(DeepLabV3+ ๊ธฐ์ค)
(Baseline)BCE | 95.38 % |
---|---|
BCE+Dice(bce_weight=0.5) | 95.50 % |
Focal+Dice | 95.23 % |
Focal4+Dice6 | 95.21 % |
๊ฒฐ๋ก ๋ฐ ์ต์ข ์ ํ
- BCE+Dice: DeeplabV3+, ConvNext, SegFormer์ ์ ์ฉ
- Focal4+Dice6: **UNet2+, UNet3+**์ ์ ์ฉ
์์ ๊ฐ์ฒด ํ์ง ์ฑ๋ฅ ํฅ์์ ์ํด Focal Loss์ Dice Loss์ ๋น์จ ์กฐ์ ์ด ํจ๊ณผ์ ์
Cosine Annealing Learning Rate Scheduler ์ฑํ
- ํ์ต ์ด๊ธฐ: ๋์ ํ์ต๋ฅ ๋ก ๋น ๋ฅด๊ฒ ์๋ ด
- ํ์ต ํ๋ฐ: ํ์ต๋ฅ ์ ์ ์ง์ ์ผ๋ก ๊ฐ์์์ผ ์์ ์ ํ์ต๊ณผ ๊ณผ์ ํฉ ๋ฐฉ์ง
- ์ฅ์ : ์์ฐ์ค๋ฌ์ด ๊ฐ์ํญ์ผ๋ก ์์ ์ ํ์ต ํ๊ฒฝ ์ ๊ณต
๊ฒฐ๊ณผ
- UNet++ ๊ธฐ์ค, ๋ฒ ์ด์ค๋ผ์ธ ๋๋น 0.01 % ์ฑ๋ฅ ํฅ์ ํ์ธ
- Cosine Annealing Scheduler๋ฅผ ์ต์ข ์ ์ผ๋ก ์ฑํ
AdamW๋ฅผ ์ต์ข ์ ์ผ๋ก ์ฑํํ์๋ค. ๊ณผ์ ํฉ ๋ฐฉ์ง์ ๋ ํจ๊ณผ์ ์ธ AdamW๋ฅผ ์ฌ์ฉํ๋ฉด ์ผ๋ฐํ ์ฑ๋ฅ์ด ํฅ์ํ์ฌ ์ฑ๋ฅ์ด ๋ ์ข๋ค๊ณ ํ๋จํ๋ค.
๊ฒฐ๊ณผ(UNet++ ๊ธฐ์ค 0.24% ์์น)
RMSprop | 95.29 % |
---|---|
AdamW | 95.53 % |
CRF (Conditional Random Field)
CRF๋ segmentation ๋ชจ๋ธ์ ์ถ๋ ฅ(ํ๋ฅ ๋งต)์ ๊ธฐ๋ฐ์ผ๋ก ๊ณต๊ฐ ๋ฐ ์์ ์ ๋ณด๋ฅผ ํ์ฉํ์ฌ ํฝ์ ๊ฐ ๊ด๊ณ๋ฅผ ์ต์ ํํ๊ณ , ์ธ๋ฐํ ๋ถ๋ฅ ์ฑ๋ฅ์ ๊ฐ์ ํ๋ ํ์ฒ๋ฆฌ ๊ธฐ๋ฒ์ด๋ค.
์คํ ๊ฒฐ๊ณผ
- ๊ธฐ๋ณธ ํ๋ผ๋ฏธํฐ:
- ํ์ผ ์ฉ๋์ด ์ง๋์น๊ฒ ์ปค์ ธ ์ฑ์ ๋ถ๊ฐ๋ฅ.
- ์์ธ: ๊ณผ๋ํ smoothing ํจ๊ณผ๋ก ๋ฐ์ดํฐ๊ฐ ๊ณผ๋ํ๊ฒ ๋ณํ๋จ.
- ํ์ดํผํ๋ผ๋ฏธํฐ ์กฐ์ :
- ์ฑ๋ฅ์ด ์คํ๋ ค ๊ฐ์.
- ์์ธ ๋ถ์:
- ํ์ดํผํ๋ผ๋ฏธํฐ ์์กด์ฑ: ๋ถ์ ์ ํ ๊ฐ ์ค์ ์ผ๋ก ์ธ๋ถ ์ ๋ณด ์์ค ๋ฐ์.
- ๋ถ์ ํฉํ smoothing: ๋ณต์กํ ๊ฒฝ๊ณ๋ฅผ ์ง๋์น๊ฒ ๋จ์ํํ์ฌ ์์ ๊ฐ์ฒด๋ ์์ ์์ญ์ด ์ ๊ฑฐ๋๊ฑฐ๋ ๋ณํฉ๋๋ ์ค๋ฅ ๋ฐ์.
CRF๋ ํฝ์ ๋จ์์ ๋ถ๋ฅ ์ค๋ฅ์ ๊ณ๋จ ํ์์ ํด๊ฒฐํ๋ ค๋ ๋ชฉ์ ์์ ๋์ ๋์์ผ๋, ์ ์ ํ ํ์ดํผํ๋ผ๋ฏธํฐ ์กฐ์ ์ด ๋ถ์กฑํ์ฌ ์ฑ๋ฅ ๊ฐ์ ์ ์คํจํ๋ค. ํนํ, ๊ณผ๋ํ smoothing์ผ๋ก ์ธํด ์ฑ๋ฅ ์ ํ์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฌธ์ ๋ฅผ ์ผ๊ธฐํ๋ค.
๋ค์ํ TTA๋ฅผ ์คํํ์ง๋ง HorizontalFlip ๋ง์ด ๊ธฐ์กด๋ณด๋ค dice๊ฐ 0.06 % ์์นํ๋ ์ ์๋ฏธํ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ฃผ์ด ์ต์ข TTA์๋ HorizontalFlip๋ง์ ์ ์ฉํ์๋ค.
๋ชจ๋ธ ์คํ์์ ์ฑ๋ฅ์ด ์ฐ์ํ๋ ๋ชจ๋ธ๋ค์ ์ ์ ํ์ฌ K-Fold๋ฅผ ์งํํ ๋ค, ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก Soft Voting, Hard Voting, Classwise Ensemble ๋ฑ ๋ค์ํ ์์๋ธ ๋ฐฉ๋ฒ์ ์คํํ๋ค.
์ต์ข ์ ์ผ๋ก ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์ธ ๋ฐฉ๋ฒ์ Classwise Ensemble๋ก, ๊ฐ ํด๋์ค์์ ๊ฐ์ฅ ์ฐ์ํ ์์ธก์ ์ํํ ๋ชจ๋ธ์ ๊ฒฐ๊ณผ๋ฅผ ์ฌ์ฉํด ์ถ๋ก ํ๋ ๋ฐฉ์์ด๋ค.
ํนํ, Cropํ ์ด๋ฏธ์ง๋ฅผ ํ์ฉํด ์๋ฑ ๋ผ๋ฅผ ์ค์ฌ์ผ๋ก ํ์ตํ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก Classwise Ensemble์ ์งํํ์ฌ ์๋ฑ ๋ผ ๋ถ๋ถ์ ์ ํ๋๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํฅ์์์ผฐ๋ค.
KFOLD
- Convnext Xlarge 1024 + 5fold
- Segformer b4 1024 + 5fold
- DeeplabV3p 2048 + 4fold
- Segformer b0 2048 + 4fold
Final Ensemble
์ต์ข Classwise Ensemble์ผ๋ก 97.54%๋ฅผ ๋ฌ์ฑํ์๋ค.
X-ray ์ ๋ผ ๋ถํ ์ ์ฃผ์ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ๋ค์ํ ์ฆ๊ฐ ๊ธฐ๋ฒ, ๋ชจ๋ธ ์ํคํ ์ฒ, ์์๋ธ ๊ธฐ๋ฒ์ ์ ์ฉํ๋ค. ํนํ, ์๋ณธ ์ด๋ฏธ์ง ํ์ต ๋ชจ๋ธ ๊ธฐ๋ฐ Classwise Ensemble ๊ธฐ๋ฒ์ ์๋ฑ ๋ผ์ ๊ฐ์ ์ด๋ ค์ด ์์ญ์์ ์ฑ๋ฅ ํฅ์์ ์ด๋์๋ค. ๋ํ, SOTA ๊ฐ์ ๋ฌด๊ฑฐ์ด ๋ชจ๋ธ์ ๋ฎ์ ํด์๋๋ก ํ์ตํ๋ ๊ฒ๋ณด๋ค ๊ฐ๋ฒผ์ด ๋ชจ๋ธ์ ๋์ ํด์๋๋ก ํ์ตํ๋ ๊ฒ์ด ๋ณธ ๋ํ ์ฑ๋ฅ ํฅ์์ ๋งค์ฐ ์ค์ํ์์ ์๊ฒ ๋์๋ค. ํฅํ ์ฐ๊ตฌ์์๋ ๋๋ฉ์ธ ์ง์์ ํ์ฉํ ๋ ์ ๊ตํ ์ ์ฒ๋ฆฌ ๋ฐ ํ์ฒ๋ฆฌ ๊ธฐ๋ฒ์ ์ ์ฉํ์ฌ ๋์ฑ ๋์ ์ฑ๋ฅ์ ๋ชฉํ๋ก ํ ๊ฒ์ด๋ค.
- Public Dice Score: 97.56%
- Private Dice Score: 97.64 %
- [1] Code for ICASSP 2020 paper โUNet 3+: A full-scale connected unet for medical image segmentation https://github.com/ZJUGiveLab/UNet-Version/tree/master
- [2] Python wrapper to Philipp Krรคhenbรผhl's dense (fully connected) CRFs with gaussian edge potentials https://github.com/lucasb-eyer/pydensecrf
- [3] Enze Xie et al., "SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers" arXiv:2105.15203v3 [cs.CV] 28 Oct 2021
- [4] Semantic Segmentationย onย ADE20K SOTA https://paperswithcode.com/sota/semantic-segmentation-on-ade20k