ํ์ ์ค์บ๋ ์์คํ (Cafeteria Food Scanner System)
์์คํ ๊ฐ์ (System Overview)
๋ณธ ์์คํ
์ ๋ํ๊ต ํ์ ๋ฉ๋ด๋ฅผ ๋ถ์ํ๊ธฐ ์ํ ๋ฉํฐ๋ชจ๋ฌ AI ์ ํ๋ฆฌ์ผ์ด์
์ด๋ค.
๋จ์ผ ํ์ ์ด๋ฏธ์ง๋ฅผ ์
๋ ฅ์ผ๋ก ๋ฐ์ ๋ฉ๋ด ๋ถ๋ฅ, ์ด๋ฏธ์ง ์บก์
์์ฑ, ์ ์ฌ ๋ฉ๋ด ๊ฒ์,
๊ทธ๋ฆฌ๊ณ ์ฌ์ฉ์์ ํ๋๋์ ๊ณ ๋ คํ ์นผ๋ก๋ฆฌ ํผ๋๋ฐฑ์ ์ ๊ณตํ๋ค.
์ฌ์ฉ ๋ชฉ์ (Intended Use)
๋ณธ ์์คํ
์ ์ฐ๊ตฌ ๋ชฉ์ ์ ์ํด ์ค๊ณ๋์๋ค.
ํ์ ๋ฉ๋ด์ ๋ํ ์ดํด๋ฅผ ๋๊ธฐ ์ํ ์ฐธ๊ณ ์ฉ ์ ๋ณด ์ ๊ณต์ ๋ชฉํ๋ก ํ๋ฉฐ,
์ ๊ณต๋๋ ์นผ๋ก๋ฆฌ ์ ๋ณด๋ ์ถ์ ๊ฐ์ผ๋ก ์ํ์ ๋๋ ๊ฑด๊ฐ ์ง๋จ ์ฉ๋๋ก๋ ์ฌ์ฉํด์๋ ์ ๋๋ค.
์ํ ๊ธฐ๋ฅ ๋ฐ ์ญํ (Tasks and Capabilities)
- ํ์ ๋ฉ๋ด ์ด๋ฏธ์ง ๋ถ๋ฅ (ConvNeXt-Base)
- ํ ์คํธโ์ด๋ฏธ์ง ์ ์ฌ๋ ๊ธฐ๋ฐ ์ ์ฌ ๋ฉ๋ด ๊ฒ์ (CLIP)
- ์ด๋ฏธ์ง ๊ธฐ๋ฐ ์์ฐ์ด ์บก์ ์์ฑ (BLIP)
- ํ๋๋ ๊ธฐ๋ฐ ์นผ๋ก๋ฆฌ ํผ๋๋ฐฑ ์ ๊ณต
- ์์ฝ์ฒ ๋ฐ ๊ตญ๊ฐํ์ค์ํ์ฑ๋ถ ๋ฐ์ดํฐ๋ฒ ์ด์ค ๊ธฐ๋ฐ ์ ์ฌ ์์ ๋งค์นญ์ ํ์ฉํ 1์ธ๋ถ ์นผ๋ก๋ฆฌ ์ถ์
์ฌ์ฉ๋ ๋ชจ๋ธ (Models Used)
- ConvNeXt-Base: ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ชจ๋ธ
- CLIP: ํ ์คํธโ์ด๋ฏธ์ง ์๋ฒ ๋ฉ ๋ฐ ์ ์ฌ๋ ๊ฒ์
- BLIP: ์ด๋ฏธ์ง ์บก์ ์์ฑ
ํ์ต ์ธ๋ถ ์ฌํญ (Training Details)
์ด๋ฏธ์ง ๋ถ๋ฅ ๋ชจ๋ธ์ ์ง์ ์์งํ ํ์ ์ด๋ฏธ์ง ๋ฐ์ดํฐ์
์ ์ฌ์ฉํ์ฌ ํ์ต๋์๋ค.
ํ์ต ๊ณผ์ ์์ MixUp, CutMix, EMA ๊ธฐ๋ฒ์ ์ ์ฉํ์ฌ ๋ชจ๋ธ์ ์ผ๋ฐํ ์ฑ๋ฅ์ ํฅ์์์ผฐ๋ค.
๋ํ ์๊ฐ์ ์ผ๋ก ๋งค์ฐ ์ ์ฌํ ๋ฉ๋ด๋ค์ 17๊ฐ์ ๋๋ถ๋ฅ๋ก ๋ณํฉํ์ฌ
๋ชจ๋ธ์ ํผ๋์ ์ค์๋ค.
๋ฐ์ดํฐ์ (Dataset)
๋ณธ ๋ฐ์ดํฐ์
์ ์น ์ด๋ฏธ์ง ํฌ๋กค๋ง์ ํตํด ์์ง๋์๋ค.
์ ์๊ถ ๋ฌธ์ ๋ก ์ธํด ๋ฐ์ดํฐ์
์ ๊ณต๊ฐ๋์ง ์๋๋ค.
์นผ๋ก๋ฆฌ ์ถ์ ๋ฐฉ์ (Calorie Estimation Method)
๋ณธ ์์คํ ์ ์นผ๋ก๋ฆฌ ์ ๋ณด๋ ์์ฝ์ฒ ๋ฐ ๊ตญ๊ฐํ์ค์ํ์ฑ๋ถ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ์ ๊ณตํ๋ ์ ์ฌ ์์์ 1์ธ๋ถ ์ด๋ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ฐ์ถ๋๋ค. ํ์ ๋ฉ๋ด์ ๊ฐ์ฅ ์๊ฐ์ ยท๊ตฌ์ฑ์ ์ผ๋ก ์ ์ฌํ ์์ ํญ๋ชฉ์ ๋งค์นญํ ๋ค, ํด๋น ์์์ 1์ธ๋ถ ์ด๋์ ํ์ ๋ฉ๋ด์ ์นผ๋ก๋ฆฌ๋ก ๊ทผ์ฌ ์ถ์ ํ๋ค. ์ด๋ ์ค์ ํ์ ๋ ์ํผ ์ ๋ณด๋ฅผ ์๊ธฐ ์ด๋ ค์ด ํ๊ฒฝ์์ ํ์ค์ ์ธ ๊ธฐ์ค ๊ฐ์ ์ ๊ณตํ๊ธฐ ์ํ ๋ฐฉ์์ด๋ค.
๋ฐ๋ชจ (Demo)
๋ณธ ์์คํ
์ ์น ๊ธฐ๋ฐ ๋ฐ๋ชจ๋ ์๋ Hugging Face Spaces์์ ํ์ธํ ์ ์๋ค.
๐ https://huggingface.co/spaces/simkyuri/cafeteria-menu-classifier
ํ๊ณ์ (Limitations)
- ์นผ๋ก๋ฆฌ ์ ๋ณด๋ ์ค์ ์กฐ๋ฆฌ๋ฒ์ด ์๋ ์ ์ฌ ์์์ ๊ณต๊ณต ๋ฐ์ดํฐ ๊ธฐ๋ฐ ์ถ์ ๊ฐ์ผ๋ก, ์ค์ ์์น์ ์ฐจ์ด๊ฐ ์์ ์ ์๋ค.
- ์๊ฐ์ ์ผ๋ก ๋งค์ฐ ๋ชจํธํ ๋ฉ๋ด์ ๋ํด์๋ ์ฑ๋ฅ์ด ์ ํ๋ ์ ์๋ค.
- ์ ๋ฐ ์์ ๋ถ์ ๊ธฐ๋ฅ์ ํฌํจํ์ง ์๋๋ค.
์ค๋ฆฌ์ ๊ณ ๋ ค์ฌํญ (Ethical Considerations)
๋ณธ ์์คํ
์ ๊ฐ์ธ ์ ๋ณด๋ฅผ ์์งํ์ง ์๋๋ค.
์ถ๋ ฅ ๊ฒฐ๊ณผ๋ ์ฐธ๊ณ ์ฉ ์ ๋ณด์ด๋ฉฐ, ์๋ฃ์ ๋๋ ์์ด ๊ด๋ จ ์์ฌ๊ฒฐ์ ์ ์ฌ์ฉ๋์ด์๋ ์ ๋๋ค.
Model tree for simkyuri/cafeteria-food-scanner-system
Base model
facebook/convnext-base-224