LectureVoice๋ ์๊ฐ ์ฅ์ ํ์๋ค์ด ๊ฐ์ ์์์ ๋ณด๋ค ์ฝ๊ฒ ์ดํดํ ์ ์๋๋ก ์์ฑ ํด์ค์ ์๋์ผ๋ก ์์ฑํ์ฌ ์ ๊ณตํ๋ ๋ชจ๋ฐ์ผ ์ ํ๋ฆฌ์ผ์ด์ ์ ๋๋ค.
- ๋น๋์ค ๋ถ์ ๋ฐ ํด์ค ์์ฑ
- ๊ฐ์ ์์์ ๋ค์ด์ด๊ทธ๋จ๊ณผ ํ ์คํธ๋ฅผ ์ธ์ํ๊ณ , ์์ธํ ์ค๋์ค ํด์ค์ ์ ๊ณตํฉ๋๋ค.
- ํ๋ซํผ
- ๋ชจ๋ฐ์ผ ๊ธฐ๊ธฐ์์ ์ฌ์ฉํ ์ ์๋๋ก ์ค๊ณ๋์์ต๋๋ค.
- ๋ชฉํ
- ์๊ฐ ์ฅ์ ํ์๋ค์๊ฒ ๋ ๋ฆฝ์ ์ด๊ณ ์ ๊ทผ ๊ฐ๋ฅํ ํ์ต ๊ฒฝํ์ ์ ๊ณตํฉ๋๋ค.
- ํต์ฌ ๊ธฐ๋ฅ
- ๋น๋์ค์ ์๊ฐ ์์์ ๋ํ ์ค๋์ค ์ค๋ช ์ ์๋ ์์ฑํ์ฌ ์ดํด๋๋ฅผ ๋์ ๋๋ค.
COVID-19 ํฌ๋ฐ๋ฏน ์ดํ ์จ๋ผ์ธ ํ์ต์ด ์ฆ๊ฐํ๋ฉด์, ์๊ฐ ์ฅ์ ํ์๋ค์ ์๊ฐ์ ์ ๋ณด ์ ๊ทผ์ ์ด๋ ค์์ ๊ฒช๊ณ ์์ต๋๋ค. LectureVoice๋ ๊ฐ์ ์์์ ๋ค์ด์ด๊ทธ๋จ๊ณผ ์๊ฐ ์๋ฃ๋ฅผ ๋ถ์ํ๊ณ ์ค๋ช ํ์ฌ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ณ ์ ํฉ๋๋ค.
- ์์ ํ ์์ฑ ์ ์ด๋ก ์๊ฐ ์ฅ์ ์ฌ์ฉ์๊ฐ ์ฑ๊ณผ ์ํธ์์ฉํ ์ ์์ต๋๋ค.
- LectureVoice๋ ๊ฐ์ ๋น๋์ค์ ํ๋ฉด ์ ํ์ ๊ฐ์งํ๊ณ , ํ ์คํธ์ ์ด๋ฏธ์ง๋ฅผ ์ถ์ถํ์ฌ ์ค๋ช ์ ์์ฑํฉ๋๋ค.
- ํ ์คํธ, ๊ทธ๋ฆผ, ํ, ๋ค์ด์ด๊ทธ๋จ ๋ฑ ์๊ฐ์ ์๋ฃ์ ์ ํ์ ๋ง๋ ํด์ค ๋ฐฉ๋ฒ์ ์ ํํ์ฌ ์ ํํ ์ดํด๋ฅผ ๋๋ ์์ฑ ํด์ค์ ์์ฑํฉ๋๋ค.
- ๋ง์ถคํ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ฌ ๋ค์ด์ด๊ทธ๋จ์ ํ์ดํ, ๋ธ๋ก, ํ ์คํธ๋ฅผ ๋ถ์ํ๊ณ , ์๋ฏธ ์๋ ๋ด๋ฌํฐ๋ธ๋ฅผ ์ ๊ณตํฉ๋๋ค.
LectureVoice๋ Dart์ Flutter ํ๋ ์์ํฌ๋ก ๊ฐ๋ฐ๋ ๋ชจ๋ฐ์ผ ์ ํ๋ฆฌ์ผ์ด์ ์ ๋๋ค. ๋ค์ํ ๋ฐฑ์๋ ๊ธฐ์ ๊ณผ API๊ฐ ํตํฉ๋์ด ์์ต๋๋ค:
- ์๋ฒ: Flask์ Python์ผ๋ก ๊ฐ๋ฐ
- ํ ์คํธ ์ธ์: Naver Clova OCR API ์ฌ์ฉ
- ์ด๋ฏธ์ง ์บก์ ๋: Google Cloud Image Captioning API ์ฌ์ฉ
- ์ค๋์ค ์ถ๋ ฅ: Google Cloud Text-to-Speech API ์ฌ์ฉ
- ์ฅ๋ฉด ๊ฐ์ง
- PySceneDetect API๋ฅผ ์ฌ์ฉํ์ฌ ์ฅ๋ฉด ์ ํ์ ๊ฐ์งํ๊ณ , ๊ฐ ์ ํ ์ง์ ์์ ์ด๋ฏธ์ง๋ฅผ ์บก์ฒํฉ๋๋ค.
- ํ
์คํธ ์ถ์ถ
- OCR์ ํตํด ์บก์ฒ๋ ์ด๋ฏธ์ง์์ ํ ์คํธ๋ฅผ ์ถ์ถํ๊ณ , ๊ณต๊ฐ ์ขํ์ ํจ๊ป ์ ์ฅํฉ๋๋ค.
- ๋ค์ด์ด๊ทธ๋จ ๋ถ์
- ๋ง์ถคํ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํด ๋ค์ด์ด๊ทธ๋จ์ ๋ถ์ํ๊ณ , ์์ธํ ์ค๋ช ์ ์์ฑํฉ๋๋ค.
- ํด์ค ์์ฑ
- ์ถ์ถ๋ ํ ์คํธ์ ์ด๋ฏธ์ง ์ค๋ช ์ ์ข ํฉํ์ฌ ๋น๋์ค ์ฌ์๊ณผ ๋๊ธฐํ๋ ํ ์คํธ ํ์ผ์ ์์ฑํฉ๋๋ค.
LectureVoice์ ์๊ณ ๋ฆฌ์ฆ์ ๋ค์ด์ด๊ทธ๋จ ์ด๋ฏธ์ง์์ **๋ชจ์(ํ์ดํ, ์ฌ๊ฐํ)**์ ๊ฐ์งํ๊ณ , ๊ตฌ์กฐํ๋ ์ค๋ช ์ ์์ฑํฉ๋๋ค:
- ์ค๊ณฝ์ ๊ฐ์ง: ๋ค์ด์ด๊ทธ๋จ์ ๊ฐ์ฅ์๋ฆฌ๋ฅผ ์๋ณํ๊ณ , ์ด๋ฅผ ํ์ดํ๋ ๋ธ๋ก์ผ๋ก ๋ถ๋ฅํฉ๋๋ค.
- ํ ์คํธ ์ฐ๊ด์ฑ ๋ถ์: ํ ์คํธ๋ฅผ ๋ค์ด์ด๊ทธ๋จ ์์์ ์ฐ๊ฒฐํ์ฌ ๊ด๊ณ๋ฅผ ์ค๋ช ํฉ๋๋ค.
- ๋ด๋ฌํฐ๋ธ ์์ฑ: ๋ค์ด์ด๊ทธ๋จ์ ๋ํ ์ผ๊ด๋ ์ค๋ช ์ ์์ฑํ์ฌ ์๊ฐ ์ฅ์ ์ฌ์ฉ์๊ฐ ๋ณต์กํ ์๊ฐ ์ ๋ณด๋ฅผ ์ดํดํ ์ ์๋๋ก ๋์ต๋๋ค.
LectureVoice๋ ์ฌ์ฉ์ฑ ๋ฐ ๋ง์กฑ๋ ํ๊ฐ์์ ํ์ค ์ด๋ฏธ์ง ์บก์ ๋ ๋ฐฉ์๋ณด๋ค ๋์ ์ดํด๋๋ฅผ ๋ณด์์ต๋๋ค. ์๊ฐ ์ฅ์ ํ์๋ค์ ํผ๋๋ฐฑ์ ํด์ค์ ๋ช ํ์ฑ๊ณผ ์ ์ฉ์ฑ์ ๊ฐ์กฐํ์ต๋๋ค.
- ์ฑ์ ์คํํ๊ณ ๊ธฐ๊ธฐ ๊ฐค๋ฌ๋ฆฌ์์ ๊ฐ์ ๋น๋์ค๋ฅผ ์ ํํ์ธ์.
- ์ฑ์ด ๋น๋์ค๋ฅผ ์ฒ๋ฆฌํ๊ณ , ๊ฐ ์ฅ๋ฉด์ ๋ํ ํด์ค์ ์์ฑํฉ๋๋ค.
- ๋น๋์ค๋ฅผ ์ฌ์ํ์ฌ ์ฅ๋ฉด ์ ํ๋ง๋ค ์ค๋์ค ์ค๋ช ์ ๋ค์ ์ ์์ต๋๋ค.
LectureVoice๋ Android ๋ฐ iOS ํ๋ซํผ์์ ์ฌ์ฉํ ์ ์์ต๋๋ค. ์ค์น ๋ฐฉ๋ฒ์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:
- ๋ ํฌ์งํ ๋ฆฌ ํด๋ก :
git clone https://github.com/nan0silver/DiagramAnalysisGenerationAlgorithm
- Dart & Flutter: flutter.dev
- Python & Flask: python.org, flask.palletsprojects.com
- PySceneDetect API: pyscenedetect.readthedocs.io
- Naver Clova OCR API: ncloud.com/product/aiService/ocr
- Google Cloud Text-to-Speech API: cloud.google.com/text-to-speech
- ์์ธํ ๋ด์ฉ์ **ICICT 2024 Conference Paper**๋ฅผ ์ฐธ๊ณ ํ์ธ์.
