icon | description | cover | coverY |
---|---|---|---|
1 |
다양한 종류의 데이터셋에 대한 소개와 이를 수집하는 방식을 알아봅니다! |
0 |
하나의 완전한 데이터셋을 소개합니다.
- AwesomeKorean Data
- KorQuad : 한국어 Machine Reading Comprehension 데이터셋
- CounselGPT : 한국어 심리 상담 데이터셋
- Welfare-QA : 한국어 복지제도 관련 QA 데이터셋
- KLUE
- Korpora
- 국립국어원 사전
- 한국어 챗봇데이터
- Korean HateSpeech Data
- Ko-Wiki-Data
- Kor-Wiki-Hop
- Korean Human Judgement
- Ko-Calibration
주어진 문서에서 내용을 추출하거나 외부에서 데이터를 수집/크롤링하는 레퍼런스를 소개합니다.
- MegaParse
- FireCrawl
- Playwright
- MinerU
- PDFMathTranslate
- OpenParse : Easy PDF Chunking open-source library
- Airflow
- Prefect