김한성 | 염성현 | 이재욱 | 최동민 | 홍인희 |
---|---|---|---|---|
Github | Github | Github | Github | Github |
11/14 ~ 12/1
관계 추출(Relation Extraction)은 문장의 단어(Entity)에 대한 속성과 관계를 예측하는 문제입니다. 관계 추출은 지식 그래프 구축을 위한 핵심 구성 요소로, 구조화된 검색, 감정 분석, 질문 답변하기, 요약과 같은 자연어처리 응용 프로그램에서 중요합니다. 비구조적인 자연어 문장에서 구조적인 triplet을 추출해 정보를 요약하고, 중요한 성분을 핵심적으로 파악할 수 있습니다.
전체 데이터에 대한 통계는 다음과 같습니다.
- train.csv: 총 32,470개
- test_data.csv: 총 7,765개 (정답 라벨 blind = 100으로 임의 표현)
데이터셋에 대한 자세한 설명은 아래 링크를 참조하시기 바랍니다.
Klue Dataset Link
- EDA
- Preprocesisng, Re-labeling
- Data Augmentation
- Noise data experiment
- Add Marker
- Binary Classification(Experimental)
- RECENT
- R-BERT
- LRFinder
- Scheduler
- Focal Loss
- Inference Analysis
- CoRE(Debiasing)
RE Project/
│
├── code/
│ ├── config/
│ ├── ...
│ └── main.py
│
├── for_binary/
│ ├── config/
│ ├── data/
│ ├── ...
│ ├── run.sh
│ └── inference.py - for all setting
│
├── multi_binary/
│ ├── config/
│ ├── ...
│ ├── binary_train.sh
│ ├── multiple_train.sh
│ └── para.train.sh - for recursive learning
│
│── rBERTa/ - for further reading
│ ├── ...
│ └── model for some code check more detail..
│
├── notebooks/
│ ├── ...
│ ├── EDA.ipynb
│ ├── noise_add.ipynb
│ └── dev_prob.ipynb
│
├── .gitignore
├── README.md
│
└── thanks for comming I'm Yeombora