You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
dense retrieval의 성능이 영 좋지 않다. (top20 - 0.40)
sparse retrieval (bert-base 성능 koelectra 보다 좋았다.)
dense retrieval 학습 문제
top20 / top30 / ... / top100 context들 전부 이어서 answer 예측했을 때 top20의 성능이 가장 좋았다.
T5 model retrieval 사용 X
generation model korquad 학습 후 inference test dataset EM score 4% 하락
bm25 max_feature 주석 처리 -> 정확도 하락
특허 상담 mrc 논문 -> wrong answer를 split하고 re-tokenizing해서 fine-tuning 성능을 올린다.
plan
한글, 특정 문자만 나오게 하는 정규식 적용 (dataset 전처리)
BERT를 이용한 한국어 특허상담 기계독해
dense retrieval
reacted with thumbs up emoji reacted with thumbs down emoji reacted with laugh emoji reacted with hooray emoji reacted with confused emoji reacted with heart emoji reacted with rocket emoji reacted with eyes emoji
-
dense retrieval의 성능이 영 좋지 않다. (top20 - 0.40)
sparse retrieval (bert-base 성능 koelectra 보다 좋았다.)
dense retrieval 학습 문제
top20 / top30 / ... / top100 context들 전부 이어서 answer 예측했을 때 top20의 성능이 가장 좋았다.
T5 model retrieval 사용 X
generation model korquad 학습 후 inference test dataset EM score 4% 하락
bm25 max_feature 주석 처리 -> 정확도 하락
특허 상담 mrc 논문 -> wrong answer를 split하고 re-tokenizing해서 fine-tuning 성능을 올린다.
plan
한글, 특정 문자만 나오게 하는 정규식 적용 (dataset 전처리)
BERT를 이용한 한국어 특허상담 기계독해
dense retrieval
Beta Was this translation helpful? Give feedback.
All reactions