- 命名實體辨別(Name Entity Recognition)
- 任務目標:識別出句子中的專有名稱。
- 總共22種類別。
- 使用 LSTM 和 GloVe 的 word embedding 進行訓練。
- 問答系統 (Question Answering)
- 任務目標:給定一篇文章和問題,找出文章中的正確答案。
- 屬於 ODQA(Open Domain Question Answering)。
- 必須使用TF-IDF 和 BM25 進行文章提取。
- 自然語言理解的解釋性資訊標記競賽
- 機器學習模型的可解釋性(explainability)是人工智慧技術在落實與應用時,備受期待的項目。如果模型能夠在精準預測之餘,同時提供佐證其預測行為之依據,人類將有機會事先發現模型判斷的錯誤,大幅提高人類對模型之信賴,使得人工智慧技術更能落實到關鍵性的決策場域。 議論探勘(argument mining)是近期廣受矚目的自然語言處理任務。該任務試圖從文句中找出人們的主張(claim),以及支持或反對這些主張的原因。這可視為輿論探勘(opinion mining)或情緒分析(sentiment analysis)的進階任務。基礎的議論探勘任務,是給定一個主張(claim)與一個前提(premise),由模型判斷兩者之間的議論關係,例如該項前提為支持或反駁該主張。換言之,這是一個典型的分類任務,判斷一組主張與前提的關係。對於這類的任務,目前的自然語言處理模型已能達到一定的效能,近期的深度學習技術也顯示模型已能掌握部份議論推理能力。然而,模型在提供分類預測之餘,究竟是如何得到該預測之結果,其中的解釋性要素則仍然未有充份的研究。 有鑑於此,本計畫以議論探勘為目標,希望能讓模型在預測文句之間支持或反駁的關係之外,找出文句之中關鍵性的片段,作為預測的佐證資訊。這類資訊可以讓研究人員更了解模型內部的行為、促進自然語言處理的研究,同時也可望將來在終端應用時,提供出模型的判斷依據,讓人類評估模型該次判斷的可靠程度。
- 比較ODQA的 generative 和 extractive 的結果表現。
- 參考論文:A Copy-Augmented Generative Model for Open-Domain Question Answering
- Author: Shuang Liu, Dong Wang, Xiaoguang Li, Minghui Huang, Meizhen Ding
- Publish: ACL 2022
- add pointer network to fuss-in-decoder model
- generative model:FiD-PGN, bert2BERT
- extractive model: bert-base-uncased, 使用 TF-IDF 和 BM25 進行文章提取。
-
score TF-IDF bert2BERT FiD-PGN Top k 1 2 3 4 5 5 25 LCS 0.633 0.654 0.650 0.671 0.724 0.372 None F1 0.591 0.612 0.606 0.635 0.663 0.348 None EM 0.524 0.538 0.536 0.547 0.578 0.312 0.684 score BM25 bert2BERT FiD-PGN Top k 1 2 3 4 5 5 25 LCS 0.631 0.776 0.764 0.782 0.804 0.372 None F1 0.588 0.751 0.748 0.758 0.779 0.348 None EM 0.514 0.676 0.632 0.681 0.697 0.312 0.684