nlp-basictasks是利用PyTorch深度学习框架所构建一个简单的库,旨在快速搭建模型完成一些基础的NLP任务,如分类、匹配、序列标注、语义相似度计算等。
如上图,整体架构分为三个大模块:
- readers负责读取数据,不同的任务在readers中有不同的数据处理形式。不同任务的数据后处理代码也放在readers中。
- modules代表编码器,用来提取文本特征,主要包括BERT、LSTM、MLP。
- tasks根据任务的不同有相应的处理方式。(和readers中相应的数据处理方式对应)
pip install --index-url https://pypi.org/project/ nlp-basictasks==0.2.4
or
git clone https://github.com/xianghuisun/nlp-basictasks.git
cd nlp-basictasks & python setup.py install
notebooks中展示了用nlp-basictasks框架快速实现五个NLP常见任务,具体见: