classification-base-bert

项目介绍

本项目使用google-bert/bert-base-chinese模型进行中文文本分类任务，使用中文数据集进行训练，训练完成后，可以导出模型，进行预测。
数据集下载地址
 相关问题分析

环境安装

创建新的虚拟环境
conda create -n bert_env python==3.8
激活环境
conda activate bert_env
安装依赖包，临时使用镜像源
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

使用方法

环境搭建完成，激活依赖下载完成后可以按需求分别执行predict_single.py和predict_batch.py文件。

在THUCNews/data/test.csv数据集上进行测试的结果如下：

混淆矩阵的详细参考这里

分类指标如下：

指标	值
Accuracy	0.9434
Precision	0.9438
Recall	0.9434

贡献指南

许可证

项目采用Apache License 2.0许可。

注意

bert-base-chinese 需要自行下载，下载方式参考classification-base-bert/bert-base-chinese/README.md
classification-base-bert/model_config.py的model_path是预训练后的模型文件，推理之前需要先执行model_train.py文件进行训练。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

classification-base-bert

目录

项目介绍

环境安装

使用方法

贡献指南

许可证

注意

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
THUCNews/data		THUCNews/data
bert-base-chinese		bert-base-chinese
img		img
logs		logs
LICENSE.txt		LICENSE.txt
README.md		README.md
model_config.py		model_config.py
model_load.py		model_load.py
model_train.py		model_train.py
predict_batch.py		predict_batch.py
predict_single.py		predict_single.py
requirements.txt		requirements.txt

License

hgsw/classification-base-bert

Folders and files

Latest commit

History

Repository files navigation

classification-base-bert

目录

项目介绍

环境安装

使用方法

贡献指南

许可证

注意

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages