项目简介

本项目主要对各个模型的文本分类能力进行测试，模型包括早期的机器学习模型和目前流行的深度学习。项目中包含数据集的处理和读取方法，相应模型的部分处理代码，以及最后的测试代码。

模型	代码
朴素贝叶斯	朴素贝叶斯.py
MLP	MLP.ipynb
Bert	BERT.ipynb
XLNet	run_classifier.py
TextRNN, TextCNN, TextRCNN	TextRNN, TextCNN, TextRCNN/*.

数据集读取

用法：

from utils.data_loader import load_data

train,test=load_data('./小组作业-语料/') # 输入存放数据集的文件夹即可读取数据集，数据集已经过shuffle

格式：

[
    ["中国将军团8年来首访日本 日方希望加强和中国沟通",1],
    ["他一张脸都皱紧了",4],
]

结果评测

用法：

from utils.score import score

score(label_truth,label_predict,output_filename='mlp.txt')
# label_truth和label_predict均为整数list
# output_filename参数可选

示例：

label_truth=[1,2,3,5,1,2,3,5,1,2,3,5,1,2,3,5]
label_predict=[2,5,5,5,3,2,3,1,1,2,1,5,1,3,3,5]

score(label_truth,label_predict,output_filename='mlp.txt')

Name		Name	Last commit message	Last commit date
Latest commit History 35 Commits
.idea		.idea
.ipynb_checkpoints		.ipynb_checkpoints
TextRNN, TextCNN, TextRCNN		TextRNN, TextCNN, TextRCNN
augmented		augmented
bert-master		bert-master
datasets		datasets
imgs/README		imgs/README
output		output
scripts		scripts
src		src
utils		utils
小组作业-语料		小组作业-语料
.DS_Store		.DS_Store
.gitattributes		.gitattributes
BERT.ipynb		BERT.ipynb
CharCNN.ipynb		CharCNN.ipynb
MLP.ipynb		MLP.ipynb
MLP_with_augmented_dataset.ipynb		MLP_with_augmented_dataset.ipynb
README.md		README.md
bert.txt		bert.txt
bert_2.txt		bert_2.txt
bert_eval_res.py		bert_eval_res.py
charcnn.txt		charcnn.txt
electra.txt		electra.txt
mlp.txt		mlp.txt
mlp_augmented.txt		mlp_augmented.txt
run_classifier.py		run_classifier.py
朴素贝叶斯.py		朴素贝叶斯.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

项目简介

数据集读取

结果评测

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

项目简介

数据集读取

结果评测

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages