Skip to content

butlerwilson/review

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

酒店评论标签生成

朴素贝叶斯实现文本分类

外部依赖

  1. numpy
  2. sklearn
  3. jieba
  4. snownlp
  5. scipy

pip install package 可直接安装

代码组织

  1. preprocess.py

训练集,测试集,预测集数据准备; 结巴分词,增加自定义字典; 统计单词频度,去掉低频词语;

  1. classify.py

加载所有数据,使用朴素贝叶斯算法进行分类

  1. tag_features.py gen_results.py

根据自己需求做一部分的结果处理

  1. 目录

data目录,所有原始数据目录; middle目录,所有中间数据目录; result目录,所有结果数据目录;

  1. run.sh

运行测试参数和运行,运行先请修改

相关技术博客分享

author: youngcy

About

文本分类,评论分类,朴素贝叶斯多分类,酒店评论分类

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors