专利名称:一种基于赌属性选择的文本情感分类集成系统专利类型:发明专利
发明人:张忠良,张晨玥,雒兴刚,蔡灵莎,苑嘉航
申请号:CN202011640409.1
申请日:20201231
公开号:CN112667817A
公开日:
20210416
专利内容由知识产权出版社提供
摘要:本发明涉及数据挖掘及产品技术领域,尤其涉及一种基于赌属性选择的文本情感分类集成系统,包括以下步骤:S1:获取在线文本和对应的情感类别数据;S2:通过对获取的在线文本特征提取,将获取的在线文本转化为特征向量并进行预处理;S3:将预处理后文本的特征向量涉及到的多分类问题转化为一对一问题;S4:对每个一对一问题,计算每个词的信息增益后,使用赌进行特征选择;S5:将进行过特征选择的数据集用于训练分类器,将分类器进行集成;S6:集成后的系统通过聚合策略得到情感类别预测结果。本发明可以有效解决多分类问题模型复杂,难于求解的问题。
申请人:杭州电子科技大学
最强大脑王昱珩老婆地址:310018 浙江省杭州市经济技术开发区白杨街道2号大街1158号
国籍:CN
代理机构:浙江千克知识产权代理有限公司
代理人:周希良
更多信息请下载全文后查看