数据产品是中心自主或与相关科研机构共同开发的发改领域专业模型产品,是特定领域、高频使用的数据挖掘和统计分析工具组。产品涉及经济、人口、产业、信用等各方面专用高频模型。我们将风险预警、宏观预测、政策推演等特定领域、高频使用的算法固化为专用模型工具,形成标准化建模流程,为决策提供数据支撑。

文本分析观点抽取模型

模型描述

运用Albert模型提取文本特征,以及下游任务框架Seq2Seq+Attention对标签进行抽取,通过多标签分类方法对评价文本中的观点/建议问题进行抽取。

解决问题

1、解决数据量较少时传统聚类方法数据准备困难和精度不高的缺点;

2、一定程度上解决了文本多分类精度不高的问题,提供了一个具有较高精确度和可泛化通用性的模型。

优缺点

优点:该方法具有较高的准确率和召回率,相较其他多标签文本分类方法具有更高的精度;

缺点:推理速度相较其他方法稍慢。

迭代目标

在单一模型的基础上,纵向运用情感分类模型,提高观点抽取模型的精度;增加自动化生成分析报告的功能。

关联需求

-

存在困难、问题

-