*本系统功能模块、字段参数,均可结合用户实际业务需求调整,可增可减,以达到最佳业务管理流程的体验!
编号 | 模块名称 | 字段参数 |
1 | 数据采集 | URL、标题、内容、发布时间、作者、点赞数、评论数、网页链接、类别、来源、热度、关键词、原始数据等 |
2 | 数据清洗 | 文本清洗、去除特殊符号、删除重复数据、去除HTML标签、去除停用词、分词等 |
3 | 停用词过滤 | Filter、Stopwords、Whitelist、Blacklist等 |
4 | 词频统计 | 词语、词频、文档频率、TF:IDF值、凝固度、自由度、互信息、主题模型等 |
5 | N | 出现次数、频率排名、高频词组、一致性分数、信息增益等 |
6 | 情感分析 | 情感得分、正面情感、负面情感、中性情感、情感极性、情感强度、关键词、情感词、否定词等 |
7 | 关键词提取 | 关键词、关键短语、热门关键词、权重、标签、文本摘要等 |
8 | 主题模型 | 主题、文档主题分布、关键词、主题相似度、主题聚类等 |
9 | 时间序列分析 | 时间、趋势、周期性、季节性、时间序列模型、季节调整等 |
10 | 实体识别 | 实体、类别、实体关系、命名实体等 |
11 | 数据可视化 | 词云图、柱状图、折线图、散点图、热力图、地理图、饼图等 |
12 | 用户画像分析 | 性别、年龄、地域、兴趣爱好、消费行为、用户分类等 |
13 | 用户评论分析 | 评论内容、评论情感、评论用户、评论时间、点赞数、回复数、评论分类等 |
14 | 网络舆情监测 | 关键词监测、舆情情感、舆情热度、舆情趋势、实时监控等 |
15 | 地域分布分析 | 地域名称、地域人口、地域密度、地域GDP、地域分类等 |
16 | 知识图谱构建 | 实体、属性、关系、图谱可视化、基于知识图谱的问答等 |
17 | 相似性分析 | 相似度计算、余弦相似度、欧氏距离、皮尔逊相关系数等 |
18 | 事件检测与追踪 | 事件名称、事件发生时间、事件关键词、事件热度、事件演化趋势等 |
19 | 分类与聚类 | 分类标签、类别、聚类结果、聚类中心、聚类评估等 |
20 | 异常检测 | 异常数据、异常类型、异常标记、异常性质等 |