网络舆情监控系统
分为前台展示和后台系统两大部分,前台展示包括监控大屏界面、新闻列表和展示、舆情趋势展示、新闻来源统计等;后台主要包括舆情采集、 舆情展示、 舆情分析、舆情专题、 舆情预警和系统管理等。
监控大屏(日常)
监控大屏(突发预警)
信息列表
负面信息列表
信息来源总览
舆情趋势
数据采集子系统
负责对信息源头采集,采集子系统主要实现多线程、分布式采集模式。满足项目采集深度和广度要求,采集深度按照需求可采集到门户网站、论坛、贴吧、社区、搜索引擎、跟帖评论等。
采集广度本系统提供通用采集配置,支持大部分新闻、论坛的采集,只需要配置 URL即可实现采集。采集性能可以灵活配置策略,分为指定调度和随机调度两个模式。采集时效性可以定制。
舆情内容预处理
按照系统制定的数据规范对数据进行标准化和规范化处理,包括链接分析、编码识别、错误内容处理、发布时间提取、关键字提取、自然语言处理、内容去重等。
舆情分析引擎
舆情分析引擎基于分布式Hadoop和Spark,应用Spark MLLib提供舆情过滤、舆情重排、转载分析、内容分类/聚类、自然语言处理、舆情研判和倾向性分析等功能。
舆情服务应用
舆情服务应用提供用户直接的舆情功能应用,提供包括舆情门户、舆情预警、舆情监测、舆情分类、舆情趋势分析、舆情工作台等各类功能模块。