TRS DL-CKM 基于深度学习的自然语言处理引擎

2020  02/18

解决方案的内容


场景描述

专题分析,即专题事件分析,与专题库服务对新闻稿件进行深度挖掘,以为新闻业务人员提供模块化、自动化、开放化的专题分析与展现工具为目的,通过对机构(特别是媒体)内外资源的全面聚合分析,实现专题选题的还原与挖掘、全生命周期式的多维度分析、专题产品快速定制与专题的全量存储和管理。

产品使用
以TRS DL-CKM为基础开发的专题分析系统,对专题数据集进行数据分析,包括关键词分析、时间轴分析、相关地域分析、相关人物分析、各方言论分析等。专题分析的结果保存到快照库中,用户访问时,实际上是访问的最新的分析快照,这样做可以提高访问速度,增强用户体验。

image.png


应用成效

在新华社相关项目中,TRS DL-CKM专题分析系统支持其历史稿件进行周期性的挖掘整理,并进行自动汇聚,从而达到发现话题、分析话题并制作成专题的目的。


TRS DL-CKM在分析真实文本中的各种错误表现形式及其成因的基础上,有针对性地建立面向文本错误侦测的知识库。

面向字词级错误侦测的
词语知识库构建

面向句法级错误侦测的
规则知识库构建

面向语义级错误侦测的
语义搭配知识库构建

面向错误定位与纠错建议生成的
纠错知识库构建

image.png

图像分类检索已应用于新华社图片搜索、专利局图像查重和外观检索等领域,并取得了极好的效果。其中,新华社图片搜索是监控新闻图片的分享、转载等操作,追踪实时热点和关键新闻;专利局图像查重是对新提交的专利进行图像比对,检查提交专利是否与现有专利冲突,辅助专利审批工作;专利局外观检索,是利用专利附图进行专利检索、分类和筛选,管理并完善专利信息库。


以TRS DL-CKM为核心的知识图谱构建解决方案,是基于行业数据的再加工,包括关系数据库中的结构化数据、文本或 XML 中的非结构化或半结构化数据、领域本体知识以及外部知识,通过自然语言处理技术(TRS DL-CKM)中各种数据挖掘、信息抽取和知识融合等技术,构建统一的行业知识库。

image.png

热门评论
发布评论

登录 后发表评论