亿橙NLP智能分析平台

为中航、中船、中电、中科院等旗下几十家单位,解决了智能情报关联分析、数据安全智能检测的问题,极大的降低了人工的工作量。

平台介绍

技术框架图

平台简介

亿橙NLP内容分析平台基于我们十七年在情报分析、文献挖掘领域积累的训练样本和算法模型,从内容提取阶段,到词句分析、机器阅读理解提供内容分析全流程的技术服务。

优势特点

1、高效内容提取

平台目前支持400余种格式及小版本的内容提取,包括Office word、ppt、excel、Visio,WPS,PDF、RAR、ZIP、DWG、HTML、TXT、BMP、JPEG等上百种主流文档,并支持基于文档结构深入解析的文档冗余信息提取、嵌入信息提取等功能,实现文档类型伪装的准确检查。解析提取速度高达10GB/分钟,配合OCR可实现图片、视频内容提取。

2、智能内容理解

基于行业的语料数据、规则库和模型库,利用大数据平台和自学习平台,为文件(文本)安全检测的全过程提供解析支撑和全程智能辅助提醒,提升检查效率,提高准确率。通过NLP(自然语言处理)、文本相似度、多语言支持组件为文本的字、词、句、段落提供分析API支撑,结合上下文,使机器阅读理解文本内容。

3、关键词精准匹配

基于自研的NLP关键词比对算法,软件为用户提供高性能、高精准的文件检查保障,10W+关键词毫秒级完成比对。