详情
主要功能
智能创作,数据脱敏,图文提取,文件概览,内容提取,文档库
详情

一 概述

产品背景

随着经济的高速发展,以习近平同志为核心的党中央高度重视数字化发展,明确提出数字中国战略。党的十九届五中全会通过的《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》,明确提出要“加快数字化发展”,并对此作出了系统部署。数字经济、数字社会、数字政府,是数字化发展的重要组成部分,三者互为支撑、彼此渗透、相互交融。而企业数字化重要的是企业内容数字化管理与应用。

企业内容数据量的飞速增长带来了大数据技术和服务市场的繁荣发展,也给企业信息管理提出了日益严峻的挑战。以传统方式进行企业内容的管理和使用已经不能满足当前各企业的需求。基于当前网络化基础设施建设的兴起,亟需适合当代企业发展水平的信息化工具和高效制度来建立新的管理体系。面对新形势,企业管理者应当采取积极主动的整体战略,认真规划企业内容管理系统的建设,深度挖掘文档资源的价值,研究与探索信息化背景下企业文档利用服务的新模式,才能高效管理企业内容,并利用内容提升实现商业收益。

依据党和国家“数字化”发展的要求,结合企业分析实际工作,以“完善管理措施、提高工作效率、加强资源共享”为目标,提高企业数字资产管理和应用能力,推出了全新的橙文档。结合文档相关工作分类整理、全文检索智能创作数据脱敏等核心技术,一站式为企业赋能,解决企业数字宝藏“重保管,轻利用”的现状,提高企业全体员工工作效率,降本增效,为高效便捷地利用文档提供了有利条件,使单位数字资产可以更充分地发挥自身价值助力企业实现数智经济。

产品定位

橙文档是一个专注于文档智能处理和应用的AI能力平台。

该平台运用自然语言处理、大数据及全文检索技术实现对文档内容智能分析和处理擅长对非结构化、多格式文件的集中管理,在性能上达到百万文档、全文搜索、毫秒响应;

平台帮助军工科研单位、政府企业管理类型繁多、存量巨大的文档建立文档库、专题库知识图谱同时提供智能创作、智能摘要、图文提取、信息脱敏、内容溯源等海量的智能应用,提升用户在文案撰写、审查纠错、信息安全防护等文档处理方面的工作效率。

 

二 产品主要功能

橙文档分为前台应用和后台管理两个模块,前台应用模块主要包括页、文档库、智慧应用三部分,支持用户对文档进行智能搜索和智慧应用;后台管理包括文件管理和用户管理两部分,支持管理人员对平台内的文件和平台用户进行智慧管理。

前台应用功能

1.1 

页提供文档快搜功能,支持输入关键词对平台内的文档进行快速搜索;支持查看、下载多的热门文档、新上传的文档和系统推荐文档;支持从页快速进入智慧应用模块。image.png

 

1.2 文档库

文档库实现海量文件、百余种格式文件便捷汇聚,帮助政府、科研单位及企业构建自己私有化的“百度”文库,实现各类文件集约化、科学化、智能化管理及使用。image.png

 

Ø 支持根据关键词进行快速查询;

Ø 支持根据关键词及相关同义词进行模糊查询,同时会对错误拼写进行提示修正;

Ø 支持以知识标签体系的关键词扩展联想检索;

Ø 支持对文档相关的各式附件,进行全文搜索,例如Office系列文件、PDFHTML等;

Ø 支持布尔逻辑的组合检索,可通过文件名、文件内容、文件修改时间、文件大小进行搜索。image.png

 

Ø 支持通过文件分类、文件标签进行文件筛选;image.png

 

Ø 支持查看搜索相关结果文件数量、搜索用时;

Ø 支持搜索结果按照文件匹配度、时间进行排序;

Ø 支持对搜索结果中的文件进行更新/上传时间查看和文件大小查看;image.png

 

Ø 支持对文档进行文档预览、文档摘要、关键词命中、文档全文查看;

Ø 支持对jpgpnggif等主流图片文件、doc(x)xls(x)ppt(x)pdf等多种主流格式文件、htmlxml等格式的在线预览。

Ø 文档摘要支持对摘要信息、关键词频、词云进行查看;

Ø 支持对搜索结果中的文件进行下载;image.png

 

1.3 智慧应用

1.3.1 智能创作

智能创作只需进行选(目录)、搜(素材)创(作),简单三步即可轻松完成文案编撰,可用于写公文、写标书、写论文、写合同、写方案等方面,实现一步完成素材搜索,过程智能精准,结果直观可见,拒绝文不对题。与传统的创作方式相比,智能创作效率提升70%以上节约人力成本40%以上image.png

 

Ø 支持根据关键词进行素材搜索;

Ø 支持查看搜索历史;

Ø 支持按照目录筛选素材;

Ø 支持对素材进行一键插入;

Ø 支持为创作文档创建标题;

Ø 支持对创作文档进行实时编辑,支持对插入素材进行一键删除。

1.3.2 数据脱敏

数据脱敏是指将文本或文件中的敏感信息识别出来,再将敏感信息进行修改,然后按照文本或文件原格式导出就能得到脱去敏感信息的文件。数据脱敏可对单位敏感数字资产进行保护。image.png

 

Ø 支持批量上传文件;

Ø 支持对txt、ppt、pptx、doc、docx、xls、xlsx格式文件进行脱敏;

 

Ø 支持以柱状图形式查看上传文件中敏感信息数量;

Ø 批量上传时,支持查看单个文件中敏感信息数量;

Ø 支持任意文本,可对指定关键词、正则表达式、身份证号、银行卡号、姓名、组织名、公司名、时间、地址等进行脱敏;

Ø 支持设置脱敏规则,脱敏规则支持全遮蔽、部分遮蔽、替换(姓名改为张三);

Ø 支持遮蔽脱敏或者保格式脱敏两种脱敏规则;

 

Ø 支持查看脱敏后文件和原文件的对比;

Ø 支持以饼状图查看脱敏信息比例分布;

Ø 支持以原文件格式一键导出脱敏文件,不改变字体、字号、排版等样式。

 

1.3.3 图文提取

可对扫描或拍照文件(例如PDFJPG)进行文字识别,通过检测暗、亮的模式确定其形状,针对印刷体字符,采用光学的方式将文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。图文提取支持从各类图片中,提取图片上的所有文字,图文提取准确率高达99%。image.png

 

Ø 支持jpgpngbmppdfemf等格式文件的文字提取;

Ø 支持查看提取后的文字内容与原文件;

Ø 支持对提取出的文字进行复制,支持将提取出的文字以Word格式导出;

Ø 支持在提取出的文字全文中进行关键词搜索。

1.3.4 文件概览

对于成百上千页的文件人工查看起来非常耗时耗力,可通过文件概览功能快速提取、分析文件的关键内容,总结出文档摘要和关键词使文件内容一目了然,帮助用户快速了解文件内容。image.png

 

Ø 支持对doc、docx、pdf格式文件进行文件概览;

Ø 支持批量文件概览;

Ø 支持查看文档摘要、文档关键词;

Ø 支持对文档摘要进行一键复制,支持将摘要以Word格式一键导出;

Ø 支持对文件进行关键词搜索。

1.3.5 内容溯源

上传文档内容或者文档,通过文档溯源可快速寻找内容“出处”,不需要用户再从以往的文件夹中一一翻看文档内容,极大的节省了用户查找内容的时间。

 

Ø 支持上传文件或者输入内容进行内容溯源;

Ø 支持根据内容相似度进行内容搜索;

Ø 对于搜索出的文件支持查看文件分类、分类标签、更新时间、相似度;

Ø 支持对搜索出的文件进行下载。

1.3.6 内容提取

通过上传文件(支持上传任意文档格式文件)、图片、扫描件等,系统可快速从上传或输入的文本、表格中快速提取身份证号、地址、人名、电话号等信息,帮助用户快速提取所需内容。

 

Ø 支持上传文件或者输入文本;

Ø 支持上传任意文档格式文件;

Ø 支持提取身份证、地址、银行卡、人名、电话号码、表格等内容;

Ø 支持查看提取后的内容。

后台管理功能

2.1 文件管理

2.1.1 文件管理

文件管理可对平台内的文件进行上传、更新、下载、移动、删除等操作,可对管理权限内的文件进行管理。image.png

 

Ø 支持上传文件;

Ø 支持根据关键词和上传时间进行文件搜索;

Ø 支持根据文件分类进行文件管理;

Ø 支持查看个人权限内的所有文件,可查看文件名、文件格式、文件大小、上传人、上传时间等信息,并可对文件进行下载、更新、移动、删除等操作;

Ø 支持修改文件名;

 

Ø 支持点击文件名对文件进行查看,可进行文件预览和文件全文查看;

Ø 可查看文件上传人、更新时间、文件分类、文件大小、文件阅读量和下载量。

 

2.1.2 文件分类

文件分类是指对平台内的文件进行分类管理,方便用户对文件进行分类查看,浏览文件更加直观。image.png

 

Ø 支持添加新的分类,并可设置分类名称、访问权限、操作权限;

 

Ø 支持在一级分类下添加二级分类,并可设置访问权限和操作权限;

Ø 支持编辑文件分类,可修改分类名称、访问权限、操作权限;

Ø 支持删除文件分类。

2.1.3 文件标签

文件标签是指对根据文件内容属性赋予文件相关的标签,根据标签进行文件管理和筛选。

 

Ø 支持按照标签名称或者标签启用状态进行标签查询;

Ø 支持添加新的标签,可设置标签名称、标签关键词、标签图标;

 

Ø 支持文件标签选择启用或者禁用的状态模式;

Ø 支持在一级标签下添加二级标签;

Ø 支持对标签进行编辑,可修改标签名称、标签关键词、标签图标;

Ø 支持删除标签。

2.1.4 文件类型

文件类型可对文件进行文档类、音频类、图片类、视频类等分类型管理,方便文件查询。

 

Ø 支持按照文件类型名称或者类型状态进行查询;

Ø 支持添加新的文件类型,可设置类型名称、类型扩展名、标签图标;

 

Ø 支持文件类型选择启用或者禁用的状态模式;

Ø 支持对文件类型进行编辑,可修改类型名称、类型扩展名、标签图标;

Ø 支持删除文件类型。

 

2.2 用户管理

2.2.1 用户列表

    image.png

Ø 支持根据用户姓名、手机号、用户组、用户状态进行查询;

Ø 支持添加新用户,可设置用户手机号、用户组、所属部门等;

Ø 支持查看用户详情,包括ID、所属部门、姓名、手机号、所属用户组、注册时间、上传文件数等信息;

Ø 支持编辑用户资料,可修改用户组、姓名、所属部门、启用状态等;

Ø 支持查看用户操作日志。

 

2.2.2 用户组

 

Ø 支持根据用户名称和启用状态进行查询;

Ø 支持编辑用户组的权限;

Ø 支持添加新的用户组,可设置用户组名称和用户组权限。

 

2.2.3 部门管理

部门管理可根据公司架构进行部门设置,在平台内依据公司部门对用户进行管理。在新建用户时可为用户选择所属部门,将平台管理与现实管理接轨,使用户管理更加简单方便,逻辑清晰。

 

 

三 系统支撑功能

单点登录

支持与院门户集成,支持全院所有员工使用,采用用户名、密码、验证码方式登录,可在后台设置IP地址绑定等安全性更高的登陆管控。如有快速访问功能的要求,可指定默认用户登录,默认情况下,自动按此用户登录系统。无法登录时支持忘记密码,用户登陆后可修改个人信息和密码。

部门管理

支持多10级深度的用户组织架构,采用图形化树形结构管理,可在任意节点增加、删除、修改内容,每一级组织结构下,均可选择用户归属。节点数据大100000个,每节点支持大100000个用户。

用户管理

通过新增用户来赋予该用户扮演的角色,然后通过权限控制来实现对账号的管控,该用户所在的部门也能清晰的展现出来,新增的用户信息可以点击详情进行查看,也可以对该用户进行停用和启用等状态。还可以对所有的用户角色进行删除等操作。

1)登录管理:实现系统用户安全登录、登出以及角色操作控制,修改密码等等;

2)单点用户登录:账号只能担任登录,文件作业记录保密;

3)单点登录:实现单点登录,多功能切换无需重复登录;

4)超时登出:15分钟无界面操作账号自动退出;

5)三权分立:系统管理员、系统安全员、用户之前各司其职,实现对用户管理、安全控制、应用使用的三方控制,系统管理员实现系统角色的添加、删除,安全员实现角色具体权限的分配与修改,用户自己访问文档与作业;

权限管理

提供系统级、功能级、数据级三种不同级别的用户角色权限,具备角色的定义、添加、删除、编辑等功能。可单赋予管理员用户管理权限。对目前系统中所有的用户角色赋予权限等操作,针对权限还可以进行修改,查看,编辑等操作。

四 、系统优势

全国产支持

基于自研核心,平台支持Windows及国产化操作系统。

多细节支持

平台目前支持1000余种格式及小版本的内容分析,包括Office Word、PPT、Excel、Visio,WPS,PDF、RAR、ZIP、DWG、HTML、TXT、BMP、JPEG等主流文档,并支持基于文档结构深入解析的文档冗余信息提取、嵌入信息提取等功能,实现文档内容深度提取。配合OCR可实现图片、扫描件PDF内容识别提取。

超高效表现

平台单服务器可支持文档高效检索,毫秒响应。文档解析提取速度高达10GB/分钟,

高智能表现

智能理解文档语义,关键词、规则精准匹配,少误报

结合上下文语境,浓缩精华内容,实现价值汇聚