豪杰文档数据库

产品功能

关系数据存储和处理

完全支持SQL92、SQL99、SQL2003、OLAP等国际标准，高度兼容Postgresql、MySQL语法，90%兼容Oracle语法
数据库接口：ODBC、JDBC、ADO.Net、PEP249、PDO、GO-LIBPQ等
支持标准SQL所有数据类型， INET、CIDR、UUID、IBSN等扩展数据类型，K-V、XML、JSON等半结构数据类型，POINT、CIRCLE、LINE等GIS数据类型，共计100多种
单机500G数据100毫秒以内响应，集群100T数据1秒以内响应
Share Nothing MPP分布式架构，分布式引擎，多种数据分片策略，支持32个计算节点弹性扩展

文档数据存储和处理

文本自然语言处理和文本智能

公文流转和版式文件分页显示

数据安全保护（等保2.0安全四级）

数据存储加密，支持系统文件、表、对象、WAL日志、审计日志等存储加密
数据传输加密，基于GMSSL的传输加密
多重身份认证，支持口令、证书、令牌、APPKEY、应用水印等多重认证方式
细粒度的授权访问，支持基于角色和组的授权访问方式，授权对象支持表、行、列、函数、序列等，粒度达到select、insert、update、delete、execute等
安全标记及强制访问控制，安全标记支持密级（或等级，允许自定义）和范围（例如部门）两种安全标签组合，强制访问控制到表级、列级、行级和单元级
三员管理和多员管理，数据库系统自带三员管理，即系统管理员、安全管理员和安全审计，三员管理按照“最小授权、相互制约”的原则设计，允许定义多员管理，满足不同场景的安全需求
日志审计，支持审计日志策略配置，支持用户审计、对象审计、权限审计、登录审计、结果审计和TCB审计
接入控制，支持黑白名单，支持按IP地址段、MAC地址、登录时间段等多种方式
SQL防火墙，支持SQL规则自学习和SQL注入检测
数据脱敏，支持常用数据类型自动脱敏，支持自定义脱敏规则
数据安全和应用安全统一管理，将数据授权（表、视图、字段、记录）和应用授权（链接、菜单、按钮）统一管理的授权方式，实现数据安全和应用安全有机统一，避免了应用授权和数据授权的脱节

技术指标

核心指标	HeroDB 7c
数据容量	10PB
数据库个数	10000
每个数据库大小	1PB
支持文字检索的图像文档	PDF、JPG、JPEG、TIFF、PNG等几十种常用图像文档；
支持文字检索的视频文档	mp4、avi等十多种常用视频文档（需要配合dbBrain使用）
全文检索	支持入库即可全文检索，达到近实时的水平；支持255个条件组合检索；
ADHOC检索	支持任意字段的组合检索和多表关联检索；支持任意词、词语、语句三种级别的组合检索
语义检索	支持词语级、语句级、文档级的语义相似检索（非检索词硬性检索）；支持文档排重检索；支持文档模糊检索；文档检索结果相关性排序
密表加密方式	整表加密、行加密、列加密
强制访问控制粒度	支持表级、记录级、字段级、记录字段级，支持虚拟私有数据表
密表性能损耗	关系表15%以内，文档库35%以内
密表空间膨胀	5%以内
支持数据类型	除文档类型外，支持数值类型、货币类型、字符类型、二进制数据类型、日期/时间类型、布尔类型、枚举类型、几何类型、网络地址类型、文本搜索类型、UUID类型、xml数据类型、JSON类型、范围类型、对象标识符类型、伪类型、数组类型、复合类型等
支持SQL规范	SQL92/ SQL99/SQL2003/SQL2011核心规范
服务器字符集	utf-8、gbk、unicode等
数据库接口	LIB、ODBC、OLE DB、JDBC、ADO.NET、PEP246、PDO、GO-LIB等
锁和事务隔离级别	MVCC 无锁设计，支持Read uncommitted、Read committed（默认）、Repeatable read、Serializable等四种事务隔离级别
流复制方式	支持同步、异步、半同步
备份恢复	全量备份、定时备份、增量备份；全量恢复、PITR恢复（恢复到时间点）
高可用架构	不依赖第三方软件的情况，支持双机热备、一主多从、读写分离支持数据库虚拟IP，主备秒级切换
并发连接数	600
支持操作系统	麒麟、统信、方德、EulerOS、CentOS、Ubuntu、Windows Server 2012-2020
支持处理器	龙芯、飞腾、申威、海光、Amd64
支持云平台	支持公有/私有/混合云，例如阿里云/腾讯云/青云/金山云/易捷行云/zstack等

典型应用案例

应用1: 等保2.0数据安全保护
应用2: 党政公文流转应用
应用3: 情报与舆情分析
应用4: MongoDB替代
应用5: 档案数字化

面临挑战
- 等保2.0已经开始实施，数据安全是最难解决的环节，如何用较小代价实现等保2.0网络合规？
- 80%的安全问题来自内部，其中最严重的问题是拖库、管理员权限无节制。如何真正实现内部安全防控？
解决方案
- HeroDB兼容主流数据库的语法和字段类型，数据能平滑迁移，应用系统无需二次开发;
- HeroDB安全性对用户透明，不改变用户的使用习惯，同时对于密级与分类细粒度访问控制无需编程即可实现。
客户价值
目前市场上代价较小的等保2.0合规和内部安全防控的解决方案。
应用领域
已应用于政务、军工、央企等各类敏感信息的保护以及等保2.0系统建设。

面临挑战
- 党政公文流转应用面临三个挑战：一是公文为涉密文档，安全性如何有效解决；二是公文的实效性，公文流转如何进行快速高效的流转；三是公文交换，公文交换涉及多系统建设，如何有效杜绝单点故障。
解决方案
- HeroDB 7c安全性高，文档数据、索引均可加密保护，符合等保和分保涉密信息的保护要求;
- HeroDB 7c数据库内置MQ，公文交换实现SQL语句化，跨服务器的公文交换较通用方案部署简单，工作高效，具有大并发量支撑能力，提升公文交换时效性;
- HeroDB 7c实现电子公文授权、流转、传输和交换功能SQL化，开发公文流转应用项目能节省至少30%的工作量，已经被多个政务应用开发厂商选为此类应用的后台数据库。
客户价值
提升公文应用的安全性，降低高效公文流转应用的开发的门槛，缩短开发周期和成本。
应用领域
电子政务、电子公文、办公自动化（OA）等领域。

面临挑战
- 情报与舆情分析涉及海量的图、文、音像、社交媒体等多模态数据存储和处理，背后往往需要多达十来种sql、nosql数据库作为支撑，不仅选型复杂，而且实现繁琐，投入大、周期长，如何解决这个难题？
解决方案
- 首先，该产品能够在一套数据库内存储和处理结构化、半结构化和非结构化数据库，支持事务ACID特性，能解决多种数据库带来的事务、关联、一致性等问题；
- 其次，该产品基于机器学习和深度神经网络，在多模态数据处理功能上十分强大，支持图片文档的OCR识别，音像文档语音识别和字幕识别（需配合dbBrain产品和云服务）；
- 最后，该产品内置的NLP处理引擎，具备较高的文本智能，常用的NLP任务全部SQL语句化，用户的学习和使用成本低，节省大量的开发成本，缩短开发周期；同时，一种数据库相比十多种数据库来说，部署简单，维护方便。
客户价值
情报数据的安全性，降低情报分析、舆情分析等这种复杂应用的开发的门槛，缩短开发周期和成本。
应用领域
政务、安全、档案、金融、传媒等领域。

面临挑战
- 目前，使用量最大的文档数据库为MongoDB，开源的MongoDB存在安全性差（容易被拖库和勒索）、企业版收费等问题，MongoDB的如何替代？
解决方案
- 首先，该产品功能上与mongodb相似，支持海量文档的存储和管理，具有很好的弹性扩展能力。HeroDB 7c在下面两个方面比mongodb有较大的优势：
- 其次，HeroDB 7c遵循原文入库、原文存储和原型格式显示的原则，不需要预处理、内容提取和Json格式封装，使用上更加符合文档操作的习惯；同时，采用的SQL语句化操作，有别于mongodb的JSON API 访问机制，学习成本比较低，上手使用容易；
- 最后，HeroDB 7c达到国标四级的安全性，内置NLP处理引擎，支持NLP处理和机器学习，这些功能mongodb都无法具备。
客户价值
为用户提供增值的mongodb的替代方案，保障用户利益的长远发展。
应用领域
适用于使用mongodb的所有领域，适用于mongodb的国产化低成本替代

面临挑战
- 档案的数字化多数停留在档案的管理和借阅层次，对档案价值没有很好地利用起来，尤其是涉密档案，档案资料的查询、检索、分析和利用的安全性难以保障，同时档案系统均为固定模式，二次改造建设周期长，如何提供安全性高且快速的数字档案方案？
解决方案
客户价值
降低档案数字化的成本，解决档案的数字化之后的价值挖掘的难题。
应用领域
各级档案部门、科研院所。

豪杰文档数据库-HeroDB 7c

高安全性+人工智能
国产文档数据库(原CgrsDB)

产品介绍

产品功能

关系数据存储和处理

文档数据存储和处理

文本自然语言处理和文本智能

公文流转和版式文件分页显示

数据安全保护（等保2.0安全四级）

技术指标

特点优势

高安全等级

原文处理

文本智能

金融级高可用

典型应用案例

产品咨询

微信公众号

咨询客服

豪杰文档数据库-HeroDB 7c

高安全性+人工智能国产文档数据库(原CgrsDB)

产品介绍

产品功能

关系数据存储和处理

文档数据存储和处理

文本自然语言处理和文本智能

公文流转和版式文件分页显示

数据安全保护（等保2.0安全四级）

技术指标

特点优势

高安全等级

原文处理

文本智能

金融级高可用

典型应用案例

产品咨询

微信公众号

咨询客服

高安全性+人工智能
国产文档数据库(原CgrsDB)