网站首页 > 产品介绍 > 大数据应用产品

大数据应用产品

2017-01-03 15:10:02 广东广业开元科技有限公司 阅读

广业开元的数据应用产品包括:数据采集、数据融合、数据建模和数据智能,详细介绍如下:


1.数据采集

概述

全面覆盖网页、论坛等互联网渠道以及ERP, CRM等外部接口,可灵活接入多种数据源,提供实时、连续、分布式数据采集,输出多种格式的可自定义调整的数据文件,高效备齐客户所需的数据,满足客户多样的业务场景需求。

数据采集.jpg


功能

①支持多种数据源:支持文本文档、Excel、PDF、音频、主流的关系型数据库,各种接口以及云服务。

②分布式并行任务:支持多个独立的任务并行执行,并可在监控模块上进行统一管理,管理任务运行状态。

③自动化异常恢复:通过日志、故障处理等手段,保证系统运行的可靠性与安全性,出现报错时,可恢复系统运行,支持断点续传。

④敏捷的配置工具:提供字段、文件格式自定义配置功能,充分满足不同的数据输出需求。


2.数据融合

概述

本产品提供数据转换和数据清洗功能,包含数据抽取、数据转换、数据转载的过程,实现将分散的数据库中的数据合并到统一的数据库中。

数据融合.jpg


功能

①数据源的导入:包含常见的数据源,如文本,表格,关系型数据库等。

②数据的清洗:去除无效值,偏离值等。

③数据关联分析:提供数据的关联关系分析,合并相关程度高的数据项以降低数据维度。

④数据归一化转换:按照约定的格式、范围和结构对数据进行标准化和归一化转换,以便后续的数据挖掘分析算法调用。

⑤标准数据调用接口: 接口输出的数据须符合各个数据挖掘和机器学习算法的数据输入规范。


3.数据建模

概述

本产品运用经清洗转换的标准数据作为数据分析挖掘算法的输入,提供与数据接口兼容的数据分析挖掘算法和机器学习算法模块,实现预测模型、聚类模型、分类模型以及关联规则模型,能够高效地解决用户海量数据计算问题。

数据建模.jpg


功能

①多种数据分析模型:支持预测模型、聚类模型、分类模型及关联规则模型的实现,深入洞悉数据规律,充分发掘数据价值。

②支持多种校验逻辑:提供字段级、表级、表间的校验,可校验每个层级内的数据关联关系。

③高性能计算能力:基于分布式并行处理,数据分段算法等技术手段,极大地提升了计算效率,提升了整体效能。

④数据版本管理:提供数据的版本管理功能,记录了数据的变更操作,确保了数据的质量,保证后续使用数据的权威性和可靠性。


4 数据智能

概述

本产品是针对海量数据平台提供的分布式智能分析引擎,主要方向为机器学习与人工智能。数据智能产品依托分布式数据处理能力,支撑快速处理海量数据,让预期结果准确、及时、有效。


数据智能.jpg


功能

①完整的解决方案支持:提供风险分析、精准推荐、故障检测、智能控制在内的多个行业解决方案,使得用户可以基于数据智能产品快速地基于自身业务系统构建解决方案。

②强大的计算能力:可处理PB级的数据,数据处理过程高速、稳定,适用于银行、税务、政务、交通等数据量巨大的机构/单位。

③智能分析:提供图像识别、文本分析、音频分析等强大功能,集语义解析、意图识别等功能于一体, 让应用具备理解能力。


广业开元 版权所有 2015-2016 粤ICP备16011930号-1

广州市天河区珠江新城金穗路1号邦华环球广场

商务合作:business@ggkbigdata.com

招     聘:hr@ggkbigdata.com