产品介绍
飔拓(AInspir)是一套基于大数据的数据挖掘解决方案,构建于分布式系统之上,以机器学习算法和深度学习算法为核心,提供海量大数据的接入、清洗、管理、建模、挖掘、可视化等功能。专注于金融、医疗等行业,进行深度知识挖掘,助力企业洞察潜藏在数据中业务价值。
技术架构
功能特点
- 大数据支持,基于Hadoop和Spark技术,支持海量数据挖掘
- 深度学习支持,支持运行于GPU之上的深度学习算法,大幅提高预测准确度和降低误差率
- 多数据源支持,支持RDBMS、NoSQL、消息队列和文本数据源
- 支持私有云和公有云部署
- MaaS(Model as a Service)支持,模型云端共享,降低建模成本,支持数据的集成接入
- 业务模型,建立行业模型,让客户更关注于业务
- 算法组件化,提供数据源、数据预处理、特征工程、统计分析、机器学习、文本处理六大类型的数据挖掘组件
- GUI模型编排,采用Drag and Drop体验式建模过程
应用领域
产品界面
分布式机器学习平台-首页
分布式机器学习平台-建模组件
分布式机器学习平台-数据管理
1.1 产品特点
支持大数据,基于 Hadoop 和 Spark 技术,支持海量数据挖掘;
支持深度学习,支持运行于 GPU 之上的深度学习算法,大幅度提高预测准确
度和降低误差率;
支持多数据源,支持 RDBMS、 NoSQL、消息队列和文本数据;
支持私有云和公有云部署;
支持 Maas(Model as a Service),模型云端共享,降低建模成本,支持数据
的集成接入;
算法组件化,提供数据源、数据预处理、特征工程、统计分析、机器学习、
文本处理、关联分析、协同过滤、可视化等数据挖掘组件;
GUI 模型编排,采用 Drag and Drop 体验式建模过程。
1.2 名词解释
建模组件:是指构建模型方案时需要用到的各个算法,每个组件独立存在,
各自实现特定的功能;
数据管理:集中管理数据的模块,其中包括导入的数据和保存的数据;
方案管理:集中管理方案的模块,主要用于方案的历史查看、再编辑和复用;
数据集:大量数据导入平台后的简称;
预处理:对数据集进行去重、清洗、值填充等转换操作的简称;
可视化:数据图形化展现。