爱游戏平台官网入口
联系我们
联系方式
人才招聘
在线留言
政策解读
案例分析
典型客户
案例解读
监理
咨询
测评
荣誉资质
公司资质
公司荣誉
新闻资讯
公司新闻
行业动态
技术服务
信息化监理
咨询设计
软件测评
等保测评
风险评估
源代码安全审计
渗透测试
关于我们
公司简介
发展历程
组织架构
企业文化
公司活动
公司庆典
员工文选
网站首页
c
ase analysis
案例分析
典型客户
案例解读
监理
咨询
测评
联系我们
contact us
联系人:宋经理
座 机:028-86677012
邮 箱:songp@cdjxcm.com
地 址:成都市武侯区长华路19号万科汇智中心30楼
咨询
您当前位置:
首页
>
案例分析
>
案例解读
>
咨询
>
大数据方案对比
大数据(bigdata),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
基本特征可以用4个V来总结(Volume、Variety、Value和Velocity),即体量大、多样性、价值密度低、速度快。
一,数据体量巨大。从TB级别,跃升到PB级别。
******,数据类型繁多,如网络日志、视频、图片、地理位置信息等。
第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。
第四,处理速度快。1秒定律。这一点也是和传统的数据挖掘技术有着本质的不同。
本文将介绍三家厂商的大数据技术:阿里大数据、oracle大数据、第三方大数据。
1 阿里大数据
1.1 特点与架构
阿里大数据(大规模计算)是阿里云环境下的模块之一,阿里云主要模块有:弹性计算、数据库、存储于CDN、网络、互联网中间件、大规模计算等。与传统大数据部署方式不同的是更加关注上层应用的建设,对于下层支持平台,只有服务器、交换机等,其他功能全部运用技术方式实现,这样***对于大数据建设来说,“轻资产,重应用”。
图1 阿里大数据平台“数加”
1.1 阿里大数据生产链条
产品覆盖数据采集、计算引擎、数据加工、数据分析、机器学习、数据应用等数据生产链条。
图2 数据生产全链条
1.1.1 数据采集
Datahub是“数加”上的一款数据采集产品,可为用户提供实时数据的发布和订阅功能。写入的数据可直接进行流式数据处理,也可参与后续的离线作业计算。Datahub同主流插件和客户端保持高度兼容。
1.1.2 计算引擎
大数据计算服务MaxCompute(原ODPS)、分析型数据库Analytic DB、流计算StreamCompute共同组成了底层强大的计算引擎。
分析型数据库可实现对数据的实时多维分析。
流计算擅长对实时流式数据进行分析,具有低延时、高性能的特点。每秒查询率可以达到*********,日均处理万亿条消息、PB量级的数据。
1.1.3 数据加工
计算引擎之上,“数加”提供了丰富的云端数据开发套件,*********可一站式完成数据加工。这些产品包含:数据集成、数据开发、调度系统、数据管理、运维视屏、数据质量、任务监控。
大数据开发套件的优势包括:支持100人以上协同设计、开发、运维;具有良好的扩展性;提供各个产品功能模块的Open API,可二次开发;多个数据实例之间的数据授权机制,确保数据只能使用却不可见;提供白屏化的运维能力,以及字段级数据质量监控、机器预警、资源使用率监控等功能,让用户更好的掌控自己的数据及数据任务。
1.1.4 数据分析:
在数据分析方面,数加提供了3款产品供*********使用:
1、通过移动数据分析产品,*********可快速搭建日志采集、分析系统,从而为用户提供个性化服务;
2、通过数加BI报表产品,3分钟即可完成海量数据的分析报告。产品支持多种云数据源,提供近20种可视化效果。
3、通过数据可视化产品DataV,一星期***能做出双11同款大屏。这款产品,曾支持了阿里巴巴多年的双11、双12作战指挥。
同时,基于DataV,数加还发布了面向政府的行业应用产品“郡县图治”。通过这款产品,县长可以在一个屏幕下统览全县各项经济民生数据,为政府决策提供辅助。
1.1.5 机器学习:
对于时下大热的机器学习,数加更是提供了全面支持。“数加”发布的机器学习工具,可基于海量数据实现对用户行为、行业走势、天气、交通等的预测。图形化编程让用户无需编码、只需用鼠标拖拽标准化组件即可完成开发。产品还集成了阿里巴巴核心算法库,包括特征工程、大规模机器学习、深度学习等。
1.1.6 数据应用:
为了能够帮助*********更快捷在应用中集成大数据功能,“数加”同时提供了规则引擎、推荐引擎、文字识别、智能语音交互等数据应用产品。
规则引擎是一款用于解决业务规则频繁变化的在线服务,可通过简单组合预定义的条件因子编写业务规则,并做出业务决策。比如,银行会设置如果10分钟内用户在两个省份交易,则需要电话确认。
推荐引擎是一款用于实时预测用户对物品偏好的数据工具,它能够帮助客户发现众多物品中用户感兴趣什么。
文字识别提供自然场景下拍摄的图片中英文文字检测、识别以及常见的证件类检测和识别。
智能语音交互基于语音和自然语言技术构建的在线服务,为智能手机,智能电视以及物联网等产品提供“能听、会说、懂你”式的智能人机交互体验。
2.2针对高法的解决方案
2.2.1 高法解决方案技术框架
1、采用私有云方式建设
2、在政法网内部部署阿里ODPS一体机,共包含10台服务器,其中7台管控节点,3台计算节点。本部分预算250万。其中计算节点可以扩容。
3、阿里云一体机已包含ODPS大数据处理平台,费用已包含在内。
4、ODPS大数据平台可部署阿里数据抽取工具,在各数据库抽取数据,并实现规范化。ETL抽取工具的预算100万。
5、以此为基础,以阿里为主题,期做相似案件分析的应用,可快速出成绩。本部分预算100万。
6、引入ISV,并进行算法的持续的开发和合作。
2.2.2 解决方案特点
1、部署要求是须购买阿里云服务,数据处理方式“黑盒模式”。
2、数据标准化与后续的算法应用基于同一平台,可持续演进。
3、ODPS支持多租户,可面向各业务处室开展应用开发。
4、在算法领域持续******,快速出成效。
5、在法务部和电子政务执法领域可展开深入合作。
2 oracle大数据
2.1 特点与架构
传统业务数据为主,商业化服务支持,简化架构,更多精力在业务层面,部署模式比较灵活。
2.2 针对高法的解决方案
部署内容:
ODI/OGG( Oracle Data Integrator)
提供实时/批量大数据收集工具;
Oracle NoSQL 数据库
分布式的、高可扩展性的键-值数据库;
Oracle大数据一体机-完整的Hadoop平台
大数据一体机(200万);
Oracle Big Data SQL实现跨平台统一数据访问;
提供大量的分析工具;
Big Data Discovery:Hadoop的可视化和探索工具
不需要进行建模即可以交互式访问和探索;
BIEE/DV
Oracle BIEE是一个非常有创造力的工具,它对于物理层,逻辑层,展现层的理解和定义创造了一个非常简洁而清晰的数据模型,使用这个数据模型可以完整地连接企业内各个异构数据源,从而使商业智能真正能够在企业范围内得到大规模部署和使用。
3 第三方大数据
3.1 特点与框架
以开源架构模式进行大数据整体框架的架构。
3.2 针对高法的解决方案
建设内容:数据实时汇集平台、数据中心改造升级、数据综合管理系统、大数据主题应用数据仓库、大数据基础支撑平台、大数据应用工具箱系统、大数据可视化平台。
3.2.1 数据实时汇集平台
对分散在各业务系统ORACLE数据库的信息进行实时、准实时、定时的复制。复制的数据将统一汇总进入原数据中心数据库。
3.2.2 中心基础数据库
原有数据架构形成一个数据汇集层,用于承载业务系统的数据。
3.2.3 数据综合管理系统
该系统包含的核心内容之一为在业务系统数据库中设置数据校验层,从根本上解决建设目标中的数据质量问题。
3.2.4 大数据主题应用数据库
大数据主题应用数据库是原数据中心数据库的升华,通过分析、清理、归类等形成面向不同应用主题的、不同纬度的数据。
3.2.5 大数据基础支撑平台
数据支撑平台采用基于Hadoop、Spark架构的大数据体系架构,为商业化封装版本产品。其核心分为三个部份建设工作:存储部分、分布式计算查询部份、算法工作流部分。
3.2.6 大数据应用工具箱系统
大数据核心价值具现化的载体,通过交互式查询接口实现大数据MPP主题应用数据库的访问,通过算法工作流接口实现大数据非结构化数据的访问和计算。
3.2.7 大数据可视化平台
智能分析的成果可视化展示平台工具。
4 综合对比结果
阿里大数据是基于互联网模式,数据以非结构化、新数据为主,适用于公有云服务。
oracle大数据是以传统业务数据为主,数据以结构化为主。
第三方大数据则以******数据质量为前提,通过一种新的设计模式,来强化大数据的应用展示。
咨询中心 潘存利 供稿
上一篇:
数字化校园介绍
下一篇:
浅谈快速功能点方法的一般流程
XML 地图