提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|行业资讯|编辑:陈俊吉|2016-07-12 10:14:35.000|阅读 503 次
概述:从NoSQL到NewSQL,新技术的发展极大拓展了数据查询的应用场景:支持半结构化数据(JOSON)、非结构化数据的高效率读写和查询等。而在此过程中经典的SQL技术仍旧在发挥着无可替代的作用,在Hadoop的世界中也必将占据一席之地。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
相关链接:
从NoSQL到NewSQL,新技术的发展极大拓展了数据查询的应用场景:支持半结构化数据(JOSON)、非结构化数据的高效率读写和查询等。而在此过程中经典的SQL技术仍旧在发挥着无可替代的作用,在Hadoop的世界中也必将占据一席之地。
作为传统的RMDBS核心厂商之一,IBM也一直努力将SQL带入的世界,这就是BigSQL。最初版本中BigSQL是做为SQL到MR的转换引擎出现的,可以把复杂的SQL语句转换成MR作业运行。这种方式还只是适合对大量数据进行批量处理,并不能满足对数据的随需查询和秒级的查询响应时间要求。
从BigSQL3.0 开始, IBM结合自己在数据库领域长期的技术积累,把MPP相关技术带入的世界,从而为SQL on Hadoop带来真正的提升:BigSQL根据数据在HDFS中的分布,将查询任务下压至不同的Worker节点;在此过程中,引入众多成熟的SQL优化技术,包括SQL语句重写、查询谓词下压、基于统计信息和成本估计的优化策略等,解决执行路径优化等难题,确保数据查询的性能。仅在执行路径优化方面应用到的技术就包括:
数据处理顺序的优化技术:
- 根据统计信息决定查询谓词的执行顺序
- 根据数据分布情况优化关联查询次序
- 优化数据聚合策略(如每个节点先部分聚合后再汇总等)
数据表关联的优化技术:
- 表嵌套关联
- 排序合并关联
- 哈希关联
数据位置相关的优化技术:
- 并行运算
- 广播关联数据表
- 联邦查询中操作下推和函数转换等
BigSQL执行引擎根据实际情况综合考虑最终的执行路径。下图可以感受下BigSQL执行过程中应用到的多种SQL优化技术:
除了引入MPP架构来优化上的SQL引擎外,BigSQL还有众多闪光的亮点:
BigSQL全面支持SQL 2011标准,提供如表关联、嵌套语句、函数、表操作表达式、group by, union等SQL操作,还提供对存储过程、自定义函数的支持,可以无缝衔接传统的SQL查询应用,如BI系统等。下图展示了BigSQL的部分SQL能力:
BigSQL可以支持多种数据源,包括HDFS、HBASE、HIVE、外部数据源等,对数据源和数据格式的支持是完全开放的。
BigSQL完美的集成了DSM,其Web图形化界面提供从监视、开发、到管理的各项服务,可以完成监视语句执行状态、开发查询应用、开发存储过程和管理查询服务等各项任务。如下图中的SQL编辑器支持在线执行SQL语句并查看结果。
除了可以支持查询内部的各种数据源外,BigSQL 还支持与其他企业数据源进行联邦,包括:DB2/Oracle/IBM PDA/IBM PDOA/TeraData/JDBC等,联邦让跨系统的数据访问在一个SQL中完成,而不需要复杂的ETL过程和数据传输等待。
联邦的含义不仅仅是指打通了数据访问通道,还包括查询路径优化方面的考虑。比如,根据数据的分布和数据源的支持情况:将语句下压至联邦数据源执行;部分在联邦数据源部分在BigSQL执行;或者全部由BigSQL执行。
数据量、联邦数据源处理能力、联邦数据源的处理速度、返回数据比例、网络带宽等这些都在考虑之列。比如,如果数据源仅支持正切函数TAN(x),而不支持余切函数COT(X),BigSQL将会SQL中的COT(x)转换成等价的正切函数表达式1/TAN(x)。
通过联邦,BigSQL可以让本来不具备SQL数据访问能力的数据源变成兼容SQL数据访问标准的数据源。下图显示了BigSQL联邦支持的数据源:
BigSQL除了可以提供常规的SQL函数外,还提供了众多机器学习算法的实现,包括:K-means聚类算法、朴素贝叶斯算法、关联规则算法、序列模式挖掘算法、线性回归算法等。这让熟悉SQL语法和数据的DBA,马上提升数据分析技能!!
如下图显示通过简单的一条SQL语句就可以完成对人口收入调查数据集(CensusIncome)的聚类建模分析:
再通过一条SQL即可显示聚类分析结果:
安全性是企业级产品必须要考虑的,BigSQL中的用户鉴权通过外部框架完成,如LDAP,而用户连接之后的内部鉴权则由BigSQL完成。BigSQL可以根据用户的授权、属主和角色判定用户的权限。如同数据库一样,BigSQL可以通过GRANT语句给用户授权,可以做到行、列级别的权限控制。
另外,BigSQL还实现数据访问的审计功能,对什么人从什么时间什么地点访问了什么数据进行了完整的审计。
最后,除了文章中列出的这些特点,BigSQL具备更多企业级产品的特性,有待您来一起探索。
详情请咨询!
客服热线:023-66090381
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn
通过提供强大的3D CAD数据访问工具并适用于桌面、移动和Web的高级环境3D可视化发动机,HOOPS在提升造船设计和制造流程的效率方面发挥了重要作用。
HOOPS Luminate在汽车行业中的应用具有广泛的潜力和深远的影响。它通过提供高效的3D可视化、虚拟装配与拆解、性能分析、客户定制等功能,帮助汽车制造商在设计、生产和销售过程中提升效率、降低成本并提高产品质量。
在不断发展的软件开发世界中,使工具和框架与最新的平台版本保持同步至关重要,欢迎查阅~
全球航运业对国际贸易至关重要,全球 90% 以上的商品通过海运运输。准确监控和控制这些集装箱的移动对于维持高效的供应链至关重要。手动输入集装箱号码是这一程序的关键部分,它带来了相当大的挑战,例如人为错误和效率低下。
工业4.0优选产品 | 商业智能和绩效管理软件领导者,帮助企业成为业绩最佳的分析驱动型企业
SPSS Modeler工业4.0优选产品 | 在历史数据中发现规律以预测未来事件,做出更好的决策,实现更好的成效
SPSS Analytic Server从大数据中有效产生预测和建议
IBM BigInsights for Apache Hadoop经济高效地存储、管理和分析大数据
IBM InfoSphere Streams高效捕获和分析动态数据的软件平台
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@pclwef.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢