提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
转帖|其它|编辑:陈津勇|2019-10-23 16:38:42.967|阅读 465 次
概述:本文详细介绍了SQL Server大数据群集的功能、体系结构、Kubernetes的概念等内容。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
从SQL Server 2019 (15.x)开始,SQL Server大数据群集使你可以部署在Kubernetes上运行的SQL Server、Spark和HDFS容器的可缩放群集。这些组件并行运行以确保可读取、写入和处理Transact-SQL或Spark中的大数据,这样你就可以借助大量大数据轻松合并并分析高价值关系数据。
方案
SQL Server大数据群集在与大数据交互方面提供了灵活性。可查询外部数据源,存储通过SQL Server管理的HDFS中的大数据,或通过群集查询来自多个外部数据源的数据。然后,可以将数据用于AI、机器学习和其他分析任务。下列各部分提供了有关这些方案的详细信息。
数据虚拟化
通过利用SQL Server PolyBase,SQL Server大数据群集可以在不移动或复制数据的情况下查询外部数据源。SQL Server 2019 (15.x) 引入了数据源的新连接器。
Data Lake
SQL Server大数据群集包括可缩放的HDFS存储池。 这可用于存储可能来自多个外部源的大数据。 大数据存储在大数据群集中的HDFS中后,便可分析和查询数据并将其与关系数据相结合。
横向扩展数据市场
SQL Server大数据群集提供了向外扩展计算和存储,以提高分析任何数据的性能。来自各种源的数据可作为缓存跨数据池节点进行引入和分布以供进一步分析。
集成的AI和机器学习
SQL Server大数据群集在HDFS存储池中存储的数据和数据池中启用AI和机器学习任务。使用R、Python、Scala或者Java可在SQL Server中使用Spark以及内置的AI工具。
管理和监视
通过命令行工具、API、门户和动态管理视图的组合提供管理和监视。
可以使用Azure Data Studio在大数据群集上执行各种任务。这是由新的SQL Server 2019扩展(预览版)启用的。 此扩展提供:
用于常见管理任务的内置片段。
浏览HDFS、上传文件、预览文件和创建目录的能力。
创建、打开和运行与Jupyter兼容的笔记本的能力。
用于简化外部数据源的创建的数据虚拟化向导。
体系结构
SQL Server大数据群集是由Kubernetes编排的Linux 容器群集。
Kubernetes的概念
Kubernetes是一个开放源代码容器业务流程协调程序,可以根据需要缩放容器部署。下表定义了一些重要的Kubernetes术语:
Cluster Kubernetes | 群集是一组称为节点的计算机。一个节点控制群集并被指定为主节点,其余节点是工作器节点。Kubernetes主节点负责在工作器节点之间分配工作,并负责监视群集的运行状况。 |
Node | 节点运行容器化应用程序。 它可以是物理计算机或虚拟机。 Kubernetes 群集可以混合包含物理计算机节点和虚拟机节点。 |
Pod | Pod是Kubernetes的原子部署单元。Pod是运行应用程序所需的一个或多个容器和相关资源的逻辑组。一个Pod只能在一个节点上运行,一个节点可以运行一个或多个Pod。Kubernetes主节点自动将Pod分配给群集中的其余节点。 |
在SQL Server大数据群集中,Kubernetes负责SQL Server大数据群集的状态,Kubernetes构建和配置群集节点,将pod分配给节点,并监视群集的运行状况。
大数据群集体系结构
下图显示了SQL Server的大数据群体的组件。
控制器
控制器为群集提供管理和安全性。它包含控制服务、配置存储和其他群集级服务,例如Kibana、Grafana和弹性搜索。
计算池
计算池为群集提供计算资源。它包含在Linux上的SQL Server Pod上运行的节点。计算池中的Pod分为用于特定处理任务的SQL Compute实例。
数据池
数据池用于数据暂留和缓存。数据池由一个或多个运行Linux上的SQL Server的Pod组成。它用于从SQL查询或Spark作业中提取数据。SQL Server大数据群集数据市场持久保留在数据池中。
存储池
存储池由Linux上的SQL Server、Spark和HDFS组成的存储池Pod组成。SQL Server大数据群集中的所有存储节点都是HDFS群集的成员。
后续步骤
有关部署SQL Server大数据群集的详细信息,请参阅SQL Server大数据群集入门。
*想要获得Microsoft SQL Server更多资源或正版授权的朋友,可以咨询了解哦~
慧都网·1024程序员节,DevExpress、MyEclipse、Axure RP、Aspose、FastReport等产品限时放“价”,给你专属宠爱!点击下方图片查看活动详情↓↓↓
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@pclwef.cn
文章转载自:面对“数字中国”建设和中国制造2025战略实施的机遇期,中车信息公司紧跟时代的步伐,以“集约化、专业化、标准化、精益化、一体化、平台化”为工作目标,大力推进信息服务、工业软件等核心产品及业务的发展。在慧都3D解决方案的实施下,清软英泰建成了多模型来源的综合轻量化显示平台、实现文件不失真的百倍压缩比、针对模型中的大模型文件,在展示平台上进行流畅展示,提升工作效率,优化了使用体验。
本站的模型资源均免费下载,登录后即可下载。模型仅供学习交流,勿做商业用途。
本站的模型资源均免费下载,登录后即可下载。模型仅供学习交流,勿做商业用途。
本站的模型资源均免费下载,登录后即可下载。模型仅供学习交流,勿做商业用途。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@pclwef.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢