KSQL,用于Apache Kafka的流数据SQL引擎

KSQL,用于Apache Kafka的流数据SQL引擎

作者:佚名 2017-09-06 16:49:43

大数据

SQL Server

Kafka Apache Kafka是一个分布式的、分区的、多复本的日志提交服务,使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。

Apache Kafka是一个分布式的、分区的、多复本的日志提交服务,使用Scala编写,以可水平扩展和高吞吐率而被广泛使用。Kafka最初是由LinkedIn开发,并于2011年初开源,目标是为实时数据处理提供一个统一、高通量、低等待的平台。目前,越来越多的开源分布式处理系统如Cloudera、Apache Storm、Spark都支持与Kafka集成。

 

Kafka拓扑结构

Kafka的设计可以帮助用户解决很多架构上的问题,其具备的高性能、低耦合、高可靠性、数据不丢失等特性,结合实际的应用系统使用场景,能够非常满足用户的需求。

8月28日,Kafka Summit大会在旧金山召开,同一天Confluent宣布Kafka新的里程碑:KSQL——用于Apache Kafka的流数据SQL引擎。KSQL(点击查看demo)是分布式、可扩展、可靠的和实时的,支持多种流式操作,包括聚合(aggregate)、连接(join)、时间窗口(window)、会话(session)等等。它为Kafka的流处理提供了一个简单而完整的SQL界面,而不需要再用编程语言(如Java或Python)编写代码。

KSQL的两个核心概念是流(Stream)和表(Table),集成流和表,允许将代表当前状态的表与代表当前发生事件的流连接在一起。

 

KSQL项目架构

事实上,KSQL与关系型数据库中的SQL还是有很大不同的。传统的SQL都是即时的一次性操作,不管是查询还是更新都是在当前的数据集上进行。KSQL的查询和更新是持续进行的,而且数据集可以源源不断地增加。简言之,KSQL所做的其实是转换操作,也就是流式处理。

虽然项目基于Apache 2.0协议开源,但目前还处于开发者预览阶段,不建议用于生产集群中。在可预料的条件下,KSQL在实时监控、安全检测、在线数据集成、应用开发等场景拥有极大的潜力。

实时监控:通过KSQL自定义业务层面的度量指标,可以实时获得。底层的度量指标无法告诉用户应用程序的实际行为,所以基于应用程序生成的原始事件来自定义度量指标可以更好地了解应用程序的运行状况。另外,可以通过KSQL为应用程序定义某种标准,用于检查应用程序在生产环境中的行为是否达到预期;

安全检测:KSQL把事件流转换成包含数值的时间序列数据,通过可视化工具把这些数据展示在UI上,可以检测到很多威胁安全的行为,比如欺诈、入侵等等;

在线数据集成:大部分的数据处理都会经历ETL过程,而这样的系统通常都是通过定时的批次作业来完成数据处理的,但批次作业所带来的延时在很多时候是无法被接受的。通过使用KSQL和Kafka连接器,可以将批次数据集成转变成在线数据集成;

应用开发:对于复杂应用来说,使用Kafka的原生Streams API或许更合适。不过对于简单应用,或者对于不喜欢Java编程的人来说,KSQL会是更好的选择。

未来,项目计划增加更多的特性,包括支持更丰富的SQL语法,让KSQL成为生产就绪的系统。相信KSQL为处理Kafka数据而提供的简单完整的可交互式SQL接口,能够降低流式处理的门槛。

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/246984.html<

(0)
运维的头像运维
上一篇2025-04-26 21:57
下一篇 2025-04-26 21:58

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注