Erlang+C+Lisp的大数据方案:BugSense

【精选译文】编辑注:本文作者是BugSense公司的创始人兼首席技术官Jon Vlachogiannis。BugSense是一家专门报告错误、度量质量的服务商,每天跟踪成千上万个应用程序。移动应用程序崩溃时,BugSense可以帮助开发人员准确查明问题,并解决问题。这家新兴公司的客户包括VMWare、三星、Skype以及数千家独立应用软件开发商。跟踪2亿多种设备需要有一套运行速度快、容错性强、成本又低廉的基础设施。

在最近六个月,我们决定使用自己的BigData基础设施,为用户们提供评估应用程序性能和稳定性的度量指标,好让他们知道出现的错误给其用户群和经营收入带来了怎样的影响。

我们清楚,自己的解决方案自一开始就应该具有良好的扩展性,因为外面所有的智能手机中超过4%会开始向我们发送大量数据,实际上无异于分布式拒绝服务攻击(DDoS)。

我们希望能够做到以下这几点:

■抽取应用程序逻辑,并以JSON格式向浏览器传送数据

■实时运行复杂算法

■尝试处理数据,不需要专门的Hadoop集群

■预处理数据,然后存储数据(减少存储空间)

■能够在每一个节点上处理1000多个并发请求

■每个应用程序对超过1.25亿行进行“联结”操作

■不需要把大笔钱投入到服务器上,即可做到这一点

解决方案使用了:

■在Azure平台上运行的不到20个大实例

■内存中数据库

■使用C语言编写的完全成熟的自定义LISP语言,以实现查询,其速度要比让虚拟机(附带废料收集器)一直在线运行快好多倍。

■用于节点之间联系的Erlang语言

■经过改动的TCP_TIMEWAIT_LEN,足足少了4万条连接,节省了处理器、内存和TCP缓冲器等方面的资源。

内存中数据库万岁!

我们知道,我们要处理这一切流量,唯一的办法就是使用内存中数据库。

为了迅速解答针对庞大数据集的临时特定问题(比如“一个多星期以来,多少不重复的三星设备用户遇到了这个特定的错误?”),你不仅要应对内存方面的局限性,还要应对在数据处理前后的数据串行化和并行化工作。这就是我们启动LDB项目的原因。

LDB项目介绍

你是否相信能做到这点:可以将来自不同数据源(甚至上千个不同数据源,如移动设备)的数据传送到某个系统中,描述你用仅仅几行代码想提取什么样的信息,然后让所有这些信息触手可及?而且以实时方式实现,同时不影响系统的正常运行?

LDB与其说是个数据库,还不如说是款应用服务器。尽管它是内存中数据库,但是数据实际上存储在硬驱中,并且复制到其他节点上。

有了LDB,我们并不运行查询,而是运行算法,因为我们有一种使用C语言编写的完全成熟的自定义LISP语言,它可以访问与数据库同样的地址空间。这意味着,你能够以极快的速度搜索数据、增加计数器以及进行get/put操作等。

拥有LISP的优点在于,你可以轻松创建类似SQL的语言,比如Hive,并且实时查询数据,就像这样:

LDB工作起来像这样:

每一个应用程序都有各自的LDB。这意味着它有自己的内存空间。这样一来,我们就可以把就流量而言更庞大的应用程序轻松转移到不同的机器上。

当请求来自移动设备时,主LDB节点接受连接(使用erlang线程池),并将该数据转发到某个特定的数据库(DB)。这种请求处理机制是用不到20行Erlang代码实现的。这也是我们选择Erlang用于节点之间联系的另一个原因。

当请求被“流式传送”到LDB后,一个名为“process.lql”的文件负责分析和标记数据,并创建各种计数器。这一切都是实时进行的,对每个请求而言都是如此。

我们之所以能够这么做,是因为针对每个请求,开启我们的LISP虚拟机、处理所有这些过程仍比让虚拟机(附带废料收集器)一直在线运行快好多倍。

借助LDB,我们只要用短短的3行代码,就能创建时间序列和聚合数据。

比如说,下列代码为不重复用户创建了7天的时间序列:

替代办法

我们在测试过程中发现,SQL数据库之所以不是很适合,正是由于这一点:我们的数据以非结构化数据为主,我们需要许多复杂的“联结”(和许多索引)。另一方面,就NoSQL数据库而言,我们无法在系统运行的同时针对数据运行我们的算法,而拥有mappers/reducers使得整个事情处理起来既复杂又缓慢。我们需要一种没有大锁或数据库锁的高并发系统,可以用仅仅几KB就能跟踪数百万个不重复事件,而且、扩展起来很容易。

一个很好的替代办法就是使用Stream数据库(比如Storm)。我们的主要问题在于,单个节点有许多变化因素,而且存在性能问题。借助LDB,我们有了这个优点:能够以极快的速度处理数据(数据驻留在同一个内存空间),把它们作为聚合计数器或符号来存储(因而能够将数GB数据塞入到数KB空间),然后让特定领域语言(DSL)来实时处理我们想要进行的任何关联操作。没有串行化/并行化,没有网络调用,也没有废料收集器。这就好比是将汇编代码映射到你的数据上。

除此之外,借助LDB,我们有了可以扩展并处理入站数据的接收器、一切仅用几行代码就可以定义的流式组件以及存储引擎(Storage Engine)和复制引擎(Replication engine)。

优化内核

较之于每秒处理大量请求的其他服务,我们进行分析时的独特地方在于,移动设备与服务器之间的对话极少(3个TCP握手数据包、1个有效载荷数据包和3个TCP终结数据包)。

不过,TCP在设计时并没有考虑到这种情况(也就是说设备之间的对话很少),而是实现了一种名为TIME_WAIT的状态(在2.6 Linux内核中持续时间约1分钟):上一个FIN(完成)数据包被发送后,该特定连接tuple的TCP状态仍保持一段时间的开启状态,目的是为了接收可能延误的任何杂散数据包(也就是说,在连接关闭之前)。不过就我们的情况而言,这用处不大(我们希望酷似UDP行为,但又有TCP保障),因为有效载荷只是1个数据包(浏览请求多达4个或5个数据包),于是我们决定改动内核源代码,把这个参数的常量减小到20秒。结果就是足足少了4万条连接,数量惊人,因而节省了处理器、内存和TCP缓冲器等方面的资源。

我们所打的补丁在这个文件中:

linux-kernel-source/include/net/tcp.h
#define TCP_TIMEWAIT_LEN (60*HZ)

换成

#define TCP_TIMEWAIT_LEN (20*HZ)

使用这种架构,我们就能为我们的所有付费客户提供实时分析和了解移动应用程序的功能,不到20个大实例在Azure平台上运行,包括退守服务器和备用服务器。

原文:BigData Using Erlang, C And Lisp To Fight The Tsunami Of Mobile Data

 

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/291344.html<

(0)
运维的头像运维
上一篇2025-05-19 15:38
下一篇 2025-05-19 15:40

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注