微软进军NoSQL 发布Trinity数据库

【综合报道】正当我们感慨各类NoSQL数据库遍地开花的时候,老大哥微软也加入了这一阵营,最近微软发布了其图数据库系统Trinity。

笔者在很多文章中看见微软发布了其图数据库系统Trinity的消息,但是Trinity具体是什么样子的数据库,有什么功能只有短短几句介绍,于是笔者查看了该项目的原文地址,并加以翻译。水平有限,请大家多多指教。

[[20659]]

Trinity是一个图数据库,也是建立在分布存储云上的计算平台。作为一个数据库,它提供如高度并行查询处理、事务记录、一致性控制等功能。作为一个计算平台,它为大型图形提供了同步或不同步的批处理计算。Trinity可以配置在一台计算机或数百台计算机上。

图是一种具有较高表达能力的抽象数据结构。许多现实生活中的应用都可以通过图模拟,包括生物网络,语义网络和社会网络。因此,图形引擎对多种应用都是非常重要的。目前,在这个领域有:Neo4j, HyperGraphDB,InfiniteGraph等等。

  1. Neo4j是一个基于磁盘的事务性图数据库。
  2. HyperGraphDB是基于键/值对存储的Berkeley DB。
  3. InfiniteGraph是对大型图数据分析的分布式系统。  

2009年,google 发布了Pregel,作为其大型图处理平台。Pregel 是一个批处理系统,同时它不支持在线查询处理或图服务。对比来看,Trinity不仅支持在线查询也支持离线批处理。进一步,Pregel中的批处理是严格同步的,但是Trinity 支持了不同步计算,有更好得性能。

#p#

Trinity 的特点

  1. 数据模型:超图
  2. 分布式: Trinity 可以配置在一台或上百台计算机上
  3. 图数据库: Trinity是一个基于内存的图仓库,它有丰富的数据库特点,如:在线高度并行查询处理,ACI交易支持,等等。目前Trinity对图处理为用户提供C# APIs 。
  4. 并行图处理系统:Trinity 支持大型,离线批处理。支持同步和不同步批计算。

图模型

Trinity采用超图模型。简单图模型和超图模型之间的一个区别就是:超图中的边(称为超边)连接任意数量的节点,而在一个简单的图中边只能连接两个节点。

超图是比简单图更一般:

  1. 超图模型对许多应用程序来说更直接,因为很多关系都不是一对一的关系。
  2. 一些多边关系不能轻易通过简单图模拟出来。直接用简单图建模往往导致信息丢失。

Trinity是一个分布式图数据库

一个图形数据库应该支持一些基本的数据库功能,如查询,事务记录,并行控制和一致性维护。

Trinity支持内容丰富的图表。每个节点(或边缘)与一组数据,或者一个键/值对相关联。换句话说,在Trinity中节点和边是异构类型。

Trinity优化并发联机查询处理。当在一台机器上部署,Trinity可以在一秒钟内访问1,000,000节点(例如,当执行BFS时)。当通过网络部署时,速度是受网络延迟。Trinity提供了一个图形分割机制,以尽量减少延迟。我们在InfiniBand网络上部署了Trinity,我们将尽快报告结果。

为支持高效的网上查询处理,Trinity配置了各种索引。目前,我们提供单词查找树、访问节点/边缘名称和与节点/边缘关联的键/值对散列。我们正在实现与子图匹配的结构索引。

Trinity还支持对图的时时更新。它是事务记录,并发控制和一致性都生效。

目前,Trinity没有图形查询语言。图的访问都是通过C#的API进行。我们正在为Trinity设计一种高级的查询语言。

Trinity是一个基于图数据的分布式并行平台

很多图上操作都是以批处理模式执行的,例如: PageRank,最短路径查询,频繁子图挖掘,随机游走,图形分割等。

和谷歌的Pregel一样,Trinity支持以节点为基础的图形并行处理。通过门户网站,用户提供一个脚本(目前C#代码或DLL)来对一个节点指定计算方法,包括它把什么信息传递给相邻节点。该系统将对这些进行并行计算。

与谷歌的Pregel不一样的是,在节点上的操作没有严格要求以同步的方式进行。某些操作(例如,最短路径查询)在非同步模式下会更好的被执行。

举个例子,这是同步的最短路径搜索(伪代码,C#代码)的代码,这是不同步最短路径搜索(伪代码,C#代码)的代码。

我们还设计一种高级语言,使用户可以轻松编写自己的脚本。

#p#

Trinity架构

Trinity是基于云存储的。它主要使用内存存储,磁盘仅作为备份存储。

系统架构

#p#

Trinity应用

随着越来越多的应用程序涉及图形数据,我们预计Trinity将有许多应用。目前,Trinity支持以下两个应用程序:Probase(一个研究原型)和AEther(生产系统)。

 

Trinity是Probase的基础架构,它可以自动从网上获得大规模知识库。 Probase有上百万的节点(表示概念)和边(表示关系)。超图比简单图更合适对认知建模。Trinity用于:1)分类建设; 2)数据集成(如添加Freebase data到Probase),3)查询Probase.

  

Microsoft Bing的AEther项目现在使用Trinity管理AEther的实验数据,其中包括大量的工作流和工作流中的演化。Trinity是Aether工作流程管理系统的后端图存储引擎。我们正在增加更多功能,特别是子图匹配和频繁子图挖掘,从而支持该项目。

 原文链接:http://research.microsoft.com/en-us/projects/trinity/

 

【责任编辑: 艾婧 TEL:(010)68476606】

 

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/270776.html<

(0)
运维的头像运维
上一篇2025-05-07 23:42
下一篇 2025-05-07 23:43

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注