R对MongoDB的性能测试——RMongo

在九月初的时候，RMongoDB正式发布了修订版本，这也就意味着，从事数值计算的语言也可以于Nosql产品相接轨了，但是鉴于我身边并没有公司真的在使用R和MongoDB的结合，所以在效率问题上，我们也不敢掉以轻心，所以就做了一个这样的测试。

测试环境是8核，64位机。用于测试的库是一个未经Sharding，大概30G左右的Collection。用于存储用户的喜好信息，标签信息等数据。

library(rmongodb)   
 
mongo <- mongo.create()  
 
if(mongo.is.connected(mongo))  
{  
    ns <- 'rivendell.user' 
    print('查询一个没有索引的字段，查询一条')  
    print(system.time(p <- mongo.find.one(mongo,ns,list(Friend=600))))  
    print('查询一个没有索引的字段，多条,without buffer')  
    print(system.time(p <- mongo.find(mongo,ns,list(Friend=600))))  
    print('看看是否有缓存策略')  
    print(system.time(p <- mongo.find(mongo,ns,list(Friend=600))))  
 
    print('查询一个没有索引的字段，多条,has buffer')  
    buf <- mongo.bson.buffer.create()  
    mongo.bson.buffer.append(buf,'Friend',600L)  
    query <- mongo.bson.from.buffer(buf)  
    print(system.time(p <- mongo.find(mongo,ns,query)))  
    print('看看是否有缓存策略')  
    buf <- mongo.bson.buffer.create()  
    mongo.bson.buffer.append(buf,'Friend',600L)  
    query <- mongo.bson.from.buffer(buf)  
    print(system.time(p <- mongo.find(mongo,ns,query)))  
 
    print('大于的查询，查询一条记录')  
    print(system.time(p <- mongo.find.one(mongo,ns,list(Friend=list('$gt'=600L)))))  
    print('大于的记录，查询多条记录')  
    print(system.time(cursor <- mongo.find(mongo,ns,list(Friend=list('$gt'=600L)))))  
    mongo.cursor.destroy(cursor)  
 
    print('查询一条有索引的记录')  
    print(system.time(p <- mongo.find.one(mongo,ns,list('_id'=3831809L))))  
    print('查询索引的记录')  
    print(system.time(p <- mongo.find(mongo,ns,list('_id'=3831809L))))  
 
    print('插入一条记录')  
    buf <- mongo.bson.buffer.create()  
    mongo.bson.buffer.append(buf,'name',"huangxin")  
    mongo.bson.buffer.append(buf,'age',22L)  
    p <- mongo.bson.from.buffer(buf)  
    print(system.time(mongo.insert(mongo,ns,p)))  
 
    print('找到刚刚插入的记录')  
    print(system.time(p <- mongo.find.one(mongo,ns,list('name'='huangxin'))))  
    if(!is.null(p))  
    {  
        print('success')  
    }  
 
    print('批量插入')  
 
    buf <- mongo.bson.buffer.create()  
    mongo.bson.buffer.append(buf,'name','huangxin')  
    mongo.bson.buffer.append(buf,'age',22L)  
    p1 <- mongo.bson.from.buffer(buf)  
 
    buf <- mongo.bson.buffer.create()  
    mongo.bson.buffer.append(buf,'name','huangxin')  
    mongo.bson.buffer.append(buf,'age',22L)  
    p2 <- mongo.bson.from.buffer(buf)  
 
    buf <- mongo.bson.buffer.create()  
    mongo.bson.buffer.append(buf,'name','huangxin')  
    mongo.bson.buffer.append(buf,'age',22L)  
    p3 <- mongo.bson.from.buffer(buf)  
 
    print(system.time(mongo.insert.batch(mongo,ns,list(p1,p2,p3))))  
 
    print('找到刚刚批量插入的记录')  
    print(system.time(cursor <- mongo.find(mongo,ns,list('name'='huangxin'))))  
 
    i <- 0  
    while(mongo.cursor.next(cursor))  
    {  
        i <- i + 1  
    }  
    print(i)  
 
    print('批量更新')  
    print(system.time(mongo.update(mongo,ns,list(name='huangxin'),list('name'= 'kym'))))  
 
    print('查看更新是否成功')  
    print(system.time(p <- mongo.find.one(mongo,ns,list('name'='kym'))))  
    if(!is.null(p))  
    {  
        print('success')  
    }  
 
    print('批量删除')  
    print(system.time(mongo.remove(mongo,ns,list(name='kym'))))  
}  
 
    print(system.time(p <- mongo.find.one(mongo,ns,list('name'='kym'))))  
    if(!is.null(p))  
    {  
        print('success')  
    }

[1] "查询一个没有索引的字段，查询一条" 
user system elapsed  
0.000 0.000 0.115  
[1] "查询一个没有索引的字段，多条,without buffer" 
user system elapsed  
0.000 0.000 32.513  
[1] "看看是否有缓存策略" 
user system elapsed  
0.000 0.000 32.528  
[1] "查询一个没有索引的字段，多条,has buffer" 
user system elapsed  
0.000 0.000 32.685  
[1] "看看是否有缓存策略" 
user system elapsed  
0.000 0.000 33.172  
[1] "大于的查询，查询一条记录" 
user system elapsed  
0.000 0.000 0.001  
[1] "大于的记录，查询多条记录" 
user system elapsed  
0.000 0.000 0.014  
[1] "查询一条有索引的记录" 
user system elapsed  
0 0 0  
[1] "查询索引的记录" 
user system elapsed  
0 0 0  
[1] "插入一条记录" 
user system elapsed  
0 0 0  
[1] "找到刚刚插入的记录" 
user system elapsed  
0.00 0.00 35.42  
[1] "success" 
[1] "批量插入" 
user system elapsed  
0 0 0  
[1] "找到刚刚批量插入的记录" 
user system elapsed  
0.004 0.000 35.934  
[1] 7  
[1] "批量更新" 
user system elapsed  
0.000 0.004 0.000  
[1] "查看更新是否成功" 
user system elapsed  
0.000 0.000 67.773  
[1] "success" 
[1] "批量删除" 
user system elapsed  
0 0 0  
user system elapsed  
0.000 0.000 91.396