Oracle数据库终于支持R语言 发力数据挖掘

据Oracle官方博客 最近更新的New R Interface to Oracle Data Mining Available for Download,甲骨文开始正式支持R语言在Oracle数据库中的应用(简单的非官方说法是:甲骨文贡献了一个提供Oracle和R之间接口的附加包)。

援引博客中对R-ODM(R-Oracle Data Mining)的介绍:

R-ODM is especially useful for:

Quick prototyping of vertical or domain-based applications where the Oracle Database supports the application
Scripting of “production” data mining methodologies
Customizing graphics of ODM data mining results (examples: classification, regression, anomaly detection) 众所周知,R在实现原型算法方面有着不可替代的巨大优势。诚然,通过R实现的一般性数据挖掘算法都可以嵌入到数据库中,但Oracle提供的这个接口,极大地提高了挖掘算法的部署效率。

今天(2010.06.08),CRAN上更新了RODM包的1.0-2版本,支持Windows、Linux、MacOS X系统。

下面是RODM包帮助文档中的一个例子,可以初步地体会算法高效的部署:

  1. ### GLM Regression  
  2. ## Not run:  
  3. x1 <- 2 * runif(200)  
  4. noise <- 3 * runif(200) - 1.5  
  5. y1 <- 2 + 2*x1 + x1*x1 + noise  
  6. dataset <- data.frame(x1, y1)  
  7. names(dataset) <- c("X1""Y1")  
  8. RODM_create_dbms_table(DB, "dataset")   
  9. # Push the training table to the database  
  10.    
  11. glm <- RODM_create_glm_model(database = DB,    # Create ODM GLM model  
  12.                              data_table_name = "dataset",  
  13.                              target_column_name = "Y1",  
  14.                              mining_function = "regression")  
  15.    
  16. glm2 <- RODM_apply_model(database = DB,    # Predict training data  
  17.                              data_table_name = "dataset",  
  18.                              model_name = "GLM_MODEL",  
  19.                              supplemental_cols = "X1")  
  20. windows(height=8, width=12)  
  21. plot(x1, y1, pch=20, col="blue")  
  22. points(x=glm2$model.apply.results[, "X1"],  
  23.        glm2$model.apply.results[, "PREDICTION"], pch=20, col="red")  
  24. legend(0.5, 9, legend = c("actual""GLM regression"), pch = c(20, 20),  
  25.           col = c("blue""red"),  
  26.      pt.bg =  c("blue""red"), cex = 1.20, pt.cex=1.5, bty="n")  
  27.    
  28. RODM_drop_model(DB, "GLM_MODEL")            # Drop the model  
  29. RODM_drop_dbms_table(DB, "dataset")   # Drop the database table  
  30. RODM_close_dbms_connection(DB)  
  31. RODM_close_dbms_connection(DB) 

说一句题外话:

R的影响力除了在统计分析领域(SAS、SPSS、Statistica已经都开始支持R接口)外,已然发展到了商业数据库领域。

延伸阅读

[[12114]]

R语言是主要用于统计分析、绘图的语言和操作环境。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman开发。(也因此称为R)现在由“R开发核心团队”负责开发。R是基于S语言的一个GNU项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。R的语法是来自Scheme。

R的源代码可自由下载使用,亦有已编译的执行档版本可以下载,可在多种平台下运行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。R主要是以命令行操作,同时有人开发了几种图形用户界面。

【编辑推荐】

  1. Oracle数据库索引和SQL Server的阐述
  2. Oracle更改表空间大小的代码与实际操作
  3. Oracle优化器的3不同类型介绍
  4. Oracle优化器三大种类的介绍
  5. Oracle优化器二十六个参数

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/275952.html<

(0)
运维的头像运维
上一篇2025-05-10 10:37
下一篇 2025-05-10 10:39

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注