2017年大数据年终盘点:开源工具、MySQL和Python是最大赢家!

2001年,Gartner给出了大数据的概念,即大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。这其中点出了大数据关键的3V特征,即海量、速度和多样性,也很明确的为我们指出了大数据在哪些方面存在挑战。但是,16年过去了,现在大数据发展仍然没有达到边界,还是一个充满想象力的领域。

因为数据的存在,让很多新的行业焕发出了***的价值,社交媒体网站可能就是一个典型的例子。对于企业来说,目前的主要问题就是如何使用收集来的数据创造价值。为此,Dzone社区调查了734个和大数据相关的技术人员,下面我们就来看看有哪些有趣的结论。

开源仍然是大趋势

开源是整个IT技术的大趋势,在大数据领域也不例外。据Dzone的相关调查,71% 的受访者都在使用开源工具进行数据科学的相关工作,只有16%的人在使用商业工具。开源工具在个人开发项目和企业应用程序中得到了快速应用。

2016年曝光度***的开源工具Spark,今年的采用率从去年的31%增长到了45%。而今年曝光率***的开源工具,TensorFlow绝对算得上一号,自谷歌一年半之前发布以来TensorFlow的采用率已经达到17%。

开源工具的出现让大数据的应用推进的更快,如果不能快速适应上手新的开源工具,那么关于数据科学的相关工具就无法开展。

Apache Hadoop仍然是领头羊

前几天,有的专家在预测数据库未来发展趋势时,提出了一个观点那就是“Hadoop将死”,但是通过具体的数据,我们发现Apache Hadoop现在仍然有实力强劲。65%的数据工程师都正在使用或者曾经使用过Apache Hadoop。47%的技术人员使用Yarn进行集群管理。62%使用Apache ZooKeeper,55%使用Hive来做数据仓储。

得益于MapReduce处理和存储数据的能力,自2011年发布以来,Apache Hadoop就一直呈现着高速发展的趋势,现在广受欢迎的众多先进工具都是建立在Hadoop之上。对于开发者和数据科学家来说,Hadoop是一盏明灯,有助于他们在未来职业中的晋升。

当然,为了克服MapReduce的局限性,Apache Spark应运而生,同时还衍生出一些其他的新技术,例如 Spark SQL、GraphX、 MLib和 Spark Stream等等。

数据库的发展

关于数据库的发展,今年并没有大格局的变化。据Dzone的调查,MySQL被60%的受访者应用于生产和非生产的环境中。MongoDB被47%的受访者应用于生产环境中,48%应用于非生产环境中,PostgreSQL被41%的受访者应用于生产环境中和40%应用于非生产环境中。

而商业数据库可能是由于许可证的问题,似乎并不如开源数据库那么受欢迎。而其他一些数据库,例如SQLite这样轻量级的数据库也会占据一定的份额。但是NoSQL数据库的发展则越来越稳健,有56%的数据科学从业人员选择使用NoSQL。

编程语言、工具、库和框架

数据科学其实很大程度上都依赖开源的编程语言、工具、库和框架。就编程语言来说,Python和R都是数据科学的热门语言。相比较于R语言来说,Python可能更受欢迎一些,其在受访者中获得了63%的支持,而R语言则获得了61%的支持。

而对于框架来说,Spark Stream在流数据计算框架中颇受欢迎,在数据采集过程中Kafka得到了54%的支持。剩余其它的一些框架则没有得到超过25%的支持率,不过,这其中还有一匹黑马,那就是GraphX,其在迭代图处理类别中获得了24%的支持率。 

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/248441.html<

(0)
运维的头像运维
上一篇2025-04-27 14:18
下一篇 2025-04-27 14:19

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注