ParallelStream的坑,不踩不知道,一踩吓一跳

[[342087]]

本文转载自微信公众号「小姐姐味道」,作者小姐姐养的狗  。转载本文请联系小姐姐味道公众号。 

很多同学喜欢使用lambda表达式,它允许你定义短小精悍的函数,体现你高超的编码水平。当然,这个功能在某些以代码行数来衡量工作量的公司来说,就比较吃亏一些。

比如下面的代码片段,让人阅读的时候就像是读诗一样。但是一旦用不好,也是会要命的。

  1. List<Integer> transactionsIds = 
  2. widgets.stream() 
  3.              .filter(b -> b.getColor() == RED) 
  4.              .sorted((x,y) -> x.getWeight() - y.getWeight()) 
  5.              .mapToInt(Widget::getWeight) 
  6.              .sum(); 

这段代码有一个关键的函数,那就是stream。通过它,可以将一个普通的list,转化为流,然后就可以使用类似于管道的方式对list进行操作。总之,用过的都说好。

对这些函数还不是太熟悉?可以参考:《到处是map、flatMap,啥意思?》

问题来了

假如我们把stream换成parallelStream,会发生什么情况?

根据字面上的意思,流会从串行 变成并行。

既然是并行,那用屁股想一想,就知道这里面肯定会有线程安全问题。不过我们这里讨论的并不是要你使用线程安全的集合,这个话题太低级。现阶段,知道在线程不安全的环境中使用线程安全的集合,已经是一个基本的技能。

这次踩坑的地方,是并行流的性能问题。

我们用代码来说话。

下面的代码,开启了8个线程,这8个线程都在使用并行流进行数据计算。在执行的逻辑中,我们让每个任务都sleep 1秒钟,这样就能够模拟一些I/O请求的耗时等待。

使用stream,程序会在30秒后返回,但我们期望程序能够在1秒多返回,因为它是并行流,得对得起这个称号。

测试发现,我们等了好久,任务才执行完毕。

  1. static void paralleTest() { 
  2.     List<Integer> numbers = Arrays.asList( 
  3.             0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 
  4.             10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 
  5.             20, 21, 22, 23, 24, 25, 26, 27, 28, 29 
  6.     ); 
  7.     final long begin = System.currentTimeMillis(); 
  8.     numbers.parallelStream().map(k -> { 
  9.         try { 
  10.             Thread.sleep(1000); 
  11.             System.out.println((System.currentTimeMillis() - begin) + "ms => " + k + " \t" + Thread.currentThread()); 
  12.         } catch (InterruptedException e) { 
  13.             e.printStackTrace(); 
  14.         } 
  15.         return k; 
  16.     }).collect(Collectors.toList()); 
  17.  
  18. public static void main(String[] args) { 
  19. //    System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism""20"); 
  20.     new Thread(() -> paralleTest()).start(); 
  21.     new Thread(() -> paralleTest()).start(); 
  22.     new Thread(() -> paralleTest()).start(); 
  23.     new Thread(() -> paralleTest()).start(); 
  24.     new Thread(() -> paralleTest()).start(); 
  25.     new Thread(() -> paralleTest()).start(); 
  26.     new Thread(() -> paralleTest()).start(); 
  27.     new Thread(() -> paralleTest()).start(); 

实际上,在不同的机器上执行,这段代码花费的时间都不一样。

既然是并行,那肯定得有个并行度。太低了,体现不到并行的能能力;太大了,又浪费了上下文切换的时间。我是很沮丧的发现,很多高级研发,将线程池的各种参数背的滚瓜烂熟,各种调优,竟然敢睁一只眼闭一只眼的在I/O密集型业务中用上parallelStream。

要了解这个并行度,我们需要查看具体的构造方法。在ForkJoinPool类中找到这样的代码。

  1. try {  // ignore exceptions in accessing/parsing properties 
  2.     String pp = System.getProperty 
  3.         ("java.util.concurrent.ForkJoinPool.common.parallelism"); 
  4.     if (pp != null
  5.         parallelism = Integer.parseInt(pp); 
  6.     fac = (ForkJoinWorkerThreadFactory) newInstanceFromSystemProperty( 
  7.         "java.util.concurrent.ForkJoinPool.common.threadFactory"); 
  8.     handler = (UncaughtExceptionHandler) newInstanceFromSystemProperty( 
  9.         "java.util.concurrent.ForkJoinPool.common.exceptionHandler"); 
  10. } catch (Exception ignore) { 
  11.  
  12. if (fac == null) { 
  13.     if (System.getSecurityManager() == null
  14.         fac = defaultForkJoinWorkerThreadFactory; 
  15.     else // use security-managed default 
  16.         fac = new InnocuousForkJoinWorkerThreadFactory(); 
  17. if (parallelism < 0 && // default 1 less than #cores 
  18.     (parallelism = Runtime.getRuntime().availableProcessors() - 1) <= 0) 
  19.     parallelism = 1; 
  20. if (parallelism > MAX_CAP) 
  21.     parallelism = MAX_CAP; 

可以看到,并行度到底是多少,是由下面的参数来控制的。如果无法获取这个参数,则默认使用 CPU个数-1 的并行度。

可以看到,这个函数是为了计算密集型业务去设计的。如果你喂给它一大堆任务,它就会由并行执行退变成类似于串行的效果。

  1. -Djava.util.concurrent.ForkJoinPool.common.parallelism=N 

即使你使用-Djava.util.concurrent.ForkJoinPool.common.parallelism=N设置了一个初始值大小,它依然有问题。

因为,parallelism这个变量是final的,一旦设定,不允许修改。也就是说,上面的参数只会生效一次。

张三可能使用下面的代码,设置了并行度大小为20。

  1. System.setProperty("java.util.concurrent.ForkJoinPool.common.parallelism""20"); 

李四可能用同样的方式,设置了这个值为30。那实际在项目中用的是哪个值,那就得问JVM是怎么加载的类信息了。

这种方式并不太非常靠谱。

一种解决方式

我们可以通过提供外置的forkjoinpool,也就是改变提交方式,来实现不同类型的任务分离。

代码如下所示,通过显式的代码提交,即可实现任务分离。

  1. ForkJoinPool pool = new ForkJoinPool(30); 
  2.  
  3. final long begin = System.currentTimeMillis(); 
  4. try { 
  5.     pool.submit(() -> 
  6.             numbers.parallelStream().map(k -> { 
  7.                 try { 
  8.                     Thread.sleep(1000); 
  9.                     System.out.println((System.currentTimeMillis() - begin) + "ms => " + k + " \t" + Thread.currentThread()); 
  10.                 } catch (InterruptedException e) { 
  11.                     e.printStackTrace(); 
  12.                 } 
  13.                 return k; 
  14.             }).collect(Collectors.toList())).get(); 
  15. } catch (InterruptedException e) { 
  16.     e.printStackTrace(); 
  17. } catch (ExecutionException e) { 
  18.     e.printStackTrace(); 

这样,不同的场景,就可以拥有不同的并行度。这种方式和CountDownLatch有异曲同工之妙,我们需要手动管理资源。

使用了这种方式,代码量增加,已经和优雅关系不大了,不仅不优雅,而且丑的要命。白天鹅变成了丑小鸭,你还会爱它么?

 

作者简介:小姐姐味道 (xjjdog),一个不允许程序员走弯路的公众号。聚焦基础架构和Linux。十年架构,日百亿流量,与你探讨高并发世界,给你不一样的味道。我的个人微信xjjdog0,欢迎添加好友,进一步交流。

 

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/145461.html<

(0)
运维的头像运维
上一篇2025-03-10 15:30
下一篇 2025-03-10 15:32

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注