當(dāng)前位置：首頁 > 编程语言 > java >内容正文

java

java多核并行计算_谈谈Java任务的并行处理

發(fā)布時(shí)間：2023/12/15 java 23 豆豆

生活随笔收集整理的這篇文章主要介紹了 java多核并行计算_谈谈Java任务的并行处理小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

前言

談到并行，我們可能最先想到的是線程，多個(gè)線程一起運(yùn)行，來提高我們系統(tǒng)的整體處理速度；為什么使用多個(gè)線程就能提高處理速度，因?yàn)楝F(xiàn)在計(jì)算機(jī)普遍都是多核處理器，我們需要充分利用cpu資源；如果站的更高一點(diǎn)來看，我們每臺(tái)機(jī)器都可以是一個(gè)處理節(jié)點(diǎn)，多臺(tái)機(jī)器并行處理；并行的處理方式可以說無處不在，本文主要來談?wù)凧ava在并行處理方面的努力。

無處不在的并行

Java的垃圾回收器，我們可以看到每一代版本的更新，伴隨著GC更短的延遲，從serial到cms再到現(xiàn)在的G1，一直在摘掉Java慢的帽子；消息隊(duì)列從早期的ActiveMQ到現(xiàn)在的kafka和RocketMQ，引入的分區(qū)的概念，提高了消息的并行性；數(shù)據(jù)庫單表數(shù)據(jù)到一定量級(jí)之后，訪問速度會(huì)很慢，我們會(huì)對表進(jìn)行分表處理，引入數(shù)據(jù)庫中間件；Redis你可能覺得本身處理是單線程的，但是Redis的集群方案中引入了slot(槽)的概念；更普遍的就是我們很多的業(yè)務(wù)系統(tǒng)，通常會(huì)部署多臺(tái)，通過負(fù)載均衡器來進(jìn)行分發(fā)；好了還有其他的一些例子，此處不在一一例舉。

如何并行

我覺得并行的核心在于"拆分"，把大任務(wù)變成小任務(wù)，然后利用多核CPU也好，還是多節(jié)點(diǎn)也好，同時(shí)并行的處理，Java歷代版本的更新，都在為我們開發(fā)者提供更方便的并行處理，從開始的Thread，到線程池，再到fork/join框架，最后到流處理，下面使用簡單的求和例子來看看各種方式是如何并行處理的；

單線程處理

首先看一下最簡單的單線程處理方式，直接使用主線程進(jìn)行求和操作；

public class SingleThread {

public static long[] numbers;

public static void main(String[] args) {

numbers = LongStream.rangeClosed(1, 10_000_000).toArray();

long sum = 0;

for (int i = 0; i < numbers.length; i++) {

sum += numbers[i];

}

System.out.println("sum = " + sum);

}

求和本身是一個(gè)計(jì)算密集型任務(wù)，但是現(xiàn)在已經(jīng)是多核時(shí)代，只用單線程，相當(dāng)于只使用了其中一個(gè)cpu，其他cpu被閑置，資源的浪費(fèi)；

Thread方式

我們把任務(wù)拆分成多個(gè)小任務(wù)，然后每個(gè)小任務(wù)分別啟動(dòng)一個(gè)線程，如下所示：

public class ThreadTest {

public static final int THRESHOLD = 10_000;

public static long[] numbers;

private static long allSum;

public static void main(String[] args) throws Exception {

numbers = LongStream.rangeClosed(1, 10_000_000).toArray();

int taskSize = (int) (numbers.length / THRESHOLD);

for (int i = 1; i <= taskSize; i++) {

final int key = i;

new Thread(new Runnable() {

public void run() {

sumAll(sum((key - 1) * THRESHOLD, key * THRESHOLD));

}

}).start();

}

Thread.sleep(100);

System.out.println("allSum = " + getAllSum());

}

private static synchronized long sumAll(long threadSum) {

return allSum += threadSum;

}

public static synchronized long getAllSum() {

return allSum;

}

private static long sum(int start, int end) {

long sum = 0;

for (int i = start; i < end; i++) {

sum += numbers[i];

}

return sum;

}

以上指定了一個(gè)拆分閥值，計(jì)算拆分多少個(gè)認(rèn)為，同時(shí)啟動(dòng)多少線程；這種處理就是啟動(dòng)的線程數(shù)過多，而CPU數(shù)有限，更重要的是求和是一個(gè)計(jì)算密集型任務(wù)，啟動(dòng)過多的線程只會(huì)帶來更多的線程上下文切換；同時(shí)線程處理完一個(gè)任務(wù)就終止了，也是對資源的浪費(fèi)；另外可以看到主線程不知道何時(shí)子任務(wù)已經(jīng)處理完了，需要做額外的處理；所有Java后續(xù)引入了線程池。

線程池方式

jdk1.5引入了并發(fā)包，其中包括了ThreadPoolExecutor，相關(guān)代碼如下：

public class ExecutorServiceTest {

public static final int THRESHOLD = 10_000;

public static long[] numbers;

public static void main(String[] args) throws Exception {

numbers = LongStream.rangeClosed(1, 10_000_000).toArray();

ExecutorService executor = Executors.newFixedThreadPool(Runtime.getRuntime().availableProcessors() + 1);

CompletionService completionService = new ExecutorCompletionService(executor);

int taskSize = (int) (numbers.length / THRESHOLD);

for (int i = 1; i <= taskSize; i++) {

final int key = i;

completionService.submit(new Callable() {

@Override

public Long call() throws Exception {

return sum((key - 1) * THRESHOLD, key * THRESHOLD);

}

});

}

long sumValue = 0;

for (int i = 0; i < taskSize; i++) {

sumValue += completionService.take().get();

}

// 所有任務(wù)已經(jīng)完成,關(guān)閉線程池

System.out.println("sumValue = " + sumValue);

executor.shutdown();

}

private static long sum(int start, int end) {

long sum = 0;

for (int i = start; i < end; i++) {

sum += numbers[i];

}

return sum;

}

上面已經(jīng)分析了計(jì)算密集型并不是線程越多越好，這里創(chuàng)建了JDK默認(rèn)的線程數(shù):CPU數(shù)+1，這是一個(gè)經(jīng)過大量測試以后給出的一個(gè)結(jié)果；線程池顧名思義，可以重復(fù)利用現(xiàn)有的線程；同時(shí)利用CompletionService來對子任務(wù)進(jìn)行匯總；合理的使用線程池已經(jīng)可以充分的并行處理任務(wù)，只是在寫法上有點(diǎn)繁瑣，此時(shí)JDK1.7中引入了fork/join框架；

fork/join框架

分支/合并框架的目的是以遞歸的方式將可以并行的認(rèn)為拆分成更小的任務(wù)，然后將每個(gè)子任務(wù)的結(jié)果合并起來生成整體結(jié)果；相關(guān)代碼如下：

public class ForkJoinTest extends java.util.concurrent.RecursiveTask {

private static final long serialVersionUID = 1L;

private final long[] numbers;

private final int start;

private final int end;

public static final long THRESHOLD = 10_000;

public ForkJoinTest(long[] numbers) {

this(numbers, 0, numbers.length);

}

private ForkJoinTest(long[] numbers, int start, int end) {

this.numbers = numbers;

this.start = start;

this.end = end;

}

@Override

protected Long compute() {

int length = end - start;

if (length <= THRESHOLD) {

return computeSequentially();

}

ForkJoinTest leftTask = new ForkJoinTest(numbers, start, start + length / 2);

leftTask.fork();

ForkJoinTest rightTask = new ForkJoinTest(numbers, start + length / 2, end);

Long rightResult = rightTask.compute();

// 注：join方法會(huì)阻塞，因此有必要在兩個(gè)子任務(wù)的計(jì)算都開始之后才執(zhí)行join方法

Long leftResult = leftTask.join();

return leftResult + rightResult;

}

private long computeSequentially() {

long sum = 0;

for (int i = start; i < end; i++) {

sum += numbers[i];

}

return sum;

}

public static void main(String[] args) {

System.out.println(forkJoinSum(10_000_000));

}

public static long forkJoinSum(long n) {

long[] numbers = LongStream.rangeClosed(1, n).toArray();

ForkJoinTask task = new ForkJoinTest(numbers);

return new ForkJoinPool().invoke(task);

}

ForkJoinPool是ExecutorService接口的一個(gè)實(shí)現(xiàn)，子認(rèn)為分配給線程池中的工作線程；同時(shí)需要把任務(wù)提交到此線程池中，需要?jiǎng)?chuàng)建RecursiveTask的一個(gè)子類；大體邏輯就是通過fork進(jìn)行拆分，然后通過join進(jìn)行結(jié)果的合并，JDK為我們提供了一個(gè)框架，我們只需要在里面填充即可，更加方便；有沒有更簡單的方式，連拆分都省了，自動(dòng)拆分合并，jdk在1.8中引入了流的概念；

流方式

Java8引入了stream的概念，可以讓我們更好的利用并行，使用流代碼如下：

public class StreamTest {

public static void main(String[] args) {

System.out.println("sum = " + parallelRangedSum(10_000_000));

}

public static long parallelRangedSum(long n) {

return LongStream.rangeClosed(1, n).parallel().reduce(0L, Long::sum);

}

以上代碼是不是非常簡單，對于開發(fā)者來說完全不需要手動(dòng)拆分，使用同步機(jī)制等方式，就可以讓任務(wù)并行處理，只需要對流使用parallel()方法，系統(tǒng)自動(dòng)會(huì)對任務(wù)進(jìn)行拆分，當(dāng)然前提是沒有共享可變狀態(tài)；其實(shí)并行流內(nèi)部使用的也是fork/join框架；

總結(jié)

本文使用一個(gè)求和的實(shí)例，來介紹了jdk為開發(fā)者提供并行處理的各種方式，可以看到Java一直在為提供更方便的并行處理而努力。

參考

總結(jié)

以上是生活随笔為你收集整理的java多核并行计算_谈谈Java任务的并行处理的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

多核
JAVA

上一篇：小米排第三！2022年手机厂商总出货量不
下一篇：有趣java_有趣的Java