1; RUN: opt %s -loop-vectorize -force-vector-interleave=2 -force-vector-width=4 -S | FileCheck %s
2
3; Fixes PR43828
4
5define void @test(i32* %B) {
6; CHECK-LABEL: @test(
7; CHECK:       vector.body:
8; CHECK-COUNT-2: sub <4 x i32>
9entry:
10  br label %outer_loop
11
12outer_loop:
13  %local_4 = phi i32 [ 2, %entry ], [ %4, %outer_tail]
14  br label %inner_loop
15
16inner_loop:
17  %local_2 = phi i32 [ 0, %outer_loop ], [ %1, %inner_loop ]
18  %local_3 = phi i32 [ -104, %outer_loop ], [ %0, %inner_loop ]
19  %0 = sub nuw nsw i32 %local_3, %local_4
20  %1 = add nuw nsw i32 %local_2, 1
21  %2 = icmp ugt i32 %local_2, 126
22  br i1 %2, label %outer_tail, label %inner_loop
23
24outer_tail:
25  %3 = phi i32 [ %0, %inner_loop ]
26  store atomic i32 %3, i32 * %B unordered, align 8
27  %4 = add i32 %local_4, 1
28  %5 = icmp slt i32 %4, 6
29  br i1 %5, label %outer_loop, label %exit
30
31exit:
32  ret void
33}
34
35define i32 @multi-instr(i32* noalias nocapture %A, i32* noalias nocapture %B, i32 %inc) {
36; CHECK-LABEL: @multi-instr(
37; CHECK:       vector.body:
38; CHECK-COUNT-4: add <4 x i32>
39entry:
40  br label %loop
41
42loop:
43  %iv = phi i32 [0, %entry], [%iv_inc, %loop]
44  %redu = phi i32 [0, %entry], [%3, %loop]
45  %gepa = getelementptr inbounds i32, i32* %A, i32 %iv
46  %gepb = getelementptr inbounds i32, i32* %B, i32 %iv
47  %0 = load i32, i32* %gepa
48  %1 = load i32, i32* %gepb
49  %2 = add nuw nsw i32 %redu, %0
50  %3 = add nuw nsw i32 %2, %1
51  %iv_inc = add nuw nsw i32 %iv, 1
52  %4 = icmp ult i32 %iv_inc, 128
53  br i1 %4, label %loop, label %exit
54
55exit:
56  %lcssa = phi i32 [%3, %loop]
57  ret i32 %lcssa
58}
59