1 //  RUN: %clang_cc1 -flax-vector-conversions=none -ffreestanding %s -triple=x86_64-apple-darwin \
2 //  RUN:            -target-feature +avx512bf16 -emit-llvm -o - -Wall -Werror \
3 //  RUN:            | FileCheck %s
4 
5 #include <immintrin.h>
6 
test_mm_cvtsbh_ss(__bfloat16 A)7 float test_mm_cvtsbh_ss(__bfloat16 A) {
8   // CHECK-LABEL: @test_mm_cvtsbh_ss
9   // CHECK: zext i16 %{{.*}} to i32
10   // CHECK: shl i32 %{{.*}}, 16
11   // CHECK: bitcast i32 %{{.*}} to float
12   // CHECK: ret float %{{.*}}
13   return _mm_cvtsbh_ss(A);
14 }
15 
test_mm512_cvtne2ps_pbh(__m512 A,__m512 B)16 __m512bh test_mm512_cvtne2ps_pbh(__m512 A, __m512 B) {
17   // CHECK-LABEL: @test_mm512_cvtne2ps_pbh
18   // CHECK: @llvm.x86.avx512bf16.cvtne2ps2bf16.512
19   // CHECK: ret <32 x i16> %{{.*}}
20   return _mm512_cvtne2ps_pbh(A, B);
21 }
22 
test_mm512_maskz_cvtne2ps_pbh(__m512 A,__m512 B,__mmask32 U)23 __m512bh test_mm512_maskz_cvtne2ps_pbh(__m512 A, __m512 B, __mmask32 U) {
24   // CHECK-LABEL: @test_mm512_maskz_cvtne2ps_pbh
25   // CHECK: @llvm.x86.avx512bf16.cvtne2ps2bf16.512
26   // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}}
27   // CHECK: ret <32 x i16> %{{.*}}
28   return _mm512_maskz_cvtne2ps_pbh(U, A, B);
29 }
30 
test_mm512_mask_cvtne2ps_pbh(__m512bh C,__mmask32 U,__m512 A,__m512 B)31 __m512bh test_mm512_mask_cvtne2ps_pbh(__m512bh C, __mmask32 U, __m512 A, __m512 B) {
32   // CHECK-LABEL: @test_mm512_mask_cvtne2ps_pbh
33   // CHECK: @llvm.x86.avx512bf16.cvtne2ps2bf16.512
34   // CHECK: select <32 x i1> %{{.*}}, <32 x i16> %{{.*}}, <32 x i16> %{{.*}}
35   // CHECK: ret <32 x i16> %{{.*}}
36   return _mm512_mask_cvtne2ps_pbh(C, U, A, B);
37 }
38 
test_mm512_cvtneps_pbh(__m512 A)39 __m256bh test_mm512_cvtneps_pbh(__m512 A) {
40   // CHECK-LABEL: @test_mm512_cvtneps_pbh
41   // CHECK: @llvm.x86.avx512bf16.cvtneps2bf16.512
42   // CHECK: ret <16 x i16> %{{.*}}
43   return _mm512_cvtneps_pbh(A);
44 }
45 
test_mm512_mask_cvtneps_pbh(__m256bh C,__mmask16 U,__m512 A)46 __m256bh test_mm512_mask_cvtneps_pbh(__m256bh C, __mmask16 U, __m512 A) {
47   // CHECK-LABEL: @test_mm512_mask_cvtneps_pbh
48   // CHECK: @llvm.x86.avx512bf16.cvtneps2bf16.512
49   // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}}
50   // CHECK: ret <16 x i16> %{{.*}}
51   return _mm512_mask_cvtneps_pbh(C, U, A);
52 }
53 
test_mm512_maskz_cvtneps_pbh(__m512 A,__mmask16 U)54 __m256bh test_mm512_maskz_cvtneps_pbh(__m512 A, __mmask16 U) {
55   // CHECK-LABEL: @test_mm512_maskz_cvtneps_pbh
56   // CHECK: @llvm.x86.avx512bf16.cvtneps2bf16.512
57   // CHECK: select <16 x i1> %{{.*}}, <16 x i16> %{{.*}}, <16 x i16> %{{.*}}
58   // CHECK: ret <16 x i16> %{{.*}}
59   return _mm512_maskz_cvtneps_pbh(U, A);
60 }
61 
test_mm512_dpbf16_ps(__m512 D,__m512bh A,__m512bh B)62 __m512 test_mm512_dpbf16_ps(__m512 D, __m512bh A, __m512bh B) {
63   // CHECK-LABEL: @test_mm512_dpbf16_ps
64   // CHECK: @llvm.x86.avx512bf16.dpbf16ps.512
65   // CHECK: ret <16 x float> %{{.*}}
66   return _mm512_dpbf16_ps(D, A, B);
67 }
68 
test_mm512_maskz_dpbf16_ps(__m512 D,__m512bh A,__m512bh B,__mmask16 U)69 __m512 test_mm512_maskz_dpbf16_ps(__m512 D, __m512bh A, __m512bh B, __mmask16 U) {
70   // CHECK-LABEL: @test_mm512_maskz_dpbf16_ps
71   // CHECK: @llvm.x86.avx512bf16.dpbf16ps.512
72   // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}}
73   // CHECK: ret <16 x float> %{{.*}}
74   return _mm512_maskz_dpbf16_ps(U, D, A, B);
75 }
76 
test_mm512_mask_dpbf16_ps(__m512 D,__m512bh A,__m512bh B,__mmask16 U)77 __m512 test_mm512_mask_dpbf16_ps(__m512 D, __m512bh A, __m512bh B, __mmask16 U) {
78   // CHECK-LABEL: @test_mm512_mask_dpbf16_ps
79   // CHECK: @llvm.x86.avx512bf16.dpbf16ps.512
80   // CHECK: select <16 x i1> %{{.*}}, <16 x float> %{{.*}}, <16 x float> %{{.*}}
81   // CHECK: ret <16 x float> %{{.*}}
82   return _mm512_mask_dpbf16_ps(D, U, A, B);
83 }
84 
test_mm512_cvtpbh_ps(__m256bh A)85 __m512 test_mm512_cvtpbh_ps(__m256bh A) {
86   // CHECK-LABEL: @test_mm512_cvtpbh_ps
87   // CHECK: sext <16 x i16> %{{.*}} to <16 x i32>
88   // CHECK: @llvm.x86.avx512.pslli.d.512
89   // CHECK: bitcast <8 x i64> %{{.*}} to <16 x float>
90   // CHECK: ret <16 x float> %{{.*}}
91   return _mm512_cvtpbh_ps(A);
92 }
93 
test_mm512_maskz_cvtpbh_ps(__mmask16 M,__m256bh A)94 __m512 test_mm512_maskz_cvtpbh_ps(__mmask16 M, __m256bh A) {
95   // CHECK-LABEL: @test_mm512_maskz_cvtpbh_ps
96   // CHECK: sext <16 x i16> %{{.*}} to <16 x i32>
97   // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}}
98   // CHECK: @llvm.x86.avx512.pslli.d.512
99   // CHECK: bitcast <8 x i64> %{{.*}} to <16 x float>
100   // CHECK: ret <16 x float> %{{.*}}
101   return _mm512_maskz_cvtpbh_ps(M, A);
102 }
103 
test_mm512_mask_cvtpbh_ps(__m512 S,__mmask16 M,__m256bh A)104 __m512 test_mm512_mask_cvtpbh_ps(__m512 S, __mmask16 M, __m256bh A) {
105   // CHECK-LABEL: @test_mm512_mask_cvtpbh_ps
106   // CHECK: sext <16 x i16> %{{.*}} to <16 x i32>
107   // CHECK: @llvm.x86.avx512.pslli.d.512
108   // CHECK: select <16 x i1> %{{.*}}, <16 x i32> %{{.*}}, <16 x i32> %{{.*}}
109   // CHECK: bitcast <8 x i64> %{{.*}} to <16 x float>
110   // CHECK: ret <16 x float> %{{.*}}
111   return _mm512_mask_cvtpbh_ps(S, M, A);
112 }
113