1 /*===---- avx512vpopcntdqintrin.h - AVX512VPOPCNTDQ intrinsics -------------===
2 *
3 *
4 * Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
5 * See https://llvm.org/LICENSE.txt for license information.
6 * SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
7 *
8 *===-----------------------------------------------------------------------===
9 */
10 #ifndef __IMMINTRIN_H
11 #error \
12 "Never use <avx512vpopcntdqvlintrin.h> directly; include <immintrin.h> instead."
13 #endif
14
15 #ifndef __AVX512VPOPCNTDQVLINTRIN_H
16 #define __AVX512VPOPCNTDQVLINTRIN_H
17
18 /* Define the default attributes for the functions in this file. */
19 #define __DEFAULT_FN_ATTRS128 \
20 __attribute__((__always_inline__, __nodebug__, \
21 __target__("avx512vpopcntdq,avx512vl,no-evex512"), \
22 __min_vector_width__(128)))
23 #define __DEFAULT_FN_ATTRS256 \
24 __attribute__((__always_inline__, __nodebug__, \
25 __target__("avx512vpopcntdq,avx512vl,no-evex512"), \
26 __min_vector_width__(256)))
27
28 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_popcnt_epi64(__m128i __A)29 _mm_popcnt_epi64(__m128i __A) {
30 return (__m128i)__builtin_ia32_vpopcntq_128((__v2di)__A);
31 }
32
33 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_popcnt_epi64(__m128i __W,__mmask8 __U,__m128i __A)34 _mm_mask_popcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) {
35 return (__m128i)__builtin_ia32_selectq_128(
36 (__mmask8)__U, (__v2di)_mm_popcnt_epi64(__A), (__v2di)__W);
37 }
38
39 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_popcnt_epi64(__mmask8 __U,__m128i __A)40 _mm_maskz_popcnt_epi64(__mmask8 __U, __m128i __A) {
41 return _mm_mask_popcnt_epi64((__m128i)_mm_setzero_si128(), __U, __A);
42 }
43
44 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_popcnt_epi32(__m128i __A)45 _mm_popcnt_epi32(__m128i __A) {
46 return (__m128i)__builtin_ia32_vpopcntd_128((__v4si)__A);
47 }
48
49 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_popcnt_epi32(__m128i __W,__mmask8 __U,__m128i __A)50 _mm_mask_popcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) {
51 return (__m128i)__builtin_ia32_selectd_128(
52 (__mmask8)__U, (__v4si)_mm_popcnt_epi32(__A), (__v4si)__W);
53 }
54
55 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_popcnt_epi32(__mmask8 __U,__m128i __A)56 _mm_maskz_popcnt_epi32(__mmask8 __U, __m128i __A) {
57 return _mm_mask_popcnt_epi32((__m128i)_mm_setzero_si128(), __U, __A);
58 }
59
60 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_popcnt_epi64(__m256i __A)61 _mm256_popcnt_epi64(__m256i __A) {
62 return (__m256i)__builtin_ia32_vpopcntq_256((__v4di)__A);
63 }
64
65 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_popcnt_epi64(__m256i __W,__mmask8 __U,__m256i __A)66 _mm256_mask_popcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) {
67 return (__m256i)__builtin_ia32_selectq_256(
68 (__mmask8)__U, (__v4di)_mm256_popcnt_epi64(__A), (__v4di)__W);
69 }
70
71 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_popcnt_epi64(__mmask8 __U,__m256i __A)72 _mm256_maskz_popcnt_epi64(__mmask8 __U, __m256i __A) {
73 return _mm256_mask_popcnt_epi64((__m256i)_mm256_setzero_si256(), __U, __A);
74 }
75
76 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_popcnt_epi32(__m256i __A)77 _mm256_popcnt_epi32(__m256i __A) {
78 return (__m256i)__builtin_ia32_vpopcntd_256((__v8si)__A);
79 }
80
81 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_popcnt_epi32(__m256i __W,__mmask8 __U,__m256i __A)82 _mm256_mask_popcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) {
83 return (__m256i)__builtin_ia32_selectd_256(
84 (__mmask8)__U, (__v8si)_mm256_popcnt_epi32(__A), (__v8si)__W);
85 }
86
87 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_popcnt_epi32(__mmask8 __U,__m256i __A)88 _mm256_maskz_popcnt_epi32(__mmask8 __U, __m256i __A) {
89 return _mm256_mask_popcnt_epi32((__m256i)_mm256_setzero_si256(), __U, __A);
90 }
91
92 #undef __DEFAULT_FN_ATTRS128
93 #undef __DEFAULT_FN_ATTRS256
94
95 #endif
96