1 /*===---- avx512vpopcntdqintrin.h - AVX512VPOPCNTDQ intrinsics -------------===
2 *
3 *
4 * Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
5 * See https://llvm.org/LICENSE.txt for license information.
6 * SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
7 *
8 *===-----------------------------------------------------------------------===
9 */
10 #ifndef __IMMINTRIN_H
11 #error \
12 "Never use <avx512vpopcntdqvlintrin.h> directly; include <immintrin.h> instead."
13 #endif
14
15 #ifndef __AVX512VPOPCNTDQVLINTRIN_H
16 #define __AVX512VPOPCNTDQVLINTRIN_H
17
18 /* Define the default attributes for the functions in this file. */
19 #define __DEFAULT_FN_ATTRS128 \
20 __attribute__((__always_inline__, __nodebug__, __target__("avx512vpopcntdq,avx512vl"), __min_vector_width__(128)))
21 #define __DEFAULT_FN_ATTRS256 \
22 __attribute__((__always_inline__, __nodebug__, __target__("avx512vpopcntdq,avx512vl"), __min_vector_width__(256)))
23
24 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_popcnt_epi64(__m128i __A)25 _mm_popcnt_epi64(__m128i __A) {
26 return (__m128i)__builtin_ia32_vpopcntq_128((__v2di)__A);
27 }
28
29 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_popcnt_epi64(__m128i __W,__mmask8 __U,__m128i __A)30 _mm_mask_popcnt_epi64(__m128i __W, __mmask8 __U, __m128i __A) {
31 return (__m128i)__builtin_ia32_selectq_128(
32 (__mmask8)__U, (__v2di)_mm_popcnt_epi64(__A), (__v2di)__W);
33 }
34
35 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_popcnt_epi64(__mmask8 __U,__m128i __A)36 _mm_maskz_popcnt_epi64(__mmask8 __U, __m128i __A) {
37 return _mm_mask_popcnt_epi64((__m128i)_mm_setzero_si128(), __U, __A);
38 }
39
40 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_popcnt_epi32(__m128i __A)41 _mm_popcnt_epi32(__m128i __A) {
42 return (__m128i)__builtin_ia32_vpopcntd_128((__v4si)__A);
43 }
44
45 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_mask_popcnt_epi32(__m128i __W,__mmask8 __U,__m128i __A)46 _mm_mask_popcnt_epi32(__m128i __W, __mmask8 __U, __m128i __A) {
47 return (__m128i)__builtin_ia32_selectd_128(
48 (__mmask8)__U, (__v4si)_mm_popcnt_epi32(__A), (__v4si)__W);
49 }
50
51 static __inline__ __m128i __DEFAULT_FN_ATTRS128
_mm_maskz_popcnt_epi32(__mmask8 __U,__m128i __A)52 _mm_maskz_popcnt_epi32(__mmask8 __U, __m128i __A) {
53 return _mm_mask_popcnt_epi32((__m128i)_mm_setzero_si128(), __U, __A);
54 }
55
56 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_popcnt_epi64(__m256i __A)57 _mm256_popcnt_epi64(__m256i __A) {
58 return (__m256i)__builtin_ia32_vpopcntq_256((__v4di)__A);
59 }
60
61 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_popcnt_epi64(__m256i __W,__mmask8 __U,__m256i __A)62 _mm256_mask_popcnt_epi64(__m256i __W, __mmask8 __U, __m256i __A) {
63 return (__m256i)__builtin_ia32_selectq_256(
64 (__mmask8)__U, (__v4di)_mm256_popcnt_epi64(__A), (__v4di)__W);
65 }
66
67 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_popcnt_epi64(__mmask8 __U,__m256i __A)68 _mm256_maskz_popcnt_epi64(__mmask8 __U, __m256i __A) {
69 return _mm256_mask_popcnt_epi64((__m256i)_mm256_setzero_si256(), __U, __A);
70 }
71
72 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_popcnt_epi32(__m256i __A)73 _mm256_popcnt_epi32(__m256i __A) {
74 return (__m256i)__builtin_ia32_vpopcntd_256((__v8si)__A);
75 }
76
77 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_mask_popcnt_epi32(__m256i __W,__mmask8 __U,__m256i __A)78 _mm256_mask_popcnt_epi32(__m256i __W, __mmask8 __U, __m256i __A) {
79 return (__m256i)__builtin_ia32_selectd_256(
80 (__mmask8)__U, (__v8si)_mm256_popcnt_epi32(__A), (__v8si)__W);
81 }
82
83 static __inline__ __m256i __DEFAULT_FN_ATTRS256
_mm256_maskz_popcnt_epi32(__mmask8 __U,__m256i __A)84 _mm256_maskz_popcnt_epi32(__mmask8 __U, __m256i __A) {
85 return _mm256_mask_popcnt_epi32((__m256i)_mm256_setzero_si256(), __U, __A);
86 }
87
88 #undef __DEFAULT_FN_ATTRS128
89 #undef __DEFAULT_FN_ATTRS256
90
91 #endif
92