/dports/math/onednn/oneDNN-2.5.1/src/gpu/jit/gemm/ |
H A D | gemm_recipes.hpp | 29 ngen::HW hw; 66 {ngen::HW::Gen9, "SSS", "NNN", {}, 16, 16, "ab8 ab16 ab acb", {}, {}}, 69 {ngen::HW::Gen9, "SSS", "NNN", {}, 32, 12, "ab1x2 ab16 ab acb", {}, {}}, 70 {ngen::HW::Gen9, "SSS", "NNN", {}, 32, 16, "ab1x2 ab16 ab acb", {}, {}}, 76 {ngen::HW::Gen9, "SSS", "NTN", {}, 16, 16, "ab4x2 ab16 ab acb", {}, {}}, 78 {ngen::HW::Gen9, "SSS", "NTN", {}, 32, 16, "ab4 ab4x2 ab acb", {}, {}}, 85 {ngen::HW::Gen9, "SSS", "TNN", {}, 16, 32, "as4 su4 ab k8 da cs", {}, {}}, 87 {ngen::HW::Gen9, "SSS", "TTN", {}, 16, 32, "as4 ab4 su k8 da cs", {}, {}}, 88 {ngen::HW::Gen9, "SSS", "TTT", {}, 16, 32, "as4 ab4 ab k8 da cs", {}, {}}, 110 {ngen::HW::Gen12LP, "SSS", "NNN", {}, 32, 8, "ab8 ab8 ab int", {}, {}}, [all …]
|
H A D | xe_hp_systolic_gemm_kernel.hpp | 47 ngen::DataType co_type = ngen::DataType::invalid; 48 ngen::DataType scale_type = ngen::DataType::f; 247 void emov(const ngen::InstructionModifier &mod, ngen::RegData dst, in emov() 252 void emov(const ngen::InstructionModifier &mod, ngen::RegData dst, in emov() 258 const ngen::RegData &src0, const ngen::RegData &src1) { in eadd() 264 const ngen::RegData &src0, ngen::Immediate src1) { in eadd() 270 const ngen::RegData &src0, const ngen::RegData &src1) { in emul() 276 const ngen::RegData &src0, ngen::Immediate src1) { in emul() 281 void eshl(const ngen::InstructionModifier &mod, ngen::RegData dst, in eshl() 287 void eshr(const ngen::InstructionModifier &mod, ngen::RegData dst, in eshr() [all …]
|
H A D | gen_gemm_kernel_generator.hpp | 109 ngen::DataType ngen() const { in ngen() function in dnnl::impl::gpu::jit::Type 245 Scalar(ngen::Subregister reg0, ngen::Subregister reg1) in Scalar() 287 ngen::HW hw, const ngen::RegData &rd) const; 304 ngen::RegData sub = ngen::Subregister {}; in operator >>() 1306 const ngen::RegData &src0, ngen::Immediate src1, in eadd() 1320 const ngen::RegData &src0, ngen::Immediate src1, in emul() 1441 ngen::Bundle hint = ngen::Bundle()); 1455 ngen::Bundle hint = ngen::Bundle(ngen::Bundle::any, 0)); 1977 ngen::RegData flagLoadB = ngen::RegData()); 1990 ngen::RegData flagWaitLoad = ngen::RegData(), [all …]
|
H A D | emulation.hpp | 136 ngen::RegData in, ngen::RegData &outLo, ngen::RegData &outHi) { in splitToDW() 175 static ngen::RegData lowWord(ngen::RegData in) { in lowWord() 187 static ngen::Immediate lowWord(const ngen::Immediate &in) { in lowWord() 198 ngen::RegData dst, ngen::RegData src0, in emov() 229 ngen::RegData dst, ngen::Immediate src0, in emov() 283 const ngen::RegData &src1, ngen::RegData &s1LoPos, in eaddSignExtend1() 284 ngen::RegData &s1Lo, ngen::RegData &s1Hi, bool &s1Q, in eaddSignExtend1() 336 ngen::RegData dst, ngen::RegData src0, S1 src1, in eaddInternal() 499 ngen::RegData dst, ngen::RegData src0, S1 src1, in emulInternal() 733 const ngen::RegData &src0, ngen::Immediate src1, \ [all …]
|
H A D | gen_gemm_kernel.hpp | 71 default: return ngen::HW::Unknown; in convert_dnnl_arch_to_hw() 75 ngen::HW hw_ = ngen::HW::Unknown; 78 ngen::NEOInterfaceHandler interface_ {ngen::HW::Unknown}; 82 static bool matching_hw(ngen::HW hw, ngen::HW hw_ref); 115 problem_.A.base = ngen::AddressBase::createA64(true); in init() 116 problem_.B.base = ngen::AddressBase::createA64(true); in init() 117 problem_.C.base = ngen::AddressBase::createA64(true); in init() 132 ? ngen::AddressBase::createA64(true) in init() 133 : ngen::AddressBase::createBTS(0); in init() 223 ? ngen::AddressBase::createA64(true) in init() [all …]
|
/dports/math/onednn/oneDNN-2.5.1/src/gpu/jit/ngen/ |
H A D | ngen_register_decl.hpp | 29 PREFIX constexpr ngen::GRF CG::r0; \ 30 PREFIX constexpr ngen::GRF CG::r1; \ 497 NGEN_REGISTER_DECL(ngen::BinaryCodeGenerator<hw>, template <ngen::HW hw>) 504 template class ngen::BinaryCodeGenerator<ngen::HW::Unknown>; 505 template class ngen::BinaryCodeGenerator<ngen::HW::Gen9>; 506 template class ngen::BinaryCodeGenerator<ngen::HW::Gen10>; 507 template class ngen::BinaryCodeGenerator<ngen::HW::Gen11>; 508 template class ngen::BinaryCodeGenerator<ngen::HW::Gen12LP>; 509 template class ngen::BinaryCodeGenerator<ngen::HW::XeHP>; 510 template class ngen::BinaryCodeGenerator<ngen::HW::XeHPG>; [all …]
|
H A D | ngen.hpp | 40 namespace ngen { namespace 1578 using ngen::BinaryCodeGenerator<hw>::r0; using ngen::BinaryCodeGenerator<hw>::r1; using ngen::Binar… 1579 using ngen::BinaryCodeGenerator<hw>::r4; using ngen::BinaryCodeGenerator<hw>::r5; using ngen::Binar… 1580 using ngen::BinaryCodeGenerator<hw>::r8; using ngen::BinaryCodeGenerator<hw>::r9; using ngen::Binar… 1619 using ngen::BinaryCodeGenerator<hw>::ce0; using ngen::BinaryCodeGenerator<hw>::sp; using ngen::Bina… 1620 using ngen::BinaryCodeGenerator<hw>::cr0; using ngen::BinaryCodeGenerator<hw>::n0; using ngen::Bina… 1633 using ngen::BinaryCodeGenerator<hw>::ze; using ngen::BinaryCodeGenerator<hw>::eq; using ngen::Binar… 1634 using ngen::BinaryCodeGenerator<hw>::gt; using ngen::BinaryCodeGenerator<hw>::ge; using ngen::Binar… 1636 using ngen::BinaryCodeGenerator<hw>::M0; using ngen::BinaryCodeGenerator<hw>::M4; using ngen::Binar… 1682 using ngen::BinaryCodeGenerator<hw>::D8; using ngen::BinaryCodeGenerator<hw>::D16; using ngen::Bina… [all …]
|
H A D | ngen_elf.hpp | 25 namespace ngen { namespace 229 int getSIMD() const { return ngen::ELFCodeGenerator<hw>::getSIMD(); } \ 230 int getGRFCount() const { return ngen::ELFCodeGenerator<hw>::getGRFCount(); } \ 244 void requireType(ngen::DataType type) { ngen::ELFCodeGenerator<hw>::requireType(type); } \ 250 template <typename... Targs> ngen::Subregister getArgument(Targs&&... args) { return ngen::ELFCodeG… 251 template <typename... Targs> ngen::Subregister getArgumentIfExists(Targs&&... args) { return ngen::… 254 template <typename... Targs> ngen::GRF getLocalID(Targs&&... args) { return ngen::ELFCodeGenerator<… 255 template <typename... Targs> ngen::RegData getSIMD1LocalID(Targs&&... args) { return ngen::ELFCodeG… 256 template <typename... Targs> ngen::Subregister getLocalSize(Targs&&... args) { return ngen::ELFCode… 257 void epilogue(const ngen::RegData &r0_info = ngen::RegData()) { ngen::ELFCodeGenerator<hw>::epilogu… [all …]
|
/dports/misc/mxnet/incubator-mxnet-1.9.0/3rdparty/mkldnn/src/gpu/jit/gemm/ |
H A D | gemm_recipes.hpp | 29 ngen::HW hw; 43 {ngen::HW::Gen9, "SSS", "NNN", {}, 16, 8, "ab4x2 ab16x2 ab acb nmk"}, 44 {ngen::HW::Gen9, "SSS", "NNN", {}, 16, 16, "ab8 ab16 ab acb"}, 45 {ngen::HW::Gen9, "SSS", "NNN", {}, 32, 8, "ab4x2 ab16x2 ab acb nmk"}, 46 {ngen::HW::Gen9, "SSS", "NNN", {}, 32, 12, "ab1x2 ab16 ab acb"}, 47 {ngen::HW::Gen9, "SSS", "NNN", {}, 32, 16, "ab1x2 ab16 ab acb"}, 48 {ngen::HW::Gen9, "SSS", "NNN", {}, 64, 8, "ab1x2 ab16 ab acb nmk"}, 52 {ngen::HW::Gen9, "SSS", "NTN", {}, 16, 16, "ab4x2 ab16 ab acb"}, 53 {ngen::HW::Gen9, "SSS", "NTN", {}, 16, 32, "ab1x2 ab8 ab acb"}, 54 {ngen::HW::Gen9, "SSS", "NTN", {}, 32, 16, "ab4 ab4x2 ab acb"}, [all …]
|
H A D | gen_gemm_kernel_generator.hpp | 92 ngen::DataType ngen() const { in ngen() function in dnnl::impl::gpu::jit::Type 191 Scalar(ngen::Subregister reg0, ngen::Subregister reg1) in Scalar() 233 ngen::HW hw, const ngen::RegData &rd) const; 239 ngen::Subregister regs[maxShift + 1] = {ngen::Subregister()}; 250 ngen::RegData sub = ngen::Subregister {}; in operator >>() 1107 const ngen::RegData &src0, ngen::Immediate src1, in eadd() 1121 const ngen::RegData &src0, ngen::Immediate src1, in emul() 1167 void ejmpi(ngen::InstructionModifier mod, ngen::Label &dst); 1177 const ngen::RegData &dst, const ngen::RegData &src0, 1215 ngen::Bundle hint = ngen::Bundle()); [all …]
|
H A D | emulation.hpp | 118 ngen::RegData in, ngen::RegData &outLo, ngen::RegData &outHi) { in splitToDW() 157 static ngen::RegData lowWord(ngen::RegData in) { in lowWord() 167 static ngen::Immediate lowWord(const ngen::Immediate &in) { in lowWord() 178 ngen::RegData dst, ngen::RegData src0, in emov() 202 ngen::RegData dst, ngen::Immediate src0, in emov() 256 const ngen::RegData &src1, ngen::RegData &s1LoPos, in eaddSignExtend1() 257 ngen::RegData &s1Lo, ngen::RegData &s1Hi, bool &s1Q, in eaddSignExtend1() 309 ngen::RegData dst, ngen::RegData src0, S1 src1, in eaddInternal() 472 ngen::RegData dst, ngen::RegData src0, S1 src1, in emulInternal() 700 const ngen::RegData &src0, ngen::Immediate src1, \ [all …]
|
H A D | gen_gemm_kernel.hpp | 38 if (hw_ == ngen::HW::Unknown) return status::unimplemented; in init_gemm() 67 case compute::gpu_arch_t::gen9: return ngen::HW::Gen9; in convert_dnnl_arch_to_hw() 68 case compute::gpu_arch_t::xe_lp: return ngen::HW::Xe_LP; in convert_dnnl_arch_to_hw() 69 default: return ngen::HW::Unknown; in convert_dnnl_arch_to_hw() 73 ngen::HW hw_ = ngen::HW::Unknown; 76 ngen::NEOInterfaceHandler interface_ {ngen::HW::Unknown}; 79 static bool matching_hw(ngen::HW hw, ngen::HW hw_ref); 105 problem_.A.base = ngen::AddressBase::createA64(true); in init() 106 problem_.B.base = ngen::AddressBase::createA64(true); in init() 107 problem_.C.base = ngen::AddressBase::createA64(true); in init() [all …]
|
/dports/misc/mxnet/incubator-mxnet-1.9.0/3rdparty/mkldnn/src/gpu/jit/ngen/ |
H A D | ngen_register_decl.hpp | 29 PREFIX constexpr ngen::GRF CG::r0; \ 30 PREFIX constexpr ngen::GRF CG::r1; \ 31 PREFIX constexpr ngen::GRF CG::r2; \ 32 PREFIX constexpr ngen::GRF CG::r3; \ 33 PREFIX constexpr ngen::GRF CG::r4; \ 34 PREFIX constexpr ngen::GRF CG::r5; \ 307 NGEN_REGISTER_DECL(ngen::BinaryCodeGenerator<hw>, template <ngen::HW hw>) 314 template class ngen::BinaryCodeGenerator<ngen::HW::Gen9>; 315 template class ngen::BinaryCodeGenerator<ngen::HW::Gen10>; 316 template class ngen::BinaryCodeGenerator<ngen::HW::Gen11>; [all …]
|
H A D | ngen.hpp | 38 namespace ngen { namespace 1336 using ngen::BinaryCodeGenerator<hw>::r0; using ngen::BinaryCodeGenerator<hw>::r1; using ngen::Binar… 1337 using ngen::BinaryCodeGenerator<hw>::r4; using ngen::BinaryCodeGenerator<hw>::r5; using ngen::Binar… 1338 using ngen::BinaryCodeGenerator<hw>::r8; using ngen::BinaryCodeGenerator<hw>::r9; using ngen::Binar… 1339 using ngen::BinaryCodeGenerator<hw>::r12; using ngen::BinaryCodeGenerator<hw>::r13; using ngen::Bin… 1340 using ngen::BinaryCodeGenerator<hw>::r16; using ngen::BinaryCodeGenerator<hw>::r17; using ngen::Bin… 1377 using ngen::BinaryCodeGenerator<hw>::ce0; using ngen::BinaryCodeGenerator<hw>::sp; using ngen::Bina… 1378 using ngen::BinaryCodeGenerator<hw>::cr0; using ngen::BinaryCodeGenerator<hw>::n0; using ngen::Bina… 1391 using ngen::BinaryCodeGenerator<hw>::ze; using ngen::BinaryCodeGenerator<hw>::eq; using ngen::Binar… 1392 using ngen::BinaryCodeGenerator<hw>::gt; using ngen::BinaryCodeGenerator<hw>::ge; using ngen::Binar… [all …]
|
H A D | ngen_elf.hpp | 25 namespace ngen { namespace 196 template <typename... Targs> void requireGRF(Targs&&... args) { ngen::ELFCodeGenerator<hw>::require… 201 template <typename... Targs> void requireSIMD(Targs&&... args) { ngen::ELFCodeGenerator<hw>::requir… 202 template <typename... Targs> void requireSLM(Targs&&... args) { ngen::ELFCodeGenerator<hw>::require… 203 void requireType(ngen::DataType type) { ngen::ELFCodeGenerator<hw>::requireType(type); } \ 204 template <typename DT = void> void requireType() { ngen::BinaryCodeGenerator<hw>::template requireT… 206 template <typename... Targs> void newArgument(Targs&&... args) { ngen::ELFCodeGenerator<hw>::newArg… 207 template <typename... Targs> ngen::Subregister getArgument(Targs&&... args) { return ngen::ELFCodeG… 208 template <typename... Targs> ngen::Subregister getArgumentIfExists(Targs&&... args) { return ngen::… 210 template <typename... Targs> ngen::GRF getLocalID(Targs&&... args) { return ngen::ELFCodeGenerator<… [all …]
|
/dports/math/onednn/oneDNN-2.5.1/src/gpu/jit/ |
H A D | jit_eltwise_injector.hpp | 50 const ngen::GRFRange &scratch = ngen::GRFRange(), in jit_eltwise_injector_f32() 70 void compute(const ngen::GRFRange ®s); 81 ngen::GRFRange scratch_; 92 void abs_compute_fwd(int simd, const ngen::GRF &r); 106 const ngen::GRF &temp, const ngen::GRF &dest, int phase, int off); 109 void sqrt_compute_fwd(int simd, const ngen::GRF &r); 110 void square_compute_fwd(int simd, const ngen::GRF &r); 111 void round_compute_fwd(int simd, const ngen::GRF &r); 121 void relu_compute_bwd(int simd, const ngen::GRF &r); 123 void square_compute_bwd(int simd, const ngen::GRF &r); [all …]
|
H A D | jit_generator.hpp | 27 namespace ngen { namespace 40 using gpu_gen_t = ngen::HW; 41 constexpr gpu_gen_t gpu_gen9 = ngen::HW::Gen9; 42 constexpr gpu_gen_t gpu_gen11 = ngen::HW::Gen11; 43 constexpr gpu_gen_t gpu_xe_lp = ngen::HW::XeLP; 44 constexpr gpu_gen_t gpu_xe_hp = ngen::HW::XeHP; 45 constexpr gpu_gen_t gpu_xe_hpg = ngen::HW::XeHPG; 46 constexpr gpu_gen_t gpu_xe_hpc = ngen::HW::XeHPC; 142 void emath(ngen::MathFunction fc, int simd, ngen::GRF dst, ngen::GRF src) { in emath() 147 void eexp(int simd, const ngen::GRF &dst, const ngen::GRF &src) { in eexp() [all …]
|
/dports/misc/mxnet/incubator-mxnet-1.9.0/3rdparty/mkldnn/src/gpu/jit/ |
H A D | jit_eltwise_injector.hpp | 42 const ngen::GRFRange &scratch = ngen::GRFRange(), in jit_eltwise_injector_f32() 61 void compute(const ngen::GRF ®) { compute(reg - reg); } in compute() 62 void compute(const ngen::GRFRange ®s); 73 ngen::GRFRange scratch_; 84 void abs_compute_fwd(int simd, const ngen::GRF &r); 85 void square_compute_fwd(int simd, const ngen::GRF &r); 86 void round_compute_fwd(int simd, const ngen::GRF &r); 93 void relu_compute_bwd(int simd, const ngen::GRF &r); 95 void square_compute_bwd(int simd, const ngen::GRF &r); 96 void linear_compute_bwd(int simd, const ngen::GRF &r); [all …]
|
H A D | jit_generator.hpp | 23 namespace ngen { namespace 36 using gpu_gen_t = ngen::HW; 37 constexpr gpu_gen_t gpu_gen9 = ngen::HW::Gen9; 38 constexpr gpu_gen_t gpu_gen11 = ngen::HW::Gen11; 39 constexpr gpu_gen_t gpu_xe_lp = ngen::HW::Xe_LP; 98 class jit_generator : public ngen::OpenCLCodeGenerator<hw>, 135 void emath(ngen::MathFunction fc, int simd, ngen::GRF dst, ngen::GRF src) { in emath() 139 void eexp(int simd, const ngen::GRF &dst, const ngen::GRF &src) { in eexp() 140 emath(ngen::MathFunction::exp, simd, dst, src); in eexp() 142 void einv(int simd, const ngen::GRF &dst, const ngen::GRF &src) { in einv() [all …]
|
/dports/science/elk/elk-7.2.42/src/spacegroup/ |
H A D | seitzgen.f90 | 127 do i=ngen+1,2*ngen 131 ngen=2*ngen 333 ngen=ngen+1 342 stgen(1,ngen)=stgen(1,ngen)+0.5d0 345 stgen(2,ngen)=stgen(2,ngen)+0.5d0 348 stgen(3,ngen)=stgen(3,ngen)+0.5d0 351 stgen(:,ngen)=stgen(:,ngen)+0.5d0 354 stgen(1,ngen)=stgen(1,ngen)+0.25d0 357 stgen(2,ngen)=stgen(2,ngen)+0.25d0 360 stgen(3,ngen)=stgen(3,ngen)+0.25d0 [all …]
|
/dports/math/onednn/oneDNN-2.5.1/src/gpu/jit/conv/ |
H A D | conv_kernel.hpp | 154 ngen::RegData ngen_reg_data(ngen::HW hw, const ngen::RegData &base, in ngen_reg_data() 178 ngen::Subregister ngen_subregister(ngen::HW hw, const ngen::RegData &base, in ngen_subregister() 185 ngen::Immediate ngen_negate(const ngen::Immediate &imm) { in ngen_negate() 213 type, ngen::DataType::bf, ngen::DataType::hf, ngen::DataType::f); in ngen_is_xf() 421 ngen::GRF alloc(ngen::Bundle bundle = ngen::Bundle()) { in alloc() 426 ngen::DataType type, ngen::Bundle bundle = ngen::Bundle()) { in alloc_sub() 433 ngen::Bundle bundle = ngen::Bundle()) { in alloc_reg_data() 929 ngen::HW hw, ngen::DataType type, const ngen::GRFRange &r, int idx) { in get_subregister() 940 template <ngen::HW hw = ngen::HW::Unknown> 1060 template <ngen::HW hw = ngen::HW::Unknown> [all …]
|
/dports/science/xtb/xtb-6.4.1/src/ |
H A D | symtranslib.f90 | 275 do 500 igen=1,ngen 476 ngen=0 504 ngen = ngen +1 529 ngen = ngen +1 548 ngen = ngen +1 562 ngen = ngen + 1 570 gen(4,ngen) = -gen(2,ngen) 573 gen(7,ngen) = gen(3,ngen) 574 gen(8,ngen) = -gen(6,ngen) 584 ngen = ngen +1 [all …]
|
/dports/science/nwchem/nwchem-7b21660b82ebd85ef659f6fba7e1e73433b0bd0a/src/NWints/api/ |
H A D | int_nint.F | 232 integer type, nprim, ngen, spcart local 250 if (.not.bas_continfo(ibasin,icnt,type,nprim,ngen,spcart)) 253 nbf = int_nbf_x(type)*ngen 262 nbf = int_nbf_x(type)*ngen 271 nbf = int_nbf_x(type)*ngen 280 nbf = int_nbf_x(type)*ngen 338 integer type, nprim, ngen, spcart local 362 nbf = int_nbf_x(type)*ngen 371 nbf = int_nbf_x(type)*ngen 380 nbf = int_nbf_x(type)*ngen [all …]
|
/dports/science/nwchem-data/nwchem-7.0.2-release/src/NWints/api/ |
H A D | int_nint.F | 232 integer type, nprim, ngen, spcart 250 if (.not.bas_continfo(ibasin,icnt,type,nprim,ngen,spcart)) 253 nbf = int_nbf_x(type)*ngen 262 nbf = int_nbf_x(type)*ngen 271 nbf = int_nbf_x(type)*ngen 280 nbf = int_nbf_x(type)*ngen 338 integer type, nprim, ngen, spcart 362 nbf = int_nbf_x(type)*ngen 371 nbf = int_nbf_x(type)*ngen 380 nbf = int_nbf_x(type)*ngen [all …]
|
/dports/science/nwchem-data/nwchem-7.0.2-release/src/basis/ |
H A D | testbasis.F | 26 integer rtdb, geom, basis, ngen,nprim, iang 95 write(LuOut,*)' user:query: ngen cont 1 ',ngen 97 if (nprim*ngen.gt.lexcf) call errquit 98 & (' lexcf too small ',(nprim*ngen), BASIS_ERR) 112 if (nprim*ngen.gt.lexcf) call errquit 113 & (' lexcf too small ',(nprim*ngen), BASIS_ERR) 114 write(LuOut,*)' unique:query: ngen cont 1 ',ngen 130 status = bas_setu_coeff(basis,1,coeff,nprim*ngen) 138 write(LuOut,*)' unique:query: ngen cont 1 ',ngen 140 if (nprim*ngen.gt.lexcf) call errquit [all …]
|