/dports/math/clblas/clBLAS-2.10/src/library/blas/gens/clTemplates/ |
H A D | sgemm_gcn.cl | 18 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 19 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 20 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 21 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 22 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 23 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 24 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 25 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 26 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 27 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ [all …]
|
H A D | sgemm_gcn_bigMatrices.cl | 21 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 22 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 23 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 24 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 25 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 26 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 27 rC[6][0]=mad(rA[0][6],rB[0][0],rC[6][0]); \ 29 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 30 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 31 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ [all …]
|
H A D | sgemm_hawaiiSplitKernel.cl | 18 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 19 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 20 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 21 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 22 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 23 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 24 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 25 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 26 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 27 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ [all …]
|
H A D | dgemm_hawai.cl | 137 rC[0][0] = mad(rA[0],rB[0],rC[0][0]); 138 rC[0][1] = mad(rA[1],rB[0],rC[0][1]); 139 rC[0][2] = mad(rA[2],rB[0],rC[0][2]); 140 rC[0][3] = mad(rA[3],rB[0],rC[0][3]); 141 rC[0][4] = mad(rA[4],rB[0],rC[0][4]); 142 rC[0][5] = mad(rA[5],rB[0],rC[0][5]); 143 rC[1][0] = mad(rA[0],rB[1],rC[1][0]); 144 rC[1][1] = mad(rA[1],rB[1],rC[1][1]); 145 rC[1][2] = mad(rA[2],rB[1],rC[1][2]); 146 rC[1][3] = mad(rA[3],rB[1],rC[1][3]); [all …]
|
H A D | dgemm_hawaiiSplitKernel.cl | 3756 rC[0][0]=mad(rA[0],rB[0],rC[0][0]); 3757 rC[1][0]=mad(rA[1],rB[0],rC[1][0]); 3758 rC[2][0]=mad(rA[2],rB[0],rC[2][0]); 3759 rC[3][0]=mad(rA[3],rB[0],rC[3][0]); 3760 rC[4][0]=mad(rA[4],rB[0],rC[4][0]); 3761 rC[5][0]=mad(rA[5],rB[0],rC[5][0]); 3762 rC[0][1]=mad(rA[0],rB[1],rC[0][1]); 3763 rC[1][1]=mad(rA[1],rB[1],rC[1][1]); 3764 rC[2][1]=mad(rA[2],rB[1],rC[2][1]); 3765 rC[3][1]=mad(rA[3],rB[1],rC[3][1]); [all …]
|
H A D | dgemm_NT_MN48.cl | 83 rC[0][0] = fma(rA[0],rB[0],rC[0][0]); 84 rC[0][1] = fma(rA[1],rB[0],rC[0][1]); 85 rC[0][2] = fma(rA[2],rB[0],rC[0][2]); 86 rC[0][3] = fma(rA[3],rB[0],rC[0][3]); 87 rC[0][4] = fma(rA[4],rB[0],rC[0][4]); 88 rC[0][5] = fma(rA[5],rB[0],rC[0][5]); 89 rC[1][0] = fma(rA[0],rB[1],rC[1][0]); 90 rC[1][1] = fma(rA[1],rB[1],rC[1][1]); 91 rC[1][2] = fma(rA[2],rB[1],rC[1][2]); 92 rC[1][3] = fma(rA[3],rB[1],rC[1][3]); [all …]
|
/dports/math/clblas/clBLAS-2.10/src/library/blas/AutoGemm/UserGemmKernelSources/ |
H A D | sgemm_Col_NT_B1_MX128_NX128_KX16_src.cpp | 49 rC[0][0] = mad(rA[0][0],rB[0][0],rC[0][0]); \ 50 rC[1][0] = mad(rA[0][1],rB[0][0],rC[1][0]); \ 51 rC[2][0] = mad(rA[0][2],rB[0][0],rC[2][0]); \ 52 rC[3][0] = mad(rA[0][3],rB[0][0],rC[3][0]); \ 53 rC[4][0] = mad(rA[0][4],rB[0][0],rC[4][0]); \ 54 rC[5][0] = mad(rA[0][5],rB[0][0],rC[5][0]); \ 55 rC[6][0] = mad(rA[0][6],rB[0][0],rC[6][0]); \ 56 rC[7][0] = mad(rA[0][7],rB[0][0],rC[7][0]); \ 57 rC[0][1] = mad(rA[0][0], rB[0][1], rC[0][1]); \ 58 rC[1][1] = mad(rA[0][1], rB[0][1], rC[1][1]); \ [all …]
|
H A D | dgemm_Col_TN_B0_MX048_NX048_KX08_src.cpp | 105 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); 106 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); 107 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); 108 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); 109 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); 110 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); 111 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); 112 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); 113 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); 114 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); [all …]
|
H A D | dgemm_Col_NN_B0_MX048_NX048_KX08_src.cpp | 38 rC[0][0]=mad(rA[0],rB[0],rC[0][0]); \ 39 rC[1][0]=mad(rA[1],rB[0],rC[1][0]); \ 40 rC[2][0]=mad(rA[2],rB[0],rC[2][0]); \ 41 rC[3][0]=mad(rA[3],rB[0],rC[3][0]); \ 42 rC[4][0]=mad(rA[4],rB[0],rC[4][0]); \ 43 rC[5][0]=mad(rA[5],rB[0],rC[5][0]); \ 44 rC[0][1]=mad(rA[0],rB[1],rC[0][1]); \ 45 rC[1][1]=mad(rA[1],rB[1],rC[1][1]); \ 46 rC[2][1]=mad(rA[2],rB[1],rC[2][1]); \ 47 rC[3][1]=mad(rA[3],rB[1],rC[3][1]); \ [all …]
|
H A D | sgemm_Col_NN_B0_MX096_NX096_KX16_src.cpp | 37 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 38 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 39 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 40 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 41 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 42 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 43 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 44 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 45 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 46 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ [all …]
|
H A D | sgemm_Col_NT_B0_MX096_NX096_KX16_src.cpp | 37 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 38 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 39 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 40 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 41 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 42 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 43 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 44 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 45 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 46 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ [all …]
|
H A D | sgemm_Col_TN_B1_MX096_NX096_KX16_src.cpp | 37 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 38 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 39 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 40 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 41 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 42 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 43 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 44 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 45 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 46 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ [all …]
|
H A D | sgemm_Col_NN_B1_MX096_NX096_KX16_src.cpp | 37 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 38 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 39 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 40 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 41 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 42 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 43 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 44 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 45 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 46 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ [all …]
|
H A D | sgemm_Col_NT_B1_MX096_NX096_KX16_src.cpp | 39 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 40 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 41 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 42 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 43 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 44 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 45 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 46 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 47 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 48 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ [all …]
|
H A D | dgemm_Col_NN_B1_MX048_NX048_KX08_src.cpp | 38 rC[0][0]=mad(rA[0],rB[0],rC[0][0]); \ 39 rC[1][0]=mad(rA[1],rB[0],rC[1][0]); \ 40 rC[2][0]=mad(rA[2],rB[0],rC[2][0]); \ 41 rC[3][0]=mad(rA[3],rB[0],rC[3][0]); \ 42 rC[4][0]=mad(rA[4],rB[0],rC[4][0]); \ 43 rC[5][0]=mad(rA[5],rB[0],rC[5][0]); \ 44 rC[0][1]=mad(rA[0],rB[1],rC[0][1]); \ 45 rC[1][1]=mad(rA[1],rB[1],rC[1][1]); \ 46 rC[2][1]=mad(rA[2],rB[1],rC[2][1]); \ 47 rC[3][1]=mad(rA[3],rB[1],rC[3][1]); \ [all …]
|
H A D | dgemm_Col_TN_B1_MX048_NX048_KX08_src.cpp | 105 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); 106 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); 107 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); 108 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); 109 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); 110 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); 111 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); 112 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); 113 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); 114 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); [all …]
|
H A D | sgemm_Col_TN_B0_MX096_NX096_KX16_src.cpp | 37 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 38 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 39 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 40 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 41 rC[4][0]=mad(rA[0][4],rB[0][0],rC[4][0]); \ 42 rC[5][0]=mad(rA[0][5],rB[0][0],rC[5][0]); \ 43 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 44 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 45 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 46 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ [all …]
|
H A D | dgemm_Col_NT_B0_MX048_NX048_KX08_src.cpp | 45 rC[0][0] = mad(rA[0],rB[0],rC[0][0]); \ 46 rC[0][1] = mad(rA[1],rB[0],rC[0][1]); \ 47 rC[0][2] = mad(rA[2],rB[0],rC[0][2]); \ 48 rC[0][3] = mad(rA[3],rB[0],rC[0][3]); \ 49 rC[0][4] = mad(rA[4],rB[0],rC[0][4]); \ 50 rC[0][5] = mad(rA[5],rB[0],rC[0][5]); \ 51 rC[1][0] = mad(rA[0],rB[1],rC[1][0]); \ 52 rC[1][1] = mad(rA[1],rB[1],rC[1][1]); \ 53 rC[1][2] = mad(rA[2],rB[1],rC[1][2]); \ 54 rC[1][3] = mad(rA[3],rB[1],rC[1][3]); \ [all …]
|
H A D | dgemm_Col_NT_B1_MX048_NX048_KX08_src.cpp | 45 rC[0][0] = mad(rA[0],rB[0],rC[0][0]); \ 46 rC[0][1] = mad(rA[1],rB[0],rC[0][1]); \ 47 rC[0][2] = mad(rA[2],rB[0],rC[0][2]); \ 48 rC[0][3] = mad(rA[3],rB[0],rC[0][3]); \ 49 rC[0][4] = mad(rA[4],rB[0],rC[0][4]); \ 50 rC[0][5] = mad(rA[5],rB[0],rC[0][5]); \ 51 rC[1][0] = mad(rA[0],rB[1],rC[1][0]); \ 52 rC[1][1] = mad(rA[1],rB[1],rC[1][1]); \ 53 rC[1][2] = mad(rA[2],rB[1],rC[1][2]); \ 54 rC[1][3] = mad(rA[3],rB[1],rC[1][3]); \ [all …]
|
H A D | sgemm_Col_NN_B0_MX064_NX064_KX16_src.cpp | 33 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 34 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 35 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 36 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 37 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 38 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 39 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 40 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ 41 rC[0][2]=mad(rA[0][0],rB[0][2],rC[0][2]); \ 42 rC[1][2]=mad(rA[0][1],rB[0][2],rC[1][2]); \ [all …]
|
H A D | sgemm_Col_NT_B0_MX064_NX064_KX16_src.cpp | 33 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 34 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 35 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 36 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 37 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 38 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 39 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 40 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ 41 rC[0][2]=mad(rA[0][0],rB[0][2],rC[0][2]); \ 42 rC[1][2]=mad(rA[0][1],rB[0][2],rC[1][2]); \ [all …]
|
H A D | sgemm_Col_TN_B0_MX064_NX064_KX16_src.cpp | 33 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 34 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 35 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 36 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 37 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 38 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 39 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 40 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ 41 rC[0][2]=mad(rA[0][0],rB[0][2],rC[0][2]); \ 42 rC[1][2]=mad(rA[0][1],rB[0][2],rC[1][2]); \ [all …]
|
H A D | sgemm_Col_NN_B1_MX064_NX064_KX16_src.cpp | 33 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 34 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 35 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 36 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 37 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 38 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 39 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 40 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ 41 rC[0][2]=mad(rA[0][0],rB[0][2],rC[0][2]); \ 42 rC[1][2]=mad(rA[0][1],rB[0][2],rC[1][2]); \ [all …]
|
H A D | sgemm_Col_TN_B1_MX064_NX064_KX16_src.cpp | 33 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 34 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 35 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 36 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 37 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 38 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 39 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 40 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ 41 rC[0][2]=mad(rA[0][0],rB[0][2],rC[0][2]); \ 42 rC[1][2]=mad(rA[0][1],rB[0][2],rC[1][2]); \ [all …]
|
H A D | sgemm_Col_NT_B1_MX064_NX064_KX16_src.cpp | 33 rC[0][0]=mad(rA[0][0],rB[0][0],rC[0][0]); \ 34 rC[1][0]=mad(rA[0][1],rB[0][0],rC[1][0]); \ 35 rC[2][0]=mad(rA[0][2],rB[0][0],rC[2][0]); \ 36 rC[3][0]=mad(rA[0][3],rB[0][0],rC[3][0]); \ 37 rC[0][1]=mad(rA[0][0],rB[0][1],rC[0][1]); \ 38 rC[1][1]=mad(rA[0][1],rB[0][1],rC[1][1]); \ 39 rC[2][1]=mad(rA[0][2],rB[0][1],rC[2][1]); \ 40 rC[3][1]=mad(rA[0][3],rB[0][1],rC[3][1]); \ 41 rC[0][2]=mad(rA[0][0],rB[0][2],rC[0][2]); \ 42 rC[1][2]=mad(rA[0][1],rB[0][2],rC[1][2]); \ [all …]
|