1*06042735SVincent Franchomme /*
2*06042735SVincent Franchomme  * Copyright (c) 2016-2020, Yann Collet, Facebook, Inc.
3*06042735SVincent Franchomme  * All rights reserved.
4*06042735SVincent Franchomme  *
5*06042735SVincent Franchomme  * This source code is licensed under both the BSD-style license (found in the
6*06042735SVincent Franchomme  * LICENSE file in the root directory of this source tree) and the GPLv2 (found
7*06042735SVincent Franchomme  * in the COPYING file in the root directory of this source tree).
8*06042735SVincent Franchomme  * You may select, at your option, one of the above-listed licenses.
9*06042735SVincent Franchomme  */
10*06042735SVincent Franchomme 
11*06042735SVincent Franchomme /* zstd_ddict.c :
12*06042735SVincent Franchomme  * concentrates all logic that needs to know the internals of ZSTD_DDict object */
13*06042735SVincent Franchomme 
14*06042735SVincent Franchomme /*-*******************************************************
15*06042735SVincent Franchomme *  Dependencies
16*06042735SVincent Franchomme *********************************************************/
17*06042735SVincent Franchomme #include <string.h>      /* memcpy, memmove, memset */
18*06042735SVincent Franchomme #include "cpu.h"         /* bmi2 */
19*06042735SVincent Franchomme #include "mem.h"         /* low level memory routines */
20*06042735SVincent Franchomme #define FSE_STATIC_LINKING_ONLY
21*06042735SVincent Franchomme #include "fse.h"
22*06042735SVincent Franchomme #define HUF_STATIC_LINKING_ONLY
23*06042735SVincent Franchomme #include "huf.h"
24*06042735SVincent Franchomme #include "zstd_decompress_internal.h"
25*06042735SVincent Franchomme #include "zstd_ddict.h"
26*06042735SVincent Franchomme 
27*06042735SVincent Franchomme #if defined(ZSTD_LEGACY_SUPPORT) && (ZSTD_LEGACY_SUPPORT>=1)
28*06042735SVincent Franchomme #  include "../legacy/zstd_legacy.h"
29*06042735SVincent Franchomme #endif
30*06042735SVincent Franchomme 
31*06042735SVincent Franchomme 
32*06042735SVincent Franchomme 
33*06042735SVincent Franchomme /*-*******************************************************
34*06042735SVincent Franchomme *  Types
35*06042735SVincent Franchomme *********************************************************/
36*06042735SVincent Franchomme struct ZSTD_DDict_s {
37*06042735SVincent Franchomme     void* dictBuffer;
38*06042735SVincent Franchomme     const void* dictContent;
39*06042735SVincent Franchomme     size_t dictSize;
40*06042735SVincent Franchomme     ZSTD_entropyDTables_t entropy;
41*06042735SVincent Franchomme     U32 dictID;
42*06042735SVincent Franchomme     U32 entropyPresent;
43*06042735SVincent Franchomme     ZSTD_customMem cMem;
44*06042735SVincent Franchomme };  /* typedef'd to ZSTD_DDict within "zstd.h" */
45*06042735SVincent Franchomme 
ZSTD_DDict_dictContent(const ZSTD_DDict * ddict)46*06042735SVincent Franchomme const void* ZSTD_DDict_dictContent(const ZSTD_DDict* ddict)
47*06042735SVincent Franchomme {
48*06042735SVincent Franchomme     assert(ddict != NULL);
49*06042735SVincent Franchomme     return ddict->dictContent;
50*06042735SVincent Franchomme }
51*06042735SVincent Franchomme 
ZSTD_DDict_dictSize(const ZSTD_DDict * ddict)52*06042735SVincent Franchomme size_t ZSTD_DDict_dictSize(const ZSTD_DDict* ddict)
53*06042735SVincent Franchomme {
54*06042735SVincent Franchomme     assert(ddict != NULL);
55*06042735SVincent Franchomme     return ddict->dictSize;
56*06042735SVincent Franchomme }
57*06042735SVincent Franchomme 
ZSTD_copyDDictParameters(ZSTD_DCtx * dctx,const ZSTD_DDict * ddict)58*06042735SVincent Franchomme void ZSTD_copyDDictParameters(ZSTD_DCtx* dctx, const ZSTD_DDict* ddict)
59*06042735SVincent Franchomme {
60*06042735SVincent Franchomme     DEBUGLOG(4, "ZSTD_copyDDictParameters");
61*06042735SVincent Franchomme     assert(dctx != NULL);
62*06042735SVincent Franchomme     assert(ddict != NULL);
63*06042735SVincent Franchomme     dctx->dictID = ddict->dictID;
64*06042735SVincent Franchomme     dctx->prefixStart = ddict->dictContent;
65*06042735SVincent Franchomme     dctx->virtualStart = ddict->dictContent;
66*06042735SVincent Franchomme     dctx->dictEnd = (const BYTE*)ddict->dictContent + ddict->dictSize;
67*06042735SVincent Franchomme     dctx->previousDstEnd = dctx->dictEnd;
68*06042735SVincent Franchomme #ifdef FUZZING_BUILD_MODE_UNSAFE_FOR_PRODUCTION
69*06042735SVincent Franchomme     dctx->dictContentBeginForFuzzing = dctx->prefixStart;
70*06042735SVincent Franchomme     dctx->dictContentEndForFuzzing = dctx->previousDstEnd;
71*06042735SVincent Franchomme #endif
72*06042735SVincent Franchomme     if (ddict->entropyPresent) {
73*06042735SVincent Franchomme         dctx->litEntropy = 1;
74*06042735SVincent Franchomme         dctx->fseEntropy = 1;
75*06042735SVincent Franchomme         dctx->LLTptr = ddict->entropy.LLTable;
76*06042735SVincent Franchomme         dctx->MLTptr = ddict->entropy.MLTable;
77*06042735SVincent Franchomme         dctx->OFTptr = ddict->entropy.OFTable;
78*06042735SVincent Franchomme         dctx->HUFptr = ddict->entropy.hufTable;
79*06042735SVincent Franchomme         dctx->entropy.rep[0] = ddict->entropy.rep[0];
80*06042735SVincent Franchomme         dctx->entropy.rep[1] = ddict->entropy.rep[1];
81*06042735SVincent Franchomme         dctx->entropy.rep[2] = ddict->entropy.rep[2];
82*06042735SVincent Franchomme     } else {
83*06042735SVincent Franchomme         dctx->litEntropy = 0;
84*06042735SVincent Franchomme         dctx->fseEntropy = 0;
85*06042735SVincent Franchomme     }
86*06042735SVincent Franchomme }
87*06042735SVincent Franchomme 
88*06042735SVincent Franchomme 
89*06042735SVincent Franchomme static size_t
ZSTD_loadEntropy_intoDDict(ZSTD_DDict * ddict,ZSTD_dictContentType_e dictContentType)90*06042735SVincent Franchomme ZSTD_loadEntropy_intoDDict(ZSTD_DDict* ddict,
91*06042735SVincent Franchomme                            ZSTD_dictContentType_e dictContentType)
92*06042735SVincent Franchomme {
93*06042735SVincent Franchomme     ddict->dictID = 0;
94*06042735SVincent Franchomme     ddict->entropyPresent = 0;
95*06042735SVincent Franchomme     if (dictContentType == ZSTD_dct_rawContent) return 0;
96*06042735SVincent Franchomme 
97*06042735SVincent Franchomme     if (ddict->dictSize < 8) {
98*06042735SVincent Franchomme         if (dictContentType == ZSTD_dct_fullDict)
99*06042735SVincent Franchomme             return ERROR(dictionary_corrupted);   /* only accept specified dictionaries */
100*06042735SVincent Franchomme         return 0;   /* pure content mode */
101*06042735SVincent Franchomme     }
102*06042735SVincent Franchomme     {   U32 const magic = MEM_readLE32(ddict->dictContent);
103*06042735SVincent Franchomme         if (magic != ZSTD_MAGIC_DICTIONARY) {
104*06042735SVincent Franchomme             if (dictContentType == ZSTD_dct_fullDict)
105*06042735SVincent Franchomme                 return ERROR(dictionary_corrupted);   /* only accept specified dictionaries */
106*06042735SVincent Franchomme             return 0;   /* pure content mode */
107*06042735SVincent Franchomme         }
108*06042735SVincent Franchomme     }
109*06042735SVincent Franchomme     ddict->dictID = MEM_readLE32((const char*)ddict->dictContent + ZSTD_FRAMEIDSIZE);
110*06042735SVincent Franchomme 
111*06042735SVincent Franchomme     /* load entropy tables */
112*06042735SVincent Franchomme     RETURN_ERROR_IF(ZSTD_isError(ZSTD_loadDEntropy(
113*06042735SVincent Franchomme             &ddict->entropy, ddict->dictContent, ddict->dictSize)),
114*06042735SVincent Franchomme         dictionary_corrupted, "");
115*06042735SVincent Franchomme     ddict->entropyPresent = 1;
116*06042735SVincent Franchomme     return 0;
117*06042735SVincent Franchomme }
118*06042735SVincent Franchomme 
119*06042735SVincent Franchomme 
ZSTD_initDDict_internal(ZSTD_DDict * ddict,const void * dict,size_t dictSize,ZSTD_dictLoadMethod_e dictLoadMethod,ZSTD_dictContentType_e dictContentType)120*06042735SVincent Franchomme static size_t ZSTD_initDDict_internal(ZSTD_DDict* ddict,
121*06042735SVincent Franchomme                                       const void* dict, size_t dictSize,
122*06042735SVincent Franchomme                                       ZSTD_dictLoadMethod_e dictLoadMethod,
123*06042735SVincent Franchomme                                       ZSTD_dictContentType_e dictContentType)
124*06042735SVincent Franchomme {
125*06042735SVincent Franchomme     if ((dictLoadMethod == ZSTD_dlm_byRef) || (!dict) || (!dictSize)) {
126*06042735SVincent Franchomme         ddict->dictBuffer = NULL;
127*06042735SVincent Franchomme         ddict->dictContent = dict;
128*06042735SVincent Franchomme         if (!dict) dictSize = 0;
129*06042735SVincent Franchomme     } else {
130*06042735SVincent Franchomme         void* const internalBuffer = ZSTD_malloc(dictSize, ddict->cMem);
131*06042735SVincent Franchomme         ddict->dictBuffer = internalBuffer;
132*06042735SVincent Franchomme         ddict->dictContent = internalBuffer;
133*06042735SVincent Franchomme         if (!internalBuffer) return ERROR(memory_allocation);
134*06042735SVincent Franchomme         memcpy(internalBuffer, dict, dictSize);
135*06042735SVincent Franchomme     }
136*06042735SVincent Franchomme     ddict->dictSize = dictSize;
137*06042735SVincent Franchomme     ddict->entropy.hufTable[0] = (HUF_DTable)((HufLog)*0x1000001);  /* cover both little and big endian */
138*06042735SVincent Franchomme 
139*06042735SVincent Franchomme     /* parse dictionary content */
140*06042735SVincent Franchomme     FORWARD_IF_ERROR( ZSTD_loadEntropy_intoDDict(ddict, dictContentType) , "");
141*06042735SVincent Franchomme 
142*06042735SVincent Franchomme     return 0;
143*06042735SVincent Franchomme }
144*06042735SVincent Franchomme 
ZSTD_createDDict_advanced(const void * dict,size_t dictSize,ZSTD_dictLoadMethod_e dictLoadMethod,ZSTD_dictContentType_e dictContentType,ZSTD_customMem customMem)145*06042735SVincent Franchomme ZSTD_DDict* ZSTD_createDDict_advanced(const void* dict, size_t dictSize,
146*06042735SVincent Franchomme                                       ZSTD_dictLoadMethod_e dictLoadMethod,
147*06042735SVincent Franchomme                                       ZSTD_dictContentType_e dictContentType,
148*06042735SVincent Franchomme                                       ZSTD_customMem customMem)
149*06042735SVincent Franchomme {
150*06042735SVincent Franchomme     if (!customMem.customAlloc ^ !customMem.customFree) return NULL;
151*06042735SVincent Franchomme 
152*06042735SVincent Franchomme     {   ZSTD_DDict* const ddict = (ZSTD_DDict*) ZSTD_malloc(sizeof(ZSTD_DDict), customMem);
153*06042735SVincent Franchomme         if (ddict == NULL) return NULL;
154*06042735SVincent Franchomme         ddict->cMem = customMem;
155*06042735SVincent Franchomme         {   size_t const initResult = ZSTD_initDDict_internal(ddict,
156*06042735SVincent Franchomme                                             dict, dictSize,
157*06042735SVincent Franchomme                                             dictLoadMethod, dictContentType);
158*06042735SVincent Franchomme             if (ZSTD_isError(initResult)) {
159*06042735SVincent Franchomme                 ZSTD_freeDDict(ddict);
160*06042735SVincent Franchomme                 return NULL;
161*06042735SVincent Franchomme         }   }
162*06042735SVincent Franchomme         return ddict;
163*06042735SVincent Franchomme     }
164*06042735SVincent Franchomme }
165*06042735SVincent Franchomme 
166*06042735SVincent Franchomme /*! ZSTD_createDDict() :
167*06042735SVincent Franchomme *   Create a digested dictionary, to start decompression without startup delay.
168*06042735SVincent Franchomme *   `dict` content is copied inside DDict.
169*06042735SVincent Franchomme *   Consequently, `dict` can be released after `ZSTD_DDict` creation */
ZSTD_createDDict(const void * dict,size_t dictSize)170*06042735SVincent Franchomme ZSTD_DDict* ZSTD_createDDict(const void* dict, size_t dictSize)
171*06042735SVincent Franchomme {
172*06042735SVincent Franchomme     ZSTD_customMem const allocator = { NULL, NULL, NULL };
173*06042735SVincent Franchomme     return ZSTD_createDDict_advanced(dict, dictSize, ZSTD_dlm_byCopy, ZSTD_dct_auto, allocator);
174*06042735SVincent Franchomme }
175*06042735SVincent Franchomme 
176*06042735SVincent Franchomme /*! ZSTD_createDDict_byReference() :
177*06042735SVincent Franchomme  *  Create a digested dictionary, to start decompression without startup delay.
178*06042735SVincent Franchomme  *  Dictionary content is simply referenced, it will be accessed during decompression.
179*06042735SVincent Franchomme  *  Warning : dictBuffer must outlive DDict (DDict must be freed before dictBuffer) */
ZSTD_createDDict_byReference(const void * dictBuffer,size_t dictSize)180*06042735SVincent Franchomme ZSTD_DDict* ZSTD_createDDict_byReference(const void* dictBuffer, size_t dictSize)
181*06042735SVincent Franchomme {
182*06042735SVincent Franchomme     ZSTD_customMem const allocator = { NULL, NULL, NULL };
183*06042735SVincent Franchomme     return ZSTD_createDDict_advanced(dictBuffer, dictSize, ZSTD_dlm_byRef, ZSTD_dct_auto, allocator);
184*06042735SVincent Franchomme }
185*06042735SVincent Franchomme 
186*06042735SVincent Franchomme 
ZSTD_initStaticDDict(void * sBuffer,size_t sBufferSize,const void * dict,size_t dictSize,ZSTD_dictLoadMethod_e dictLoadMethod,ZSTD_dictContentType_e dictContentType)187*06042735SVincent Franchomme const ZSTD_DDict* ZSTD_initStaticDDict(
188*06042735SVincent Franchomme                                 void* sBuffer, size_t sBufferSize,
189*06042735SVincent Franchomme                                 const void* dict, size_t dictSize,
190*06042735SVincent Franchomme                                 ZSTD_dictLoadMethod_e dictLoadMethod,
191*06042735SVincent Franchomme                                 ZSTD_dictContentType_e dictContentType)
192*06042735SVincent Franchomme {
193*06042735SVincent Franchomme     size_t const neededSpace = sizeof(ZSTD_DDict)
194*06042735SVincent Franchomme                              + (dictLoadMethod == ZSTD_dlm_byRef ? 0 : dictSize);
195*06042735SVincent Franchomme     ZSTD_DDict* const ddict = (ZSTD_DDict*)sBuffer;
196*06042735SVincent Franchomme     assert(sBuffer != NULL);
197*06042735SVincent Franchomme     assert(dict != NULL);
198*06042735SVincent Franchomme     if ((size_t)sBuffer & 7) return NULL;   /* 8-aligned */
199*06042735SVincent Franchomme     if (sBufferSize < neededSpace) return NULL;
200*06042735SVincent Franchomme     if (dictLoadMethod == ZSTD_dlm_byCopy) {
201*06042735SVincent Franchomme         memcpy(ddict+1, dict, dictSize);  /* local copy */
202*06042735SVincent Franchomme         dict = ddict+1;
203*06042735SVincent Franchomme     }
204*06042735SVincent Franchomme     if (ZSTD_isError( ZSTD_initDDict_internal(ddict,
205*06042735SVincent Franchomme                                               dict, dictSize,
206*06042735SVincent Franchomme                                               ZSTD_dlm_byRef, dictContentType) ))
207*06042735SVincent Franchomme         return NULL;
208*06042735SVincent Franchomme     return ddict;
209*06042735SVincent Franchomme }
210*06042735SVincent Franchomme 
211*06042735SVincent Franchomme 
ZSTD_freeDDict(ZSTD_DDict * ddict)212*06042735SVincent Franchomme size_t ZSTD_freeDDict(ZSTD_DDict* ddict)
213*06042735SVincent Franchomme {
214*06042735SVincent Franchomme     if (ddict==NULL) return 0;   /* support free on NULL */
215*06042735SVincent Franchomme     {   ZSTD_customMem const cMem = ddict->cMem;
216*06042735SVincent Franchomme         ZSTD_free(ddict->dictBuffer, cMem);
217*06042735SVincent Franchomme         ZSTD_free(ddict, cMem);
218*06042735SVincent Franchomme         return 0;
219*06042735SVincent Franchomme     }
220*06042735SVincent Franchomme }
221*06042735SVincent Franchomme 
222*06042735SVincent Franchomme /*! ZSTD_estimateDDictSize() :
223*06042735SVincent Franchomme  *  Estimate amount of memory that will be needed to create a dictionary for decompression.
224*06042735SVincent Franchomme  *  Note : dictionary created by reference using ZSTD_dlm_byRef are smaller */
ZSTD_estimateDDictSize(size_t dictSize,ZSTD_dictLoadMethod_e dictLoadMethod)225*06042735SVincent Franchomme size_t ZSTD_estimateDDictSize(size_t dictSize, ZSTD_dictLoadMethod_e dictLoadMethod)
226*06042735SVincent Franchomme {
227*06042735SVincent Franchomme     return sizeof(ZSTD_DDict) + (dictLoadMethod == ZSTD_dlm_byRef ? 0 : dictSize);
228*06042735SVincent Franchomme }
229*06042735SVincent Franchomme 
ZSTD_sizeof_DDict(const ZSTD_DDict * ddict)230*06042735SVincent Franchomme size_t ZSTD_sizeof_DDict(const ZSTD_DDict* ddict)
231*06042735SVincent Franchomme {
232*06042735SVincent Franchomme     if (ddict==NULL) return 0;   /* support sizeof on NULL */
233*06042735SVincent Franchomme     return sizeof(*ddict) + (ddict->dictBuffer ? ddict->dictSize : 0) ;
234*06042735SVincent Franchomme }
235*06042735SVincent Franchomme 
236*06042735SVincent Franchomme /*! ZSTD_getDictID_fromDDict() :
237*06042735SVincent Franchomme  *  Provides the dictID of the dictionary loaded into `ddict`.
238*06042735SVincent Franchomme  *  If @return == 0, the dictionary is not conformant to Zstandard specification, or empty.
239*06042735SVincent Franchomme  *  Non-conformant dictionaries can still be loaded, but as content-only dictionaries. */
ZSTD_getDictID_fromDDict(const ZSTD_DDict * ddict)240*06042735SVincent Franchomme unsigned ZSTD_getDictID_fromDDict(const ZSTD_DDict* ddict)
241*06042735SVincent Franchomme {
242*06042735SVincent Franchomme     if (ddict==NULL) return 0;
243*06042735SVincent Franchomme     return ZSTD_getDictID_fromDict(ddict->dictContent, ddict->dictSize);
244*06042735SVincent Franchomme }
245