1*00b67f09SDavid van Moolenbroek /*	$NetBSD: converter.c,v 1.4 2014/12/10 04:37:55 christos Exp $	*/
2*00b67f09SDavid van Moolenbroek 
3*00b67f09SDavid van Moolenbroek #ifndef lint
4*00b67f09SDavid van Moolenbroek static char *rcsid = "Id: converter.c,v 1.1 2003/06/04 00:25:51 marka Exp ";
5*00b67f09SDavid van Moolenbroek #endif
6*00b67f09SDavid van Moolenbroek 
7*00b67f09SDavid van Moolenbroek /*
8*00b67f09SDavid van Moolenbroek  * Copyright (c) 2000,2002 Japan Network Information Center.
9*00b67f09SDavid van Moolenbroek  * All rights reserved.
10*00b67f09SDavid van Moolenbroek  *
11*00b67f09SDavid van Moolenbroek  * By using this file, you agree to the terms and conditions set forth bellow.
12*00b67f09SDavid van Moolenbroek  *
13*00b67f09SDavid van Moolenbroek  * 			LICENSE TERMS AND CONDITIONS
14*00b67f09SDavid van Moolenbroek  *
15*00b67f09SDavid van Moolenbroek  * The following License Terms and Conditions apply, unless a different
16*00b67f09SDavid van Moolenbroek  * license is obtained from Japan Network Information Center ("JPNIC"),
17*00b67f09SDavid van Moolenbroek  * a Japanese association, Kokusai-Kougyou-Kanda Bldg 6F, 2-3-4 Uchi-Kanda,
18*00b67f09SDavid van Moolenbroek  * Chiyoda-ku, Tokyo 101-0047, Japan.
19*00b67f09SDavid van Moolenbroek  *
20*00b67f09SDavid van Moolenbroek  * 1. Use, Modification and Redistribution (including distribution of any
21*00b67f09SDavid van Moolenbroek  *    modified or derived work) in source and/or binary forms is permitted
22*00b67f09SDavid van Moolenbroek  *    under this License Terms and Conditions.
23*00b67f09SDavid van Moolenbroek  *
24*00b67f09SDavid van Moolenbroek  * 2. Redistribution of source code must retain the copyright notices as they
25*00b67f09SDavid van Moolenbroek  *    appear in each source code file, this License Terms and Conditions.
26*00b67f09SDavid van Moolenbroek  *
27*00b67f09SDavid van Moolenbroek  * 3. Redistribution in binary form must reproduce the Copyright Notice,
28*00b67f09SDavid van Moolenbroek  *    this License Terms and Conditions, in the documentation and/or other
29*00b67f09SDavid van Moolenbroek  *    materials provided with the distribution.  For the purposes of binary
30*00b67f09SDavid van Moolenbroek  *    distribution the "Copyright Notice" refers to the following language:
31*00b67f09SDavid van Moolenbroek  *    "Copyright (c) 2000-2002 Japan Network Information Center.  All rights reserved."
32*00b67f09SDavid van Moolenbroek  *
33*00b67f09SDavid van Moolenbroek  * 4. The name of JPNIC may not be used to endorse or promote products
34*00b67f09SDavid van Moolenbroek  *    derived from this Software without specific prior written approval of
35*00b67f09SDavid van Moolenbroek  *    JPNIC.
36*00b67f09SDavid van Moolenbroek  *
37*00b67f09SDavid van Moolenbroek  * 5. Disclaimer/Limitation of Liability: THIS SOFTWARE IS PROVIDED BY JPNIC
38*00b67f09SDavid van Moolenbroek  *    "AS IS" AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
39*00b67f09SDavid van Moolenbroek  *    LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A
40*00b67f09SDavid van Moolenbroek  *    PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL JPNIC BE LIABLE
41*00b67f09SDavid van Moolenbroek  *    FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
42*00b67f09SDavid van Moolenbroek  *    CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
43*00b67f09SDavid van Moolenbroek  *    SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR
44*00b67f09SDavid van Moolenbroek  *    BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY,
45*00b67f09SDavid van Moolenbroek  *    WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR
46*00b67f09SDavid van Moolenbroek  *    OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF
47*00b67f09SDavid van Moolenbroek  *    ADVISED OF THE POSSIBILITY OF SUCH DAMAGES.
48*00b67f09SDavid van Moolenbroek  */
49*00b67f09SDavid van Moolenbroek 
50*00b67f09SDavid van Moolenbroek #include <config.h>
51*00b67f09SDavid van Moolenbroek 
52*00b67f09SDavid van Moolenbroek #include <stddef.h>
53*00b67f09SDavid van Moolenbroek #include <stdlib.h>
54*00b67f09SDavid van Moolenbroek #include <stdio.h>
55*00b67f09SDavid van Moolenbroek #include <string.h>
56*00b67f09SDavid van Moolenbroek #include <ctype.h>
57*00b67f09SDavid van Moolenbroek #include <errno.h>
58*00b67f09SDavid van Moolenbroek #ifndef WITHOUT_ICONV
59*00b67f09SDavid van Moolenbroek #include <iconv.h>
60*00b67f09SDavid van Moolenbroek #endif
61*00b67f09SDavid van Moolenbroek 
62*00b67f09SDavid van Moolenbroek #include <idn/result.h>
63*00b67f09SDavid van Moolenbroek #include <idn/assert.h>
64*00b67f09SDavid van Moolenbroek #include <idn/logmacro.h>
65*00b67f09SDavid van Moolenbroek #include <idn/converter.h>
66*00b67f09SDavid van Moolenbroek #include <idn/aliaslist.h>
67*00b67f09SDavid van Moolenbroek #include <idn/strhash.h>
68*00b67f09SDavid van Moolenbroek #include <idn/debug.h>
69*00b67f09SDavid van Moolenbroek #include <idn/ucs4.h>
70*00b67f09SDavid van Moolenbroek #include <idn/punycode.h>
71*00b67f09SDavid van Moolenbroek #include <idn/race.h>
72*00b67f09SDavid van Moolenbroek #include <idn/util.h>
73*00b67f09SDavid van Moolenbroek 
74*00b67f09SDavid van Moolenbroek #ifndef IDN_UTF8_ENCODING_NAME
75*00b67f09SDavid van Moolenbroek #define IDN_UTF8_ENCODING_NAME "UTF-8"		/* by IANA */
76*00b67f09SDavid van Moolenbroek #endif
77*00b67f09SDavid van Moolenbroek #ifndef IDN_RACE_ENCODING_NAME
78*00b67f09SDavid van Moolenbroek #define IDN_RACE_ENCODING_NAME "RACE"
79*00b67f09SDavid van Moolenbroek #endif
80*00b67f09SDavid van Moolenbroek #ifndef IDN_AMCACEZ_ENCODING_NAME
81*00b67f09SDavid van Moolenbroek #define IDN_AMCACEZ_ENCODING_NAME "AMC-ACE-Z"
82*00b67f09SDavid van Moolenbroek #endif
83*00b67f09SDavid van Moolenbroek #ifndef IDN_PUNYCODE_ENCODING_NAME
84*00b67f09SDavid van Moolenbroek #define IDN_PUNYCODE_ENCODING_NAME "Punycode"
85*00b67f09SDavid van Moolenbroek #endif
86*00b67f09SDavid van Moolenbroek 
87*00b67f09SDavid van Moolenbroek #define MAX_RECURSE	20
88*00b67f09SDavid van Moolenbroek 
89*00b67f09SDavid van Moolenbroek #ifdef WIN32
90*00b67f09SDavid van Moolenbroek 
91*00b67f09SDavid van Moolenbroek #define IDNKEY_IDNKIT		"Software\\JPNIC\\IDN"
92*00b67f09SDavid van Moolenbroek #define IDNVAL_ALIASFILE	"AliasFile"
93*00b67f09SDavid van Moolenbroek 
94*00b67f09SDavid van Moolenbroek #else /* WIN32 */
95*00b67f09SDavid van Moolenbroek 
96*00b67f09SDavid van Moolenbroek #ifndef IDN_RESCONF_DIR
97*00b67f09SDavid van Moolenbroek #define IDN_RESCONF_DIR		"/etc"
98*00b67f09SDavid van Moolenbroek #endif
99*00b67f09SDavid van Moolenbroek #define IDN_ALIAS_FILE		IDN_RESCONF_DIR "/idnalias.conf"
100*00b67f09SDavid van Moolenbroek 
101*00b67f09SDavid van Moolenbroek #endif /* WIN32 */
102*00b67f09SDavid van Moolenbroek 
103*00b67f09SDavid van Moolenbroek typedef struct {
104*00b67f09SDavid van Moolenbroek 	idn_converter_openproc_t openfromucs4;
105*00b67f09SDavid van Moolenbroek 	idn_converter_openproc_t opentoucs4;
106*00b67f09SDavid van Moolenbroek 	idn_converter_convfromucs4proc_t convfromucs4;
107*00b67f09SDavid van Moolenbroek 	idn_converter_convtoucs4proc_t convtoucs4;
108*00b67f09SDavid van Moolenbroek 	idn_converter_closeproc_t close;
109*00b67f09SDavid van Moolenbroek 	int encoding_type;
110*00b67f09SDavid van Moolenbroek } converter_ops_t;
111*00b67f09SDavid van Moolenbroek 
112*00b67f09SDavid van Moolenbroek struct idn_converter {
113*00b67f09SDavid van Moolenbroek 	char *local_encoding_name;
114*00b67f09SDavid van Moolenbroek 	converter_ops_t *ops;
115*00b67f09SDavid van Moolenbroek 	int flags;
116*00b67f09SDavid van Moolenbroek 	int opened_convfromucs4;
117*00b67f09SDavid van Moolenbroek 	int opened_convtoucs4;
118*00b67f09SDavid van Moolenbroek 	int reference_count;
119*00b67f09SDavid van Moolenbroek 	void *private_data;
120*00b67f09SDavid van Moolenbroek };
121*00b67f09SDavid van Moolenbroek 
122*00b67f09SDavid van Moolenbroek static idn__strhash_t encoding_name_hash;
123*00b67f09SDavid van Moolenbroek static idn__aliaslist_t encoding_alias_list;
124*00b67f09SDavid van Moolenbroek 
125*00b67f09SDavid van Moolenbroek static idn_result_t	register_standard_encoding(void);
126*00b67f09SDavid van Moolenbroek static idn_result_t	roundtrip_check(idn_converter_t ctx,
127*00b67f09SDavid van Moolenbroek 					const unsigned long *from,
128*00b67f09SDavid van Moolenbroek 					const char *to);
129*00b67f09SDavid van Moolenbroek 
130*00b67f09SDavid van Moolenbroek static idn_result_t
131*00b67f09SDavid van Moolenbroek        converter_none_open(idn_converter_t ctx, void **privdata);
132*00b67f09SDavid van Moolenbroek static idn_result_t
133*00b67f09SDavid van Moolenbroek        converter_none_close(idn_converter_t ctx, void *privdata);
134*00b67f09SDavid van Moolenbroek static idn_result_t
135*00b67f09SDavid van Moolenbroek        converter_none_convfromucs4(idn_converter_t ctx,
136*00b67f09SDavid van Moolenbroek 				   void *privdata,
137*00b67f09SDavid van Moolenbroek 				   const unsigned long *from,
138*00b67f09SDavid van Moolenbroek 				   char *to, size_t tolen);
139*00b67f09SDavid van Moolenbroek static idn_result_t
140*00b67f09SDavid van Moolenbroek        converter_none_convtoucs4(idn_converter_t ctx,
141*00b67f09SDavid van Moolenbroek 				 void *privdata, const char *from,
142*00b67f09SDavid van Moolenbroek 				 unsigned long *to, size_t tolen);
143*00b67f09SDavid van Moolenbroek 
144*00b67f09SDavid van Moolenbroek #ifndef WITHOUT_ICONV
145*00b67f09SDavid van Moolenbroek static idn_result_t
146*00b67f09SDavid van Moolenbroek        converter_iconv_openfromucs4(idn_converter_t ctx, void **privdata);
147*00b67f09SDavid van Moolenbroek static idn_result_t
148*00b67f09SDavid van Moolenbroek        converter_iconv_opentoucs4(idn_converter_t ctx, void **privdata);
149*00b67f09SDavid van Moolenbroek static idn_result_t
150*00b67f09SDavid van Moolenbroek        converter_iconv_close(idn_converter_t ctx, void *privdata);
151*00b67f09SDavid van Moolenbroek static idn_result_t
152*00b67f09SDavid van Moolenbroek        converter_iconv_convfromucs4(idn_converter_t ctx,
153*00b67f09SDavid van Moolenbroek 				    void *privdata,
154*00b67f09SDavid van Moolenbroek 				    const unsigned long *from,
155*00b67f09SDavid van Moolenbroek 				    char *to, size_t tolen);
156*00b67f09SDavid van Moolenbroek static idn_result_t
157*00b67f09SDavid van Moolenbroek        converter_iconv_convtoucs4(idn_converter_t ctx,
158*00b67f09SDavid van Moolenbroek 				  void *privdata,
159*00b67f09SDavid van Moolenbroek 				  const char *from,
160*00b67f09SDavid van Moolenbroek 				  unsigned long *to, size_t tolen);
161*00b67f09SDavid van Moolenbroek 
162*00b67f09SDavid van Moolenbroek static idn_result_t
163*00b67f09SDavid van Moolenbroek iconv_initialize_privdata(void **privdata);
164*00b67f09SDavid van Moolenbroek static void
165*00b67f09SDavid van Moolenbroek iconv_finalize_privdata(void *privdata);
166*00b67f09SDavid van Moolenbroek 
167*00b67f09SDavid van Moolenbroek static char *		get_system_aliasfile(void);
168*00b67f09SDavid van Moolenbroek static int		file_exist(const char *filename);
169*00b67f09SDavid van Moolenbroek 
170*00b67f09SDavid van Moolenbroek #endif /* !WITHOUT_ICONV */
171*00b67f09SDavid van Moolenbroek 
172*00b67f09SDavid van Moolenbroek #ifdef DEBUG
173*00b67f09SDavid van Moolenbroek static idn_result_t
174*00b67f09SDavid van Moolenbroek        converter_uescape_convfromucs4(idn_converter_t ctx,
175*00b67f09SDavid van Moolenbroek 				      void *privdata,
176*00b67f09SDavid van Moolenbroek 				      const unsigned long *from,
177*00b67f09SDavid van Moolenbroek 				      char *to, size_t tolen);
178*00b67f09SDavid van Moolenbroek static idn_result_t
179*00b67f09SDavid van Moolenbroek        converter_uescape_convtoucs4(idn_converter_t ctx,
180*00b67f09SDavid van Moolenbroek 				    void *privdata,
181*00b67f09SDavid van Moolenbroek 				    const char *from,
182*00b67f09SDavid van Moolenbroek 				    unsigned long *to,
183*00b67f09SDavid van Moolenbroek 				    size_t tolen);
184*00b67f09SDavid van Moolenbroek #endif /* DEBUG */
185*00b67f09SDavid van Moolenbroek 
186*00b67f09SDavid van Moolenbroek static converter_ops_t none_converter_ops = {
187*00b67f09SDavid van Moolenbroek 	converter_none_open,
188*00b67f09SDavid van Moolenbroek 	converter_none_open,
189*00b67f09SDavid van Moolenbroek 	converter_none_convfromucs4,
190*00b67f09SDavid van Moolenbroek 	converter_none_convtoucs4,
191*00b67f09SDavid van Moolenbroek 	converter_none_close,
192*00b67f09SDavid van Moolenbroek 	IDN_NONACE,
193*00b67f09SDavid van Moolenbroek };
194*00b67f09SDavid van Moolenbroek 
195*00b67f09SDavid van Moolenbroek #ifndef WITHOUT_ICONV
196*00b67f09SDavid van Moolenbroek static converter_ops_t iconv_converter_ops = {
197*00b67f09SDavid van Moolenbroek 	converter_iconv_openfromucs4,
198*00b67f09SDavid van Moolenbroek 	converter_iconv_opentoucs4,
199*00b67f09SDavid van Moolenbroek 	converter_iconv_convfromucs4,
200*00b67f09SDavid van Moolenbroek 	converter_iconv_convtoucs4,
201*00b67f09SDavid van Moolenbroek 	converter_iconv_close,
202*00b67f09SDavid van Moolenbroek 	IDN_NONACE,
203*00b67f09SDavid van Moolenbroek };
204*00b67f09SDavid van Moolenbroek #endif
205*00b67f09SDavid van Moolenbroek 
206*00b67f09SDavid van Moolenbroek /*
207*00b67f09SDavid van Moolenbroek  * Initialize.
208*00b67f09SDavid van Moolenbroek  */
209*00b67f09SDavid van Moolenbroek 
210*00b67f09SDavid van Moolenbroek idn_result_t
idn_converter_initialize(void)211*00b67f09SDavid van Moolenbroek idn_converter_initialize(void) {
212*00b67f09SDavid van Moolenbroek 	idn_result_t r;
213*00b67f09SDavid van Moolenbroek 	idn__strhash_t hash;
214*00b67f09SDavid van Moolenbroek 	idn__aliaslist_t list;
215*00b67f09SDavid van Moolenbroek #ifndef WITHOUT_ICONV
216*00b67f09SDavid van Moolenbroek 	const char *fname;
217*00b67f09SDavid van Moolenbroek #endif
218*00b67f09SDavid van Moolenbroek 
219*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_initialize()\n"));
220*00b67f09SDavid van Moolenbroek 
221*00b67f09SDavid van Moolenbroek 	if (encoding_name_hash == NULL) {
222*00b67f09SDavid van Moolenbroek 		if ((r = idn__strhash_create(&hash)) != idn_success)
223*00b67f09SDavid van Moolenbroek 			goto ret;
224*00b67f09SDavid van Moolenbroek 		encoding_name_hash = hash;
225*00b67f09SDavid van Moolenbroek 		r = register_standard_encoding();
226*00b67f09SDavid van Moolenbroek 	}
227*00b67f09SDavid van Moolenbroek 	if (encoding_alias_list == NULL) {
228*00b67f09SDavid van Moolenbroek 		if ((r = idn__aliaslist_create(&list)) != idn_success)
229*00b67f09SDavid van Moolenbroek 			goto ret;
230*00b67f09SDavid van Moolenbroek 		encoding_alias_list = list;
231*00b67f09SDavid van Moolenbroek #ifndef WITHOUT_ICONV
232*00b67f09SDavid van Moolenbroek 		fname = get_system_aliasfile();
233*00b67f09SDavid van Moolenbroek 		if (fname != NULL && file_exist(fname))
234*00b67f09SDavid van Moolenbroek 			idn_converter_aliasfile(fname);
235*00b67f09SDavid van Moolenbroek #endif
236*00b67f09SDavid van Moolenbroek 	}
237*00b67f09SDavid van Moolenbroek 
238*00b67f09SDavid van Moolenbroek 	r = idn_success;
239*00b67f09SDavid van Moolenbroek ret:
240*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_initialize(): %s\n", idn_result_tostring(r)));
241*00b67f09SDavid van Moolenbroek 	return (r);
242*00b67f09SDavid van Moolenbroek }
243*00b67f09SDavid van Moolenbroek 
244*00b67f09SDavid van Moolenbroek #ifndef WITHOUT_ICONV
245*00b67f09SDavid van Moolenbroek static char *
get_system_aliasfile()246*00b67f09SDavid van Moolenbroek get_system_aliasfile() {
247*00b67f09SDavid van Moolenbroek #ifdef WIN32
248*00b67f09SDavid van Moolenbroek 	static char alias_path[500];	/* a good longer than MAX_PATH */
249*00b67f09SDavid van Moolenbroek 
250*00b67f09SDavid van Moolenbroek 	if (idn__util_getregistrystring(idn__util_hkey_localmachine,
251*00b67f09SDavid van Moolenbroek 					IDNVAL_ALIASFILE,
252*00b67f09SDavid van Moolenbroek 					alias_path, sizeof(alias_path))) {
253*00b67f09SDavid van Moolenbroek 		return (alias_path);
254*00b67f09SDavid van Moolenbroek 	} else {
255*00b67f09SDavid van Moolenbroek 		return (NULL);
256*00b67f09SDavid van Moolenbroek 	}
257*00b67f09SDavid van Moolenbroek #else
258*00b67f09SDavid van Moolenbroek 	return (IDN_ALIAS_FILE);
259*00b67f09SDavid van Moolenbroek #endif
260*00b67f09SDavid van Moolenbroek }
261*00b67f09SDavid van Moolenbroek 
262*00b67f09SDavid van Moolenbroek static int
file_exist(const char * filename)263*00b67f09SDavid van Moolenbroek file_exist(const char *filename) {
264*00b67f09SDavid van Moolenbroek 	FILE  *fp;
265*00b67f09SDavid van Moolenbroek 
266*00b67f09SDavid van Moolenbroek 	if ((fp = fopen(filename, "r")) == NULL)
267*00b67f09SDavid van Moolenbroek 		return (0);
268*00b67f09SDavid van Moolenbroek 	fclose(fp);
269*00b67f09SDavid van Moolenbroek 	return (1);
270*00b67f09SDavid van Moolenbroek }
271*00b67f09SDavid van Moolenbroek #endif
272*00b67f09SDavid van Moolenbroek 
273*00b67f09SDavid van Moolenbroek idn_result_t
idn_converter_create(const char * name,idn_converter_t * ctxp,int flags)274*00b67f09SDavid van Moolenbroek idn_converter_create(const char *name, idn_converter_t *ctxp, int flags) {
275*00b67f09SDavid van Moolenbroek 	const char *realname;
276*00b67f09SDavid van Moolenbroek 	idn_converter_t ctx;
277*00b67f09SDavid van Moolenbroek 	idn_result_t r;
278*00b67f09SDavid van Moolenbroek 	void *v;
279*00b67f09SDavid van Moolenbroek 
280*00b67f09SDavid van Moolenbroek 	assert(name != NULL && ctxp != NULL);
281*00b67f09SDavid van Moolenbroek 
282*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_create(%s)\n", name));
283*00b67f09SDavid van Moolenbroek 
284*00b67f09SDavid van Moolenbroek 	realname = idn_converter_getrealname(name);
285*00b67f09SDavid van Moolenbroek #ifdef DEBUG
286*00b67f09SDavid van Moolenbroek 	if (strcmp(name, realname) != 0) {
287*00b67f09SDavid van Moolenbroek 		TRACE(("idn_converter_create: realname=%s\n", realname));
288*00b67f09SDavid van Moolenbroek 	}
289*00b67f09SDavid van Moolenbroek #endif
290*00b67f09SDavid van Moolenbroek 
291*00b67f09SDavid van Moolenbroek 	*ctxp = NULL;
292*00b67f09SDavid van Moolenbroek 
293*00b67f09SDavid van Moolenbroek 	/* Allocate memory for a converter context and the name. */
294*00b67f09SDavid van Moolenbroek 	ctx = malloc(sizeof(struct idn_converter) + strlen(realname) + 1);
295*00b67f09SDavid van Moolenbroek 	if (ctx == NULL) {
296*00b67f09SDavid van Moolenbroek 		r = idn_nomemory;
297*00b67f09SDavid van Moolenbroek 		goto ret;
298*00b67f09SDavid van Moolenbroek 	}
299*00b67f09SDavid van Moolenbroek 
300*00b67f09SDavid van Moolenbroek 	ctx->local_encoding_name = (char *)(ctx + 1);
301*00b67f09SDavid van Moolenbroek 	(void)strcpy(ctx->local_encoding_name, realname);
302*00b67f09SDavid van Moolenbroek 	ctx->flags = flags;
303*00b67f09SDavid van Moolenbroek 	ctx->reference_count = 1;
304*00b67f09SDavid van Moolenbroek 	ctx->opened_convfromucs4 = 0;
305*00b67f09SDavid van Moolenbroek 	ctx->opened_convtoucs4 = 0;
306*00b67f09SDavid van Moolenbroek 	ctx->private_data = NULL;
307*00b67f09SDavid van Moolenbroek 
308*00b67f09SDavid van Moolenbroek 	assert(encoding_name_hash != NULL);
309*00b67f09SDavid van Moolenbroek 
310*00b67f09SDavid van Moolenbroek 	if (strcmp(realname, IDN_UTF8_ENCODING_NAME) == 0) {
311*00b67f09SDavid van Moolenbroek 		/* No conversion needed */
312*00b67f09SDavid van Moolenbroek 		ctx->ops = &none_converter_ops;
313*00b67f09SDavid van Moolenbroek 	} else if ((r = idn__strhash_get(encoding_name_hash, realname, &v))
314*00b67f09SDavid van Moolenbroek 		   == idn_success) {
315*00b67f09SDavid van Moolenbroek 		/* Special converter found */
316*00b67f09SDavid van Moolenbroek 		ctx->ops = (converter_ops_t *)v;
317*00b67f09SDavid van Moolenbroek 	} else {
318*00b67f09SDavid van Moolenbroek 		/* General case */
319*00b67f09SDavid van Moolenbroek #ifdef WITHOUT_ICONV
320*00b67f09SDavid van Moolenbroek 		free(ctx);
321*00b67f09SDavid van Moolenbroek 		*ctxp = NULL;
322*00b67f09SDavid van Moolenbroek 		r = idn_invalid_name;
323*00b67f09SDavid van Moolenbroek 		goto ret;
324*00b67f09SDavid van Moolenbroek #else
325*00b67f09SDavid van Moolenbroek 		ctx->ops = &iconv_converter_ops;
326*00b67f09SDavid van Moolenbroek #endif
327*00b67f09SDavid van Moolenbroek 	}
328*00b67f09SDavid van Moolenbroek 
329*00b67f09SDavid van Moolenbroek 	if ((flags & IDN_CONVERTER_DELAYEDOPEN) == 0) {
330*00b67f09SDavid van Moolenbroek 		r = (ctx->ops->openfromucs4)(ctx, &(ctx->private_data));
331*00b67f09SDavid van Moolenbroek 		if (r != idn_success) {
332*00b67f09SDavid van Moolenbroek 			WARNING(("idn_converter_create(): open failed "
333*00b67f09SDavid van Moolenbroek 			     "(ucs4->local)\n"));
334*00b67f09SDavid van Moolenbroek 			free(ctx);
335*00b67f09SDavid van Moolenbroek 			*ctxp = NULL;
336*00b67f09SDavid van Moolenbroek 			goto ret;
337*00b67f09SDavid van Moolenbroek 		}
338*00b67f09SDavid van Moolenbroek 		ctx->opened_convfromucs4 = 1;
339*00b67f09SDavid van Moolenbroek 
340*00b67f09SDavid van Moolenbroek 		r = (*ctx->ops->opentoucs4)(ctx, &(ctx->private_data));
341*00b67f09SDavid van Moolenbroek 		if (r != idn_success) {
342*00b67f09SDavid van Moolenbroek 			WARNING(("idn_converter_create(): open failed "
343*00b67f09SDavid van Moolenbroek 			     "(local->ucs4)\n"));
344*00b67f09SDavid van Moolenbroek 			free(ctx);
345*00b67f09SDavid van Moolenbroek 			*ctxp = NULL;
346*00b67f09SDavid van Moolenbroek 			goto ret;
347*00b67f09SDavid van Moolenbroek 		}
348*00b67f09SDavid van Moolenbroek 		ctx->opened_convtoucs4 = 1;
349*00b67f09SDavid van Moolenbroek 	}
350*00b67f09SDavid van Moolenbroek 
351*00b67f09SDavid van Moolenbroek 	*ctxp = ctx;
352*00b67f09SDavid van Moolenbroek 	r = idn_success;
353*00b67f09SDavid van Moolenbroek ret:
354*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_create(): %s\n", idn_result_tostring(r)));
355*00b67f09SDavid van Moolenbroek 	return (r);
356*00b67f09SDavid van Moolenbroek }
357*00b67f09SDavid van Moolenbroek 
358*00b67f09SDavid van Moolenbroek void
idn_converter_destroy(idn_converter_t ctx)359*00b67f09SDavid van Moolenbroek idn_converter_destroy(idn_converter_t ctx) {
360*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
361*00b67f09SDavid van Moolenbroek 
362*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_destroy(ctx=%s)\n", ctx->local_encoding_name));
363*00b67f09SDavid van Moolenbroek 
364*00b67f09SDavid van Moolenbroek 	ctx->reference_count--;
365*00b67f09SDavid van Moolenbroek 	if (ctx->reference_count <= 0) {
366*00b67f09SDavid van Moolenbroek 		TRACE(("idn_converter_destroy(): the object is destroyed\n"));
367*00b67f09SDavid van Moolenbroek 		(void)(*ctx->ops->close)(ctx, ctx->private_data);
368*00b67f09SDavid van Moolenbroek 		free(ctx);
369*00b67f09SDavid van Moolenbroek 	} else {
370*00b67f09SDavid van Moolenbroek 		TRACE(("idn_converter_destroy(): "
371*00b67f09SDavid van Moolenbroek 		       "update reference count (%d->%d)\n",
372*00b67f09SDavid van Moolenbroek 		       ctx->reference_count + 1, ctx->reference_count));
373*00b67f09SDavid van Moolenbroek 	}
374*00b67f09SDavid van Moolenbroek }
375*00b67f09SDavid van Moolenbroek 
376*00b67f09SDavid van Moolenbroek void
idn_converter_incrref(idn_converter_t ctx)377*00b67f09SDavid van Moolenbroek idn_converter_incrref(idn_converter_t ctx) {
378*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
379*00b67f09SDavid van Moolenbroek 
380*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_incrref(ctx=%s)\n", ctx->local_encoding_name));
381*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_incrref: update reference count (%d->%d)\n",
382*00b67f09SDavid van Moolenbroek 	    ctx->reference_count, ctx->reference_count + 1));
383*00b67f09SDavid van Moolenbroek 
384*00b67f09SDavid van Moolenbroek 	ctx->reference_count++;
385*00b67f09SDavid van Moolenbroek }
386*00b67f09SDavid van Moolenbroek 
387*00b67f09SDavid van Moolenbroek char *
idn_converter_localencoding(idn_converter_t ctx)388*00b67f09SDavid van Moolenbroek idn_converter_localencoding(idn_converter_t ctx) {
389*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
390*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_localencoding(ctx=%s)\n",
391*00b67f09SDavid van Moolenbroek 	       ctx->local_encoding_name));
392*00b67f09SDavid van Moolenbroek 	return (ctx->local_encoding_name);
393*00b67f09SDavid van Moolenbroek }
394*00b67f09SDavid van Moolenbroek 
395*00b67f09SDavid van Moolenbroek int
idn_converter_encodingtype(idn_converter_t ctx)396*00b67f09SDavid van Moolenbroek idn_converter_encodingtype(idn_converter_t ctx) {
397*00b67f09SDavid van Moolenbroek 	int encoding_type;
398*00b67f09SDavid van Moolenbroek 
399*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
400*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_encodingtype(ctx=%s)\n",
401*00b67f09SDavid van Moolenbroek 	       ctx->local_encoding_name));
402*00b67f09SDavid van Moolenbroek 
403*00b67f09SDavid van Moolenbroek 	encoding_type = ctx->ops->encoding_type;
404*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_encodingtype(): %d\n", encoding_type));
405*00b67f09SDavid van Moolenbroek 	return (encoding_type);
406*00b67f09SDavid van Moolenbroek }
407*00b67f09SDavid van Moolenbroek 
408*00b67f09SDavid van Moolenbroek int
idn_converter_isasciicompatible(idn_converter_t ctx)409*00b67f09SDavid van Moolenbroek idn_converter_isasciicompatible(idn_converter_t ctx) {
410*00b67f09SDavid van Moolenbroek 	int iscompat;
411*00b67f09SDavid van Moolenbroek 
412*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
413*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_isasciicompatible(ctx=%s)\n",
414*00b67f09SDavid van Moolenbroek 	       ctx->local_encoding_name));
415*00b67f09SDavid van Moolenbroek 
416*00b67f09SDavid van Moolenbroek 	iscompat = (ctx->ops->encoding_type != IDN_NONACE);
417*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_isasciicompatible(): %d\n", iscompat));
418*00b67f09SDavid van Moolenbroek 	return (iscompat);
419*00b67f09SDavid van Moolenbroek }
420*00b67f09SDavid van Moolenbroek 
421*00b67f09SDavid van Moolenbroek idn_result_t
idn_converter_convfromucs4(idn_converter_t ctx,const unsigned long * from,char * to,size_t tolen)422*00b67f09SDavid van Moolenbroek idn_converter_convfromucs4(idn_converter_t ctx, const unsigned long *from,
423*00b67f09SDavid van Moolenbroek 			   char *to, size_t tolen) {
424*00b67f09SDavid van Moolenbroek 	idn_result_t r;
425*00b67f09SDavid van Moolenbroek 
426*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL && from != NULL && to != NULL);
427*00b67f09SDavid van Moolenbroek 
428*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_convfromucs4(ctx=%s, from=\"%s\", tolen=%d)\n",
429*00b67f09SDavid van Moolenbroek 	       ctx->local_encoding_name, idn__debug_ucs4xstring(from, 50),
430*00b67f09SDavid van Moolenbroek 	       (int)tolen));
431*00b67f09SDavid van Moolenbroek 
432*00b67f09SDavid van Moolenbroek 	if (!ctx->opened_convfromucs4) {
433*00b67f09SDavid van Moolenbroek 		r = (*ctx->ops->openfromucs4)(ctx, &(ctx->private_data));
434*00b67f09SDavid van Moolenbroek 		if (r != idn_success)
435*00b67f09SDavid van Moolenbroek 			goto ret;
436*00b67f09SDavid van Moolenbroek 		ctx->opened_convfromucs4 = 1;
437*00b67f09SDavid van Moolenbroek 	}
438*00b67f09SDavid van Moolenbroek 
439*00b67f09SDavid van Moolenbroek 	r = (*ctx->ops->convfromucs4)(ctx, ctx->private_data, from, to, tolen);
440*00b67f09SDavid van Moolenbroek 	if (r != idn_success)
441*00b67f09SDavid van Moolenbroek 		goto ret;
442*00b67f09SDavid van Moolenbroek 	if ((ctx->flags & IDN_CONVERTER_RTCHECK) != 0) {
443*00b67f09SDavid van Moolenbroek 		r = roundtrip_check(ctx, from, to);
444*00b67f09SDavid van Moolenbroek 		if (r != idn_success)
445*00b67f09SDavid van Moolenbroek 			goto ret;
446*00b67f09SDavid van Moolenbroek 	}
447*00b67f09SDavid van Moolenbroek 
448*00b67f09SDavid van Moolenbroek 	r = idn_success;
449*00b67f09SDavid van Moolenbroek ret:
450*00b67f09SDavid van Moolenbroek 	if (r == idn_success) {
451*00b67f09SDavid van Moolenbroek 		TRACE(("idn_converter_convfromucs4(): success (to=\"%s\")\n",
452*00b67f09SDavid van Moolenbroek 		       idn__debug_xstring(to, 50)));
453*00b67f09SDavid van Moolenbroek 	} else {
454*00b67f09SDavid van Moolenbroek 		TRACE(("idn_converter_convfromucs4(): %s\n",
455*00b67f09SDavid van Moolenbroek 		       idn_result_tostring(r)));
456*00b67f09SDavid van Moolenbroek 	}
457*00b67f09SDavid van Moolenbroek 	return (r);
458*00b67f09SDavid van Moolenbroek }
459*00b67f09SDavid van Moolenbroek 
460*00b67f09SDavid van Moolenbroek idn_result_t
idn_converter_convtoucs4(idn_converter_t ctx,const char * from,unsigned long * to,size_t tolen)461*00b67f09SDavid van Moolenbroek idn_converter_convtoucs4(idn_converter_t ctx, const char *from,
462*00b67f09SDavid van Moolenbroek 			 unsigned long *to, size_t tolen) {
463*00b67f09SDavid van Moolenbroek 	idn_result_t r;
464*00b67f09SDavid van Moolenbroek 
465*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL && from != NULL && to != NULL);
466*00b67f09SDavid van Moolenbroek 
467*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_convtoucs4(ctx=%s, from=\"%s\", tolen=%d)\n",
468*00b67f09SDavid van Moolenbroek 	       ctx->local_encoding_name, idn__debug_xstring(from, 50),
469*00b67f09SDavid van Moolenbroek 	       (int)tolen));
470*00b67f09SDavid van Moolenbroek 
471*00b67f09SDavid van Moolenbroek 	if (!ctx->opened_convtoucs4) {
472*00b67f09SDavid van Moolenbroek 		r = (*ctx->ops->opentoucs4)(ctx, &(ctx->private_data));
473*00b67f09SDavid van Moolenbroek 		if (r != idn_success)
474*00b67f09SDavid van Moolenbroek 			goto ret;
475*00b67f09SDavid van Moolenbroek 		ctx->opened_convtoucs4 = 1;
476*00b67f09SDavid van Moolenbroek 	}
477*00b67f09SDavid van Moolenbroek 
478*00b67f09SDavid van Moolenbroek 	r = (*ctx->ops->convtoucs4)(ctx, ctx->private_data, from, to, tolen);
479*00b67f09SDavid van Moolenbroek ret:
480*00b67f09SDavid van Moolenbroek 	if (r == idn_success) {
481*00b67f09SDavid van Moolenbroek 		TRACE(("idn_converter_convtoucs4(): success (to=\"%s\")\n",
482*00b67f09SDavid van Moolenbroek 		       idn__debug_ucs4xstring(to, 50)));
483*00b67f09SDavid van Moolenbroek 	} else {
484*00b67f09SDavid van Moolenbroek 		TRACE(("idn_converter_convtoucs4(): %s\n",
485*00b67f09SDavid van Moolenbroek 		       idn_result_tostring(r)));
486*00b67f09SDavid van Moolenbroek 	}
487*00b67f09SDavid van Moolenbroek 	return (r);
488*00b67f09SDavid van Moolenbroek }
489*00b67f09SDavid van Moolenbroek 
490*00b67f09SDavid van Moolenbroek /*
491*00b67f09SDavid van Moolenbroek  * Encoding registration.
492*00b67f09SDavid van Moolenbroek  */
493*00b67f09SDavid van Moolenbroek 
494*00b67f09SDavid van Moolenbroek idn_result_t
idn_converter_register(const char * name,idn_converter_openproc_t openfromucs4,idn_converter_openproc_t opentoucs4,idn_converter_convfromucs4proc_t convfromucs4,idn_converter_convtoucs4proc_t convtoucs4,idn_converter_closeproc_t close,int encoding_type)495*00b67f09SDavid van Moolenbroek idn_converter_register(const char *name,
496*00b67f09SDavid van Moolenbroek 		       idn_converter_openproc_t openfromucs4,
497*00b67f09SDavid van Moolenbroek 		       idn_converter_openproc_t opentoucs4,
498*00b67f09SDavid van Moolenbroek 		       idn_converter_convfromucs4proc_t convfromucs4,
499*00b67f09SDavid van Moolenbroek 		       idn_converter_convtoucs4proc_t convtoucs4,
500*00b67f09SDavid van Moolenbroek 		       idn_converter_closeproc_t close,
501*00b67f09SDavid van Moolenbroek 		       int encoding_type) {
502*00b67f09SDavid van Moolenbroek 	converter_ops_t *ops;
503*00b67f09SDavid van Moolenbroek 	idn_result_t r;
504*00b67f09SDavid van Moolenbroek 
505*00b67f09SDavid van Moolenbroek 	assert(name != NULL && convfromucs4 != NULL && convtoucs4 != NULL);
506*00b67f09SDavid van Moolenbroek 
507*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_register(name=%s)\n", name));
508*00b67f09SDavid van Moolenbroek 
509*00b67f09SDavid van Moolenbroek 	if ((ops = malloc(sizeof(*ops))) == NULL) {
510*00b67f09SDavid van Moolenbroek 		r = idn_nomemory;
511*00b67f09SDavid van Moolenbroek 		goto ret;
512*00b67f09SDavid van Moolenbroek 	}
513*00b67f09SDavid van Moolenbroek 
514*00b67f09SDavid van Moolenbroek 	if (openfromucs4 == NULL)
515*00b67f09SDavid van Moolenbroek 		openfromucs4 = converter_none_open;
516*00b67f09SDavid van Moolenbroek 	if (opentoucs4 == NULL)
517*00b67f09SDavid van Moolenbroek 		opentoucs4 = converter_none_open;
518*00b67f09SDavid van Moolenbroek 	if (close == NULL)
519*00b67f09SDavid van Moolenbroek 		close = converter_none_close;
520*00b67f09SDavid van Moolenbroek 
521*00b67f09SDavid van Moolenbroek 	ops->openfromucs4 = openfromucs4;
522*00b67f09SDavid van Moolenbroek 	ops->opentoucs4 = opentoucs4;
523*00b67f09SDavid van Moolenbroek 	ops->convfromucs4 = convfromucs4;
524*00b67f09SDavid van Moolenbroek 	ops->convtoucs4 = convtoucs4;
525*00b67f09SDavid van Moolenbroek 	ops->close = close;
526*00b67f09SDavid van Moolenbroek 	ops->encoding_type = encoding_type;
527*00b67f09SDavid van Moolenbroek 
528*00b67f09SDavid van Moolenbroek 	r = idn__strhash_put(encoding_name_hash, name, ops);
529*00b67f09SDavid van Moolenbroek 	if (r != idn_success) {
530*00b67f09SDavid van Moolenbroek 		free(ops);
531*00b67f09SDavid van Moolenbroek 		goto ret;
532*00b67f09SDavid van Moolenbroek 	}
533*00b67f09SDavid van Moolenbroek 
534*00b67f09SDavid van Moolenbroek 	r = idn_success;
535*00b67f09SDavid van Moolenbroek ret:
536*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_register(): %s\n", idn_result_tostring(r)));
537*00b67f09SDavid van Moolenbroek 	return (r);
538*00b67f09SDavid van Moolenbroek }
539*00b67f09SDavid van Moolenbroek 
540*00b67f09SDavid van Moolenbroek static idn_result_t
register_standard_encoding(void)541*00b67f09SDavid van Moolenbroek register_standard_encoding(void) {
542*00b67f09SDavid van Moolenbroek 	idn_result_t r;
543*00b67f09SDavid van Moolenbroek 
544*00b67f09SDavid van Moolenbroek 	r = idn_converter_register(IDN_PUNYCODE_ENCODING_NAME,
545*00b67f09SDavid van Moolenbroek 				   NULL,
546*00b67f09SDavid van Moolenbroek 				   NULL,
547*00b67f09SDavid van Moolenbroek 				   idn__punycode_encode,
548*00b67f09SDavid van Moolenbroek 				   idn__punycode_decode,
549*00b67f09SDavid van Moolenbroek 				   converter_none_close,
550*00b67f09SDavid van Moolenbroek 				   IDN_ACE_STRICTCASE);
551*00b67f09SDavid van Moolenbroek 	if (r != idn_success)
552*00b67f09SDavid van Moolenbroek 		return (r);
553*00b67f09SDavid van Moolenbroek 
554*00b67f09SDavid van Moolenbroek #ifdef IDN_EXTRA_ACE
555*00b67f09SDavid van Moolenbroek 	r = idn_converter_register(IDN_AMCACEZ_ENCODING_NAME,
556*00b67f09SDavid van Moolenbroek 				   NULL,
557*00b67f09SDavid van Moolenbroek 				   NULL,
558*00b67f09SDavid van Moolenbroek 				   idn__punycode_encode,
559*00b67f09SDavid van Moolenbroek 				   idn__punycode_decode,
560*00b67f09SDavid van Moolenbroek 				   converter_none_close,
561*00b67f09SDavid van Moolenbroek 				   IDN_ACE_STRICTCASE);
562*00b67f09SDavid van Moolenbroek 	if (r != idn_success)
563*00b67f09SDavid van Moolenbroek 		return (r);
564*00b67f09SDavid van Moolenbroek 
565*00b67f09SDavid van Moolenbroek 	r = idn_converter_register(IDN_RACE_ENCODING_NAME,
566*00b67f09SDavid van Moolenbroek 				   NULL,
567*00b67f09SDavid van Moolenbroek 				   NULL,
568*00b67f09SDavid van Moolenbroek 				   idn__race_encode,
569*00b67f09SDavid van Moolenbroek 				   idn__race_decode,
570*00b67f09SDavid van Moolenbroek 				   converter_none_close,
571*00b67f09SDavid van Moolenbroek 				   IDN_ACE_LOOSECASE);
572*00b67f09SDavid van Moolenbroek 	if (r != idn_success)
573*00b67f09SDavid van Moolenbroek 		return (r);
574*00b67f09SDavid van Moolenbroek #endif /* IDN_EXTRA_ACE */
575*00b67f09SDavid van Moolenbroek 
576*00b67f09SDavid van Moolenbroek #ifdef DEBUG
577*00b67f09SDavid van Moolenbroek 	/* This is convenient for debug.  Not useful for other purposes. */
578*00b67f09SDavid van Moolenbroek 	r = idn_converter_register("U-escape",
579*00b67f09SDavid van Moolenbroek 				   NULL,
580*00b67f09SDavid van Moolenbroek 				   NULL,
581*00b67f09SDavid van Moolenbroek 				   converter_uescape_convfromucs4,
582*00b67f09SDavid van Moolenbroek 				   converter_uescape_convtoucs4,
583*00b67f09SDavid van Moolenbroek 				   NULL,
584*00b67f09SDavid van Moolenbroek 				   IDN_NONACE);
585*00b67f09SDavid van Moolenbroek 	if (r != idn_success)
586*00b67f09SDavid van Moolenbroek 		return (r);
587*00b67f09SDavid van Moolenbroek #endif /* DEBUG */
588*00b67f09SDavid van Moolenbroek 
589*00b67f09SDavid van Moolenbroek 	return (r);
590*00b67f09SDavid van Moolenbroek }
591*00b67f09SDavid van Moolenbroek 
592*00b67f09SDavid van Moolenbroek /*
593*00b67f09SDavid van Moolenbroek  * Encoding alias support.
594*00b67f09SDavid van Moolenbroek  */
595*00b67f09SDavid van Moolenbroek idn_result_t
idn_converter_addalias(const char * alias_name,const char * real_name,int first_item)596*00b67f09SDavid van Moolenbroek idn_converter_addalias(const char *alias_name, const char *real_name,
597*00b67f09SDavid van Moolenbroek 		       int first_item) {
598*00b67f09SDavid van Moolenbroek 	idn_result_t r;
599*00b67f09SDavid van Moolenbroek 
600*00b67f09SDavid van Moolenbroek 	assert(alias_name != NULL && real_name != NULL);
601*00b67f09SDavid van Moolenbroek 
602*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_addalias(alias_name=%s,real_name=%s)\n",
603*00b67f09SDavid van Moolenbroek 	       alias_name, real_name));
604*00b67f09SDavid van Moolenbroek 
605*00b67f09SDavid van Moolenbroek 	if (strlen(alias_name) == 0 || strlen(real_name) == 0) {
606*00b67f09SDavid van Moolenbroek 		return idn_invalid_syntax;
607*00b67f09SDavid van Moolenbroek 	}
608*00b67f09SDavid van Moolenbroek 
609*00b67f09SDavid van Moolenbroek 	if (strcmp(alias_name, real_name) == 0) {
610*00b67f09SDavid van Moolenbroek 		r = idn_success;
611*00b67f09SDavid van Moolenbroek 		goto ret;
612*00b67f09SDavid van Moolenbroek 	}
613*00b67f09SDavid van Moolenbroek 
614*00b67f09SDavid van Moolenbroek 	if (encoding_alias_list == NULL) {
615*00b67f09SDavid van Moolenbroek 		WARNING(("idn_converter_addalias(): the module is not "
616*00b67f09SDavid van Moolenbroek 			 "initialized\n"));
617*00b67f09SDavid van Moolenbroek 		r = idn_failure;
618*00b67f09SDavid van Moolenbroek 		goto ret;
619*00b67f09SDavid van Moolenbroek 	}
620*00b67f09SDavid van Moolenbroek 
621*00b67f09SDavid van Moolenbroek 	r = idn__aliaslist_additem(encoding_alias_list, alias_name, real_name,
622*00b67f09SDavid van Moolenbroek 				   first_item);
623*00b67f09SDavid van Moolenbroek ret:
624*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_addalias(): %s\n", idn_result_tostring(r)));
625*00b67f09SDavid van Moolenbroek 	return (r);
626*00b67f09SDavid van Moolenbroek }
627*00b67f09SDavid van Moolenbroek 
628*00b67f09SDavid van Moolenbroek idn_result_t
idn_converter_aliasfile(const char * path)629*00b67f09SDavid van Moolenbroek idn_converter_aliasfile(const char *path) {
630*00b67f09SDavid van Moolenbroek 	idn_result_t r;
631*00b67f09SDavid van Moolenbroek 
632*00b67f09SDavid van Moolenbroek 	assert(path != NULL);
633*00b67f09SDavid van Moolenbroek 
634*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_aliasfile(path=%s)\n", path));
635*00b67f09SDavid van Moolenbroek 
636*00b67f09SDavid van Moolenbroek 	if (encoding_alias_list == NULL) {
637*00b67f09SDavid van Moolenbroek 		WARNING(("idn_converter_aliasfile(): the module is not "
638*00b67f09SDavid van Moolenbroek 			 "initialized\n"));
639*00b67f09SDavid van Moolenbroek 		return (idn_failure);
640*00b67f09SDavid van Moolenbroek 	}
641*00b67f09SDavid van Moolenbroek 
642*00b67f09SDavid van Moolenbroek 	r = idn__aliaslist_aliasfile(encoding_alias_list, path);
643*00b67f09SDavid van Moolenbroek 
644*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_aliasfile(): %s\n", idn_result_tostring(r)));
645*00b67f09SDavid van Moolenbroek 	return (r);
646*00b67f09SDavid van Moolenbroek }
647*00b67f09SDavid van Moolenbroek 
648*00b67f09SDavid van Moolenbroek idn_result_t
idn_converter_resetalias(void)649*00b67f09SDavid van Moolenbroek idn_converter_resetalias(void) {
650*00b67f09SDavid van Moolenbroek 	idn__aliaslist_t list;
651*00b67f09SDavid van Moolenbroek 	idn_result_t r;
652*00b67f09SDavid van Moolenbroek 
653*00b67f09SDavid van Moolenbroek  	TRACE(("idn_converter_resetalias()\n"));
654*00b67f09SDavid van Moolenbroek 
655*00b67f09SDavid van Moolenbroek 	if (encoding_alias_list == NULL) {
656*00b67f09SDavid van Moolenbroek 		WARNING(("idn_converter_resetalias(): the module is not "
657*00b67f09SDavid van Moolenbroek 			 "initialized\n"));
658*00b67f09SDavid van Moolenbroek 		return (idn_failure);
659*00b67f09SDavid van Moolenbroek 	}
660*00b67f09SDavid van Moolenbroek 
661*00b67f09SDavid van Moolenbroek 	list = encoding_alias_list;
662*00b67f09SDavid van Moolenbroek 	encoding_alias_list = NULL;
663*00b67f09SDavid van Moolenbroek 	idn__aliaslist_destroy(list);
664*00b67f09SDavid van Moolenbroek 	list = NULL;
665*00b67f09SDavid van Moolenbroek 	r = idn__aliaslist_create(&list);
666*00b67f09SDavid van Moolenbroek 	encoding_alias_list = list;
667*00b67f09SDavid van Moolenbroek 
668*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_resetalias(): %s\n", idn_result_tostring(r)));
669*00b67f09SDavid van Moolenbroek 	return (r);
670*00b67f09SDavid van Moolenbroek }
671*00b67f09SDavid van Moolenbroek 
672*00b67f09SDavid van Moolenbroek const char *
idn_converter_getrealname(const char * name)673*00b67f09SDavid van Moolenbroek idn_converter_getrealname(const char *name) {
674*00b67f09SDavid van Moolenbroek 	char *realname;
675*00b67f09SDavid van Moolenbroek 	idn_result_t r;
676*00b67f09SDavid van Moolenbroek 
677*00b67f09SDavid van Moolenbroek  	TRACE(("idn_converter_getrealname()\n"));
678*00b67f09SDavid van Moolenbroek 
679*00b67f09SDavid van Moolenbroek 	assert(name != NULL);
680*00b67f09SDavid van Moolenbroek 
681*00b67f09SDavid van Moolenbroek 	if (encoding_alias_list == NULL) {
682*00b67f09SDavid van Moolenbroek 		WARNING(("idn_converter_getrealname(): the module is not "
683*00b67f09SDavid van Moolenbroek 			 "initialized\n"));
684*00b67f09SDavid van Moolenbroek 		return (name);
685*00b67f09SDavid van Moolenbroek 	}
686*00b67f09SDavid van Moolenbroek 
687*00b67f09SDavid van Moolenbroek 	r = idn__aliaslist_find(encoding_alias_list, name, &realname);
688*00b67f09SDavid van Moolenbroek 	if (r != idn_success) {
689*00b67f09SDavid van Moolenbroek 		return (name);
690*00b67f09SDavid van Moolenbroek 	}
691*00b67f09SDavid van Moolenbroek 	return (realname);
692*00b67f09SDavid van Moolenbroek }
693*00b67f09SDavid van Moolenbroek 
694*00b67f09SDavid van Moolenbroek /*
695*00b67f09SDavid van Moolenbroek  * Round trip check.
696*00b67f09SDavid van Moolenbroek  */
697*00b67f09SDavid van Moolenbroek 
698*00b67f09SDavid van Moolenbroek static idn_result_t
roundtrip_check(idn_converter_t ctx,const unsigned long * from,const char * to)699*00b67f09SDavid van Moolenbroek roundtrip_check(idn_converter_t ctx, const unsigned long *from, const char *to)
700*00b67f09SDavid van Moolenbroek {
701*00b67f09SDavid van Moolenbroek 	/*
702*00b67f09SDavid van Moolenbroek 	 * One problem with iconv() convertion is that
703*00b67f09SDavid van Moolenbroek 	 * iconv() doesn't signal an error if the input
704*00b67f09SDavid van Moolenbroek 	 * string contains characters which are valid but
705*00b67f09SDavid van Moolenbroek 	 * do not have mapping to the output codeset.
706*00b67f09SDavid van Moolenbroek 	 * (the behavior of iconv() for that case is defined as
707*00b67f09SDavid van Moolenbroek 	 * `implementation dependent')
708*00b67f09SDavid van Moolenbroek 	 * One way to check this case is to perform round-trip
709*00b67f09SDavid van Moolenbroek 	 * conversion and see if it is same as the original string.
710*00b67f09SDavid van Moolenbroek 	 */
711*00b67f09SDavid van Moolenbroek 	idn_result_t r;
712*00b67f09SDavid van Moolenbroek 	unsigned long *back;
713*00b67f09SDavid van Moolenbroek 	unsigned long backbuf[256];
714*00b67f09SDavid van Moolenbroek 	size_t fromlen;
715*00b67f09SDavid van Moolenbroek 	size_t backlen;
716*00b67f09SDavid van Moolenbroek 
717*00b67f09SDavid van Moolenbroek 	TRACE(("idn_converter_convert: round-trip checking (from=\"%s\")\n",
718*00b67f09SDavid van Moolenbroek 	       idn__debug_ucs4xstring(from, 50)));
719*00b67f09SDavid van Moolenbroek 
720*00b67f09SDavid van Moolenbroek 	/* Allocate enough buffer. */
721*00b67f09SDavid van Moolenbroek 	fromlen = idn_ucs4_strlen(from) + 1;
722*00b67f09SDavid van Moolenbroek 	if (fromlen * sizeof(*back) <= sizeof(backbuf)) {
723*00b67f09SDavid van Moolenbroek 		backlen = sizeof(backbuf);
724*00b67f09SDavid van Moolenbroek 		back = backbuf;
725*00b67f09SDavid van Moolenbroek 	} else {
726*00b67f09SDavid van Moolenbroek 		backlen = fromlen;
727*00b67f09SDavid van Moolenbroek 		back = (unsigned long *)malloc(backlen * sizeof(*back));
728*00b67f09SDavid van Moolenbroek 		if (back == NULL)
729*00b67f09SDavid van Moolenbroek 			return (idn_nomemory);
730*00b67f09SDavid van Moolenbroek 	}
731*00b67f09SDavid van Moolenbroek 
732*00b67f09SDavid van Moolenbroek 	/*
733*00b67f09SDavid van Moolenbroek 	 * Perform backward conversion.
734*00b67f09SDavid van Moolenbroek 	 */
735*00b67f09SDavid van Moolenbroek 	r = idn_converter_convtoucs4(ctx, to, back, backlen);
736*00b67f09SDavid van Moolenbroek 	switch (r) {
737*00b67f09SDavid van Moolenbroek 	case idn_success:
738*00b67f09SDavid van Moolenbroek 		if (memcmp(back, from, sizeof(*from) * fromlen) != 0)
739*00b67f09SDavid van Moolenbroek 			r = idn_nomapping;
740*00b67f09SDavid van Moolenbroek 		break;
741*00b67f09SDavid van Moolenbroek 	case idn_invalid_encoding:
742*00b67f09SDavid van Moolenbroek 	case idn_buffer_overflow:
743*00b67f09SDavid van Moolenbroek 		r = idn_nomapping;
744*00b67f09SDavid van Moolenbroek 		break;
745*00b67f09SDavid van Moolenbroek 	default:
746*00b67f09SDavid van Moolenbroek 		break;
747*00b67f09SDavid van Moolenbroek 	}
748*00b67f09SDavid van Moolenbroek 
749*00b67f09SDavid van Moolenbroek 	if (back != backbuf)
750*00b67f09SDavid van Moolenbroek 		free(back);
751*00b67f09SDavid van Moolenbroek 
752*00b67f09SDavid van Moolenbroek 	if (r != idn_success) {
753*00b67f09SDavid van Moolenbroek 		TRACE(("round-trip check failed: %s\n",
754*00b67f09SDavid van Moolenbroek 		       idn_result_tostring(r)));
755*00b67f09SDavid van Moolenbroek 	}
756*00b67f09SDavid van Moolenbroek 
757*00b67f09SDavid van Moolenbroek 	return (r);
758*00b67f09SDavid van Moolenbroek }
759*00b67f09SDavid van Moolenbroek 
760*00b67f09SDavid van Moolenbroek /*
761*00b67f09SDavid van Moolenbroek  * Identity conversion (or, no conversion at all).
762*00b67f09SDavid van Moolenbroek  */
763*00b67f09SDavid van Moolenbroek 
764*00b67f09SDavid van Moolenbroek static idn_result_t
converter_none_open(idn_converter_t ctx,void ** privdata)765*00b67f09SDavid van Moolenbroek converter_none_open(idn_converter_t ctx, void **privdata) {
766*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
767*00b67f09SDavid van Moolenbroek 
768*00b67f09SDavid van Moolenbroek 	return (idn_success);
769*00b67f09SDavid van Moolenbroek }
770*00b67f09SDavid van Moolenbroek 
771*00b67f09SDavid van Moolenbroek static idn_result_t
converter_none_close(idn_converter_t ctx,void * privdata)772*00b67f09SDavid van Moolenbroek converter_none_close(idn_converter_t ctx, void *privdata) {
773*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
774*00b67f09SDavid van Moolenbroek 
775*00b67f09SDavid van Moolenbroek 	return (idn_success);
776*00b67f09SDavid van Moolenbroek }
777*00b67f09SDavid van Moolenbroek 
778*00b67f09SDavid van Moolenbroek static idn_result_t
converter_none_convfromucs4(idn_converter_t ctx,void * privdata,const unsigned long * from,char * to,size_t tolen)779*00b67f09SDavid van Moolenbroek converter_none_convfromucs4(idn_converter_t ctx, void *privdata,
780*00b67f09SDavid van Moolenbroek 		       const unsigned long *from, char *to, size_t tolen) {
781*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL && from != NULL && to != NULL);
782*00b67f09SDavid van Moolenbroek 
783*00b67f09SDavid van Moolenbroek 	return idn_ucs4_ucs4toutf8(from, to, tolen);
784*00b67f09SDavid van Moolenbroek }
785*00b67f09SDavid van Moolenbroek 
786*00b67f09SDavid van Moolenbroek static idn_result_t
converter_none_convtoucs4(idn_converter_t ctx,void * privdata,const char * from,unsigned long * to,size_t tolen)787*00b67f09SDavid van Moolenbroek converter_none_convtoucs4(idn_converter_t ctx, void *privdata,
788*00b67f09SDavid van Moolenbroek 		     const char *from, unsigned long *to, size_t tolen) {
789*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL && from != NULL && to != NULL);
790*00b67f09SDavid van Moolenbroek 
791*00b67f09SDavid van Moolenbroek 	return idn_ucs4_utf8toucs4(from, to, tolen);
792*00b67f09SDavid van Moolenbroek }
793*00b67f09SDavid van Moolenbroek 
794*00b67f09SDavid van Moolenbroek #ifndef WITHOUT_ICONV
795*00b67f09SDavid van Moolenbroek 
796*00b67f09SDavid van Moolenbroek /*
797*00b67f09SDavid van Moolenbroek  * Conversion using iconv() interface.
798*00b67f09SDavid van Moolenbroek  */
799*00b67f09SDavid van Moolenbroek 
800*00b67f09SDavid van Moolenbroek static idn_result_t
converter_iconv_openfromucs4(idn_converter_t ctx,void ** privdata)801*00b67f09SDavid van Moolenbroek converter_iconv_openfromucs4(idn_converter_t ctx, void **privdata) {
802*00b67f09SDavid van Moolenbroek 	iconv_t *ictxp;
803*00b67f09SDavid van Moolenbroek 	idn_result_t r;
804*00b67f09SDavid van Moolenbroek 
805*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
806*00b67f09SDavid van Moolenbroek 
807*00b67f09SDavid van Moolenbroek 	r = iconv_initialize_privdata(privdata);
808*00b67f09SDavid van Moolenbroek 	if (r != idn_success)
809*00b67f09SDavid van Moolenbroek 		return (r);
810*00b67f09SDavid van Moolenbroek 
811*00b67f09SDavid van Moolenbroek 	ictxp = (iconv_t *)*privdata;
812*00b67f09SDavid van Moolenbroek 	*ictxp = iconv_open(ctx->local_encoding_name, IDN_UTF8_ENCODING_NAME);
813*00b67f09SDavid van Moolenbroek 	if (*ictxp == (iconv_t)(-1)) {
814*00b67f09SDavid van Moolenbroek 		free(*privdata);
815*00b67f09SDavid van Moolenbroek 		*privdata = NULL;
816*00b67f09SDavid van Moolenbroek 		switch (errno) {
817*00b67f09SDavid van Moolenbroek 		case ENOMEM:
818*00b67f09SDavid van Moolenbroek 			return (idn_nomemory);
819*00b67f09SDavid van Moolenbroek 		case EINVAL:
820*00b67f09SDavid van Moolenbroek 			return (idn_invalid_name);
821*00b67f09SDavid van Moolenbroek 		default:
822*00b67f09SDavid van Moolenbroek 			WARNING(("iconv_open failed with errno %d\n", errno));
823*00b67f09SDavid van Moolenbroek 			return (idn_failure);
824*00b67f09SDavid van Moolenbroek 		}
825*00b67f09SDavid van Moolenbroek 	}
826*00b67f09SDavid van Moolenbroek 
827*00b67f09SDavid van Moolenbroek 	return (idn_success);
828*00b67f09SDavid van Moolenbroek }
829*00b67f09SDavid van Moolenbroek 
830*00b67f09SDavid van Moolenbroek static idn_result_t
converter_iconv_opentoucs4(idn_converter_t ctx,void ** privdata)831*00b67f09SDavid van Moolenbroek converter_iconv_opentoucs4(idn_converter_t ctx, void **privdata) {
832*00b67f09SDavid van Moolenbroek 	iconv_t *ictxp;
833*00b67f09SDavid van Moolenbroek 	idn_result_t r;
834*00b67f09SDavid van Moolenbroek 
835*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
836*00b67f09SDavid van Moolenbroek 
837*00b67f09SDavid van Moolenbroek 	r = iconv_initialize_privdata(privdata);
838*00b67f09SDavid van Moolenbroek 	if (r != idn_success)
839*00b67f09SDavid van Moolenbroek 		return (r);
840*00b67f09SDavid van Moolenbroek 
841*00b67f09SDavid van Moolenbroek 	ictxp = (iconv_t *)*privdata + 1;
842*00b67f09SDavid van Moolenbroek 	*ictxp = iconv_open(IDN_UTF8_ENCODING_NAME, ctx->local_encoding_name);
843*00b67f09SDavid van Moolenbroek 	if (*ictxp == (iconv_t)(-1)) {
844*00b67f09SDavid van Moolenbroek 		free(*privdata);
845*00b67f09SDavid van Moolenbroek 		*privdata = NULL;
846*00b67f09SDavid van Moolenbroek 		switch (errno) {
847*00b67f09SDavid van Moolenbroek 		case ENOMEM:
848*00b67f09SDavid van Moolenbroek 			return (idn_nomemory);
849*00b67f09SDavid van Moolenbroek 		case EINVAL:
850*00b67f09SDavid van Moolenbroek 			return (idn_invalid_name);
851*00b67f09SDavid van Moolenbroek 		default:
852*00b67f09SDavid van Moolenbroek 			WARNING(("iconv_open failed with errno %d\n", errno));
853*00b67f09SDavid van Moolenbroek 			return (idn_failure);
854*00b67f09SDavid van Moolenbroek 		}
855*00b67f09SDavid van Moolenbroek 	}
856*00b67f09SDavid van Moolenbroek 
857*00b67f09SDavid van Moolenbroek 	return (idn_success);
858*00b67f09SDavid van Moolenbroek }
859*00b67f09SDavid van Moolenbroek 
860*00b67f09SDavid van Moolenbroek static idn_result_t
iconv_initialize_privdata(void ** privdata)861*00b67f09SDavid van Moolenbroek iconv_initialize_privdata(void **privdata) {
862*00b67f09SDavid van Moolenbroek 	if (*privdata == NULL) {
863*00b67f09SDavid van Moolenbroek 		*privdata = malloc(sizeof(iconv_t) * 2);
864*00b67f09SDavid van Moolenbroek 		if (*privdata == NULL)
865*00b67f09SDavid van Moolenbroek 			return (idn_nomemory);
866*00b67f09SDavid van Moolenbroek 		*((iconv_t *)*privdata) = (iconv_t)(-1);
867*00b67f09SDavid van Moolenbroek 		*((iconv_t *)*privdata + 1) = (iconv_t)(-1);
868*00b67f09SDavid van Moolenbroek 	}
869*00b67f09SDavid van Moolenbroek 
870*00b67f09SDavid van Moolenbroek 	return (idn_success);
871*00b67f09SDavid van Moolenbroek }
872*00b67f09SDavid van Moolenbroek 
873*00b67f09SDavid van Moolenbroek static void
iconv_finalize_privdata(void * privdata)874*00b67f09SDavid van Moolenbroek iconv_finalize_privdata(void *privdata) {
875*00b67f09SDavid van Moolenbroek 	iconv_t *ictxp;
876*00b67f09SDavid van Moolenbroek 
877*00b67f09SDavid van Moolenbroek 	if (privdata != NULL) {
878*00b67f09SDavid van Moolenbroek 		ictxp = (iconv_t *)privdata;
879*00b67f09SDavid van Moolenbroek 		if (*ictxp != (iconv_t)(-1))
880*00b67f09SDavid van Moolenbroek 			iconv_close(*ictxp);
881*00b67f09SDavid van Moolenbroek 
882*00b67f09SDavid van Moolenbroek 		ictxp++;
883*00b67f09SDavid van Moolenbroek 		if (*ictxp != (iconv_t)(-1))
884*00b67f09SDavid van Moolenbroek 			iconv_close(*ictxp);
885*00b67f09SDavid van Moolenbroek 		free(privdata);
886*00b67f09SDavid van Moolenbroek 	}
887*00b67f09SDavid van Moolenbroek }
888*00b67f09SDavid van Moolenbroek 
889*00b67f09SDavid van Moolenbroek static idn_result_t
converter_iconv_close(idn_converter_t ctx,void * privdata)890*00b67f09SDavid van Moolenbroek converter_iconv_close(idn_converter_t ctx, void *privdata) {
891*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL);
892*00b67f09SDavid van Moolenbroek 
893*00b67f09SDavid van Moolenbroek 	iconv_finalize_privdata(privdata);
894*00b67f09SDavid van Moolenbroek 
895*00b67f09SDavid van Moolenbroek 	return (idn_success);
896*00b67f09SDavid van Moolenbroek }
897*00b67f09SDavid van Moolenbroek 
898*00b67f09SDavid van Moolenbroek static idn_result_t
converter_iconv_convfromucs4(idn_converter_t ctx,void * privdata,const unsigned long * from,char * to,size_t tolen)899*00b67f09SDavid van Moolenbroek converter_iconv_convfromucs4(idn_converter_t ctx, void *privdata,
900*00b67f09SDavid van Moolenbroek 			     const unsigned long *from, char *to,
901*00b67f09SDavid van Moolenbroek 			     size_t tolen) {
902*00b67f09SDavid van Moolenbroek 	iconv_t ictx;
903*00b67f09SDavid van Moolenbroek 	char *utf8 = NULL;
904*00b67f09SDavid van Moolenbroek 	size_t utf8size = 256;  /* large enough */
905*00b67f09SDavid van Moolenbroek 	idn_result_t r;
906*00b67f09SDavid van Moolenbroek 	size_t sz;
907*00b67f09SDavid van Moolenbroek 	size_t inleft;
908*00b67f09SDavid van Moolenbroek 	size_t outleft;
909*00b67f09SDavid van Moolenbroek 	char *inbuf, *outbuf;
910*00b67f09SDavid van Moolenbroek 
911*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL && from != NULL && to != NULL);
912*00b67f09SDavid van Moolenbroek 
913*00b67f09SDavid van Moolenbroek 	if (tolen <= 0) {
914*00b67f09SDavid van Moolenbroek 		r = idn_buffer_overflow;	/* need space for NUL */
915*00b67f09SDavid van Moolenbroek 		goto ret;
916*00b67f09SDavid van Moolenbroek 	}
917*00b67f09SDavid van Moolenbroek 
918*00b67f09SDavid van Moolenbroek 	/*
919*00b67f09SDavid van Moolenbroek 	 * UCS4 -> UTF-8 conversion.
920*00b67f09SDavid van Moolenbroek 	 */
921*00b67f09SDavid van Moolenbroek 	utf8 = (char *)malloc(utf8size);
922*00b67f09SDavid van Moolenbroek 	if (utf8 == NULL) {
923*00b67f09SDavid van Moolenbroek 		r = idn_nomemory;
924*00b67f09SDavid van Moolenbroek 		goto ret;
925*00b67f09SDavid van Moolenbroek 	}
926*00b67f09SDavid van Moolenbroek 
927*00b67f09SDavid van Moolenbroek try_again:
928*00b67f09SDavid van Moolenbroek 	r = idn_ucs4_ucs4toutf8(from, utf8, utf8size);
929*00b67f09SDavid van Moolenbroek 	if (r == idn_buffer_overflow) {
930*00b67f09SDavid van Moolenbroek 		char *new_utf8;
931*00b67f09SDavid van Moolenbroek 
932*00b67f09SDavid van Moolenbroek 		utf8size *= 2;
933*00b67f09SDavid van Moolenbroek 		new_utf8 = (char *)realloc(utf8, utf8size);
934*00b67f09SDavid van Moolenbroek 		if (new_utf8 == NULL) {
935*00b67f09SDavid van Moolenbroek 			r = idn_nomemory;
936*00b67f09SDavid van Moolenbroek 			goto ret;
937*00b67f09SDavid van Moolenbroek 		}
938*00b67f09SDavid van Moolenbroek 		utf8 = new_utf8;
939*00b67f09SDavid van Moolenbroek 		goto try_again;
940*00b67f09SDavid van Moolenbroek 	} else if (r != idn_success) {
941*00b67f09SDavid van Moolenbroek 		goto ret;
942*00b67f09SDavid van Moolenbroek 	}
943*00b67f09SDavid van Moolenbroek 
944*00b67f09SDavid van Moolenbroek 	ictx = ((iconv_t *)privdata)[0];
945*00b67f09SDavid van Moolenbroek 
946*00b67f09SDavid van Moolenbroek 	/*
947*00b67f09SDavid van Moolenbroek 	 * Reset internal state.
948*00b67f09SDavid van Moolenbroek 	 *
949*00b67f09SDavid van Moolenbroek 	 * The following code should work according to the SUSv2 spec,
950*00b67f09SDavid van Moolenbroek 	 * but causes segmentation fault with Solaris 2.6.
951*00b67f09SDavid van Moolenbroek 	 * So.. a work-around.
952*00b67f09SDavid van Moolenbroek 	 *
953*00b67f09SDavid van Moolenbroek 	 * (void)iconv(ictx, (const char **)NULL, (size_t *)NULL,
954*00b67f09SDavid van Moolenbroek 	 * 	    (char **)NULL, (size_t *)NULL);
955*00b67f09SDavid van Moolenbroek 	 */
956*00b67f09SDavid van Moolenbroek 	inleft = 0;
957*00b67f09SDavid van Moolenbroek 	outbuf = NULL;
958*00b67f09SDavid van Moolenbroek 	outleft = 0;
959*00b67f09SDavid van Moolenbroek 	(void)iconv(ictx, (const char **)NULL, &inleft, &outbuf, &outleft);
960*00b67f09SDavid van Moolenbroek 
961*00b67f09SDavid van Moolenbroek 	inleft = strlen(utf8);
962*00b67f09SDavid van Moolenbroek 	inbuf = utf8;
963*00b67f09SDavid van Moolenbroek 	outleft = tolen - 1;	/* reserve space for terminating NUL */
964*00b67f09SDavid van Moolenbroek 	sz = iconv(ictx, (const char **)&inbuf, &inleft, &to, &outleft);
965*00b67f09SDavid van Moolenbroek 
966*00b67f09SDavid van Moolenbroek 	if (sz == (size_t)(-1) || inleft > 0) {
967*00b67f09SDavid van Moolenbroek 		switch (errno) {
968*00b67f09SDavid van Moolenbroek 		case EILSEQ:
969*00b67f09SDavid van Moolenbroek 		case EINVAL:
970*00b67f09SDavid van Moolenbroek 			/*
971*00b67f09SDavid van Moolenbroek 			 * We already checked the validity of the input
972*00b67f09SDavid van Moolenbroek 			 * string.  So we assume a mapping error.
973*00b67f09SDavid van Moolenbroek 			 */
974*00b67f09SDavid van Moolenbroek 			r = idn_nomapping;
975*00b67f09SDavid van Moolenbroek 			goto ret;
976*00b67f09SDavid van Moolenbroek 		case E2BIG:
977*00b67f09SDavid van Moolenbroek 			r = idn_buffer_overflow;
978*00b67f09SDavid van Moolenbroek 			goto ret;
979*00b67f09SDavid van Moolenbroek 		default:
980*00b67f09SDavid van Moolenbroek 			WARNING(("iconv failed with errno %d\n", errno));
981*00b67f09SDavid van Moolenbroek 			r = idn_failure;
982*00b67f09SDavid van Moolenbroek 			goto ret;
983*00b67f09SDavid van Moolenbroek 		}
984*00b67f09SDavid van Moolenbroek 	}
985*00b67f09SDavid van Moolenbroek 
986*00b67f09SDavid van Moolenbroek 	/*
987*00b67f09SDavid van Moolenbroek 	 * For UTF-8 -> local conversion, append a sequence of
988*00b67f09SDavid van Moolenbroek 	 * state reset.
989*00b67f09SDavid van Moolenbroek 	 */
990*00b67f09SDavid van Moolenbroek 	inleft = 0;
991*00b67f09SDavid van Moolenbroek 	sz = iconv(ictx, (const char **)NULL, &inleft, &to, &outleft);
992*00b67f09SDavid van Moolenbroek 	if (sz == (size_t)(-1)) {
993*00b67f09SDavid van Moolenbroek 		switch (errno) {
994*00b67f09SDavid van Moolenbroek 		case EILSEQ:
995*00b67f09SDavid van Moolenbroek 		case EINVAL:
996*00b67f09SDavid van Moolenbroek 			r = idn_invalid_encoding;
997*00b67f09SDavid van Moolenbroek 			goto ret;
998*00b67f09SDavid van Moolenbroek 		case E2BIG:
999*00b67f09SDavid van Moolenbroek 			r = idn_buffer_overflow;
1000*00b67f09SDavid van Moolenbroek 			goto ret;
1001*00b67f09SDavid van Moolenbroek 		default:
1002*00b67f09SDavid van Moolenbroek 			WARNING(("iconv failed with errno %d\n", errno));
1003*00b67f09SDavid van Moolenbroek 			r = idn_failure;
1004*00b67f09SDavid van Moolenbroek 			goto ret;
1005*00b67f09SDavid van Moolenbroek 		}
1006*00b67f09SDavid van Moolenbroek 	}
1007*00b67f09SDavid van Moolenbroek 	*to = '\0';
1008*00b67f09SDavid van Moolenbroek 	r = idn_success;
1009*00b67f09SDavid van Moolenbroek 
1010*00b67f09SDavid van Moolenbroek ret:
1011*00b67f09SDavid van Moolenbroek 	free(utf8);
1012*00b67f09SDavid van Moolenbroek 	return (r);
1013*00b67f09SDavid van Moolenbroek 
1014*00b67f09SDavid van Moolenbroek }
1015*00b67f09SDavid van Moolenbroek 
1016*00b67f09SDavid van Moolenbroek static idn_result_t
converter_iconv_convtoucs4(idn_converter_t ctx,void * privdata,const char * from,unsigned long * to,size_t tolen)1017*00b67f09SDavid van Moolenbroek converter_iconv_convtoucs4(idn_converter_t ctx, void *privdata,
1018*00b67f09SDavid van Moolenbroek 			   const char *from, unsigned long *to, size_t tolen) {
1019*00b67f09SDavid van Moolenbroek 	iconv_t ictx;
1020*00b67f09SDavid van Moolenbroek 	char *utf8 = NULL;
1021*00b67f09SDavid van Moolenbroek 	size_t utf8size = 256;  /* large enough */
1022*00b67f09SDavid van Moolenbroek 	idn_result_t r;
1023*00b67f09SDavid van Moolenbroek 	size_t sz;
1024*00b67f09SDavid van Moolenbroek 	size_t inleft;
1025*00b67f09SDavid van Moolenbroek 	size_t outleft;
1026*00b67f09SDavid van Moolenbroek 	const char *from_ptr;
1027*00b67f09SDavid van Moolenbroek 	char *outbuf;
1028*00b67f09SDavid van Moolenbroek 
1029*00b67f09SDavid van Moolenbroek 	assert(ctx != NULL && from != NULL && to != NULL);
1030*00b67f09SDavid van Moolenbroek 
1031*00b67f09SDavid van Moolenbroek 	if (tolen <= 0) {
1032*00b67f09SDavid van Moolenbroek 		r = idn_buffer_overflow;	/* need space for NUL */
1033*00b67f09SDavid van Moolenbroek 		goto ret;
1034*00b67f09SDavid van Moolenbroek 	}
1035*00b67f09SDavid van Moolenbroek 	ictx = ((iconv_t *)privdata)[1];
1036*00b67f09SDavid van Moolenbroek 	utf8 = (char *)malloc(utf8size);
1037*00b67f09SDavid van Moolenbroek 	if (utf8 == NULL) {
1038*00b67f09SDavid van Moolenbroek 		r = idn_nomemory;
1039*00b67f09SDavid van Moolenbroek 		goto ret;
1040*00b67f09SDavid van Moolenbroek 	}
1041*00b67f09SDavid van Moolenbroek 
1042*00b67f09SDavid van Moolenbroek try_again:
1043*00b67f09SDavid van Moolenbroek 	/*
1044*00b67f09SDavid van Moolenbroek 	 * Reset internal state.
1045*00b67f09SDavid van Moolenbroek 	 */
1046*00b67f09SDavid van Moolenbroek 	inleft = 0;
1047*00b67f09SDavid van Moolenbroek 	outbuf = NULL;
1048*00b67f09SDavid van Moolenbroek 	outleft = 0;
1049*00b67f09SDavid van Moolenbroek 	(void)iconv(ictx, (const char **)NULL, &inleft, &outbuf, &outleft);
1050*00b67f09SDavid van Moolenbroek 
1051*00b67f09SDavid van Moolenbroek 	from_ptr = from;
1052*00b67f09SDavid van Moolenbroek 	inleft = strlen(from);
1053*00b67f09SDavid van Moolenbroek 	outbuf = utf8;
1054*00b67f09SDavid van Moolenbroek 	outleft = utf8size - 1;    /* reserve space for terminating NUL */
1055*00b67f09SDavid van Moolenbroek 	sz = iconv(ictx, (const char **)&from_ptr, &inleft, &outbuf, &outleft);
1056*00b67f09SDavid van Moolenbroek 
1057*00b67f09SDavid van Moolenbroek 	if (sz == (size_t)(-1) || inleft > 0) {
1058*00b67f09SDavid van Moolenbroek 		char *new_utf8;
1059*00b67f09SDavid van Moolenbroek 
1060*00b67f09SDavid van Moolenbroek 		switch (errno) {
1061*00b67f09SDavid van Moolenbroek 		case EILSEQ:
1062*00b67f09SDavid van Moolenbroek 		case EINVAL:
1063*00b67f09SDavid van Moolenbroek 			/*
1064*00b67f09SDavid van Moolenbroek 			 * We assume all the characters in the local
1065*00b67f09SDavid van Moolenbroek 			 * codeset are included in UCS.  This means mapping
1066*00b67f09SDavid van Moolenbroek 			 * error is not possible, so the input string must
1067*00b67f09SDavid van Moolenbroek 			 * have some problem.
1068*00b67f09SDavid van Moolenbroek 			 */
1069*00b67f09SDavid van Moolenbroek 			r = idn_invalid_encoding;
1070*00b67f09SDavid van Moolenbroek 			goto ret;
1071*00b67f09SDavid van Moolenbroek 		case E2BIG:
1072*00b67f09SDavid van Moolenbroek 			utf8size *= 2;
1073*00b67f09SDavid van Moolenbroek 			new_utf8 = (char *)realloc(utf8, utf8size);
1074*00b67f09SDavid van Moolenbroek 			if (new_utf8 == NULL) {
1075*00b67f09SDavid van Moolenbroek 				r = idn_nomemory;
1076*00b67f09SDavid van Moolenbroek 				goto ret;
1077*00b67f09SDavid van Moolenbroek 			}
1078*00b67f09SDavid van Moolenbroek 			utf8 = new_utf8;
1079*00b67f09SDavid van Moolenbroek 			goto try_again;
1080*00b67f09SDavid van Moolenbroek 		default:
1081*00b67f09SDavid van Moolenbroek 			WARNING(("iconv failed with errno %d\n", errno));
1082*00b67f09SDavid van Moolenbroek 			r = idn_failure;
1083*00b67f09SDavid van Moolenbroek 			goto ret;
1084*00b67f09SDavid van Moolenbroek 		}
1085*00b67f09SDavid van Moolenbroek 	}
1086*00b67f09SDavid van Moolenbroek 	*outbuf = '\0';
1087*00b67f09SDavid van Moolenbroek 
1088*00b67f09SDavid van Moolenbroek 	/*
1089*00b67f09SDavid van Moolenbroek 	 * UTF-8 -> UCS4 conversion.
1090*00b67f09SDavid van Moolenbroek 	 */
1091*00b67f09SDavid van Moolenbroek 	r = idn_ucs4_utf8toucs4(utf8, to, tolen);
1092*00b67f09SDavid van Moolenbroek 
1093*00b67f09SDavid van Moolenbroek ret:
1094*00b67f09SDavid van Moolenbroek 	free(utf8);
1095*00b67f09SDavid van Moolenbroek 	return (r);
1096*00b67f09SDavid van Moolenbroek }
1097*00b67f09SDavid van Moolenbroek 
1098*00b67f09SDavid van Moolenbroek #endif /* !WITHOUT_ICONV */
1099*00b67f09SDavid van Moolenbroek 
1100*00b67f09SDavid van Moolenbroek #ifdef DEBUG
1101*00b67f09SDavid van Moolenbroek /*
1102*00b67f09SDavid van Moolenbroek  * Conversion to/from unicode escape string.
1103*00b67f09SDavid van Moolenbroek  * Arbitrary UCS-4 character can be specified by a special sequence
1104*00b67f09SDavid van Moolenbroek  *	\u{XXXXXX}
1105*00b67f09SDavid van Moolenbroek  * where XXXXX denotes any hexadecimal string up to FFFFFFFF.
1106*00b67f09SDavid van Moolenbroek  * This is designed for debugging.
1107*00b67f09SDavid van Moolenbroek  */
1108*00b67f09SDavid van Moolenbroek 
1109*00b67f09SDavid van Moolenbroek static idn_result_t
converter_uescape_convfromucs4(idn_converter_t ctx,void * privdata,const unsigned long * from,char * to,size_t tolen)1110*00b67f09SDavid van Moolenbroek converter_uescape_convfromucs4(idn_converter_t ctx, void *privdata,
1111*00b67f09SDavid van Moolenbroek 			  const unsigned long *from, char *to,
1112*00b67f09SDavid van Moolenbroek 			  size_t tolen) {
1113*00b67f09SDavid van Moolenbroek 	idn_result_t r;
1114*00b67f09SDavid van Moolenbroek 	unsigned long v;
1115*00b67f09SDavid van Moolenbroek 
1116*00b67f09SDavid van Moolenbroek 	while (*from != '\0') {
1117*00b67f09SDavid van Moolenbroek 		v = *from++;
1118*00b67f09SDavid van Moolenbroek 
1119*00b67f09SDavid van Moolenbroek 		if (v <= 0x7f) {
1120*00b67f09SDavid van Moolenbroek 			if (tolen < 1) {
1121*00b67f09SDavid van Moolenbroek 				r = idn_buffer_overflow;
1122*00b67f09SDavid van Moolenbroek 				goto failure;
1123*00b67f09SDavid van Moolenbroek 			}
1124*00b67f09SDavid van Moolenbroek 			*to++ = v;
1125*00b67f09SDavid van Moolenbroek 			tolen--;
1126*00b67f09SDavid van Moolenbroek 		} else if (v <= 0xffffffff) {
1127*00b67f09SDavid van Moolenbroek 			char tmp[20];
1128*00b67f09SDavid van Moolenbroek 			int len;
1129*00b67f09SDavid van Moolenbroek 
1130*00b67f09SDavid van Moolenbroek 			(void)sprintf(tmp, "\\u{%lx}", v);
1131*00b67f09SDavid van Moolenbroek 			len = strlen(tmp);
1132*00b67f09SDavid van Moolenbroek 			if (tolen < len) {
1133*00b67f09SDavid van Moolenbroek 				r = idn_buffer_overflow;
1134*00b67f09SDavid van Moolenbroek 				goto failure;
1135*00b67f09SDavid van Moolenbroek 			}
1136*00b67f09SDavid van Moolenbroek 			(void)memcpy(to, tmp, len);
1137*00b67f09SDavid van Moolenbroek 			to += len;
1138*00b67f09SDavid van Moolenbroek 			tolen -= len;
1139*00b67f09SDavid van Moolenbroek 		} else {
1140*00b67f09SDavid van Moolenbroek 			r = idn_invalid_encoding;
1141*00b67f09SDavid van Moolenbroek 			goto failure;
1142*00b67f09SDavid van Moolenbroek 		}
1143*00b67f09SDavid van Moolenbroek 	}
1144*00b67f09SDavid van Moolenbroek 
1145*00b67f09SDavid van Moolenbroek 	if (tolen <= 0) {
1146*00b67f09SDavid van Moolenbroek 		r = idn_buffer_overflow;
1147*00b67f09SDavid van Moolenbroek 		goto failure;
1148*00b67f09SDavid van Moolenbroek 	}
1149*00b67f09SDavid van Moolenbroek 	*to = '\0';
1150*00b67f09SDavid van Moolenbroek 
1151*00b67f09SDavid van Moolenbroek 	return (idn_success);
1152*00b67f09SDavid van Moolenbroek 
1153*00b67f09SDavid van Moolenbroek failure:
1154*00b67f09SDavid van Moolenbroek 	if (r != idn_buffer_overflow) {
1155*00b67f09SDavid van Moolenbroek 		WARNING(("idn_uescape_convfromucs4(): %s\n",
1156*00b67f09SDavid van Moolenbroek 			 idn_result_tostring(r)));
1157*00b67f09SDavid van Moolenbroek 	}
1158*00b67f09SDavid van Moolenbroek 	return (r);
1159*00b67f09SDavid van Moolenbroek }
1160*00b67f09SDavid van Moolenbroek 
1161*00b67f09SDavid van Moolenbroek static idn_result_t
converter_uescape_convtoucs4(idn_converter_t ctx,void * privdata,const char * from,unsigned long * to,size_t tolen)1162*00b67f09SDavid van Moolenbroek converter_uescape_convtoucs4(idn_converter_t ctx, void *privdata,
1163*00b67f09SDavid van Moolenbroek 			const char *from, unsigned long *to, size_t tolen)
1164*00b67f09SDavid van Moolenbroek {
1165*00b67f09SDavid van Moolenbroek 	idn_result_t r;
1166*00b67f09SDavid van Moolenbroek 	size_t fromlen = strlen(from);
1167*00b67f09SDavid van Moolenbroek 
1168*00b67f09SDavid van Moolenbroek 	while (*from != '\0') {
1169*00b67f09SDavid van Moolenbroek 		if (tolen <= 0) {
1170*00b67f09SDavid van Moolenbroek 			r = idn_buffer_overflow;
1171*00b67f09SDavid van Moolenbroek 			goto failure;
1172*00b67f09SDavid van Moolenbroek 		}
1173*00b67f09SDavid van Moolenbroek 		if (strncmp(from, "\\u{", 3) == 0 ||
1174*00b67f09SDavid van Moolenbroek 		    strncmp(from, "\\U{", 3) == 0) {
1175*00b67f09SDavid van Moolenbroek 			size_t ullen;
1176*00b67f09SDavid van Moolenbroek 			unsigned long v;
1177*00b67f09SDavid van Moolenbroek 			char *end;
1178*00b67f09SDavid van Moolenbroek 
1179*00b67f09SDavid van Moolenbroek 			v = strtoul(from + 3, &end, 16);
1180*00b67f09SDavid van Moolenbroek 			ullen = end - (from + 3);
1181*00b67f09SDavid van Moolenbroek 			if (*end == '}' && ullen > 1 && ullen < 8) {
1182*00b67f09SDavid van Moolenbroek 				*to = v;
1183*00b67f09SDavid van Moolenbroek 				from = end + 1;
1184*00b67f09SDavid van Moolenbroek 				fromlen -= ullen;
1185*00b67f09SDavid van Moolenbroek 			} else {
1186*00b67f09SDavid van Moolenbroek 				*to = '\\';
1187*00b67f09SDavid van Moolenbroek 				from++;
1188*00b67f09SDavid van Moolenbroek 				fromlen--;
1189*00b67f09SDavid van Moolenbroek 			}
1190*00b67f09SDavid van Moolenbroek 		} else {
1191*00b67f09SDavid van Moolenbroek 			int c = *(unsigned char *)from;
1192*00b67f09SDavid van Moolenbroek 			size_t width;
1193*00b67f09SDavid van Moolenbroek 			char buf[8];
1194*00b67f09SDavid van Moolenbroek 
1195*00b67f09SDavid van Moolenbroek 			if (c < 0x80)
1196*00b67f09SDavid van Moolenbroek 				width = 1;
1197*00b67f09SDavid van Moolenbroek 			else if (c < 0xc0)
1198*00b67f09SDavid van Moolenbroek 				width = 0;
1199*00b67f09SDavid van Moolenbroek 			else if (c < 0xe0)
1200*00b67f09SDavid van Moolenbroek 				width = 2;
1201*00b67f09SDavid van Moolenbroek 			else if (c < 0xf0)
1202*00b67f09SDavid van Moolenbroek 				width = 3;
1203*00b67f09SDavid van Moolenbroek 			else if (c < 0xf8)
1204*00b67f09SDavid van Moolenbroek 				width = 4;
1205*00b67f09SDavid van Moolenbroek 			else if (c < 0xfc)
1206*00b67f09SDavid van Moolenbroek 				width = 5;
1207*00b67f09SDavid van Moolenbroek 			else if (c < 0xfe)
1208*00b67f09SDavid van Moolenbroek 				width = 6;
1209*00b67f09SDavid van Moolenbroek 			else
1210*00b67f09SDavid van Moolenbroek 				width = 0;
1211*00b67f09SDavid van Moolenbroek 			if (width == 0 || width > fromlen) {
1212*00b67f09SDavid van Moolenbroek 				r = idn_invalid_encoding;
1213*00b67f09SDavid van Moolenbroek 				goto failure;
1214*00b67f09SDavid van Moolenbroek 			}
1215*00b67f09SDavid van Moolenbroek 
1216*00b67f09SDavid van Moolenbroek 			memcpy(buf, from, width);
1217*00b67f09SDavid van Moolenbroek 			buf[width] = '\0';
1218*00b67f09SDavid van Moolenbroek 			r = idn_ucs4_utf8toucs4(buf, to, tolen);
1219*00b67f09SDavid van Moolenbroek 			if (r != idn_success) {
1220*00b67f09SDavid van Moolenbroek 				r = idn_invalid_encoding;
1221*00b67f09SDavid van Moolenbroek 				goto failure;
1222*00b67f09SDavid van Moolenbroek 			}
1223*00b67f09SDavid van Moolenbroek 			from += width;
1224*00b67f09SDavid van Moolenbroek 			fromlen -= width;
1225*00b67f09SDavid van Moolenbroek 		}
1226*00b67f09SDavid van Moolenbroek 		to++;
1227*00b67f09SDavid van Moolenbroek 		tolen--;
1228*00b67f09SDavid van Moolenbroek 	}
1229*00b67f09SDavid van Moolenbroek 
1230*00b67f09SDavid van Moolenbroek 	if (tolen <= 0) {
1231*00b67f09SDavid van Moolenbroek 		r = idn_buffer_overflow;
1232*00b67f09SDavid van Moolenbroek 		goto failure;
1233*00b67f09SDavid van Moolenbroek 	}
1234*00b67f09SDavid van Moolenbroek 	*to = '\0';
1235*00b67f09SDavid van Moolenbroek 
1236*00b67f09SDavid van Moolenbroek 	return (idn_success);
1237*00b67f09SDavid van Moolenbroek 
1238*00b67f09SDavid van Moolenbroek failure:
1239*00b67f09SDavid van Moolenbroek 	if (r != idn_buffer_overflow) {
1240*00b67f09SDavid van Moolenbroek 		WARNING(("idn_uescape_convtoucs4(): %s\n",
1241*00b67f09SDavid van Moolenbroek 			 idn_result_tostring(r)));
1242*00b67f09SDavid van Moolenbroek 	}
1243*00b67f09SDavid van Moolenbroek 	return (r);
1244*00b67f09SDavid van Moolenbroek }
1245*00b67f09SDavid van Moolenbroek 
1246*00b67f09SDavid van Moolenbroek #endif
1247