xref: /freebsd/contrib/mandoc/man_validate.c (revision 6d38604f)
1*6d38604fSBaptiste Daroussin /* $Id: man_validate.c,v 1.156 2021/08/10 12:55:03 schwarze Exp $ */
261d06d6bSBaptiste Daroussin /*
3*6d38604fSBaptiste Daroussin  * Copyright (c) 2010, 2012-2020 Ingo Schwarze <schwarze@openbsd.org>
461d06d6bSBaptiste Daroussin  * Copyright (c) 2008, 2009, 2010, 2011 Kristaps Dzonsons <kristaps@bsd.lv>
561d06d6bSBaptiste Daroussin  *
661d06d6bSBaptiste Daroussin  * Permission to use, copy, modify, and distribute this software for any
761d06d6bSBaptiste Daroussin  * purpose with or without fee is hereby granted, provided that the above
861d06d6bSBaptiste Daroussin  * copyright notice and this permission notice appear in all copies.
961d06d6bSBaptiste Daroussin  *
1061d06d6bSBaptiste Daroussin  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHORS DISCLAIM ALL WARRANTIES
1161d06d6bSBaptiste Daroussin  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
1261d06d6bSBaptiste Daroussin  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHORS BE LIABLE FOR
1361d06d6bSBaptiste Daroussin  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
1461d06d6bSBaptiste Daroussin  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
1561d06d6bSBaptiste Daroussin  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
1661d06d6bSBaptiste Daroussin  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
17*6d38604fSBaptiste Daroussin  *
18*6d38604fSBaptiste Daroussin  * Validation module for man(7) syntax trees used by mandoc(1).
1961d06d6bSBaptiste Daroussin  */
2061d06d6bSBaptiste Daroussin #include "config.h"
2161d06d6bSBaptiste Daroussin 
2261d06d6bSBaptiste Daroussin #include <sys/types.h>
2361d06d6bSBaptiste Daroussin 
2461d06d6bSBaptiste Daroussin #include <assert.h>
2561d06d6bSBaptiste Daroussin #include <ctype.h>
2661d06d6bSBaptiste Daroussin #include <errno.h>
2761d06d6bSBaptiste Daroussin #include <limits.h>
2861d06d6bSBaptiste Daroussin #include <stdarg.h>
297295610fSBaptiste Daroussin #include <stdio.h>
3061d06d6bSBaptiste Daroussin #include <stdlib.h>
3161d06d6bSBaptiste Daroussin #include <string.h>
3261d06d6bSBaptiste Daroussin #include <time.h>
3361d06d6bSBaptiste Daroussin 
3461d06d6bSBaptiste Daroussin #include "mandoc_aux.h"
3561d06d6bSBaptiste Daroussin #include "mandoc.h"
3661d06d6bSBaptiste Daroussin #include "roff.h"
3761d06d6bSBaptiste Daroussin #include "man.h"
3861d06d6bSBaptiste Daroussin #include "libmandoc.h"
3961d06d6bSBaptiste Daroussin #include "roff_int.h"
4061d06d6bSBaptiste Daroussin #include "libman.h"
41*6d38604fSBaptiste Daroussin #include "tag.h"
4261d06d6bSBaptiste Daroussin 
4361d06d6bSBaptiste Daroussin #define	CHKARGS	  struct roff_man *man, struct roff_node *n
4461d06d6bSBaptiste Daroussin 
4561d06d6bSBaptiste Daroussin typedef	void	(*v_check)(CHKARGS);
4661d06d6bSBaptiste Daroussin 
4745a5aec3SBaptiste Daroussin static	void	  check_abort(CHKARGS) __attribute__((__noreturn__));
4861d06d6bSBaptiste Daroussin static	void	  check_par(CHKARGS);
4961d06d6bSBaptiste Daroussin static	void	  check_part(CHKARGS);
5061d06d6bSBaptiste Daroussin static	void	  check_root(CHKARGS);
51*6d38604fSBaptiste Daroussin static	void	  check_tag(struct roff_node *, struct roff_node *);
5261d06d6bSBaptiste Daroussin static	void	  check_text(CHKARGS);
5361d06d6bSBaptiste Daroussin 
5461d06d6bSBaptiste Daroussin static	void	  post_AT(CHKARGS);
557295610fSBaptiste Daroussin static	void	  post_EE(CHKARGS);
567295610fSBaptiste Daroussin static	void	  post_EX(CHKARGS);
5761d06d6bSBaptiste Daroussin static	void	  post_IP(CHKARGS);
5861d06d6bSBaptiste Daroussin static	void	  post_OP(CHKARGS);
597295610fSBaptiste Daroussin static	void	  post_SH(CHKARGS);
6061d06d6bSBaptiste Daroussin static	void	  post_TH(CHKARGS);
61*6d38604fSBaptiste Daroussin static	void	  post_TP(CHKARGS);
6261d06d6bSBaptiste Daroussin static	void	  post_UC(CHKARGS);
6361d06d6bSBaptiste Daroussin static	void	  post_UR(CHKARGS);
6461d06d6bSBaptiste Daroussin static	void	  post_in(CHKARGS);
6561d06d6bSBaptiste Daroussin 
667295610fSBaptiste Daroussin static	const v_check man_valids[MAN_MAX - MAN_TH] = {
6761d06d6bSBaptiste Daroussin 	post_TH,    /* TH */
687295610fSBaptiste Daroussin 	post_SH,    /* SH */
697295610fSBaptiste Daroussin 	post_SH,    /* SS */
70*6d38604fSBaptiste Daroussin 	post_TP,    /* TP */
71*6d38604fSBaptiste Daroussin 	post_TP,    /* TQ */
727295610fSBaptiste Daroussin 	check_abort,/* LP */
7361d06d6bSBaptiste Daroussin 	check_par,  /* PP */
747295610fSBaptiste Daroussin 	check_abort,/* P */
7561d06d6bSBaptiste Daroussin 	post_IP,    /* IP */
7661d06d6bSBaptiste Daroussin 	NULL,       /* HP */
7761d06d6bSBaptiste Daroussin 	NULL,       /* SM */
7861d06d6bSBaptiste Daroussin 	NULL,       /* SB */
7961d06d6bSBaptiste Daroussin 	NULL,       /* BI */
8061d06d6bSBaptiste Daroussin 	NULL,       /* IB */
8161d06d6bSBaptiste Daroussin 	NULL,       /* BR */
8261d06d6bSBaptiste Daroussin 	NULL,       /* RB */
8361d06d6bSBaptiste Daroussin 	NULL,       /* R */
8461d06d6bSBaptiste Daroussin 	NULL,       /* B */
8561d06d6bSBaptiste Daroussin 	NULL,       /* I */
8661d06d6bSBaptiste Daroussin 	NULL,       /* IR */
8761d06d6bSBaptiste Daroussin 	NULL,       /* RI */
8861d06d6bSBaptiste Daroussin 	NULL,       /* RE */
8961d06d6bSBaptiste Daroussin 	check_part, /* RS */
9061d06d6bSBaptiste Daroussin 	NULL,       /* DT */
9161d06d6bSBaptiste Daroussin 	post_UC,    /* UC */
9261d06d6bSBaptiste Daroussin 	NULL,       /* PD */
9361d06d6bSBaptiste Daroussin 	post_AT,    /* AT */
9461d06d6bSBaptiste Daroussin 	post_in,    /* in */
957295610fSBaptiste Daroussin 	NULL,       /* SY */
967295610fSBaptiste Daroussin 	NULL,       /* YS */
9761d06d6bSBaptiste Daroussin 	post_OP,    /* OP */
987295610fSBaptiste Daroussin 	post_EX,    /* EX */
997295610fSBaptiste Daroussin 	post_EE,    /* EE */
10061d06d6bSBaptiste Daroussin 	post_UR,    /* UR */
10161d06d6bSBaptiste Daroussin 	NULL,       /* UE */
10261d06d6bSBaptiste Daroussin 	post_UR,    /* MT */
10361d06d6bSBaptiste Daroussin 	NULL,       /* ME */
10461d06d6bSBaptiste Daroussin };
10561d06d6bSBaptiste Daroussin 
10661d06d6bSBaptiste Daroussin 
1077295610fSBaptiste Daroussin /* Validate the subtree rooted at man->last. */
10861d06d6bSBaptiste Daroussin void
man_validate(struct roff_man * man)1097295610fSBaptiste Daroussin man_validate(struct roff_man *man)
11061d06d6bSBaptiste Daroussin {
11161d06d6bSBaptiste Daroussin 	struct roff_node *n;
11261d06d6bSBaptiste Daroussin 	const v_check	 *cp;
11361d06d6bSBaptiste Daroussin 
1147295610fSBaptiste Daroussin 	/*
1157295610fSBaptiste Daroussin 	 * Translate obsolete macros such that later code
1167295610fSBaptiste Daroussin 	 * does not need to look for them.
1177295610fSBaptiste Daroussin 	 */
1187295610fSBaptiste Daroussin 
11961d06d6bSBaptiste Daroussin 	n = man->last;
1207295610fSBaptiste Daroussin 	switch (n->tok) {
1217295610fSBaptiste Daroussin 	case MAN_LP:
1227295610fSBaptiste Daroussin 	case MAN_P:
1237295610fSBaptiste Daroussin 		n->tok = MAN_PP;
1247295610fSBaptiste Daroussin 		break;
1257295610fSBaptiste Daroussin 	default:
1267295610fSBaptiste Daroussin 		break;
1277295610fSBaptiste Daroussin 	}
1287295610fSBaptiste Daroussin 
1297295610fSBaptiste Daroussin 	/*
1307295610fSBaptiste Daroussin 	 * Iterate over all children, recursing into each one
1317295610fSBaptiste Daroussin 	 * in turn, depth-first.
1327295610fSBaptiste Daroussin 	 */
1337295610fSBaptiste Daroussin 
13461d06d6bSBaptiste Daroussin 	man->last = man->last->child;
13561d06d6bSBaptiste Daroussin 	while (man->last != NULL) {
1367295610fSBaptiste Daroussin 		man_validate(man);
13761d06d6bSBaptiste Daroussin 		if (man->last == n)
13861d06d6bSBaptiste Daroussin 			man->last = man->last->child;
13961d06d6bSBaptiste Daroussin 		else
14061d06d6bSBaptiste Daroussin 			man->last = man->last->next;
14161d06d6bSBaptiste Daroussin 	}
14261d06d6bSBaptiste Daroussin 
1437295610fSBaptiste Daroussin 	/* Finally validate the macro itself. */
1447295610fSBaptiste Daroussin 
14561d06d6bSBaptiste Daroussin 	man->last = n;
14661d06d6bSBaptiste Daroussin 	man->next = ROFF_NEXT_SIBLING;
14761d06d6bSBaptiste Daroussin 	switch (n->type) {
14861d06d6bSBaptiste Daroussin 	case ROFFT_TEXT:
14961d06d6bSBaptiste Daroussin 		check_text(man, n);
15061d06d6bSBaptiste Daroussin 		break;
15161d06d6bSBaptiste Daroussin 	case ROFFT_ROOT:
15261d06d6bSBaptiste Daroussin 		check_root(man, n);
15361d06d6bSBaptiste Daroussin 		break;
15461d06d6bSBaptiste Daroussin 	case ROFFT_COMMENT:
15561d06d6bSBaptiste Daroussin 	case ROFFT_EQN:
15661d06d6bSBaptiste Daroussin 	case ROFFT_TBL:
15761d06d6bSBaptiste Daroussin 		break;
15861d06d6bSBaptiste Daroussin 	default:
15961d06d6bSBaptiste Daroussin 		if (n->tok < ROFF_MAX) {
16061d06d6bSBaptiste Daroussin 			roff_validate(man);
16161d06d6bSBaptiste Daroussin 			break;
16261d06d6bSBaptiste Daroussin 		}
16361d06d6bSBaptiste Daroussin 		assert(n->tok >= MAN_TH && n->tok < MAN_MAX);
1647295610fSBaptiste Daroussin 		cp = man_valids + (n->tok - MAN_TH);
16561d06d6bSBaptiste Daroussin 		if (*cp)
16661d06d6bSBaptiste Daroussin 			(*cp)(man, n);
16761d06d6bSBaptiste Daroussin 		if (man->last == n)
1687295610fSBaptiste Daroussin 			n->flags |= NODE_VALID;
16961d06d6bSBaptiste Daroussin 		break;
17061d06d6bSBaptiste Daroussin 	}
17161d06d6bSBaptiste Daroussin }
17261d06d6bSBaptiste Daroussin 
17361d06d6bSBaptiste Daroussin static void
check_root(CHKARGS)17461d06d6bSBaptiste Daroussin check_root(CHKARGS)
17561d06d6bSBaptiste Daroussin {
17661d06d6bSBaptiste Daroussin 	assert((man->flags & (MAN_BLINE | MAN_ELINE)) == 0);
17761d06d6bSBaptiste Daroussin 
17861d06d6bSBaptiste Daroussin 	if (n->last == NULL || n->last->type == ROFFT_COMMENT)
1797295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_DOC_EMPTY, n->line, n->pos, NULL);
18061d06d6bSBaptiste Daroussin 	else
18161d06d6bSBaptiste Daroussin 		man->meta.hasbody = 1;
18261d06d6bSBaptiste Daroussin 
18361d06d6bSBaptiste Daroussin 	if (NULL == man->meta.title) {
1847295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_TH_NOTITLE, n->line, n->pos, NULL);
18561d06d6bSBaptiste Daroussin 
18661d06d6bSBaptiste Daroussin 		/*
18761d06d6bSBaptiste Daroussin 		 * If a title hasn't been set, do so now (by
18861d06d6bSBaptiste Daroussin 		 * implication, date and section also aren't set).
18961d06d6bSBaptiste Daroussin 		 */
19061d06d6bSBaptiste Daroussin 
19161d06d6bSBaptiste Daroussin 		man->meta.title = mandoc_strdup("");
19261d06d6bSBaptiste Daroussin 		man->meta.msec = mandoc_strdup("");
193*6d38604fSBaptiste Daroussin 		man->meta.date = mandoc_normdate(NULL, NULL);
19461d06d6bSBaptiste Daroussin 	}
19561d06d6bSBaptiste Daroussin 
19661d06d6bSBaptiste Daroussin 	if (man->meta.os_e &&
19761d06d6bSBaptiste Daroussin 	    (man->meta.rcsids & (1 << man->meta.os_e)) == 0)
1987295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_RCS_MISSING, 0, 0,
19961d06d6bSBaptiste Daroussin 		    man->meta.os_e == MANDOC_OS_OPENBSD ?
20061d06d6bSBaptiste Daroussin 		    "(OpenBSD)" : "(NetBSD)");
20161d06d6bSBaptiste Daroussin }
20261d06d6bSBaptiste Daroussin 
20361d06d6bSBaptiste Daroussin static void
check_abort(CHKARGS)2047295610fSBaptiste Daroussin check_abort(CHKARGS)
2057295610fSBaptiste Daroussin {
2067295610fSBaptiste Daroussin 	abort();
2077295610fSBaptiste Daroussin }
2087295610fSBaptiste Daroussin 
209*6d38604fSBaptiste Daroussin /*
210*6d38604fSBaptiste Daroussin  * Skip leading whitespace, dashes, backslashes, and font escapes,
211*6d38604fSBaptiste Daroussin  * then create a tag if the first following byte is a letter.
212*6d38604fSBaptiste Daroussin  * Priority is high unless whitespace is present.
213*6d38604fSBaptiste Daroussin  */
214*6d38604fSBaptiste Daroussin static void
check_tag(struct roff_node * n,struct roff_node * nt)215*6d38604fSBaptiste Daroussin check_tag(struct roff_node *n, struct roff_node *nt)
216*6d38604fSBaptiste Daroussin {
217*6d38604fSBaptiste Daroussin 	const char	*cp, *arg;
218*6d38604fSBaptiste Daroussin 	int		 prio, sz;
219*6d38604fSBaptiste Daroussin 
220*6d38604fSBaptiste Daroussin 	if (nt == NULL || nt->type != ROFFT_TEXT)
221*6d38604fSBaptiste Daroussin 		return;
222*6d38604fSBaptiste Daroussin 
223*6d38604fSBaptiste Daroussin 	cp = nt->string;
224*6d38604fSBaptiste Daroussin 	prio = TAG_STRONG;
225*6d38604fSBaptiste Daroussin 	for (;;) {
226*6d38604fSBaptiste Daroussin 		switch (*cp) {
227*6d38604fSBaptiste Daroussin 		case ' ':
228*6d38604fSBaptiste Daroussin 		case '\t':
229*6d38604fSBaptiste Daroussin 			prio = TAG_WEAK;
230*6d38604fSBaptiste Daroussin 			/* FALLTHROUGH */
231*6d38604fSBaptiste Daroussin 		case '-':
232*6d38604fSBaptiste Daroussin 			cp++;
233*6d38604fSBaptiste Daroussin 			break;
234*6d38604fSBaptiste Daroussin 		case '\\':
235*6d38604fSBaptiste Daroussin 			cp++;
236*6d38604fSBaptiste Daroussin 			switch (mandoc_escape(&cp, &arg, &sz)) {
237*6d38604fSBaptiste Daroussin 			case ESCAPE_FONT:
238*6d38604fSBaptiste Daroussin 			case ESCAPE_FONTBOLD:
239*6d38604fSBaptiste Daroussin 			case ESCAPE_FONTITALIC:
240*6d38604fSBaptiste Daroussin 			case ESCAPE_FONTBI:
241*6d38604fSBaptiste Daroussin 			case ESCAPE_FONTROMAN:
242*6d38604fSBaptiste Daroussin 			case ESCAPE_FONTCR:
243*6d38604fSBaptiste Daroussin 			case ESCAPE_FONTCB:
244*6d38604fSBaptiste Daroussin 			case ESCAPE_FONTCI:
245*6d38604fSBaptiste Daroussin 			case ESCAPE_FONTPREV:
246*6d38604fSBaptiste Daroussin 			case ESCAPE_IGNORE:
247*6d38604fSBaptiste Daroussin 				break;
248*6d38604fSBaptiste Daroussin 			case ESCAPE_SPECIAL:
249*6d38604fSBaptiste Daroussin 				if (sz != 1)
250*6d38604fSBaptiste Daroussin 					return;
251*6d38604fSBaptiste Daroussin 				switch (*arg) {
252*6d38604fSBaptiste Daroussin 				case '-':
253*6d38604fSBaptiste Daroussin 				case 'e':
254*6d38604fSBaptiste Daroussin 					break;
255*6d38604fSBaptiste Daroussin 				default:
256*6d38604fSBaptiste Daroussin 					return;
257*6d38604fSBaptiste Daroussin 				}
258*6d38604fSBaptiste Daroussin 				break;
259*6d38604fSBaptiste Daroussin 			default:
260*6d38604fSBaptiste Daroussin 				return;
261*6d38604fSBaptiste Daroussin 			}
262*6d38604fSBaptiste Daroussin 			break;
263*6d38604fSBaptiste Daroussin 		default:
264*6d38604fSBaptiste Daroussin 			if (isalpha((unsigned char)*cp))
265*6d38604fSBaptiste Daroussin 				tag_put(cp, prio, n);
266*6d38604fSBaptiste Daroussin 			return;
267*6d38604fSBaptiste Daroussin 		}
268*6d38604fSBaptiste Daroussin 	}
269*6d38604fSBaptiste Daroussin }
270*6d38604fSBaptiste Daroussin 
2717295610fSBaptiste Daroussin static void
check_text(CHKARGS)27261d06d6bSBaptiste Daroussin check_text(CHKARGS)
27361d06d6bSBaptiste Daroussin {
27461d06d6bSBaptiste Daroussin 	char		*cp, *p;
27561d06d6bSBaptiste Daroussin 
2767295610fSBaptiste Daroussin 	if (n->flags & NODE_NOFILL)
27761d06d6bSBaptiste Daroussin 		return;
27861d06d6bSBaptiste Daroussin 
27961d06d6bSBaptiste Daroussin 	cp = n->string;
28061d06d6bSBaptiste Daroussin 	for (p = cp; NULL != (p = strchr(p, '\t')); p++)
2817295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_FI_TAB,
2827295610fSBaptiste Daroussin 		    n->line, n->pos + (int)(p - cp), NULL);
2837295610fSBaptiste Daroussin }
2847295610fSBaptiste Daroussin 
2857295610fSBaptiste Daroussin static void
post_EE(CHKARGS)2867295610fSBaptiste Daroussin post_EE(CHKARGS)
2877295610fSBaptiste Daroussin {
2887295610fSBaptiste Daroussin 	if ((n->flags & NODE_NOFILL) == 0)
2897295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_FI_SKIP, n->line, n->pos, "EE");
2907295610fSBaptiste Daroussin }
2917295610fSBaptiste Daroussin 
2927295610fSBaptiste Daroussin static void
post_EX(CHKARGS)2937295610fSBaptiste Daroussin post_EX(CHKARGS)
2947295610fSBaptiste Daroussin {
2957295610fSBaptiste Daroussin 	if (n->flags & NODE_NOFILL)
2967295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_NF_SKIP, n->line, n->pos, "EX");
29761d06d6bSBaptiste Daroussin }
29861d06d6bSBaptiste Daroussin 
29961d06d6bSBaptiste Daroussin static void
post_OP(CHKARGS)30061d06d6bSBaptiste Daroussin post_OP(CHKARGS)
30161d06d6bSBaptiste Daroussin {
30261d06d6bSBaptiste Daroussin 
30361d06d6bSBaptiste Daroussin 	if (n->child == NULL)
3047295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_OP_EMPTY, n->line, n->pos, "OP");
30561d06d6bSBaptiste Daroussin 	else if (n->child->next != NULL && n->child->next->next != NULL) {
30661d06d6bSBaptiste Daroussin 		n = n->child->next->next;
3077295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_ARG_EXCESS,
30861d06d6bSBaptiste Daroussin 		    n->line, n->pos, "OP ... %s", n->string);
30961d06d6bSBaptiste Daroussin 	}
31061d06d6bSBaptiste Daroussin }
31161d06d6bSBaptiste Daroussin 
31261d06d6bSBaptiste Daroussin static void
post_SH(CHKARGS)3137295610fSBaptiste Daroussin post_SH(CHKARGS)
3147295610fSBaptiste Daroussin {
3157295610fSBaptiste Daroussin 	struct roff_node	*nc;
316*6d38604fSBaptiste Daroussin 	char			*cp, *tag;
3177295610fSBaptiste Daroussin 
318*6d38604fSBaptiste Daroussin 	nc = n->child;
319*6d38604fSBaptiste Daroussin 	switch (n->type) {
320*6d38604fSBaptiste Daroussin 	case ROFFT_HEAD:
321*6d38604fSBaptiste Daroussin 		tag = NULL;
322*6d38604fSBaptiste Daroussin 		deroff(&tag, n);
323*6d38604fSBaptiste Daroussin 		if (tag != NULL) {
324*6d38604fSBaptiste Daroussin 			for (cp = tag; *cp != '\0'; cp++)
325*6d38604fSBaptiste Daroussin 				if (*cp == ' ')
326*6d38604fSBaptiste Daroussin 					*cp = '_';
327*6d38604fSBaptiste Daroussin 			if (nc != NULL && nc->type == ROFFT_TEXT &&
328*6d38604fSBaptiste Daroussin 			    strcmp(nc->string, tag) == 0)
329*6d38604fSBaptiste Daroussin 				tag_put(NULL, TAG_STRONG, n);
330*6d38604fSBaptiste Daroussin 			else
331*6d38604fSBaptiste Daroussin 				tag_put(tag, TAG_FALLBACK, n);
332*6d38604fSBaptiste Daroussin 			free(tag);
333*6d38604fSBaptiste Daroussin 		}
3347295610fSBaptiste Daroussin 		return;
335*6d38604fSBaptiste Daroussin 	case ROFFT_BODY:
336*6d38604fSBaptiste Daroussin 		if (nc != NULL)
337*6d38604fSBaptiste Daroussin 			break;
338*6d38604fSBaptiste Daroussin 		return;
339*6d38604fSBaptiste Daroussin 	default:
340*6d38604fSBaptiste Daroussin 		return;
341*6d38604fSBaptiste Daroussin 	}
3427295610fSBaptiste Daroussin 
3437295610fSBaptiste Daroussin 	if (nc->tok == MAN_PP && nc->body->child != NULL) {
3447295610fSBaptiste Daroussin 		while (nc->body->last != NULL) {
3457295610fSBaptiste Daroussin 			man->next = ROFF_NEXT_CHILD;
3467295610fSBaptiste Daroussin 			roff_node_relink(man, nc->body->last);
3477295610fSBaptiste Daroussin 			man->last = n;
3487295610fSBaptiste Daroussin 		}
3497295610fSBaptiste Daroussin 	}
3507295610fSBaptiste Daroussin 
3517295610fSBaptiste Daroussin 	if (nc->tok == MAN_PP || nc->tok == ROFF_sp || nc->tok == ROFF_br) {
3527295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_PAR_SKIP, nc->line, nc->pos,
3537295610fSBaptiste Daroussin 		    "%s after %s", roff_name[nc->tok], roff_name[n->tok]);
3547295610fSBaptiste Daroussin 		roff_node_delete(man, nc);
3557295610fSBaptiste Daroussin 	}
3567295610fSBaptiste Daroussin 
3577295610fSBaptiste Daroussin 	/*
3587295610fSBaptiste Daroussin 	 * Trailing PP is empty, so it is deleted by check_par().
3597295610fSBaptiste Daroussin 	 * Trailing sp is significant.
3607295610fSBaptiste Daroussin 	 */
3617295610fSBaptiste Daroussin 
3627295610fSBaptiste Daroussin 	if ((nc = n->last) != NULL && nc->tok == ROFF_br) {
3637295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_PAR_SKIP,
3647295610fSBaptiste Daroussin 		    nc->line, nc->pos, "%s at the end of %s",
3657295610fSBaptiste Daroussin 		    roff_name[nc->tok], roff_name[n->tok]);
3667295610fSBaptiste Daroussin 		roff_node_delete(man, nc);
3677295610fSBaptiste Daroussin 	}
3687295610fSBaptiste Daroussin }
3697295610fSBaptiste Daroussin 
3707295610fSBaptiste Daroussin static void
post_UR(CHKARGS)37161d06d6bSBaptiste Daroussin post_UR(CHKARGS)
37261d06d6bSBaptiste Daroussin {
37361d06d6bSBaptiste Daroussin 	if (n->type == ROFFT_HEAD && n->child == NULL)
3747295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_UR_NOHEAD, n->line, n->pos,
3757295610fSBaptiste Daroussin 		    "%s", roff_name[n->tok]);
37661d06d6bSBaptiste Daroussin 	check_part(man, n);
37761d06d6bSBaptiste Daroussin }
37861d06d6bSBaptiste Daroussin 
37961d06d6bSBaptiste Daroussin static void
check_part(CHKARGS)38061d06d6bSBaptiste Daroussin check_part(CHKARGS)
38161d06d6bSBaptiste Daroussin {
38261d06d6bSBaptiste Daroussin 
38361d06d6bSBaptiste Daroussin 	if (n->type == ROFFT_BODY && n->child == NULL)
3847295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_BLK_EMPTY, n->line, n->pos,
3857295610fSBaptiste Daroussin 		    "%s", roff_name[n->tok]);
38661d06d6bSBaptiste Daroussin }
38761d06d6bSBaptiste Daroussin 
38861d06d6bSBaptiste Daroussin static void
check_par(CHKARGS)38961d06d6bSBaptiste Daroussin check_par(CHKARGS)
39061d06d6bSBaptiste Daroussin {
39161d06d6bSBaptiste Daroussin 
39261d06d6bSBaptiste Daroussin 	switch (n->type) {
39361d06d6bSBaptiste Daroussin 	case ROFFT_BLOCK:
39461d06d6bSBaptiste Daroussin 		if (n->body->child == NULL)
39561d06d6bSBaptiste Daroussin 			roff_node_delete(man, n);
39661d06d6bSBaptiste Daroussin 		break;
39761d06d6bSBaptiste Daroussin 	case ROFFT_BODY:
3987295610fSBaptiste Daroussin 		if (n->child != NULL &&
3997295610fSBaptiste Daroussin 		    (n->child->tok == ROFF_sp || n->child->tok == ROFF_br)) {
4007295610fSBaptiste Daroussin 			mandoc_msg(MANDOCERR_PAR_SKIP,
4017295610fSBaptiste Daroussin 			    n->child->line, n->child->pos,
4027295610fSBaptiste Daroussin 			    "%s after %s", roff_name[n->child->tok],
4037295610fSBaptiste Daroussin 			    roff_name[n->tok]);
4047295610fSBaptiste Daroussin 			roff_node_delete(man, n->child);
4057295610fSBaptiste Daroussin 		}
40661d06d6bSBaptiste Daroussin 		if (n->child == NULL)
4077295610fSBaptiste Daroussin 			mandoc_msg(MANDOCERR_PAR_SKIP, n->line, n->pos,
40861d06d6bSBaptiste Daroussin 			    "%s empty", roff_name[n->tok]);
40961d06d6bSBaptiste Daroussin 		break;
41061d06d6bSBaptiste Daroussin 	case ROFFT_HEAD:
41161d06d6bSBaptiste Daroussin 		if (n->child != NULL)
4127295610fSBaptiste Daroussin 			mandoc_msg(MANDOCERR_ARG_SKIP,
4137295610fSBaptiste Daroussin 			    n->line, n->pos, "%s %s%s",
41461d06d6bSBaptiste Daroussin 			    roff_name[n->tok], n->child->string,
41561d06d6bSBaptiste Daroussin 			    n->child->next != NULL ? " ..." : "");
41661d06d6bSBaptiste Daroussin 		break;
41761d06d6bSBaptiste Daroussin 	default:
41861d06d6bSBaptiste Daroussin 		break;
41961d06d6bSBaptiste Daroussin 	}
42061d06d6bSBaptiste Daroussin }
42161d06d6bSBaptiste Daroussin 
42261d06d6bSBaptiste Daroussin static void
post_IP(CHKARGS)42361d06d6bSBaptiste Daroussin post_IP(CHKARGS)
42461d06d6bSBaptiste Daroussin {
42561d06d6bSBaptiste Daroussin 	switch (n->type) {
42661d06d6bSBaptiste Daroussin 	case ROFFT_BLOCK:
42761d06d6bSBaptiste Daroussin 		if (n->head->child == NULL && n->body->child == NULL)
42861d06d6bSBaptiste Daroussin 			roff_node_delete(man, n);
42961d06d6bSBaptiste Daroussin 		break;
430*6d38604fSBaptiste Daroussin 	case ROFFT_HEAD:
431*6d38604fSBaptiste Daroussin 		check_tag(n, n->child);
432*6d38604fSBaptiste Daroussin 		break;
43361d06d6bSBaptiste Daroussin 	case ROFFT_BODY:
43461d06d6bSBaptiste Daroussin 		if (n->parent->head->child == NULL && n->child == NULL)
4357295610fSBaptiste Daroussin 			mandoc_msg(MANDOCERR_PAR_SKIP, n->line, n->pos,
43661d06d6bSBaptiste Daroussin 			    "%s empty", roff_name[n->tok]);
43761d06d6bSBaptiste Daroussin 		break;
43861d06d6bSBaptiste Daroussin 	default:
43961d06d6bSBaptiste Daroussin 		break;
44061d06d6bSBaptiste Daroussin 	}
44161d06d6bSBaptiste Daroussin }
44261d06d6bSBaptiste Daroussin 
443*6d38604fSBaptiste Daroussin /*
444*6d38604fSBaptiste Daroussin  * The first next-line element in the head is the tag.
445*6d38604fSBaptiste Daroussin  * If that's a font macro, use its first child instead.
446*6d38604fSBaptiste Daroussin  */
447*6d38604fSBaptiste Daroussin static void
post_TP(CHKARGS)448*6d38604fSBaptiste Daroussin post_TP(CHKARGS)
449*6d38604fSBaptiste Daroussin {
450*6d38604fSBaptiste Daroussin 	struct roff_node *nt;
451*6d38604fSBaptiste Daroussin 
452*6d38604fSBaptiste Daroussin 	if (n->type != ROFFT_HEAD || (nt = n->child) == NULL)
453*6d38604fSBaptiste Daroussin 		return;
454*6d38604fSBaptiste Daroussin 
455*6d38604fSBaptiste Daroussin 	while ((nt->flags & NODE_LINE) == 0)
456*6d38604fSBaptiste Daroussin 		if ((nt = nt->next) == NULL)
457*6d38604fSBaptiste Daroussin 			return;
458*6d38604fSBaptiste Daroussin 
459*6d38604fSBaptiste Daroussin 	switch (nt->tok) {
460*6d38604fSBaptiste Daroussin 	case MAN_B:
461*6d38604fSBaptiste Daroussin 	case MAN_BI:
462*6d38604fSBaptiste Daroussin 	case MAN_BR:
463*6d38604fSBaptiste Daroussin 	case MAN_I:
464*6d38604fSBaptiste Daroussin 	case MAN_IB:
465*6d38604fSBaptiste Daroussin 	case MAN_IR:
466*6d38604fSBaptiste Daroussin 		nt = nt->child;
467*6d38604fSBaptiste Daroussin 		break;
468*6d38604fSBaptiste Daroussin 	default:
469*6d38604fSBaptiste Daroussin 		break;
470*6d38604fSBaptiste Daroussin 	}
471*6d38604fSBaptiste Daroussin 	check_tag(n, nt);
472*6d38604fSBaptiste Daroussin }
473*6d38604fSBaptiste Daroussin 
47461d06d6bSBaptiste Daroussin static void
post_TH(CHKARGS)47561d06d6bSBaptiste Daroussin post_TH(CHKARGS)
47661d06d6bSBaptiste Daroussin {
47761d06d6bSBaptiste Daroussin 	struct roff_node *nb;
47861d06d6bSBaptiste Daroussin 	const char	*p;
47961d06d6bSBaptiste Daroussin 
48061d06d6bSBaptiste Daroussin 	free(man->meta.title);
48161d06d6bSBaptiste Daroussin 	free(man->meta.vol);
48261d06d6bSBaptiste Daroussin 	free(man->meta.os);
48361d06d6bSBaptiste Daroussin 	free(man->meta.msec);
48461d06d6bSBaptiste Daroussin 	free(man->meta.date);
48561d06d6bSBaptiste Daroussin 
48661d06d6bSBaptiste Daroussin 	man->meta.title = man->meta.vol = man->meta.date =
48761d06d6bSBaptiste Daroussin 	    man->meta.msec = man->meta.os = NULL;
48861d06d6bSBaptiste Daroussin 
48961d06d6bSBaptiste Daroussin 	nb = n;
49061d06d6bSBaptiste Daroussin 
49161d06d6bSBaptiste Daroussin 	/* ->TITLE<- MSEC DATE OS VOL */
49261d06d6bSBaptiste Daroussin 
49361d06d6bSBaptiste Daroussin 	n = n->child;
49445a5aec3SBaptiste Daroussin 	if (n != NULL && n->string != NULL) {
49545a5aec3SBaptiste Daroussin 		for (p = n->string; *p != '\0'; p++) {
49661d06d6bSBaptiste Daroussin 			/* Only warn about this once... */
49761d06d6bSBaptiste Daroussin 			if (isalpha((unsigned char)*p) &&
49861d06d6bSBaptiste Daroussin 			    ! isupper((unsigned char)*p)) {
4997295610fSBaptiste Daroussin 				mandoc_msg(MANDOCERR_TITLE_CASE, n->line,
5007295610fSBaptiste Daroussin 				    n->pos + (int)(p - n->string),
50161d06d6bSBaptiste Daroussin 				    "TH %s", n->string);
50261d06d6bSBaptiste Daroussin 				break;
50361d06d6bSBaptiste Daroussin 			}
50461d06d6bSBaptiste Daroussin 		}
50561d06d6bSBaptiste Daroussin 		man->meta.title = mandoc_strdup(n->string);
50661d06d6bSBaptiste Daroussin 	} else {
50761d06d6bSBaptiste Daroussin 		man->meta.title = mandoc_strdup("");
5087295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_TH_NOTITLE, nb->line, nb->pos, "TH");
50961d06d6bSBaptiste Daroussin 	}
51061d06d6bSBaptiste Daroussin 
51161d06d6bSBaptiste Daroussin 	/* TITLE ->MSEC<- DATE OS VOL */
51261d06d6bSBaptiste Daroussin 
51345a5aec3SBaptiste Daroussin 	if (n != NULL)
51461d06d6bSBaptiste Daroussin 		n = n->next;
515*6d38604fSBaptiste Daroussin 	if (n != NULL && n->string != NULL) {
51661d06d6bSBaptiste Daroussin 		man->meta.msec = mandoc_strdup(n->string);
517*6d38604fSBaptiste Daroussin 		if (man->filesec != '\0' &&
518*6d38604fSBaptiste Daroussin 		    man->filesec != *n->string &&
519*6d38604fSBaptiste Daroussin 		    *n->string >= '1' && *n->string <= '9')
520*6d38604fSBaptiste Daroussin 			mandoc_msg(MANDOCERR_MSEC_FILE, n->line, n->pos,
521*6d38604fSBaptiste Daroussin 			    "*.%c vs TH ... %c", man->filesec, *n->string);
522*6d38604fSBaptiste Daroussin 	} else {
52361d06d6bSBaptiste Daroussin 		man->meta.msec = mandoc_strdup("");
5247295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_MSEC_MISSING,
52561d06d6bSBaptiste Daroussin 		    nb->line, nb->pos, "TH %s", man->meta.title);
52661d06d6bSBaptiste Daroussin 	}
52761d06d6bSBaptiste Daroussin 
52861d06d6bSBaptiste Daroussin 	/* TITLE MSEC ->DATE<- OS VOL */
52961d06d6bSBaptiste Daroussin 
53045a5aec3SBaptiste Daroussin 	if (n != NULL)
53161d06d6bSBaptiste Daroussin 		n = n->next;
532*6d38604fSBaptiste Daroussin 	if (man->quick && n != NULL)
53361d06d6bSBaptiste Daroussin 		man->meta.date = mandoc_strdup("");
534*6d38604fSBaptiste Daroussin 	else
535*6d38604fSBaptiste Daroussin 		man->meta.date = mandoc_normdate(n, nb);
53661d06d6bSBaptiste Daroussin 
53761d06d6bSBaptiste Daroussin 	/* TITLE MSEC DATE ->OS<- VOL */
53861d06d6bSBaptiste Daroussin 
53961d06d6bSBaptiste Daroussin 	if (n && (n = n->next))
54061d06d6bSBaptiste Daroussin 		man->meta.os = mandoc_strdup(n->string);
54161d06d6bSBaptiste Daroussin 	else if (man->os_s != NULL)
54261d06d6bSBaptiste Daroussin 		man->meta.os = mandoc_strdup(man->os_s);
54361d06d6bSBaptiste Daroussin 	if (man->meta.os_e == MANDOC_OS_OTHER && man->meta.os != NULL) {
54461d06d6bSBaptiste Daroussin 		if (strstr(man->meta.os, "OpenBSD") != NULL)
54561d06d6bSBaptiste Daroussin 			man->meta.os_e = MANDOC_OS_OPENBSD;
54661d06d6bSBaptiste Daroussin 		else if (strstr(man->meta.os, "NetBSD") != NULL)
54761d06d6bSBaptiste Daroussin 			man->meta.os_e = MANDOC_OS_NETBSD;
54861d06d6bSBaptiste Daroussin 	}
54961d06d6bSBaptiste Daroussin 
55061d06d6bSBaptiste Daroussin 	/* TITLE MSEC DATE OS ->VOL<- */
55161d06d6bSBaptiste Daroussin 	/* If missing, use the default VOL name for MSEC. */
55261d06d6bSBaptiste Daroussin 
55361d06d6bSBaptiste Daroussin 	if (n && (n = n->next))
55461d06d6bSBaptiste Daroussin 		man->meta.vol = mandoc_strdup(n->string);
55561d06d6bSBaptiste Daroussin 	else if ('\0' != man->meta.msec[0] &&
55661d06d6bSBaptiste Daroussin 	    (NULL != (p = mandoc_a2msec(man->meta.msec))))
55761d06d6bSBaptiste Daroussin 		man->meta.vol = mandoc_strdup(p);
55861d06d6bSBaptiste Daroussin 
55961d06d6bSBaptiste Daroussin 	if (n != NULL && (n = n->next) != NULL)
5607295610fSBaptiste Daroussin 		mandoc_msg(MANDOCERR_ARG_EXCESS,
56161d06d6bSBaptiste Daroussin 		    n->line, n->pos, "TH ... %s", n->string);
56261d06d6bSBaptiste Daroussin 
56361d06d6bSBaptiste Daroussin 	/*
56461d06d6bSBaptiste Daroussin 	 * Remove the `TH' node after we've processed it for our
56561d06d6bSBaptiste Daroussin 	 * meta-data.
56661d06d6bSBaptiste Daroussin 	 */
56761d06d6bSBaptiste Daroussin 	roff_node_delete(man, man->last);
56861d06d6bSBaptiste Daroussin }
56961d06d6bSBaptiste Daroussin 
57061d06d6bSBaptiste Daroussin static void
post_UC(CHKARGS)57161d06d6bSBaptiste Daroussin post_UC(CHKARGS)
57261d06d6bSBaptiste Daroussin {
57361d06d6bSBaptiste Daroussin 	static const char * const bsd_versions[] = {
57461d06d6bSBaptiste Daroussin 	    "3rd Berkeley Distribution",
57561d06d6bSBaptiste Daroussin 	    "4th Berkeley Distribution",
57661d06d6bSBaptiste Daroussin 	    "4.2 Berkeley Distribution",
57761d06d6bSBaptiste Daroussin 	    "4.3 Berkeley Distribution",
57861d06d6bSBaptiste Daroussin 	    "4.4 Berkeley Distribution",
57961d06d6bSBaptiste Daroussin 	};
58061d06d6bSBaptiste Daroussin 
58161d06d6bSBaptiste Daroussin 	const char	*p, *s;
58261d06d6bSBaptiste Daroussin 
58361d06d6bSBaptiste Daroussin 	n = n->child;
58461d06d6bSBaptiste Daroussin 
58561d06d6bSBaptiste Daroussin 	if (n == NULL || n->type != ROFFT_TEXT)
58661d06d6bSBaptiste Daroussin 		p = bsd_versions[0];
58761d06d6bSBaptiste Daroussin 	else {
58861d06d6bSBaptiste Daroussin 		s = n->string;
58961d06d6bSBaptiste Daroussin 		if (0 == strcmp(s, "3"))
59061d06d6bSBaptiste Daroussin 			p = bsd_versions[0];
59161d06d6bSBaptiste Daroussin 		else if (0 == strcmp(s, "4"))
59261d06d6bSBaptiste Daroussin 			p = bsd_versions[1];
59361d06d6bSBaptiste Daroussin 		else if (0 == strcmp(s, "5"))
59461d06d6bSBaptiste Daroussin 			p = bsd_versions[2];
59561d06d6bSBaptiste Daroussin 		else if (0 == strcmp(s, "6"))
59661d06d6bSBaptiste Daroussin 			p = bsd_versions[3];
59761d06d6bSBaptiste Daroussin 		else if (0 == strcmp(s, "7"))
59861d06d6bSBaptiste Daroussin 			p = bsd_versions[4];
59961d06d6bSBaptiste Daroussin 		else
60061d06d6bSBaptiste Daroussin 			p = bsd_versions[0];
60161d06d6bSBaptiste Daroussin 	}
60261d06d6bSBaptiste Daroussin 
60361d06d6bSBaptiste Daroussin 	free(man->meta.os);
60461d06d6bSBaptiste Daroussin 	man->meta.os = mandoc_strdup(p);
60561d06d6bSBaptiste Daroussin }
60661d06d6bSBaptiste Daroussin 
60761d06d6bSBaptiste Daroussin static void
post_AT(CHKARGS)60861d06d6bSBaptiste Daroussin post_AT(CHKARGS)
60961d06d6bSBaptiste Daroussin {
61061d06d6bSBaptiste Daroussin 	static const char * const unix_versions[] = {
61161d06d6bSBaptiste Daroussin 	    "7th Edition",
61261d06d6bSBaptiste Daroussin 	    "System III",
61361d06d6bSBaptiste Daroussin 	    "System V",
61461d06d6bSBaptiste Daroussin 	    "System V Release 2",
61561d06d6bSBaptiste Daroussin 	};
61661d06d6bSBaptiste Daroussin 
61761d06d6bSBaptiste Daroussin 	struct roff_node *nn;
61861d06d6bSBaptiste Daroussin 	const char	*p, *s;
61961d06d6bSBaptiste Daroussin 
62061d06d6bSBaptiste Daroussin 	n = n->child;
62161d06d6bSBaptiste Daroussin 
62261d06d6bSBaptiste Daroussin 	if (n == NULL || n->type != ROFFT_TEXT)
62361d06d6bSBaptiste Daroussin 		p = unix_versions[0];
62461d06d6bSBaptiste Daroussin 	else {
62561d06d6bSBaptiste Daroussin 		s = n->string;
62661d06d6bSBaptiste Daroussin 		if (0 == strcmp(s, "3"))
62761d06d6bSBaptiste Daroussin 			p = unix_versions[0];
62861d06d6bSBaptiste Daroussin 		else if (0 == strcmp(s, "4"))
62961d06d6bSBaptiste Daroussin 			p = unix_versions[1];
63061d06d6bSBaptiste Daroussin 		else if (0 == strcmp(s, "5")) {
63161d06d6bSBaptiste Daroussin 			nn = n->next;
63261d06d6bSBaptiste Daroussin 			if (nn != NULL &&
63361d06d6bSBaptiste Daroussin 			    nn->type == ROFFT_TEXT &&
63461d06d6bSBaptiste Daroussin 			    nn->string[0] != '\0')
63561d06d6bSBaptiste Daroussin 				p = unix_versions[3];
63661d06d6bSBaptiste Daroussin 			else
63761d06d6bSBaptiste Daroussin 				p = unix_versions[2];
63861d06d6bSBaptiste Daroussin 		} else
63961d06d6bSBaptiste Daroussin 			p = unix_versions[0];
64061d06d6bSBaptiste Daroussin 	}
64161d06d6bSBaptiste Daroussin 
64261d06d6bSBaptiste Daroussin 	free(man->meta.os);
64361d06d6bSBaptiste Daroussin 	man->meta.os = mandoc_strdup(p);
64461d06d6bSBaptiste Daroussin }
64561d06d6bSBaptiste Daroussin 
64661d06d6bSBaptiste Daroussin static void
post_in(CHKARGS)64761d06d6bSBaptiste Daroussin post_in(CHKARGS)
64861d06d6bSBaptiste Daroussin {
64961d06d6bSBaptiste Daroussin 	char	*s;
65061d06d6bSBaptiste Daroussin 
65161d06d6bSBaptiste Daroussin 	if (n->parent->tok != MAN_TP ||
65261d06d6bSBaptiste Daroussin 	    n->parent->type != ROFFT_HEAD ||
65361d06d6bSBaptiste Daroussin 	    n->child == NULL ||
65461d06d6bSBaptiste Daroussin 	    *n->child->string == '+' ||
65561d06d6bSBaptiste Daroussin 	    *n->child->string == '-')
65661d06d6bSBaptiste Daroussin 		return;
65761d06d6bSBaptiste Daroussin 	mandoc_asprintf(&s, "+%s", n->child->string);
65861d06d6bSBaptiste Daroussin 	free(n->child->string);
65961d06d6bSBaptiste Daroussin 	n->child->string = s;
66061d06d6bSBaptiste Daroussin }
661