xref: /freebsd/contrib/bc/src/read.c (revision 78bc019d)
1252884aeSStefan Eßer /*
2252884aeSStefan Eßer  * *****************************************************************************
3252884aeSStefan Eßer  *
43aa99676SStefan Eßer  * SPDX-License-Identifier: BSD-2-Clause
5252884aeSStefan Eßer  *
610328f8bSStefan Eßer  * Copyright (c) 2018-2021 Gavin D. Howard and contributors.
7252884aeSStefan Eßer  *
8252884aeSStefan Eßer  * Redistribution and use in source and binary forms, with or without
9252884aeSStefan Eßer  * modification, are permitted provided that the following conditions are met:
10252884aeSStefan Eßer  *
11252884aeSStefan Eßer  * * Redistributions of source code must retain the above copyright notice, this
12252884aeSStefan Eßer  *   list of conditions and the following disclaimer.
13252884aeSStefan Eßer  *
14252884aeSStefan Eßer  * * Redistributions in binary form must reproduce the above copyright notice,
15252884aeSStefan Eßer  *   this list of conditions and the following disclaimer in the documentation
16252884aeSStefan Eßer  *   and/or other materials provided with the distribution.
17252884aeSStefan Eßer  *
18252884aeSStefan Eßer  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS"
19252884aeSStefan Eßer  * AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
20252884aeSStefan Eßer  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
21252884aeSStefan Eßer  * ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT HOLDER OR CONTRIBUTORS BE
22252884aeSStefan Eßer  * LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR
23252884aeSStefan Eßer  * CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF
24252884aeSStefan Eßer  * SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS
25252884aeSStefan Eßer  * INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN
26252884aeSStefan Eßer  * CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE)
27252884aeSStefan Eßer  * ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE
28252884aeSStefan Eßer  * POSSIBILITY OF SUCH DAMAGE.
29252884aeSStefan Eßer  *
30252884aeSStefan Eßer  * *****************************************************************************
31252884aeSStefan Eßer  *
32252884aeSStefan Eßer  * Code to handle special I/O for bc.
33252884aeSStefan Eßer  *
34252884aeSStefan Eßer  */
35252884aeSStefan Eßer 
36252884aeSStefan Eßer #include <assert.h>
37252884aeSStefan Eßer #include <ctype.h>
38252884aeSStefan Eßer #include <errno.h>
39252884aeSStefan Eßer #include <stdlib.h>
40252884aeSStefan Eßer #include <string.h>
41252884aeSStefan Eßer 
42252884aeSStefan Eßer #include <signal.h>
43252884aeSStefan Eßer 
44252884aeSStefan Eßer #include <fcntl.h>
45252884aeSStefan Eßer #include <sys/stat.h>
467e5c51e5SStefan Eßer 
477e5c51e5SStefan Eßer #ifndef _WIN32
48252884aeSStefan Eßer #include <unistd.h>
497e5c51e5SStefan Eßer #endif // _WIN32
50252884aeSStefan Eßer 
51252884aeSStefan Eßer #include <read.h>
52252884aeSStefan Eßer #include <history.h>
53252884aeSStefan Eßer #include <program.h>
54252884aeSStefan Eßer #include <vm.h>
55252884aeSStefan Eßer 
5644d4804dSStefan Eßer /**
5778bc019dSStefan Eßer  * A portability file open function. This is copied to gen/strgen.c. Make sure
5878bc019dSStefan Eßer  * to update that if this changes.
5944d4804dSStefan Eßer  * @param path  The path to the file to open.
6044d4804dSStefan Eßer  * @param mode  The mode to open in.
6144d4804dSStefan Eßer  */
6278bc019dSStefan Eßer static int
6378bc019dSStefan Eßer bc_read_open(const char* path, int mode)
6478bc019dSStefan Eßer {
657e5c51e5SStefan Eßer 	int fd;
667e5c51e5SStefan Eßer 
677e5c51e5SStefan Eßer #ifndef _WIN32
687e5c51e5SStefan Eßer 	fd = open(path, mode);
697e5c51e5SStefan Eßer #else // _WIN32
707e5c51e5SStefan Eßer 	fd = -1;
717e5c51e5SStefan Eßer 	open(&fd, path, mode);
727e5c51e5SStefan Eßer #endif
737e5c51e5SStefan Eßer 
747e5c51e5SStefan Eßer 	return fd;
757e5c51e5SStefan Eßer }
767e5c51e5SStefan Eßer 
7744d4804dSStefan Eßer /**
7844d4804dSStefan Eßer  * Returns true if the buffer data is non-text.
7944d4804dSStefan Eßer  * @param buf   The buffer to test.
8044d4804dSStefan Eßer  * @param size  The size of the buffer.
8144d4804dSStefan Eßer  */
8278bc019dSStefan Eßer static bool
8378bc019dSStefan Eßer bc_read_binary(const char* buf, size_t size)
8478bc019dSStefan Eßer {
85252884aeSStefan Eßer 	size_t i;
86252884aeSStefan Eßer 
8778bc019dSStefan Eßer 	for (i = 0; i < size; ++i)
8878bc019dSStefan Eßer 	{
89252884aeSStefan Eßer 		if (BC_ERR(BC_READ_BIN_CHAR(buf[i]))) return true;
90252884aeSStefan Eßer 	}
91252884aeSStefan Eßer 
92252884aeSStefan Eßer 	return false;
93252884aeSStefan Eßer }
94252884aeSStefan Eßer 
9578bc019dSStefan Eßer bool
9678bc019dSStefan Eßer bc_read_buf(BcVec* vec, char* buf, size_t* buf_len)
9778bc019dSStefan Eßer {
98252884aeSStefan Eßer 	char* nl;
99252884aeSStefan Eßer 
10044d4804dSStefan Eßer 	// If nothing there, return.
1013aa99676SStefan Eßer 	if (!*buf_len) return false;
102252884aeSStefan Eßer 
10344d4804dSStefan Eßer 	// Find the newline.
1043aa99676SStefan Eßer 	nl = strchr(buf, '\n');
105252884aeSStefan Eßer 
10644d4804dSStefan Eßer 	// If a newline exists...
10778bc019dSStefan Eßer 	if (nl != NULL)
10878bc019dSStefan Eßer 	{
10944d4804dSStefan Eßer 		// Get the size of the data up to, and including, the newline.
1103aa99676SStefan Eßer 		size_t nllen = (size_t) ((nl + 1) - buf);
111252884aeSStefan Eßer 
1123aa99676SStefan Eßer 		nllen = *buf_len >= nllen ? nllen : *buf_len;
113252884aeSStefan Eßer 
11444d4804dSStefan Eßer 		// Move data into the vector, and move the rest of the data in the
11544d4804dSStefan Eßer 		// buffer up.
1163aa99676SStefan Eßer 		bc_vec_npush(vec, nllen, buf);
1173aa99676SStefan Eßer 		*buf_len -= nllen;
11878bc019dSStefan Eßer 		// NOLINTNEXTLINE
1193aa99676SStefan Eßer 		memmove(buf, nl + 1, *buf_len + 1);
120252884aeSStefan Eßer 
121252884aeSStefan Eßer 		return true;
122252884aeSStefan Eßer 	}
123252884aeSStefan Eßer 
12444d4804dSStefan Eßer 	// Just put the data into the vector.
1253aa99676SStefan Eßer 	bc_vec_npush(vec, *buf_len, buf);
1263aa99676SStefan Eßer 	*buf_len = 0;
127252884aeSStefan Eßer 
128252884aeSStefan Eßer 	return false;
129252884aeSStefan Eßer }
130252884aeSStefan Eßer 
13178bc019dSStefan Eßer BcStatus
13278bc019dSStefan Eßer bc_read_chars(BcVec* vec, const char* prompt)
13378bc019dSStefan Eßer {
134252884aeSStefan Eßer 	bool done = false;
135252884aeSStefan Eßer 
136252884aeSStefan Eßer 	assert(vec != NULL && vec->size == sizeof(char));
137252884aeSStefan Eßer 
138252884aeSStefan Eßer 	BC_SIG_ASSERT_NOT_LOCKED;
139252884aeSStefan Eßer 
14044d4804dSStefan Eßer 	// Clear the vector.
14110328f8bSStefan Eßer 	bc_vec_popAll(vec);
142252884aeSStefan Eßer 
14344d4804dSStefan Eßer 	// Handle the prompt, if desired.
14478bc019dSStefan Eßer 	if (BC_PROMPT)
14578bc019dSStefan Eßer 	{
1467e5c51e5SStefan Eßer 		bc_file_puts(&vm.fout, bc_flush_none, prompt);
1477e5c51e5SStefan Eßer 		bc_file_flush(&vm.fout, bc_flush_none);
148252884aeSStefan Eßer 	}
149252884aeSStefan Eßer 
15044d4804dSStefan Eßer 	// Try reading from the buffer, and if successful, just return.
15178bc019dSStefan Eßer 	if (bc_read_buf(vec, vm.buf, &vm.buf_len))
15278bc019dSStefan Eßer 	{
153252884aeSStefan Eßer 		bc_vec_pushByte(vec, '\0');
154252884aeSStefan Eßer 		return BC_STATUS_SUCCESS;
155252884aeSStefan Eßer 	}
156252884aeSStefan Eßer 
15744d4804dSStefan Eßer 	// Loop until we have something.
15878bc019dSStefan Eßer 	while (!done)
15978bc019dSStefan Eßer 	{
160252884aeSStefan Eßer 		ssize_t r;
161252884aeSStefan Eßer 
162252884aeSStefan Eßer 		BC_SIG_LOCK;
163252884aeSStefan Eßer 
16444d4804dSStefan Eßer 		// Read data from stdin.
165252884aeSStefan Eßer 		r = read(STDIN_FILENO, vm.buf + vm.buf_len,
166252884aeSStefan Eßer 		         BC_VM_STDIN_BUF_SIZE - vm.buf_len);
167252884aeSStefan Eßer 
16844d4804dSStefan Eßer 		// If there was an error...
16978bc019dSStefan Eßer 		if (BC_UNLIKELY(r < 0))
17078bc019dSStefan Eßer 		{
17144d4804dSStefan Eßer 			// If interupted...
17278bc019dSStefan Eßer 			if (errno == EINTR)
17378bc019dSStefan Eßer 			{
17444d4804dSStefan Eßer 				// Jump out if we are supposed to quit, which certain signals
17544d4804dSStefan Eßer 				// will require.
17644d4804dSStefan Eßer 				if (vm.status == (sig_atomic_t) BC_STATUS_QUIT) BC_JMP;
177252884aeSStefan Eßer 
178252884aeSStefan Eßer 				assert(vm.sig);
179252884aeSStefan Eßer 
18044d4804dSStefan Eßer 				// Clear the signal and status.
18144d4804dSStefan Eßer 				vm.sig = 0;
182252884aeSStefan Eßer 				vm.status = (sig_atomic_t) BC_STATUS_SUCCESS;
18344d4804dSStefan Eßer 
18444d4804dSStefan Eßer 				// Print the ready message and prompt again.
18544d4804dSStefan Eßer 				bc_file_puts(&vm.fout, bc_flush_none, bc_program_ready_msg);
18644d4804dSStefan Eßer 				if (BC_PROMPT) bc_file_puts(&vm.fout, bc_flush_none, prompt);
1877e5c51e5SStefan Eßer 				bc_file_flush(&vm.fout, bc_flush_none);
188252884aeSStefan Eßer 
189252884aeSStefan Eßer 				BC_SIG_UNLOCK;
190252884aeSStefan Eßer 
191252884aeSStefan Eßer 				continue;
192252884aeSStefan Eßer 			}
193252884aeSStefan Eßer 
194252884aeSStefan Eßer 			BC_SIG_UNLOCK;
195252884aeSStefan Eßer 
19644d4804dSStefan Eßer 			// If we get here, it's bad. Barf.
19710328f8bSStefan Eßer 			bc_vm_fatalError(BC_ERR_FATAL_IO_ERR);
198252884aeSStefan Eßer 		}
199252884aeSStefan Eßer 
200252884aeSStefan Eßer 		BC_SIG_UNLOCK;
201252884aeSStefan Eßer 
20244d4804dSStefan Eßer 		// If we read nothing, make sure to terminate the string and return EOF.
20378bc019dSStefan Eßer 		if (r == 0)
20478bc019dSStefan Eßer 		{
205252884aeSStefan Eßer 			bc_vec_pushByte(vec, '\0');
206252884aeSStefan Eßer 			return BC_STATUS_EOF;
207252884aeSStefan Eßer 		}
208252884aeSStefan Eßer 
20910041e99SStefan Eßer 		BC_SIG_LOCK;
21010041e99SStefan Eßer 
21144d4804dSStefan Eßer 		// Add to the buffer.
212252884aeSStefan Eßer 		vm.buf_len += (size_t) r;
2133aa99676SStefan Eßer 		vm.buf[vm.buf_len] = '\0';
214252884aeSStefan Eßer 
21544d4804dSStefan Eßer 		// Read from the buffer.
2163aa99676SStefan Eßer 		done = bc_read_buf(vec, vm.buf, &vm.buf_len);
21710041e99SStefan Eßer 
21810041e99SStefan Eßer 		BC_SIG_UNLOCK;
219252884aeSStefan Eßer 	}
220252884aeSStefan Eßer 
22144d4804dSStefan Eßer 	// Terminate the string.
222252884aeSStefan Eßer 	bc_vec_pushByte(vec, '\0');
223252884aeSStefan Eßer 
224252884aeSStefan Eßer 	return BC_STATUS_SUCCESS;
225252884aeSStefan Eßer }
226252884aeSStefan Eßer 
22778bc019dSStefan Eßer BcStatus
22878bc019dSStefan Eßer bc_read_line(BcVec* vec, const char* prompt)
22978bc019dSStefan Eßer {
230252884aeSStefan Eßer 	BcStatus s;
231252884aeSStefan Eßer 
232252884aeSStefan Eßer #if BC_ENABLE_HISTORY
23344d4804dSStefan Eßer 	// Get a line from either history or manual reading.
234252884aeSStefan Eßer 	if (BC_TTY && !vm.history.badTerm)
23578bc019dSStefan Eßer 	{
236252884aeSStefan Eßer 		s = bc_history_line(&vm.history, vec, prompt);
23778bc019dSStefan Eßer 	}
238252884aeSStefan Eßer 	else s = bc_read_chars(vec, prompt);
239252884aeSStefan Eßer #else // BC_ENABLE_HISTORY
240252884aeSStefan Eßer 	s = bc_read_chars(vec, prompt);
241252884aeSStefan Eßer #endif // BC_ENABLE_HISTORY
242252884aeSStefan Eßer 
243252884aeSStefan Eßer 	if (BC_ERR(bc_read_binary(vec->v, vec->len - 1)))
24478bc019dSStefan Eßer 	{
24544d4804dSStefan Eßer 		bc_verr(BC_ERR_FATAL_BIN_FILE, bc_program_stdin_name);
24678bc019dSStefan Eßer 	}
247252884aeSStefan Eßer 
248252884aeSStefan Eßer 	return s;
249252884aeSStefan Eßer }
250252884aeSStefan Eßer 
25178bc019dSStefan Eßer char*
25278bc019dSStefan Eßer bc_read_file(const char* path)
25378bc019dSStefan Eßer {
25450696a6eSStefan Eßer 	BcErr e = BC_ERR_FATAL_IO_ERR;
255d43fa8efSStefan Eßer 	size_t size, to_read;
256252884aeSStefan Eßer 	struct stat pstat;
257252884aeSStefan Eßer 	int fd;
25844d4804dSStefan Eßer 	char* buf;
259d43fa8efSStefan Eßer 	char* buf2;
260252884aeSStefan Eßer 
26178bc019dSStefan Eßer 	// This has been copied to gen/strgen.c. Make sure to change that if this
26278bc019dSStefan Eßer 	// changes.
26378bc019dSStefan Eßer 
264252884aeSStefan Eßer 	BC_SIG_ASSERT_LOCKED;
265252884aeSStefan Eßer 
266252884aeSStefan Eßer 	assert(path != NULL);
267252884aeSStefan Eßer 
26844d4804dSStefan Eßer #ifndef NDEBUG
26944d4804dSStefan Eßer 	// Need this to quiet MSan.
27078bc019dSStefan Eßer 	// NOLINTNEXTLINE
27144d4804dSStefan Eßer 	memset(&pstat, 0, sizeof(struct stat));
27244d4804dSStefan Eßer #endif // NDEBUG
27344d4804dSStefan Eßer 
2747e5c51e5SStefan Eßer 	fd = bc_read_open(path, O_RDONLY);
2757e5c51e5SStefan Eßer 
27644d4804dSStefan Eßer 	// If we can't read a file, we just barf.
27744d4804dSStefan Eßer 	if (BC_ERR(fd < 0)) bc_verr(BC_ERR_FATAL_FILE_ERR, path);
27844d4804dSStefan Eßer 
27944d4804dSStefan Eßer 	// The reason we call fstat is to eliminate TOCTOU race conditions. This
28044d4804dSStefan Eßer 	// way, we have an open file, so it's not going anywhere.
281252884aeSStefan Eßer 	if (BC_ERR(fstat(fd, &pstat) == -1)) goto malloc_err;
282252884aeSStefan Eßer 
28344d4804dSStefan Eßer 	// Make sure it's not a directory.
28478bc019dSStefan Eßer 	if (BC_ERR(S_ISDIR(pstat.st_mode)))
28578bc019dSStefan Eßer 	{
28650696a6eSStefan Eßer 		e = BC_ERR_FATAL_PATH_DIR;
287252884aeSStefan Eßer 		goto malloc_err;
288252884aeSStefan Eßer 	}
289252884aeSStefan Eßer 
29044d4804dSStefan Eßer 	// Get the size of the file and allocate that much.
291252884aeSStefan Eßer 	size = (size_t) pstat.st_size;
29244d4804dSStefan Eßer 	buf = bc_vm_malloc(size + 1);
293d43fa8efSStefan Eßer 	buf2 = buf;
294d43fa8efSStefan Eßer 	to_read = size;
295252884aeSStefan Eßer 
29678bc019dSStefan Eßer 	do
29778bc019dSStefan Eßer 	{
298d43fa8efSStefan Eßer 		// Read the file. We just bail if a signal interrupts. This is so that
299d43fa8efSStefan Eßer 		// users can interrupt the reading of big files if they want.
300d43fa8efSStefan Eßer 		ssize_t r = read(fd, buf2, to_read);
301d43fa8efSStefan Eßer 		if (BC_ERR(r < 0)) goto read_err;
302d43fa8efSStefan Eßer 		to_read -= (size_t) r;
303d43fa8efSStefan Eßer 		buf2 += (size_t) r;
30478bc019dSStefan Eßer 	}
30578bc019dSStefan Eßer 	while (to_read);
306252884aeSStefan Eßer 
30744d4804dSStefan Eßer 	// Got to have a nul byte.
30844d4804dSStefan Eßer 	buf[size] = '\0';
309252884aeSStefan Eßer 
31078bc019dSStefan Eßer 	if (BC_ERR(bc_read_binary(buf, size)))
31178bc019dSStefan Eßer 	{
31250696a6eSStefan Eßer 		e = BC_ERR_FATAL_BIN_FILE;
313252884aeSStefan Eßer 		goto read_err;
314252884aeSStefan Eßer 	}
315252884aeSStefan Eßer 
316252884aeSStefan Eßer 	close(fd);
317252884aeSStefan Eßer 
31844d4804dSStefan Eßer 	return buf;
319252884aeSStefan Eßer 
320252884aeSStefan Eßer read_err:
32144d4804dSStefan Eßer 	free(buf);
322252884aeSStefan Eßer malloc_err:
323252884aeSStefan Eßer 	close(fd);
32444d4804dSStefan Eßer 	bc_verr(e, path);
32544d4804dSStefan Eßer 	return NULL;
326252884aeSStefan Eßer }
327