3rdparty/libmpg123/synth_altivec.c

*c2c66affSColin Finck/*
*c2c66affSColin Finck	decode.c: decoding samples...
*c2c66affSColin Finck
*c2c66affSColin Finck	copyright 1995-2009 by the mpg123 project - free software under the terms of the LGPL 2.1
*c2c66affSColin Finck	see COPYING and AUTHORS files in distribution or http://mpg123.org
*c2c66affSColin Finck	initially written by Michael Hipp
*c2c66affSColin Finck	altivec optimization by tmkk
*c2c66affSColin Finck*/
*c2c66affSColin Finck
*c2c66affSColin Finck#include "mpg123lib_intern.h"
*c2c66affSColin Finck
*c2c66affSColin Finck#ifndef __APPLE__
*c2c66affSColin Finck#include <altivec.h>
*c2c66affSColin Finck#endif
*c2c66affSColin Finck
*c2c66affSColin Finck/* A macro for normal synth functions */
*c2c66affSColin Finck#define SYNTH_ALTIVEC(B0STEP) \
*c2c66affSColin Finck	v1 = vec_ld(0,window); \
*c2c66affSColin Finck	v2 = vec_ld(16,window); \
*c2c66affSColin Finck	v3 = vec_ld(32,window); \
*c2c66affSColin Finck	v4 = vec_ld(48,window); \
*c2c66affSColin Finck	v5 = vec_ld(64,window); \
*c2c66affSColin Finck	v1 = vec_perm(v1,v2,vperm1); \
*c2c66affSColin Finck	v6 = vec_ld(0,b0); \
*c2c66affSColin Finck	v2 = vec_perm(v2,v3,vperm1); \
*c2c66affSColin Finck	v7 = vec_ld(16,b0); \
*c2c66affSColin Finck	v3 = vec_perm(v3,v4,vperm1); \
*c2c66affSColin Finck	v8 = vec_ld(32,b0); \
*c2c66affSColin Finck	v4 = vec_perm(v4,v5,vperm1); \
*c2c66affSColin Finck	v9 = vec_ld(48,b0); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	vsum = vec_madd(v1,v6,vzero); \
*c2c66affSColin Finck	vsum = vec_madd(v2,v7,vsum); \
*c2c66affSColin Finck	vsum = vec_madd(v3,v8,vsum); \
*c2c66affSColin Finck	vsum = vec_madd(v4,v9,vsum); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	window += 32; \
*c2c66affSColin Finck	b0 += B0STEP; \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	v1 = vec_ld(0,window); \
*c2c66affSColin Finck	v2 = vec_ld(16,window); \
*c2c66affSColin Finck	v3 = vec_ld(32,window); \
*c2c66affSColin Finck	v4 = vec_ld(48,window); \
*c2c66affSColin Finck	v5 = vec_ld(64,window); \
*c2c66affSColin Finck	v1 = vec_perm(v1,v2,vperm1); \
*c2c66affSColin Finck	v6 = vec_ld(0,b0); \
*c2c66affSColin Finck	v2 = vec_perm(v2,v3,vperm1); \
*c2c66affSColin Finck	v7 = vec_ld(16,b0); \
*c2c66affSColin Finck	v3 = vec_perm(v3,v4,vperm1); \
*c2c66affSColin Finck	v8 = vec_ld(32,b0); \
*c2c66affSColin Finck	v4 = vec_perm(v4,v5,vperm1); \
*c2c66affSColin Finck	v9 = vec_ld(48,b0); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	vsum2 = vec_madd(v1,v6,vzero); \
*c2c66affSColin Finck	vsum2 = vec_madd(v2,v7,vsum2); \
*c2c66affSColin Finck	vsum2 = vec_madd(v3,v8,vsum2); \
*c2c66affSColin Finck	vsum2 = vec_madd(v4,v9,vsum2); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	window += 32; \
*c2c66affSColin Finck	b0 += B0STEP; \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	v1 = vec_ld(0,window); \
*c2c66affSColin Finck	v2 = vec_ld(16,window); \
*c2c66affSColin Finck	v3 = vec_ld(32,window); \
*c2c66affSColin Finck	v4 = vec_ld(48,window); \
*c2c66affSColin Finck	v5 = vec_ld(64,window); \
*c2c66affSColin Finck	v1 = vec_perm(v1,v2,vperm1); \
*c2c66affSColin Finck	v6 = vec_ld(0,b0); \
*c2c66affSColin Finck	v2 = vec_perm(v2,v3,vperm1); \
*c2c66affSColin Finck	v7 = vec_ld(16,b0); \
*c2c66affSColin Finck	v3 = vec_perm(v3,v4,vperm1); \
*c2c66affSColin Finck	v8 = vec_ld(32,b0); \
*c2c66affSColin Finck	v4 = vec_perm(v4,v5,vperm1); \
*c2c66affSColin Finck	v9 = vec_ld(48,b0); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	vsum3 = vec_madd(v1,v6,vzero); \
*c2c66affSColin Finck	vsum3 = vec_madd(v2,v7,vsum3); \
*c2c66affSColin Finck	vsum3 = vec_madd(v3,v8,vsum3); \
*c2c66affSColin Finck	vsum3 = vec_madd(v4,v9,vsum3); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	window += 32; \
*c2c66affSColin Finck	b0 += B0STEP; \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	v1 = vec_ld(0,window); \
*c2c66affSColin Finck	v2 = vec_ld(16,window); \
*c2c66affSColin Finck	v3 = vec_ld(32,window); \
*c2c66affSColin Finck	v4 = vec_ld(48,window); \
*c2c66affSColin Finck	v5 = vec_ld(64,window); \
*c2c66affSColin Finck	v1 = vec_perm(v1,v2,vperm1); \
*c2c66affSColin Finck	v6 = vec_ld(0,b0); \
*c2c66affSColin Finck	v2 = vec_perm(v2,v3,vperm1); \
*c2c66affSColin Finck	v7 = vec_ld(16,b0); \
*c2c66affSColin Finck	v3 = vec_perm(v3,v4,vperm1); \
*c2c66affSColin Finck	v8 = vec_ld(32,b0); \
*c2c66affSColin Finck	v4 = vec_perm(v4,v5,vperm1); \
*c2c66affSColin Finck	v9 = vec_ld(48,b0); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	vsum4 = vec_madd(v1,v6,vzero); \
*c2c66affSColin Finck	vsum4 = vec_madd(v2,v7,vsum4); \
*c2c66affSColin Finck	vsum4 = vec_madd(v3,v8,vsum4); \
*c2c66affSColin Finck	vsum4 = vec_madd(v4,v9,vsum4); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	window += 32; \
*c2c66affSColin Finck	b0 += B0STEP; \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	v1 = vec_mergeh(vsum,vsum3); \
*c2c66affSColin Finck	v2 = vec_mergeh(vsum2,vsum4); \
*c2c66affSColin Finck	v3 = vec_mergel(vsum,vsum3); \
*c2c66affSColin Finck	v4 = vec_mergel(vsum2,vsum4); \
*c2c66affSColin Finck	v5 = vec_mergeh(v1,v2); \
*c2c66affSColin Finck	v6 = vec_mergel(v1,v2); \
*c2c66affSColin Finck	v7 = vec_mergeh(v3,v4); \
*c2c66affSColin Finck	v8 = vec_mergel(v3,v4);
*c2c66affSColin Finck
*c2c66affSColin Finck/* A macro for stereo synth functions */
*c2c66affSColin Finck#define SYNTH_STEREO_ALTIVEC(B0STEP) \
*c2c66affSColin Finck	v1 = vec_ld(0,window); \
*c2c66affSColin Finck	v2 = vec_ld(16,window); \
*c2c66affSColin Finck	v3 = vec_ld(32,window); \
*c2c66affSColin Finck	v4 = vec_ld(48,window); \
*c2c66affSColin Finck	v5 = vec_ld(64,window); \
*c2c66affSColin Finck	v1 = vec_perm(v1,v2,vperm1); \
*c2c66affSColin Finck	v6 = vec_ld(0,b0l); \
*c2c66affSColin Finck	v10 = vec_ld(0,b0r); \
*c2c66affSColin Finck	v2 = vec_perm(v2,v3,vperm1); \
*c2c66affSColin Finck	v7 = vec_ld(16,b0l); \
*c2c66affSColin Finck	v11 = vec_ld(16,b0r); \
*c2c66affSColin Finck	v3 = vec_perm(v3,v4,vperm1); \
*c2c66affSColin Finck	v8 = vec_ld(32,b0l); \
*c2c66affSColin Finck	v12 = vec_ld(32,b0r); \
*c2c66affSColin Finck	v4 = vec_perm(v4,v5,vperm1); \
*c2c66affSColin Finck	v9 = vec_ld(48,b0l); \
*c2c66affSColin Finck	v13 = vec_ld(48,b0r); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	vsum = vec_madd(v1,v6,vzero); \
*c2c66affSColin Finck	vsum5 = vec_madd(v1,v10,vzero); \
*c2c66affSColin Finck	vsum = vec_madd(v2,v7,vsum); \
*c2c66affSColin Finck	vsum5 = vec_madd(v2,v11,vsum5); \
*c2c66affSColin Finck	vsum = vec_madd(v3,v8,vsum); \
*c2c66affSColin Finck	vsum5 = vec_madd(v3,v12,vsum5); \
*c2c66affSColin Finck	vsum = vec_madd(v4,v9,vsum); \
*c2c66affSColin Finck	vsum5 = vec_madd(v4,v13,vsum5); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	window += 32; \
*c2c66affSColin Finck	b0l += B0STEP; \
*c2c66affSColin Finck	b0r += B0STEP; \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	v1 = vec_ld(0,window); \
*c2c66affSColin Finck	v2 = vec_ld(16,window); \
*c2c66affSColin Finck	v3 = vec_ld(32,window); \
*c2c66affSColin Finck	v4 = vec_ld(48,window); \
*c2c66affSColin Finck	v5 = vec_ld(64,window); \
*c2c66affSColin Finck	v1 = vec_perm(v1,v2,vperm1); \
*c2c66affSColin Finck	v6 = vec_ld(0,b0l); \
*c2c66affSColin Finck	v10 = vec_ld(0,b0r); \
*c2c66affSColin Finck	v2 = vec_perm(v2,v3,vperm1); \
*c2c66affSColin Finck	v7 = vec_ld(16,b0l); \
*c2c66affSColin Finck	v11 = vec_ld(16,b0r); \
*c2c66affSColin Finck	v3 = vec_perm(v3,v4,vperm1); \
*c2c66affSColin Finck	v8 = vec_ld(32,b0l); \
*c2c66affSColin Finck	v12 = vec_ld(32,b0r); \
*c2c66affSColin Finck	v4 = vec_perm(v4,v5,vperm1); \
*c2c66affSColin Finck	v9 = vec_ld(48,b0l); \
*c2c66affSColin Finck	v13 = vec_ld(48,b0r); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	vsum2 = vec_madd(v1,v6,vzero); \
*c2c66affSColin Finck	vsum6 = vec_madd(v1,v10,vzero); \
*c2c66affSColin Finck	vsum2 = vec_madd(v2,v7,vsum2); \
*c2c66affSColin Finck	vsum6 = vec_madd(v2,v11,vsum6); \
*c2c66affSColin Finck	vsum2 = vec_madd(v3,v8,vsum2); \
*c2c66affSColin Finck	vsum6 = vec_madd(v3,v12,vsum6); \
*c2c66affSColin Finck	vsum2 = vec_madd(v4,v9,vsum2); \
*c2c66affSColin Finck	vsum6 = vec_madd(v4,v13,vsum6); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	window += 32; \
*c2c66affSColin Finck	b0l += B0STEP; \
*c2c66affSColin Finck	b0r += B0STEP; \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	v1 = vec_ld(0,window); \
*c2c66affSColin Finck	v2 = vec_ld(16,window); \
*c2c66affSColin Finck	v3 = vec_ld(32,window); \
*c2c66affSColin Finck	v4 = vec_ld(48,window); \
*c2c66affSColin Finck	v5 = vec_ld(64,window); \
*c2c66affSColin Finck	v1 = vec_perm(v1,v2,vperm1); \
*c2c66affSColin Finck	v6 = vec_ld(0,b0l); \
*c2c66affSColin Finck	v10 = vec_ld(0,b0r); \
*c2c66affSColin Finck	v2 = vec_perm(v2,v3,vperm1); \
*c2c66affSColin Finck	v7 = vec_ld(16,b0l); \
*c2c66affSColin Finck	v11 = vec_ld(16,b0r); \
*c2c66affSColin Finck	v3 = vec_perm(v3,v4,vperm1); \
*c2c66affSColin Finck	v8 = vec_ld(32,b0l); \
*c2c66affSColin Finck	v12 = vec_ld(32,b0r); \
*c2c66affSColin Finck	v4 = vec_perm(v4,v5,vperm1); \
*c2c66affSColin Finck	v9 = vec_ld(48,b0l); \
*c2c66affSColin Finck	v13 = vec_ld(48,b0r); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	vsum3 = vec_madd(v1,v6,vzero); \
*c2c66affSColin Finck	vsum7 = vec_madd(v1,v10,vzero); \
*c2c66affSColin Finck	vsum3 = vec_madd(v2,v7,vsum3); \
*c2c66affSColin Finck	vsum7 = vec_madd(v2,v11,vsum7); \
*c2c66affSColin Finck	vsum3 = vec_madd(v3,v8,vsum3); \
*c2c66affSColin Finck	vsum7 = vec_madd(v3,v12,vsum7); \
*c2c66affSColin Finck	vsum3 = vec_madd(v4,v9,vsum3); \
*c2c66affSColin Finck	vsum7 = vec_madd(v4,v13,vsum7); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	window += 32; \
*c2c66affSColin Finck	b0l += B0STEP; \
*c2c66affSColin Finck	b0r += B0STEP; \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	v1 = vec_ld(0,window); \
*c2c66affSColin Finck	v2 = vec_ld(16,window); \
*c2c66affSColin Finck	v3 = vec_ld(32,window); \
*c2c66affSColin Finck	v4 = vec_ld(48,window); \
*c2c66affSColin Finck	v5 = vec_ld(64,window); \
*c2c66affSColin Finck	v1 = vec_perm(v1,v2,vperm1); \
*c2c66affSColin Finck	v6 = vec_ld(0,b0l); \
*c2c66affSColin Finck	v10 = vec_ld(0,b0r); \
*c2c66affSColin Finck	v2 = vec_perm(v2,v3,vperm1); \
*c2c66affSColin Finck	v7 = vec_ld(16,b0l); \
*c2c66affSColin Finck	v11 = vec_ld(16,b0r); \
*c2c66affSColin Finck	v3 = vec_perm(v3,v4,vperm1); \
*c2c66affSColin Finck	v8 = vec_ld(32,b0l); \
*c2c66affSColin Finck	v12 = vec_ld(32,b0r); \
*c2c66affSColin Finck	v4 = vec_perm(v4,v5,vperm1); \
*c2c66affSColin Finck	v9 = vec_ld(48,b0l); \
*c2c66affSColin Finck	v13 = vec_ld(48,b0r); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	vsum4 = vec_madd(v1,v6,vzero); \
*c2c66affSColin Finck	vsum8 = vec_madd(v1,v10,vzero); \
*c2c66affSColin Finck	vsum4 = vec_madd(v2,v7,vsum4); \
*c2c66affSColin Finck	vsum8 = vec_madd(v2,v11,vsum8); \
*c2c66affSColin Finck	vsum4 = vec_madd(v3,v8,vsum4); \
*c2c66affSColin Finck	vsum8 = vec_madd(v3,v12,vsum8); \
*c2c66affSColin Finck	vsum4 = vec_madd(v4,v9,vsum4); \
*c2c66affSColin Finck	vsum8 = vec_madd(v4,v13,vsum8); \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	window += 32; \
*c2c66affSColin Finck	b0l += B0STEP; \
*c2c66affSColin Finck	b0r += B0STEP; \
*c2c66affSColin Finck	 \
*c2c66affSColin Finck	v1 = vec_mergeh(vsum,vsum3); \
*c2c66affSColin Finck	v5 = vec_mergeh(vsum5,vsum7); \
*c2c66affSColin Finck	v2 = vec_mergeh(vsum2,vsum4); \
*c2c66affSColin Finck	v6 = vec_mergeh(vsum6,vsum8); \
*c2c66affSColin Finck	v3 = vec_mergel(vsum,vsum3); \
*c2c66affSColin Finck	v7 = vec_mergel(vsum5,vsum7); \
*c2c66affSColin Finck	v4 = vec_mergel(vsum2,vsum4); \
*c2c66affSColin Finck	v8 = vec_mergel(vsum6,vsum8); \
*c2c66affSColin Finck	vsum = vec_mergeh(v1,v2); \
*c2c66affSColin Finck	vsum5 = vec_mergeh(v5,v6); \
*c2c66affSColin Finck	vsum2 = vec_mergel(v1,v2); \
*c2c66affSColin Finck	vsum6 = vec_mergel(v5,v6); \
*c2c66affSColin Finck	vsum3 = vec_mergeh(v3,v4); \
*c2c66affSColin Finck	vsum7 = vec_mergeh(v7,v8); \
*c2c66affSColin Finck	vsum4 = vec_mergel(v3,v4); \
*c2c66affSColin Finck	vsum8 = vec_mergel(v7,v8);
*c2c66affSColin Finck
*c2c66affSColin Finckint synth_1to1_altivec(real *bandPtr,int channel,mpg123_handle *fr, int final)
*c2c66affSColin Finck{
*c2c66affSColin Finck	short *samples = (short *) (fr->buffer.data+fr->buffer.fill);
*c2c66affSColin Finck
*c2c66affSColin Finck	real *b0, **buf;
*c2c66affSColin Finck	int clip;
*c2c66affSColin Finck	int bo1;
*c2c66affSColin Finck#ifndef NO_EQUALIZER
*c2c66affSColin Finck	if(fr->have_eq_settings) do_equalizer(bandPtr,channel,fr->equalizer);
*c2c66affSColin Finck#endif
*c2c66affSColin Finck	if(!channel)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		fr->bo--;
*c2c66affSColin Finck		fr->bo &= 0xf;
*c2c66affSColin Finck		buf = fr->real_buffs[0];
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		samples++;
*c2c66affSColin Finck		buf = fr->real_buffs[1];
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck	if(fr->bo & 0x1)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0 = buf[0];
*c2c66affSColin Finck		bo1 = fr->bo;
*c2c66affSColin Finck		dct64_altivec(buf[1]+((fr->bo+1)&0xf),buf[0]+fr->bo,bandPtr);
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0 = buf[1];
*c2c66affSColin Finck		bo1 = fr->bo+1;
*c2c66affSColin Finck		dct64_altivec(buf[0]+fr->bo,buf[1]+fr->bo+1,bandPtr);
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck
*c2c66affSColin Finck	{
*c2c66affSColin Finck		register int j;
*c2c66affSColin Finck		real *window = fr->decwin + 16 - bo1;
*c2c66affSColin Finck
*c2c66affSColin Finck		ALIGNED(16) int clip_tmp[4];
*c2c66affSColin Finck		vector float v1,v2,v3,v4,v5,v6,v7,v8,v9;
*c2c66affSColin Finck		vector unsigned char vperm1,vperm2,vperm3,vperm4;
*c2c66affSColin Finck		vector float vsum,vsum2,vsum3,vsum4,vmin,vmax,vzero;
*c2c66affSColin Finck		vector signed int vclip;
*c2c66affSColin Finck		vector signed short vsample1,vsample2;
*c2c66affSColin Finck		vector unsigned int vshift;
*c2c66affSColin Finck		vclip = vec_xor(vclip,vclip);
*c2c66affSColin Finck		vzero = vec_xor(vzero,vzero);
*c2c66affSColin Finck		vshift = vec_splat_u32(-1); /* 31 */
*c2c66affSColin Finck#ifdef __APPLE__
*c2c66affSColin Finck		vmax = (vector float)(32767.0f);
*c2c66affSColin Finck		vmin = (vector float)(-32768.0f);
*c2c66affSColin Finck		vperm4 = (vector unsigned char)(0,1,18,19,2,3,22,23,4,5,26,27,6,7,30,31);
*c2c66affSColin Finck#else
*c2c66affSColin Finck		vmax = (vector float){32767.0f,32767.0f,32767.0f,32767.0f};
*c2c66affSColin Finck		vmin = (vector float){-32768.0f,-32768.0f,-32768.0f,-32768.0f};
*c2c66affSColin Finck		vperm4 = (vector unsigned char){0,1,18,19,2,3,22,23,4,5,26,27,6,7,30,31};
*c2c66affSColin Finck#endif
*c2c66affSColin Finck
*c2c66affSColin Finck		vperm1 = vec_lvsl(0,window);
*c2c66affSColin Finck		vperm2 = vec_lvsl(0,samples);
*c2c66affSColin Finck		vperm3 = vec_lvsr(0,samples);
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_ALTIVEC(16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_sub(v5,v6);
*c2c66affSColin Finck			v9 = vec_sub(v7,v8);
*c2c66affSColin Finck			vsum = vec_add(vsum,v9);
*c2c66affSColin Finck
*c2c66affSColin Finck			v3 = vec_round(vsum);
*c2c66affSColin Finck			v3 = (vector float)vec_cts(v3,0);
*c2c66affSColin Finck			v1 = (vector float)vec_cmpgt(vsum,vmax);
*c2c66affSColin Finck			v2 = (vector float)vec_cmplt(vsum,vmin);
*c2c66affSColin Finck			vsample1 = vec_ld(0,samples);
*c2c66affSColin Finck			vsample2 = vec_ld(15,samples);
*c2c66affSColin Finck			v3 = (vector float)vec_packs((vector signed int)v3,(vector signed int)v3);
*c2c66affSColin Finck			v4 = (vector float)vec_perm(vsample1,vsample2,vperm2);
*c2c66affSColin Finck			v5 = (vector float)vec_perm(v3,v4,vperm4);
*c2c66affSColin Finck			v6 = (vector float)vec_perm(vsample2,vsample1,vperm2);
*c2c66affSColin Finck			v7 = (vector float)vec_perm(v5,v6,vperm3);
*c2c66affSColin Finck			v8 = (vector float)vec_perm(v6,v5,vperm3);
*c2c66affSColin Finck			vec_st((vector signed short)v7,15,samples);
*c2c66affSColin Finck			vec_st((vector signed short)v8,0,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = (vector float)vec_sr((vector unsigned int)v1, vshift);
*c2c66affSColin Finck			v2 = (vector float)vec_sr((vector unsigned int)v2, vshift);
*c2c66affSColin Finck			v1 = (vector float)vec_add((vector unsigned int)v1,(vector unsigned int)v2);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v1,vclip);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_ALTIVEC(-16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_add(v5,v6);
*c2c66affSColin Finck			v9 = vec_add(v7,v8);
*c2c66affSColin Finck			vsum = vec_add(vsum,v9);
*c2c66affSColin Finck
*c2c66affSColin Finck			v3 = vec_round(vsum);
*c2c66affSColin Finck			v3 = (vector float)vec_cts(v3,0);
*c2c66affSColin Finck			v1 = (vector float)vec_cmpgt(vsum,vmax);
*c2c66affSColin Finck			v2 = (vector float)vec_cmplt(vsum,vmin);
*c2c66affSColin Finck			vsample1 = vec_ld(0,samples);
*c2c66affSColin Finck			vsample2 = vec_ld(15,samples);
*c2c66affSColin Finck			v3 = (vector float)vec_packs((vector signed int)v3,(vector signed int)v3);
*c2c66affSColin Finck			v4 = (vector float)vec_perm(vsample1,vsample2,vperm2);
*c2c66affSColin Finck			v5 = (vector float)vec_perm(v3,v4,vperm4);
*c2c66affSColin Finck			v6 = (vector float)vec_perm(vsample2,vsample1,vperm2);
*c2c66affSColin Finck			v7 = (vector float)vec_perm(v5,v6,vperm3);
*c2c66affSColin Finck			v8 = (vector float)vec_perm(v6,v5,vperm3);
*c2c66affSColin Finck			vec_st((vector signed short)v7,15,samples);
*c2c66affSColin Finck			vec_st((vector signed short)v8,0,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = (vector float)vec_sr((vector unsigned int)v1, vshift);
*c2c66affSColin Finck			v2 = (vector float)vec_sr((vector unsigned int)v2, vshift);
*c2c66affSColin Finck			v1 = (vector float)vec_add((vector unsigned int)v1,(vector unsigned int)v2);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v1,vclip);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		vec_st(vclip,0,clip_tmp);
*c2c66affSColin Finck		clip = clip_tmp[3];
*c2c66affSColin Finck	}
*c2c66affSColin Finck	if(final) fr->buffer.fill += 128;
*c2c66affSColin Finck
*c2c66affSColin Finck	return clip;
*c2c66affSColin Finck}
*c2c66affSColin Finck
*c2c66affSColin Finckint synth_1to1_stereo_altivec(real *bandPtr_l, real *bandPtr_r, mpg123_handle *fr)
*c2c66affSColin Finck{
*c2c66affSColin Finck	short *samples = (short *) (fr->buffer.data+fr->buffer.fill);
*c2c66affSColin Finck
*c2c66affSColin Finck	real *b0l, *b0r, **bufl, **bufr;
*c2c66affSColin Finck	int clip;
*c2c66affSColin Finck	int bo1;
*c2c66affSColin Finck#ifndef NO_EQUALIZER
*c2c66affSColin Finck	if(fr->have_eq_settings)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		do_equalizer(bandPtr_l,0,fr->equalizer);
*c2c66affSColin Finck		do_equalizer(bandPtr_r,1,fr->equalizer);
*c2c66affSColin Finck	}
*c2c66affSColin Finck#endif
*c2c66affSColin Finck	fr->bo--;
*c2c66affSColin Finck	fr->bo &= 0xf;
*c2c66affSColin Finck	bufl = fr->real_buffs[0];
*c2c66affSColin Finck	bufr = fr->real_buffs[1];
*c2c66affSColin Finck
*c2c66affSColin Finck	if(fr->bo & 0x1)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0l = bufl[0];
*c2c66affSColin Finck		b0r = bufr[0];
*c2c66affSColin Finck		bo1 = fr->bo;
*c2c66affSColin Finck		dct64_altivec(bufl[1]+((fr->bo+1)&0xf),bufl[0]+fr->bo,bandPtr_l);
*c2c66affSColin Finck		dct64_altivec(bufr[1]+((fr->bo+1)&0xf),bufr[0]+fr->bo,bandPtr_r);
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0l = bufl[1];
*c2c66affSColin Finck		b0r = bufr[1];
*c2c66affSColin Finck		bo1 = fr->bo+1;
*c2c66affSColin Finck		dct64_altivec(bufl[0]+fr->bo,bufl[1]+fr->bo+1,bandPtr_l);
*c2c66affSColin Finck		dct64_altivec(bufr[0]+fr->bo,bufr[1]+fr->bo+1,bandPtr_r);
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck
*c2c66affSColin Finck	{
*c2c66affSColin Finck		register int j;
*c2c66affSColin Finck		real *window = fr->decwin + 16 - bo1;
*c2c66affSColin Finck
*c2c66affSColin Finck		ALIGNED(16) int clip_tmp[4];
*c2c66affSColin Finck		vector float v1,v2,v3,v4,v5,v6,v7,v8,v9,v10,v11,v12,v13;
*c2c66affSColin Finck		vector unsigned char vperm1,vperm2;
*c2c66affSColin Finck		vector float vsum,vsum2,vsum3,vsum4,vsum5,vsum6,vsum7,vsum8,vmin,vmax,vzero;
*c2c66affSColin Finck		vector signed int vclip;
*c2c66affSColin Finck		vector unsigned int vshift;
*c2c66affSColin Finck		vector signed short vprev;
*c2c66affSColin Finck		vclip = vec_xor(vclip,vclip);
*c2c66affSColin Finck		vzero = vec_xor(vzero,vzero);
*c2c66affSColin Finck		vshift = vec_splat_u32(-1); /* 31 */
*c2c66affSColin Finck#ifdef __APPLE__
*c2c66affSColin Finck		vmax = (vector float)(32767.0f);
*c2c66affSColin Finck		vmin = (vector float)(-32768.0f);
*c2c66affSColin Finck#else
*c2c66affSColin Finck		vmax = (vector float){32767.0f,32767.0f,32767.0f,32767.0f};
*c2c66affSColin Finck		vmin = (vector float){-32768.0f,-32768.0f,-32768.0f,-32768.0f};
*c2c66affSColin Finck#endif
*c2c66affSColin Finck
*c2c66affSColin Finck		vperm1 = vec_lvsl(0,window);
*c2c66affSColin Finck		vperm2 = vec_lvsr(0,samples);
*c2c66affSColin Finck		vprev = vec_perm(vec_ld(0,samples),vec_ld(0,samples),vec_lvsl(0,samples));
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_STEREO_ALTIVEC(16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_sub(vsum,vsum2);
*c2c66affSColin Finck			vsum2 = vec_sub(vsum5,vsum6);
*c2c66affSColin Finck			vsum3 = vec_sub(vsum3,vsum4);
*c2c66affSColin Finck			vsum4 = vec_sub(vsum7,vsum8);
*c2c66affSColin Finck			vsum = vec_add(vsum,vsum3);
*c2c66affSColin Finck			vsum2 = vec_add(vsum2,vsum4);
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = vec_round(vsum);
*c2c66affSColin Finck			v2 = vec_round(vsum2);
*c2c66affSColin Finck			v1 = (vector float)vec_cts(v1,0);
*c2c66affSColin Finck			v2 = (vector float)vec_cts(v2,0);
*c2c66affSColin Finck			v3 = vec_mergeh(v1, v2);
*c2c66affSColin Finck			v4 = vec_mergel(v1, v2);
*c2c66affSColin Finck			v5 = (vector float)vec_packs((vector signed int)v3,(vector signed int)v4);
*c2c66affSColin Finck			v6 = (vector float)vec_perm(vprev,(vector signed short)v5,vperm2);
*c2c66affSColin Finck			vprev = (vector signed short)v5;
*c2c66affSColin Finck			v1 = (vector float)vec_cmpgt(vsum,vmax);
*c2c66affSColin Finck			v2 = (vector float)vec_cmplt(vsum,vmin);
*c2c66affSColin Finck			v3 = (vector float)vec_cmpgt(vsum2,vmax);
*c2c66affSColin Finck			v4 = (vector float)vec_cmplt(vsum2,vmin);
*c2c66affSColin Finck			vec_st((vector signed short)v6,0,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = (vector float)vec_sr((vector unsigned int)v1, vshift);
*c2c66affSColin Finck			v2 = (vector float)vec_sr((vector unsigned int)v2, vshift);
*c2c66affSColin Finck			v3 = (vector float)vec_sr((vector unsigned int)v3, vshift);
*c2c66affSColin Finck			v4 = (vector float)vec_sr((vector unsigned int)v4, vshift);
*c2c66affSColin Finck			v1 = (vector float)vec_add((vector unsigned int)v1,(vector unsigned int)v2);
*c2c66affSColin Finck			v2 = (vector float)vec_add((vector unsigned int)v3,(vector unsigned int)v4);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v1,vclip);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v2,vclip);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_STEREO_ALTIVEC(-16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_add(vsum,vsum2);
*c2c66affSColin Finck			vsum2 = vec_add(vsum5,vsum6);
*c2c66affSColin Finck			vsum3 = vec_add(vsum3,vsum4);
*c2c66affSColin Finck			vsum4 = vec_add(vsum7,vsum8);
*c2c66affSColin Finck			vsum = vec_add(vsum,vsum3);
*c2c66affSColin Finck			vsum2 = vec_add(vsum2,vsum4);
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = vec_round(vsum);
*c2c66affSColin Finck			v2 = vec_round(vsum2);
*c2c66affSColin Finck			v1 = (vector float)vec_cts(v1,0);
*c2c66affSColin Finck			v2 = (vector float)vec_cts(v2,0);
*c2c66affSColin Finck			v3 = vec_mergeh(v1, v2);
*c2c66affSColin Finck			v4 = vec_mergel(v1, v2);
*c2c66affSColin Finck			v5 = (vector float)vec_packs((vector signed int)v3,(vector signed int)v4);
*c2c66affSColin Finck			v6 = (vector float)vec_perm(vprev,(vector signed short)v5,vperm2);
*c2c66affSColin Finck			vprev = (vector signed short)v5;
*c2c66affSColin Finck			v1 = (vector float)vec_cmpgt(vsum,vmax);
*c2c66affSColin Finck			v2 = (vector float)vec_cmplt(vsum,vmin);
*c2c66affSColin Finck			v3 = (vector float)vec_cmpgt(vsum2,vmax);
*c2c66affSColin Finck			v4 = (vector float)vec_cmplt(vsum2,vmin);
*c2c66affSColin Finck			vec_st((vector signed short)v6,0,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = (vector float)vec_sr((vector unsigned int)v1, vshift);
*c2c66affSColin Finck			v2 = (vector float)vec_sr((vector unsigned int)v2, vshift);
*c2c66affSColin Finck			v3 = (vector float)vec_sr((vector unsigned int)v3, vshift);
*c2c66affSColin Finck			v4 = (vector float)vec_sr((vector unsigned int)v4, vshift);
*c2c66affSColin Finck			v1 = (vector float)vec_add((vector unsigned int)v1,(vector unsigned int)v2);
*c2c66affSColin Finck			v2 = (vector float)vec_add((vector unsigned int)v3,(vector unsigned int)v4);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v1,vclip);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v2,vclip);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		if((size_t)samples & 0xf)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			v1 = (vector float)vec_perm(vec_ld(0,samples),vec_ld(0,samples),vec_lvsl(0,samples));
*c2c66affSColin Finck			v2 = (vector float)vec_perm(vprev,(vector signed short)v1,vperm2);
*c2c66affSColin Finck			vec_st((vector signed short)v2,0,samples);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		vec_st(vclip,0,clip_tmp);
*c2c66affSColin Finck		clip = clip_tmp[3];
*c2c66affSColin Finck	}
*c2c66affSColin Finck	fr->buffer.fill += 128;
*c2c66affSColin Finck
*c2c66affSColin Finck	return clip;
*c2c66affSColin Finck}
*c2c66affSColin Finck
*c2c66affSColin Finckint synth_1to1_real_altivec(real *bandPtr,int channel,mpg123_handle *fr, int final)
*c2c66affSColin Finck{
*c2c66affSColin Finck	real *samples = (real *) (fr->buffer.data+fr->buffer.fill);
*c2c66affSColin Finck
*c2c66affSColin Finck	real *b0, **buf;
*c2c66affSColin Finck	int bo1;
*c2c66affSColin Finck#ifndef NO_EQUALIZER
*c2c66affSColin Finck	if(fr->have_eq_settings) do_equalizer(bandPtr,channel,fr->equalizer);
*c2c66affSColin Finck#endif
*c2c66affSColin Finck	if(!channel)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		fr->bo--;
*c2c66affSColin Finck		fr->bo &= 0xf;
*c2c66affSColin Finck		buf = fr->real_buffs[0];
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		samples++;
*c2c66affSColin Finck		buf = fr->real_buffs[1];
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck	if(fr->bo & 0x1)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0 = buf[0];
*c2c66affSColin Finck		bo1 = fr->bo;
*c2c66affSColin Finck		dct64_altivec(buf[1]+((fr->bo+1)&0xf),buf[0]+fr->bo,bandPtr);
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0 = buf[1];
*c2c66affSColin Finck		bo1 = fr->bo+1;
*c2c66affSColin Finck		dct64_altivec(buf[0]+fr->bo,buf[1]+fr->bo+1,bandPtr);
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck
*c2c66affSColin Finck	{
*c2c66affSColin Finck		register int j;
*c2c66affSColin Finck		real *window = fr->decwin + 16 - bo1;
*c2c66affSColin Finck
*c2c66affSColin Finck		vector float v1,v2,v3,v4,v5,v6,v7,v8,v9;
*c2c66affSColin Finck		vector unsigned char vperm1,vperm2,vperm3,vperm4, vperm5;
*c2c66affSColin Finck		vector float vsum,vsum2,vsum3,vsum4,vscale,vzero;
*c2c66affSColin Finck		vector float vsample1,vsample2,vsample3;
*c2c66affSColin Finck		vzero = vec_xor(vzero, vzero);
*c2c66affSColin Finck#ifdef __APPLE__
*c2c66affSColin Finck		vscale = (vector float)(1.0f/32768.0f);
*c2c66affSColin Finck		vperm4 = (vector unsigned char)(0,1,2,3,20,21,22,23,4,5,6,7,28,29,30,31);
*c2c66affSColin Finck		vperm5 = (vector unsigned char)(8,9,10,11,20,21,22,23,12,13,14,15,28,29,30,31);
*c2c66affSColin Finck#else
*c2c66affSColin Finck		vscale = (vector float){1.0f/32768.0f,1.0f/32768.0f,1.0f/32768.0f,1.0f/32768.0f};
*c2c66affSColin Finck		vperm4 = (vector unsigned char){0,1,2,3,20,21,22,23,4,5,6,7,28,29,30,31};
*c2c66affSColin Finck		vperm5 = (vector unsigned char){8,9,10,11,20,21,22,23,12,13,14,15,28,29,30,31};
*c2c66affSColin Finck#endif
*c2c66affSColin Finck
*c2c66affSColin Finck		vperm1 = vec_lvsl(0,window);
*c2c66affSColin Finck		vperm2 = vec_lvsl(0,samples);
*c2c66affSColin Finck		vperm3 = vec_lvsr(0,samples);
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_ALTIVEC(16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_sub(v5,v6);
*c2c66affSColin Finck			v9 = vec_sub(v7,v8);
*c2c66affSColin Finck			vsum = vec_add(vsum,v9);
*c2c66affSColin Finck			vsum = vec_madd(vsum, vscale, vzero);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsample1 = vec_ld(0,samples);
*c2c66affSColin Finck			vsample2 = vec_ld(16,samples);
*c2c66affSColin Finck			vsample3 = vec_ld(31,samples);
*c2c66affSColin Finck			v1 = vec_perm(vsample1, vsample2, vperm2);
*c2c66affSColin Finck			v2 = vec_perm(vsample2, vsample3, vperm2);
*c2c66affSColin Finck			v1 = vec_perm(vsum, v1, vperm4);
*c2c66affSColin Finck			v2 = vec_perm(vsum, v2, vperm5);
*c2c66affSColin Finck			v3 = vec_perm(vsample3, vsample2, vperm2);
*c2c66affSColin Finck			v4 = vec_perm(vsample2, vsample1, vperm2);
*c2c66affSColin Finck			v5 = vec_perm(v2, v3, vperm3);
*c2c66affSColin Finck			v6 = vec_perm(v1, v2, vperm3);
*c2c66affSColin Finck			v7 = vec_perm(v4, v1, vperm3);
*c2c66affSColin Finck			vec_st(v5,31,samples);
*c2c66affSColin Finck			vec_st(v6,16,samples);
*c2c66affSColin Finck			vec_st(v7,0,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_ALTIVEC(-16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_add(v5,v6);
*c2c66affSColin Finck			v9 = vec_add(v7,v8);
*c2c66affSColin Finck			vsum = vec_add(vsum,v9);
*c2c66affSColin Finck			vsum = vec_madd(vsum, vscale, vzero);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsample1 = vec_ld(0,samples);
*c2c66affSColin Finck			vsample2 = vec_ld(16,samples);
*c2c66affSColin Finck			vsample3 = vec_ld(31,samples);
*c2c66affSColin Finck			v1 = vec_perm(vsample1, vsample2, vperm2);
*c2c66affSColin Finck			v2 = vec_perm(vsample2, vsample3, vperm2);
*c2c66affSColin Finck			v1 = vec_perm(vsum, v1, vperm4);
*c2c66affSColin Finck			v2 = vec_perm(vsum, v2, vperm5);
*c2c66affSColin Finck			v3 = vec_perm(vsample3, vsample2, vperm2);
*c2c66affSColin Finck			v4 = vec_perm(vsample2, vsample1, vperm2);
*c2c66affSColin Finck			v5 = vec_perm(v2, v3, vperm3);
*c2c66affSColin Finck			v6 = vec_perm(v1, v2, vperm3);
*c2c66affSColin Finck			v7 = vec_perm(v4, v1, vperm3);
*c2c66affSColin Finck			vec_st(v5,31,samples);
*c2c66affSColin Finck			vec_st(v6,16,samples);
*c2c66affSColin Finck			vec_st(v7,0,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck		}
*c2c66affSColin Finck	}
*c2c66affSColin Finck	if(final) fr->buffer.fill += 256;
*c2c66affSColin Finck
*c2c66affSColin Finck	return 0;
*c2c66affSColin Finck}
*c2c66affSColin Finck
*c2c66affSColin Finckint synth_1to1_fltst_altivec(real *bandPtr_l, real *bandPtr_r, mpg123_handle *fr)
*c2c66affSColin Finck{
*c2c66affSColin Finck	real *samples = (real *) (fr->buffer.data+fr->buffer.fill);
*c2c66affSColin Finck
*c2c66affSColin Finck	real *b0l, *b0r, **bufl, **bufr;
*c2c66affSColin Finck	int bo1;
*c2c66affSColin Finck#ifndef NO_EQUALIZER
*c2c66affSColin Finck	if(fr->have_eq_settings)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		do_equalizer(bandPtr_l,0,fr->equalizer);
*c2c66affSColin Finck		do_equalizer(bandPtr_r,1,fr->equalizer);
*c2c66affSColin Finck	}
*c2c66affSColin Finck#endif
*c2c66affSColin Finck	fr->bo--;
*c2c66affSColin Finck	fr->bo &= 0xf;
*c2c66affSColin Finck	bufl = fr->real_buffs[0];
*c2c66affSColin Finck	bufr = fr->real_buffs[1];
*c2c66affSColin Finck
*c2c66affSColin Finck	if(fr->bo & 0x1)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0l = bufl[0];
*c2c66affSColin Finck		b0r = bufr[0];
*c2c66affSColin Finck		bo1 = fr->bo;
*c2c66affSColin Finck		dct64_altivec(bufl[1]+((fr->bo+1)&0xf),bufl[0]+fr->bo,bandPtr_l);
*c2c66affSColin Finck		dct64_altivec(bufr[1]+((fr->bo+1)&0xf),bufr[0]+fr->bo,bandPtr_r);
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0l = bufl[1];
*c2c66affSColin Finck		b0r = bufr[1];
*c2c66affSColin Finck		bo1 = fr->bo+1;
*c2c66affSColin Finck		dct64_altivec(bufl[0]+fr->bo,bufl[1]+fr->bo+1,bandPtr_l);
*c2c66affSColin Finck		dct64_altivec(bufr[0]+fr->bo,bufr[1]+fr->bo+1,bandPtr_r);
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck
*c2c66affSColin Finck	{
*c2c66affSColin Finck		register int j;
*c2c66affSColin Finck		real *window = fr->decwin + 16 - bo1;
*c2c66affSColin Finck
*c2c66affSColin Finck		vector float v1,v2,v3,v4,v5,v6,v7,v8,v9,v10,v11,v12,v13;
*c2c66affSColin Finck		vector unsigned char vperm1,vperm2;
*c2c66affSColin Finck		vector float vsum,vsum2,vsum3,vsum4,vsum5,vsum6,vsum7,vsum8,vscale,vzero;
*c2c66affSColin Finck		vector float vprev;
*c2c66affSColin Finck		vzero = vec_xor(vzero,vzero);
*c2c66affSColin Finck#ifdef __APPLE__
*c2c66affSColin Finck		vscale = (vector float)(1.0f/32768.0f);
*c2c66affSColin Finck#else
*c2c66affSColin Finck		vscale = (vector float){1.0f/32768.0f,1.0f/32768.0f,1.0f/32768.0f,1.0f/32768.0f};
*c2c66affSColin Finck#endif
*c2c66affSColin Finck
*c2c66affSColin Finck		vperm1 = vec_lvsl(0,window);
*c2c66affSColin Finck		vperm2 = vec_lvsr(0,samples);
*c2c66affSColin Finck		vprev = vec_perm(vec_ld(0,samples),vec_ld(0,samples),vec_lvsl(0,samples));
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_STEREO_ALTIVEC(16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_sub(vsum,vsum2);
*c2c66affSColin Finck			vsum2 = vec_sub(vsum5,vsum6);
*c2c66affSColin Finck			vsum3 = vec_sub(vsum3,vsum4);
*c2c66affSColin Finck			vsum4 = vec_sub(vsum7,vsum8);
*c2c66affSColin Finck			vsum = vec_add(vsum,vsum3);
*c2c66affSColin Finck			vsum2 = vec_add(vsum2,vsum4);
*c2c66affSColin Finck			vsum = vec_madd(vsum, vscale, vzero);
*c2c66affSColin Finck			vsum2 = vec_madd(vsum2, vscale, vzero);
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = vec_mergeh(vsum, vsum2);
*c2c66affSColin Finck			v2 = vec_mergel(vsum, vsum2);
*c2c66affSColin Finck			v3 = vec_perm(vprev,v1,vperm2);
*c2c66affSColin Finck			v4 = vec_perm(v1,v2,vperm2);
*c2c66affSColin Finck			vprev = v2;
*c2c66affSColin Finck			vec_st(v3,0,samples);
*c2c66affSColin Finck			vec_st(v4,16,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_STEREO_ALTIVEC(-16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_add(vsum,vsum2);
*c2c66affSColin Finck			vsum2 = vec_add(vsum5,vsum6);
*c2c66affSColin Finck			vsum3 = vec_add(vsum3,vsum4);
*c2c66affSColin Finck			vsum4 = vec_add(vsum7,vsum8);
*c2c66affSColin Finck			vsum = vec_add(vsum,vsum3);
*c2c66affSColin Finck			vsum2 = vec_add(vsum2,vsum4);
*c2c66affSColin Finck			vsum = vec_madd(vsum, vscale, vzero);
*c2c66affSColin Finck			vsum2 = vec_madd(vsum2, vscale, vzero);
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = vec_mergeh(vsum, vsum2);
*c2c66affSColin Finck			v2 = vec_mergel(vsum, vsum2);
*c2c66affSColin Finck			v3 = vec_perm(vprev,v1,vperm2);
*c2c66affSColin Finck			v4 = vec_perm(v1,v2,vperm2);
*c2c66affSColin Finck			vprev = v2;
*c2c66affSColin Finck			vec_st(v3,0,samples);
*c2c66affSColin Finck			vec_st(v4,16,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		if((size_t)samples & 0xf)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			v1 = (vector float)vec_perm(vec_ld(0,samples),vec_ld(0,samples),vec_lvsl(0,samples));
*c2c66affSColin Finck			v2 = (vector float)vec_perm(vprev,v1,vperm2);
*c2c66affSColin Finck			vec_st(v2,0,samples);
*c2c66affSColin Finck		}
*c2c66affSColin Finck	}
*c2c66affSColin Finck	fr->buffer.fill += 256;
*c2c66affSColin Finck
*c2c66affSColin Finck	return 0;
*c2c66affSColin Finck}
*c2c66affSColin Finck
*c2c66affSColin Finckint synth_1to1_s32_altivec(real *bandPtr,int channel,mpg123_handle *fr, int final)
*c2c66affSColin Finck{
*c2c66affSColin Finck	int32_t *samples = (int32_t *) (fr->buffer.data+fr->buffer.fill);
*c2c66affSColin Finck
*c2c66affSColin Finck	real *b0, **buf;
*c2c66affSColin Finck	int clip;
*c2c66affSColin Finck	int bo1;
*c2c66affSColin Finck#ifndef NO_EQUALIZER
*c2c66affSColin Finck	if(fr->have_eq_settings) do_equalizer(bandPtr,channel,fr->equalizer);
*c2c66affSColin Finck#endif
*c2c66affSColin Finck	if(!channel)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		fr->bo--;
*c2c66affSColin Finck		fr->bo &= 0xf;
*c2c66affSColin Finck		buf = fr->real_buffs[0];
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		samples++;
*c2c66affSColin Finck		buf = fr->real_buffs[1];
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck	if(fr->bo & 0x1)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0 = buf[0];
*c2c66affSColin Finck		bo1 = fr->bo;
*c2c66affSColin Finck		dct64_altivec(buf[1]+((fr->bo+1)&0xf),buf[0]+fr->bo,bandPtr);
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0 = buf[1];
*c2c66affSColin Finck		bo1 = fr->bo+1;
*c2c66affSColin Finck		dct64_altivec(buf[0]+fr->bo,buf[1]+fr->bo+1,bandPtr);
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck
*c2c66affSColin Finck	{
*c2c66affSColin Finck		register int j;
*c2c66affSColin Finck		real *window = fr->decwin + 16 - bo1;
*c2c66affSColin Finck
*c2c66affSColin Finck		ALIGNED(16) int clip_tmp[4];
*c2c66affSColin Finck		vector float v1,v2,v3,v4,v5,v6,v7,v8,v9;
*c2c66affSColin Finck		vector unsigned char vperm1,vperm2,vperm3,vperm4,vperm5;
*c2c66affSColin Finck		vector float vsum,vsum2,vsum3,vsum4,vmax,vmin,vzero;
*c2c66affSColin Finck		vector signed int vsample1,vsample2,vsample3;
*c2c66affSColin Finck		vector unsigned int vshift;
*c2c66affSColin Finck		vector signed int vclip;
*c2c66affSColin Finck		vzero = vec_xor(vzero, vzero);
*c2c66affSColin Finck		vclip = vec_xor(vclip, vclip);
*c2c66affSColin Finck		vshift = vec_splat_u32(-1); /* 31 */
*c2c66affSColin Finck#ifdef __APPLE__
*c2c66affSColin Finck		vmax = (vector float)(32767.999f);
*c2c66affSColin Finck		vmin = (vector float)(-32768.0f);
*c2c66affSColin Finck		vperm4 = (vector unsigned char)(0,1,2,3,20,21,22,23,4,5,6,7,28,29,30,31);
*c2c66affSColin Finck		vperm5 = (vector unsigned char)(8,9,10,11,20,21,22,23,12,13,14,15,28,29,30,31);
*c2c66affSColin Finck#else
*c2c66affSColin Finck		vmax = (vector float){32767.999f,32767.999f,32767.999f,32767.999f};
*c2c66affSColin Finck		vmin = (vector float){-32768.0f,-32768.0f,-32768.0f,-32768.0f};
*c2c66affSColin Finck		vperm4 = (vector unsigned char){0,1,2,3,20,21,22,23,4,5,6,7,28,29,30,31};
*c2c66affSColin Finck		vperm5 = (vector unsigned char){8,9,10,11,20,21,22,23,12,13,14,15,28,29,30,31};
*c2c66affSColin Finck#endif
*c2c66affSColin Finck
*c2c66affSColin Finck		vperm1 = vec_lvsl(0,window);
*c2c66affSColin Finck		vperm2 = vec_lvsl(0,samples);
*c2c66affSColin Finck		vperm3 = vec_lvsr(0,samples);
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_ALTIVEC(16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_sub(v5,v6);
*c2c66affSColin Finck			v9 = vec_sub(v7,v8);
*c2c66affSColin Finck			v1 = vec_add(vsum,v9);
*c2c66affSColin Finck			vsum = (vector float)vec_cts(v1,16);
*c2c66affSColin Finck			v8 = (vector float)vec_cmpgt(v1,vmax);
*c2c66affSColin Finck			v9 = (vector float)vec_cmplt(v1,vmin);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsample1 = vec_ld(0,samples);
*c2c66affSColin Finck			vsample2 = vec_ld(16,samples);
*c2c66affSColin Finck			vsample3 = vec_ld(31,samples);
*c2c66affSColin Finck			v1 = (vector float)vec_perm(vsample1, vsample2, vperm2);
*c2c66affSColin Finck			v2 = (vector float)vec_perm(vsample2, vsample3, vperm2);
*c2c66affSColin Finck			v1 = vec_perm(vsum, v1, vperm4);
*c2c66affSColin Finck			v2 = vec_perm(vsum, v2, vperm5);
*c2c66affSColin Finck			v3 = (vector float)vec_perm(vsample3, vsample2, vperm2);
*c2c66affSColin Finck			v4 = (vector float)vec_perm(vsample2, vsample1, vperm2);
*c2c66affSColin Finck			v5 = vec_perm(v2, v3, vperm3);
*c2c66affSColin Finck			v6 = vec_perm(v1, v2, vperm3);
*c2c66affSColin Finck			v7 = vec_perm(v4, v1, vperm3);
*c2c66affSColin Finck			vec_st((vector signed int)v5,31,samples);
*c2c66affSColin Finck			vec_st((vector signed int)v6,16,samples);
*c2c66affSColin Finck			vec_st((vector signed int)v7,0,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = (vector float)vec_sr((vector unsigned int)v8, vshift);
*c2c66affSColin Finck			v2 = (vector float)vec_sr((vector unsigned int)v9, vshift);
*c2c66affSColin Finck			v1 = (vector float)vec_add((vector unsigned int)v1,(vector unsigned int)v2);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v1,vclip);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_ALTIVEC(-16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_add(v5,v6);
*c2c66affSColin Finck			v9 = vec_add(v7,v8);
*c2c66affSColin Finck			v1 = vec_add(vsum,v9);
*c2c66affSColin Finck			vsum = (vector float)vec_cts(v1,16);
*c2c66affSColin Finck			v8 = (vector float)vec_cmpgt(v1,vmax);
*c2c66affSColin Finck			v9 = (vector float)vec_cmplt(v1,vmin);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsample1 = vec_ld(0,samples);
*c2c66affSColin Finck			vsample2 = vec_ld(16,samples);
*c2c66affSColin Finck			vsample3 = vec_ld(31,samples);
*c2c66affSColin Finck			v1 = (vector float)vec_perm(vsample1, vsample2, vperm2);
*c2c66affSColin Finck			v2 = (vector float)vec_perm(vsample2, vsample3, vperm2);
*c2c66affSColin Finck			v1 = vec_perm(vsum, v1, vperm4);
*c2c66affSColin Finck			v2 = vec_perm(vsum, v2, vperm5);
*c2c66affSColin Finck			v3 = (vector float)vec_perm(vsample3, vsample2, vperm2);
*c2c66affSColin Finck			v4 = (vector float)vec_perm(vsample2, vsample1, vperm2);
*c2c66affSColin Finck			v5 = vec_perm(v2, v3, vperm3);
*c2c66affSColin Finck			v6 = vec_perm(v1, v2, vperm3);
*c2c66affSColin Finck			v7 = vec_perm(v4, v1, vperm3);
*c2c66affSColin Finck			vec_st((vector signed int)v5,31,samples);
*c2c66affSColin Finck			vec_st((vector signed int)v6,16,samples);
*c2c66affSColin Finck			vec_st((vector signed int)v7,0,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = (vector float)vec_sr((vector unsigned int)v8, vshift);
*c2c66affSColin Finck			v2 = (vector float)vec_sr((vector unsigned int)v9, vshift);
*c2c66affSColin Finck			v1 = (vector float)vec_add((vector unsigned int)v1,(vector unsigned int)v2);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v1,vclip);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		vec_st(vclip,0,clip_tmp);
*c2c66affSColin Finck		clip = clip_tmp[3];
*c2c66affSColin Finck	}
*c2c66affSColin Finck	if(final) fr->buffer.fill += 256;
*c2c66affSColin Finck
*c2c66affSColin Finck	return clip;
*c2c66affSColin Finck}
*c2c66affSColin Finck
*c2c66affSColin Finck
*c2c66affSColin Finckint synth_1to1_s32_stereo_altivec(real *bandPtr_l, real *bandPtr_r, mpg123_handle *fr)
*c2c66affSColin Finck{
*c2c66affSColin Finck	int32_t *samples = (int32_t *) (fr->buffer.data+fr->buffer.fill);
*c2c66affSColin Finck
*c2c66affSColin Finck	real *b0l, *b0r, **bufl, **bufr;
*c2c66affSColin Finck	int clip;
*c2c66affSColin Finck	int bo1;
*c2c66affSColin Finck#ifndef NO_EQUALIZER
*c2c66affSColin Finck	if(fr->have_eq_settings)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		do_equalizer(bandPtr_l,0,fr->equalizer);
*c2c66affSColin Finck		do_equalizer(bandPtr_r,1,fr->equalizer);
*c2c66affSColin Finck	}
*c2c66affSColin Finck#endif
*c2c66affSColin Finck	fr->bo--;
*c2c66affSColin Finck	fr->bo &= 0xf;
*c2c66affSColin Finck	bufl = fr->real_buffs[0];
*c2c66affSColin Finck	bufr = fr->real_buffs[1];
*c2c66affSColin Finck
*c2c66affSColin Finck	if(fr->bo & 0x1)
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0l = bufl[0];
*c2c66affSColin Finck		b0r = bufr[0];
*c2c66affSColin Finck		bo1 = fr->bo;
*c2c66affSColin Finck		dct64_altivec(bufl[1]+((fr->bo+1)&0xf),bufl[0]+fr->bo,bandPtr_l);
*c2c66affSColin Finck		dct64_altivec(bufr[1]+((fr->bo+1)&0xf),bufr[0]+fr->bo,bandPtr_r);
*c2c66affSColin Finck	}
*c2c66affSColin Finck	else
*c2c66affSColin Finck	{
*c2c66affSColin Finck		b0l = bufl[1];
*c2c66affSColin Finck		b0r = bufr[1];
*c2c66affSColin Finck		bo1 = fr->bo+1;
*c2c66affSColin Finck		dct64_altivec(bufl[0]+fr->bo,bufl[1]+fr->bo+1,bandPtr_l);
*c2c66affSColin Finck		dct64_altivec(bufr[0]+fr->bo,bufr[1]+fr->bo+1,bandPtr_r);
*c2c66affSColin Finck	}
*c2c66affSColin Finck
*c2c66affSColin Finck
*c2c66affSColin Finck	{
*c2c66affSColin Finck		register int j;
*c2c66affSColin Finck		real *window = fr->decwin + 16 - bo1;
*c2c66affSColin Finck
*c2c66affSColin Finck		ALIGNED(16) int clip_tmp[4];
*c2c66affSColin Finck		vector float v1,v2,v3,v4,v5,v6,v7,v8,v9,v10,v11,v12,v13;
*c2c66affSColin Finck		vector unsigned char vperm1,vperm2;
*c2c66affSColin Finck		vector float vsum,vsum2,vsum3,vsum4,vsum5,vsum6,vsum7,vsum8,vmax,vmin,vzero;
*c2c66affSColin Finck		vector float vprev;
*c2c66affSColin Finck		vector unsigned int vshift;
*c2c66affSColin Finck		vector signed int vclip;
*c2c66affSColin Finck		vzero = vec_xor(vzero, vzero);
*c2c66affSColin Finck		vclip = vec_xor(vclip, vclip);
*c2c66affSColin Finck		vshift = vec_splat_u32(-1); /* 31 */
*c2c66affSColin Finck#ifdef __APPLE__
*c2c66affSColin Finck		vmax = (vector float)(32767.999f);
*c2c66affSColin Finck		vmin = (vector float)(-32768.0f);
*c2c66affSColin Finck#else
*c2c66affSColin Finck		vmax = (vector float){32767.999f,32767.999f,32767.999f,32767.999f};
*c2c66affSColin Finck		vmin = (vector float){-32768.0f,-32768.0f,-32768.0f,-32768.0f};
*c2c66affSColin Finck#endif
*c2c66affSColin Finck
*c2c66affSColin Finck		vperm1 = vec_lvsl(0,window);
*c2c66affSColin Finck		vperm2 = vec_lvsr(0,samples);
*c2c66affSColin Finck		vprev = (vector float)vec_perm(vec_ld(0,samples),vec_ld(0,samples),vec_lvsl(0,samples));
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_STEREO_ALTIVEC(16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_sub(vsum,vsum2);
*c2c66affSColin Finck			vsum2 = vec_sub(vsum5,vsum6);
*c2c66affSColin Finck			vsum3 = vec_sub(vsum3,vsum4);
*c2c66affSColin Finck			vsum4 = vec_sub(vsum7,vsum8);
*c2c66affSColin Finck			v1 = vec_add(vsum,vsum3);
*c2c66affSColin Finck			v2 = vec_add(vsum2,vsum4);
*c2c66affSColin Finck			vsum = (vector float)vec_cts(v1,16);
*c2c66affSColin Finck			vsum2 = (vector float)vec_cts(v2,16);
*c2c66affSColin Finck			v5 = (vector float)vec_cmpgt(v1,vmax);
*c2c66affSColin Finck			v6 = (vector float)vec_cmplt(v1,vmin);
*c2c66affSColin Finck			v7 = (vector float)vec_cmpgt(v2,vmax);
*c2c66affSColin Finck			v8 = (vector float)vec_cmplt(v2,vmin);
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = vec_mergeh(vsum, vsum2);
*c2c66affSColin Finck			v2 = vec_mergel(vsum, vsum2);
*c2c66affSColin Finck			v3 = vec_perm(vprev,v1,vperm2);
*c2c66affSColin Finck			v4 = vec_perm(v1,v2,vperm2);
*c2c66affSColin Finck			vprev = v2;
*c2c66affSColin Finck			vec_st((vector signed int)v3,0,samples);
*c2c66affSColin Finck			vec_st((vector signed int)v4,16,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = (vector float)vec_sr((vector unsigned int)v5, vshift);
*c2c66affSColin Finck			v2 = (vector float)vec_sr((vector unsigned int)v6, vshift);
*c2c66affSColin Finck			v3 = (vector float)vec_sr((vector unsigned int)v7, vshift);
*c2c66affSColin Finck			v4 = (vector float)vec_sr((vector unsigned int)v8, vshift);
*c2c66affSColin Finck			v1 = (vector float)vec_add((vector unsigned int)v1,(vector unsigned int)v2);
*c2c66affSColin Finck			v2 = (vector float)vec_add((vector unsigned int)v3,(vector unsigned int)v4);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v1,vclip);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v2,vclip);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		for (j=4;j;j--)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			SYNTH_STEREO_ALTIVEC(-16);
*c2c66affSColin Finck
*c2c66affSColin Finck			vsum = vec_add(vsum,vsum2);
*c2c66affSColin Finck			vsum2 = vec_add(vsum5,vsum6);
*c2c66affSColin Finck			vsum3 = vec_add(vsum3,vsum4);
*c2c66affSColin Finck			vsum4 = vec_add(vsum7,vsum8);
*c2c66affSColin Finck			v1 = vec_add(vsum,vsum3);
*c2c66affSColin Finck			v2 = vec_add(vsum2,vsum4);
*c2c66affSColin Finck			vsum = (vector float)vec_cts(v1,16);
*c2c66affSColin Finck			vsum2 = (vector float)vec_cts(v2,16);
*c2c66affSColin Finck			v5 = (vector float)vec_cmpgt(v1,vmax);
*c2c66affSColin Finck			v6 = (vector float)vec_cmplt(v1,vmin);
*c2c66affSColin Finck			v7 = (vector float)vec_cmpgt(v2,vmax);
*c2c66affSColin Finck			v8 = (vector float)vec_cmplt(v2,vmin);
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = vec_mergeh(vsum, vsum2);
*c2c66affSColin Finck			v2 = vec_mergel(vsum, vsum2);
*c2c66affSColin Finck			v3 = vec_perm(vprev,v1,vperm2);
*c2c66affSColin Finck			v4 = vec_perm(v1,v2,vperm2);
*c2c66affSColin Finck			vprev = v2;
*c2c66affSColin Finck			vec_st((vector signed int)v3,0,samples);
*c2c66affSColin Finck			vec_st((vector signed int)v4,16,samples);
*c2c66affSColin Finck			samples += 8;
*c2c66affSColin Finck
*c2c66affSColin Finck			v1 = (vector float)vec_sr((vector unsigned int)v5, vshift);
*c2c66affSColin Finck			v2 = (vector float)vec_sr((vector unsigned int)v6, vshift);
*c2c66affSColin Finck			v3 = (vector float)vec_sr((vector unsigned int)v7, vshift);
*c2c66affSColin Finck			v4 = (vector float)vec_sr((vector unsigned int)v8, vshift);
*c2c66affSColin Finck			v1 = (vector float)vec_add((vector unsigned int)v1,(vector unsigned int)v2);
*c2c66affSColin Finck			v2 = (vector float)vec_add((vector unsigned int)v3,(vector unsigned int)v4);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v1,vclip);
*c2c66affSColin Finck			vclip = vec_sums((vector signed int)v2,vclip);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		if((size_t)samples & 0xf)
*c2c66affSColin Finck		{
*c2c66affSColin Finck			v1 = (vector float)vec_perm(vec_ld(0,samples),vec_ld(0,samples),vec_lvsl(0,samples));
*c2c66affSColin Finck			v2 = (vector float)vec_perm(vprev,v1,vperm2);
*c2c66affSColin Finck			vec_st((vector signed int)v2,0,samples);
*c2c66affSColin Finck		}
*c2c66affSColin Finck
*c2c66affSColin Finck		vec_st(vclip,0,clip_tmp);
*c2c66affSColin Finck		clip = clip_tmp[3];
*c2c66affSColin Finck	}
*c2c66affSColin Finck	fr->buffer.fill += 256;
*c2c66affSColin Finck
*c2c66affSColin Finck	return clip;
*c2c66affSColin Finck}