sdl-ios-xcode: src/video/SDL_yuv

annotate src/video/SDL_yuv_mmx.c @ 869:ae4ab3ac89a9

Instructive comments from Max Horn

author	Sam Lantinga <slouken@libsdl.org>
date	Thu, 04 Mar 2004 05:39:17 +0000
parents	b8d311d90021
children	b4b64bb88f2f

rev	line source
0 74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	1 /*
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	2 SDL - Simple DirectMedia Layer
769 b8d311d90021 Updated copyright information for 2004 (Happy New Year!) Sam Lantinga <slouken@libsdl.org> parents: 297 diff changeset	3 Copyright (C) 1997-2004 Sam Lantinga
0 74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	5 This library is free software; you can redistribute it and/or
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	6 modify it under the terms of the GNU Library General Public
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	7 License as published by the Free Software Foundation; either
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	8 version 2 of the License, or (at your option) any later version.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	9
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	10 This library is distributed in the hope that it will be useful,
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	11 but WITHOUT ANY WARRANTY; without even the implied warranty of
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	12 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	13 Library General Public License for more details.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	14
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	15 You should have received a copy of the GNU Library General Public
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	16 License along with this library; if not, write to the Free
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	17 Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	18
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	19 Sam Lantinga
252 e8157fcb3114 Updated the source with the correct e-mail address Sam Lantinga <slouken@libsdl.org> parents: 0 diff changeset	20 slouken@libsdl.org
0 74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	21 */
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	22
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	23 #ifdef SAVE_RCSID
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	24 static char rcsid =
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	25 "@(#) $Id$";
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	26 #endif
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	27
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	28
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	29 #if defined(i386) && defined(__GNUC__) && defined(USE_ASMBLIT)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	30
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	31 #include "SDL_types.h"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	32
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	33 #ifdef __ELF__
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	34 #define ASM_VAR(X) _##X
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	35 #else
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	36 #define ASM_VAR(X) X
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	37 #endif
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	38
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	39 static unsigned int ASM_VAR(MMX_0080w)[] = {0x00800080, 0x00800080};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	40 static unsigned int ASM_VAR(MMX_00FFw)[] = {0x00ff00ff, 0x00ff00ff};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	41 static unsigned int ASM_VAR(MMX_FF00w)[] = {0xff00ff00, 0xff00ff00};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	42
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	43 static unsigned short ASM_VAR(MMX_Ycoeff)[] = {0x004a, 0x004a, 0x004a, 0x004a};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	44
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	45 static unsigned short ASM_VAR(MMX_UbluRGB)[] = {0x0072, 0x0072, 0x0072, 0x0072};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	46 static unsigned short ASM_VAR(MMX_VredRGB)[] = {0x0059, 0x0059, 0x0059, 0x0059};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	47 static unsigned short ASM_VAR(MMX_UgrnRGB)[] = {0xffea, 0xffea, 0xffea, 0xffea};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	48 static unsigned short ASM_VAR(MMX_VgrnRGB)[] = {0xffd2, 0xffd2, 0xffd2, 0xffd2};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	49
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	50 static unsigned short ASM_VAR(MMX_Ublu5x5)[] = {0x0081, 0x0081, 0x0081, 0x0081};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	51 static unsigned short ASM_VAR(MMX_Vred5x5)[] = {0x0066, 0x0066, 0x0066, 0x0066};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	52 static unsigned short ASM_VAR(MMX_Ugrn555)[] = {0xffe7, 0xffe7, 0xffe7, 0xffe7};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	53 static unsigned short ASM_VAR(MMX_Vgrn555)[] = {0xffcc, 0xffcc, 0xffcc, 0xffcc};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	54 static unsigned short ASM_VAR(MMX_Ugrn565)[] = {0xffe8, 0xffe8, 0xffe8, 0xffe8};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	55 static unsigned short ASM_VAR(MMX_Vgrn565)[] = {0xffcd, 0xffcd, 0xffcd, 0xffcd};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	56
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	57 static unsigned short ASM_VAR(MMX_red555)[] = {0x7c00, 0x7c00, 0x7c00, 0x7c00};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	58 static unsigned short ASM_VAR(MMX_red565)[] = {0xf800, 0xf800, 0xf800, 0xf800};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	59 static unsigned short ASM_VAR(MMX_grn555)[] = {0x03e0, 0x03e0, 0x03e0, 0x03e0};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	60 static unsigned short ASM_VAR(MMX_grn565)[] = {0x07e0, 0x07e0, 0x07e0, 0x07e0};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	61 static unsigned short ASM_VAR(MMX_blu5x5)[] = {0x001f, 0x001f, 0x001f, 0x001f};
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	62
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	63 /**
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	64 This MMX assembler is my first assembler/MMX program ever.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	65 Thus it maybe buggy.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	66 Send patches to:
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	67 mvogt@rhrk.uni-kl.de
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	68
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	69 After it worked fine I have "obfuscated" the code a bit to have
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	70 more parallism in the MMX units. This means I moved
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	71 initilisation around and delayed other instruction.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	72 Performance measurement did not show that this brought any advantage
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	73 but in theory it _should_ be faster this way.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	74
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	75 The overall performanve gain to the C based dither was 30%-40%.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	76 The MMX routine calculates 256bit=8RGB values in each cycle
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	77 (4 for row1 & 4 for row2)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	78
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	79 The red/green/blue.. coefficents are taken from the mpeg_play
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	80 player. They look nice, but I dont know if you can have
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	81 better values, to avoid integer rounding errors.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	82
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	83
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	84 IMPORTANT:
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	85 ==========
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	86
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	87 It is a requirement that the cr/cb/lum are 8 byte aligned and
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	88 the out are 16byte aligned or you will/may get segfaults
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	89
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	90 */
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	91
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	92 void ColorRGBDitherYV12MMX1X( int colortab, Uint32 rgb_2_pix,
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	93 unsigned char lum, unsigned char cr,
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	94 unsigned char cb, unsigned char out,
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	95 int rows, int cols, int mod )
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	96 {
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	97 Uint32 *row1;
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	98 Uint32 *row2;
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	99
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	100 unsigned char* y = lum +cols*rows; // Pointer to the end
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	101 int x=0;
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	102 row1 = (Uint32 *)out; // 32 bit target
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	103 row2 = (Uint32 *)out+cols+mod; // start of second row
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	104 mod = (mod+cols+mod)*4; // increment for row1 in byte
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	105
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	106 __asm__ __volatile__ (
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	107 /* We don't really care about PIC - the code should be rewritten to use
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	108 relative addressing for the static tables, so right now we take the
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	109 COW hit on the pages this code resides. Big deal.
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	110 This spill is just to reduce register pressure in the PIC case. */
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	111 "pushl %%ebx\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	112 "movl %0, %%ebx\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	113
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	114 ".align 8\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	115 "1:\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	116
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	117 // create Cr (result in mm1)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	118 "movd (%%ebx), %%mm1\n" // 0 0 0 0 v3 v2 v1 v0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	119 "pxor %%mm7,%%mm7\n" // 00 00 00 00 00 00 00 00
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	120 "movd (%2), %%mm2\n" // 0 0 0 0 l3 l2 l1 l0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	121 "punpcklbw %%mm7,%%mm1\n" // 0 v3 0 v2 00 v1 00 v0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	122 "punpckldq %%mm1,%%mm1\n" // 00 v1 00 v0 00 v1 00 v0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	123 "psubw _MMX_0080w,%%mm1\n" // mm1-128:r1 r1 r0 r0 r1 r1 r0 r0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	124
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	125 // create Cr_g (result in mm0)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	126 "movq %%mm1,%%mm0\n" // r1 r1 r0 r0 r1 r1 r0 r0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	127 "pmullw _MMX_VgrnRGB,%%mm0\n"// red-46dec=0.713664
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	128 "pmullw _MMX_VredRGB,%%mm1\n"// red89dec=1.401364
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	129 "psraw $6, %%mm0\n" // red=red/64
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	130 "psraw $6, %%mm1\n" // red=red/64
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	131
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	132 // create L1 L2 (result in mm2,mm4)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	133 // L2=lum+cols
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	134 "movq (%2,%4),%%mm3\n" // 0 0 0 0 L3 L2 L1 L0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	135 "punpckldq %%mm3,%%mm2\n" // L3 L2 L1 L0 l3 l2 l1 l0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	136 "movq %%mm2,%%mm4\n" // L3 L2 L1 L0 l3 l2 l1 l0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	137 "pand _MMX_FF00w,%%mm2\n" // L3 0 L1 0 l3 0 l1 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	138 "pand _MMX_00FFw,%%mm4\n" // 0 L2 0 L0 0 l2 0 l0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	139 "psrlw $8,%%mm2\n" // 0 L3 0 L1 0 l3 0 l1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	140
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	141 // create R (result in mm6)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	142 "movq %%mm2,%%mm5\n" // 0 L3 0 L1 0 l3 0 l1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	143 "movq %%mm4,%%mm6\n" // 0 L2 0 L0 0 l2 0 l0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	144 "paddsw %%mm1, %%mm5\n" // lum1+red:x R3 x R1 x r3 x r1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	145 "paddsw %%mm1, %%mm6\n" // lum1+red:x R2 x R0 x r2 x r0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	146 "packuswb %%mm5,%%mm5\n" // R3 R1 r3 r1 R3 R1 r3 r1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	147 "packuswb %%mm6,%%mm6\n" // R2 R0 r2 r0 R2 R0 r2 r0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	148 "pxor %%mm7,%%mm7\n" // 00 00 00 00 00 00 00 00
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	149 "punpcklbw %%mm5,%%mm6\n" // R3 R2 R1 R0 r3 r2 r1 r0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	150
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	151 // create Cb (result in mm1)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	152 "movd (%1), %%mm1\n" // 0 0 0 0 u3 u2 u1 u0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	153 "punpcklbw %%mm7,%%mm1\n" // 0 u3 0 u2 00 u1 00 u0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	154 "punpckldq %%mm1,%%mm1\n" // 00 u1 00 u0 00 u1 00 u0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	155 "psubw _MMX_0080w,%%mm1\n" // mm1-128:u1 u1 u0 u0 u1 u1 u0 u0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	156 // create Cb_g (result in mm5)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	157 "movq %%mm1,%%mm5\n" // u1 u1 u0 u0 u1 u1 u0 u0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	158 "pmullw _MMX_UgrnRGB,%%mm5\n" // blue-109dec=1.712964
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	159 "pmullw _MMX_UbluRGB,%%mm1\n" // blue114dec=1.7812564
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	160 "psraw $6, %%mm5\n" // blue=red/64
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	161 "psraw $6, %%mm1\n" // blue=blue/64
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	162
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	163 // create G (result in mm7)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	164 "movq %%mm2,%%mm3\n" // 0 L3 0 L1 0 l3 0 l1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	165 "movq %%mm4,%%mm7\n" // 0 L2 0 L0 0 l2 0 l1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	166 "paddsw %%mm5, %%mm3\n" // lum1+Cb_g:x G3t x G1t x g3t x g1t
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	167 "paddsw %%mm5, %%mm7\n" // lum1+Cb_g:x G2t x G0t x g2t x g0t
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	168 "paddsw %%mm0, %%mm3\n" // lum1+Cr_g:x G3 x G1 x g3 x g1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	169 "paddsw %%mm0, %%mm7\n" // lum1+blue:x G2 x G0 x g2 x g0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	170 "packuswb %%mm3,%%mm3\n" // G3 G1 g3 g1 G3 G1 g3 g1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	171 "packuswb %%mm7,%%mm7\n" // G2 G0 g2 g0 G2 G0 g2 g0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	172 "punpcklbw %%mm3,%%mm7\n" // G3 G2 G1 G0 g3 g2 g1 g0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	173
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	174 // create B (result in mm5)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	175 "movq %%mm2,%%mm3\n" // 0 L3 0 L1 0 l3 0 l1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	176 "movq %%mm4,%%mm5\n" // 0 L2 0 L0 0 l2 0 l1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	177 "paddsw %%mm1, %%mm3\n" // lum1+blue:x B3 x B1 x b3 x b1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	178 "paddsw %%mm1, %%mm5\n" // lum1+blue:x B2 x B0 x b2 x b0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	179 "packuswb %%mm3,%%mm3\n" // B3 B1 b3 b1 B3 B1 b3 b1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	180 "packuswb %%mm5,%%mm5\n" // B2 B0 b2 b0 B2 B0 b2 b0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	181 "punpcklbw %%mm3,%%mm5\n" // B3 B2 B1 B0 b3 b2 b1 b0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	182
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	183 // fill destination row1 (needed are mm6=Rr,mm7=Gg,mm5=Bb)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	184
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	185 "pxor %%mm2,%%mm2\n" // 0 0 0 0 0 0 0 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	186 "pxor %%mm4,%%mm4\n" // 0 0 0 0 0 0 0 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	187 "movq %%mm6,%%mm1\n" // R3 R2 R1 R0 r3 r2 r1 r0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	188 "movq %%mm5,%%mm3\n" // B3 B2 B1 B0 b3 b2 b1 b0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	189 // process lower lum
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	190 "punpcklbw %%mm4,%%mm1\n" // 0 r3 0 r2 0 r1 0 r0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	191 "punpcklbw %%mm4,%%mm3\n" // 0 b3 0 b2 0 b1 0 b0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	192 "movq %%mm1,%%mm2\n" // 0 r3 0 r2 0 r1 0 r0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	193 "movq %%mm3,%%mm0\n" // 0 b3 0 b2 0 b1 0 b0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	194 "punpcklwd %%mm1,%%mm3\n" // 0 r1 0 b1 0 r0 0 b0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	195 "punpckhwd %%mm2,%%mm0\n" // 0 r3 0 b3 0 r2 0 b2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	196
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	197 "pxor %%mm2,%%mm2\n" // 0 0 0 0 0 0 0 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	198 "movq %%mm7,%%mm1\n" // G3 G2 G1 G0 g3 g2 g1 g0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	199 "punpcklbw %%mm1,%%mm2\n" // g3 0 g2 0 g1 0 g0 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	200 "punpcklwd %%mm4,%%mm2\n" // 0 0 g1 0 0 0 g0 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	201 "por %%mm3, %%mm2\n" // 0 r1 g1 b1 0 r0 g0 b0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	202 "movq %%mm2,(%3)\n" // wrote out ! row1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	203
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	204 "pxor %%mm2,%%mm2\n" // 0 0 0 0 0 0 0 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	205 "punpcklbw %%mm1,%%mm4\n" // g3 0 g2 0 g1 0 g0 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	206 "punpckhwd %%mm2,%%mm4\n" // 0 0 g3 0 0 0 g2 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	207 "por %%mm0, %%mm4\n" // 0 r3 g3 b3 0 r2 g2 b2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	208 "movq %%mm4,8(%3)\n" // wrote out ! row1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	209
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	210 // fill destination row2 (needed are mm6=Rr,mm7=Gg,mm5=Bb)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	211 // this can be done "destructive"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	212 "pxor %%mm2,%%mm2\n" // 0 0 0 0 0 0 0 0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	213 "punpckhbw %%mm2,%%mm6\n" // 0 R3 0 R2 0 R1 0 R0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	214 "punpckhbw %%mm1,%%mm5\n" // G3 B3 G2 B2 G1 B1 G0 B0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	215 "movq %%mm5,%%mm1\n" // G3 B3 G2 B2 G1 B1 G0 B0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	216 "punpcklwd %%mm6,%%mm1\n" // 0 R1 G1 B1 0 R0 G0 B0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	217 "movq %%mm1,(%5)\n" // wrote out ! row2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	218 "punpckhwd %%mm6,%%mm5\n" // 0 R3 G3 B3 0 R2 G2 B2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	219 "movq %%mm5,8(%5)\n" // wrote out ! row2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	220
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	221 "addl $4,%2\n" // lum+4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	222 "leal 16(%3),%3\n" // row1+16
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	223 "leal 16(%5),%5\n" // row2+16
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	224 "addl $2, %%ebx\n" // cr+2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	225 "addl $2, %1\n" // cb+2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	226
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	227 "addl $4,%6\n" // x+4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	228 "cmpl %4,%6\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	229
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	230 "jl 1b\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	231 "addl %4, %2\n" // lum += cols
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	232 "addl %8, %3\n" // row1+= mod
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	233 "addl %8, %5\n" // row2+= mod
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	234 "movl $0, %6\n" // x=0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	235 "cmpl %7, %2\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	236 "jl 1b\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	237 "emms\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	238 "popl %%ebx\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	239 :
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	240 : "m" (cr), "r"(cb),"r"(lum),
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	241 "r"(row1),"r"(cols),"r"(row2),"m"(x),"m"(y),"m"(mod)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	242 : "%ebx"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	243 );
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	244 }
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	245
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	246 void Color565DitherYV12MMX1X( int colortab, Uint32 rgb_2_pix,
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	247 unsigned char lum, unsigned char cr,
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	248 unsigned char cb, unsigned char out,
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	249 int rows, int cols, int mod )
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	250 {
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	251 Uint16 *row1;
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	252 Uint16 *row2;
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	253
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	254 unsigned char* y = lum +colsrows; / Pointer to the end */
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	255 int x=0;
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	256 row1 = (Uint16 )out; / 16 bit target */
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	257 row2 = (Uint16 )out+cols+mod; / start of second row */
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	258 mod = (mod+cols+mod)2; / increment for row1 in byte */
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	259
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	260
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	261 __asm__ __volatile__(
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	262 "pushl %%ebx\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	263 "movl %0, %%ebx\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	264
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	265 ".align 8\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	266 "1:\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	267 "movd (%1), %%mm0\n" // 4 Cb 0 0 0 0 u3 u2 u1 u0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	268 "pxor %%mm7, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	269 "movd (%%ebx), %%mm1\n" // 4 Cr 0 0 0 0 v3 v2 v1 v0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	270 "punpcklbw %%mm7, %%mm0\n" // 4 W cb 0 u3 0 u2 0 u1 0 u0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	271 "punpcklbw %%mm7, %%mm1\n" // 4 W cr 0 v3 0 v2 0 v1 0 v0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	272 "psubw _MMX_0080w, %%mm0\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	273 "psubw _MMX_0080w, %%mm1\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	274 "movq %%mm0, %%mm2\n" // Cb 0 u3 0 u2 0 u1 0 u0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	275 "movq %%mm1, %%mm3\n" // Cr
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	276 "pmullw _MMX_Ugrn565, %%mm2\n" // Cb2green 0 R3 0 R2 0 R1 0 R0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	277 "movq (%2), %%mm6\n" // L1 l7 L6 L5 L4 L3 L2 L1 L0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	278 "pmullw _MMX_Ublu5x5, %%mm0\n" // Cb2blue
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	279 "pand _MMX_00FFw, %%mm6\n" // L1 00 L6 00 L4 00 L2 00 L0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	280 "pmullw _MMX_Vgrn565, %%mm3\n" // Cr2green
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	281 "movq (%2), %%mm7\n" // L2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	282 "pmullw _MMX_Vred5x5, %%mm1\n" // Cr2red
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	283 "psrlw $8, %%mm7\n" // L2 00 L7 00 L5 00 L3 00 L1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	284 "pmullw _MMX_Ycoeff, %%mm6\n" // lum1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	285 "paddw %%mm3, %%mm2\n" // Cb2green + Cr2green == green
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	286 "pmullw _MMX_Ycoeff, %%mm7\n" // lum2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	287
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	288 "movq %%mm6, %%mm4\n" // lum1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	289 "paddw %%mm0, %%mm6\n" // lum1 +blue 00 B6 00 B4 00 B2 00 B0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	290 "movq %%mm4, %%mm5\n" // lum1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	291 "paddw %%mm1, %%mm4\n" // lum1 +red 00 R6 00 R4 00 R2 00 R0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	292 "paddw %%mm2, %%mm5\n" // lum1 +green 00 G6 00 G4 00 G2 00 G0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	293 "psraw $6, %%mm4\n" // R1 0 .. 64
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	294 "movq %%mm7, %%mm3\n" // lum2 00 L7 00 L5 00 L3 00 L1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	295 "psraw $6, %%mm5\n" // G1 - .. +
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	296 "paddw %%mm0, %%mm7\n" // Lum2 +blue 00 B7 00 B5 00 B3 00 B1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	297 "psraw $6, %%mm6\n" // B1 0 .. 64
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	298 "packuswb %%mm4, %%mm4\n" // R1 R1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	299 "packuswb %%mm5, %%mm5\n" // G1 G1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	300 "packuswb %%mm6, %%mm6\n" // B1 B1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	301 "punpcklbw %%mm4, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	302 "punpcklbw %%mm5, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	303
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	304 "pand _MMX_red565, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	305 "psllw $3, %%mm5\n" // GREEN 1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	306 "punpcklbw %%mm6, %%mm6\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	307 "pand _MMX_grn565, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	308 "pand _MMX_red565, %%mm6\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	309 "por %%mm5, %%mm4\n" //
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	310 "psrlw $11, %%mm6\n" // BLUE 1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	311 "movq %%mm3, %%mm5\n" // lum2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	312 "paddw %%mm1, %%mm3\n" // lum2 +red 00 R7 00 R5 00 R3 00 R1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	313 "paddw %%mm2, %%mm5\n" // lum2 +green 00 G7 00 G5 00 G3 00 G1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	314 "psraw $6, %%mm3\n" // R2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	315 "por %%mm6, %%mm4\n" // MM4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	316 "psraw $6, %%mm5\n" // G2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	317 "movq (%2, %4), %%mm6\n" // L3 load lum2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	318 "psraw $6, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	319 "packuswb %%mm3, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	320 "packuswb %%mm5, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	321 "packuswb %%mm7, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	322 "pand _MMX_00FFw, %%mm6\n" // L3
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	323 "punpcklbw %%mm3, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	324 "punpcklbw %%mm5, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	325 "pmullw _MMX_Ycoeff, %%mm6\n" // lum3
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	326 "punpcklbw %%mm7, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	327 "psllw $3, %%mm5\n" // GREEN 2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	328 "pand _MMX_red565, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	329 "pand _MMX_red565, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	330 "psrlw $11, %%mm7\n" // BLUE 2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	331 "pand _MMX_grn565, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	332 "por %%mm7, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	333 "movq (%2,%4), %%mm7\n" // L4 load lum2
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	334 "por %%mm5, %%mm3\n" //
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	335 "psrlw $8, %%mm7\n" // L4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	336 "movq %%mm4, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	337 "punpcklwd %%mm3, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	338 "pmullw _MMX_Ycoeff, %%mm7\n" // lum4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	339 "punpckhwd %%mm3, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	340
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	341 "movq %%mm4, (%3)\n" // write row1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	342 "movq %%mm5, 8(%3)\n" // write row1
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	343
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	344 "movq %%mm6, %%mm4\n" // Lum3
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	345 "paddw %%mm0, %%mm6\n" // Lum3 +blue
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	346
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	347 "movq %%mm4, %%mm5\n" // Lum3
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	348 "paddw %%mm1, %%mm4\n" // Lum3 +red
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	349 "paddw %%mm2, %%mm5\n" // Lum3 +green
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	350 "psraw $6, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	351 "movq %%mm7, %%mm3\n" // Lum4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	352 "psraw $6, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	353 "paddw %%mm0, %%mm7\n" // Lum4 +blue
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	354 "psraw $6, %%mm6\n" // Lum3 +blue
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	355 "movq %%mm3, %%mm0\n" // Lum4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	356 "packuswb %%mm4, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	357 "paddw %%mm1, %%mm3\n" // Lum4 +red
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	358 "packuswb %%mm5, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	359 "paddw %%mm2, %%mm0\n" // Lum4 +green
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	360 "packuswb %%mm6, %%mm6\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	361 "punpcklbw %%mm4, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	362 "punpcklbw %%mm5, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	363 "punpcklbw %%mm6, %%mm6\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	364 "psllw $3, %%mm5\n" // GREEN 3
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	365 "pand _MMX_red565, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	366 "psraw $6, %%mm3\n" // psr 6
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	367 "psraw $6, %%mm0\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	368 "pand _MMX_red565, %%mm6\n" // BLUE
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	369 "pand _MMX_grn565, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	370 "psrlw $11, %%mm6\n" // BLUE 3
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	371 "por %%mm5, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	372 "psraw $6, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	373 "por %%mm6, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	374 "packuswb %%mm3, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	375 "packuswb %%mm0, %%mm0\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	376 "packuswb %%mm7, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	377 "punpcklbw %%mm3, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	378 "punpcklbw %%mm0, %%mm0\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	379 "punpcklbw %%mm7, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	380 "pand _MMX_red565, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	381 "pand _MMX_red565, %%mm7\n" // BLUE
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	382 "psllw $3, %%mm0\n" // GREEN 4
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	383 "psrlw $11, %%mm7\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	384 "pand _MMX_grn565, %%mm0\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	385 "por %%mm7, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	386 "por %%mm0, %%mm3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	387
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	388 "movq %%mm4, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	389
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	390 "punpcklwd %%mm3, %%mm4\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	391 "punpckhwd %%mm3, %%mm5\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	392
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	393 "movq %%mm4, (%5)\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	394 "movq %%mm5, 8(%5)\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	395
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	396 "addl $8, %6\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	397 "addl $8, %2\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	398 "addl $4, %%ebx\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	399 "addl $4, %1\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	400 "cmpl %4, %6\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	401 "leal 16(%3), %3\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	402 "leal 16(%5),%5\n" // row2+16
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	403
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	404
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	405 "jl 1b\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	406 "addl %4, %2\n" // lum += cols
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	407 "addl %8, %3\n" // row1+= mod
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	408 "addl %8, %5\n" // row2+= mod
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	409 "movl $0, %6\n" // x=0
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	410 "cmpl %7, %2\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	411 "jl 1b\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	412 "emms\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	413 "popl %%ebx\n"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	414 :
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	415 :"m" (cr), "r"(cb),"r"(lum),
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	416 "r"(row1),"r"(cols),"r"(row2),"m"(x),"m"(y),"m"(mod)
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	417 : "%ebx"
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	418 );
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	419 }
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	420
74212992fb08 Initial revision Sam Lantinga <slouken@lokigames.com> parents: diff changeset	421 #endif /* GCC i386 inline assembly */

Mercurial > sdl-ios-xcode

annotate src/video/SDL_yuv_mmx.c @ 869:ae4ab3ac89a9