]> icculus.org git repositories - icculus/iodoom3.git/blob - neo/idlib/math/Simd_SSE.h
hello world
[icculus/iodoom3.git] / neo / idlib / math / Simd_SSE.h
1 /*
2 ===========================================================================
3
4 Doom 3 GPL Source Code
5 Copyright (C) 1999-2011 id Software LLC, a ZeniMax Media company. 
6
7 This file is part of the Doom 3 GPL Source Code (?Doom 3 Source Code?).  
8
9 Doom 3 Source Code is free software: you can redistribute it and/or modify
10 it under the terms of the GNU General Public License as published by
11 the Free Software Foundation, either version 3 of the License, or
12 (at your option) any later version.
13
14 Doom 3 Source Code is distributed in the hope that it will be useful,
15 but WITHOUT ANY WARRANTY; without even the implied warranty of
16 MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17 GNU General Public License for more details.
18
19 You should have received a copy of the GNU General Public License
20 along with Doom 3 Source Code.  If not, see <http://www.gnu.org/licenses/>.
21
22 In addition, the Doom 3 Source Code is also subject to certain additional terms. You should have received a copy of these additional terms immediately following the terms and conditions of the GNU General Public License which accompanied the Doom 3 Source Code.  If not, please request a copy in writing from id Software at the address below.
23
24 If you have questions concerning this license or the applicable additional terms, you may contact in writing id Software LLC, c/o ZeniMax Media Inc., Suite 120, Rockville, Maryland 20850 USA.
25
26 ===========================================================================
27 */
28
29 #ifndef __MATH_SIMD_SSE_H__
30 #define __MATH_SIMD_SSE_H__
31
32 /*
33 ===============================================================================
34
35         SSE implementation of idSIMDProcessor
36
37 ===============================================================================
38 */
39
40 class idSIMD_SSE : public idSIMD_MMX {
41 public:
42 #if defined(MACOS_X) && defined(__i386__)
43         virtual const char * VPCALL GetName( void ) const;
44         virtual void VPCALL Dot( float *dst,                    const idPlane &constant,const idDrawVert *src,  const int count );      
45         virtual void VPCALL MinMax( idVec3 &min,                idVec3 &max,                    const idDrawVert *src,  const int *indexes,             const int count );      
46         virtual void VPCALL Dot( float *dst,                    const idVec3 &constant, const idPlane *src,             const int count );      
47
48 #elif defined(_WIN32)
49         virtual const char * VPCALL GetName( void ) const;
50
51         virtual void VPCALL Add( float *dst,                    const float constant,   const float *src,               const int count );
52         virtual void VPCALL Add( float *dst,                    const float *src0,              const float *src1,              const int count );
53         virtual void VPCALL Sub( float *dst,                    const float constant,   const float *src,               const int count );
54         virtual void VPCALL Sub( float *dst,                    const float *src0,              const float *src1,              const int count );
55         virtual void VPCALL Mul( float *dst,                    const float constant,   const float *src,               const int count );
56         virtual void VPCALL Mul( float *dst,                    const float *src0,              const float *src1,              const int count );
57         virtual void VPCALL Div( float *dst,                    const float constant,   const float *src,               const int count );
58         virtual void VPCALL Div( float *dst,                    const float *src0,              const float *src1,              const int count );
59         virtual void VPCALL MulAdd( float *dst,                 const float constant,   const float *src,               const int count );
60         virtual void VPCALL MulAdd( float *dst,                 const float *src0,              const float *src1,              const int count );
61         virtual void VPCALL MulSub( float *dst,                 const float constant,   const float *src,               const int count );
62         virtual void VPCALL MulSub( float *dst,                 const float *src0,              const float *src1,              const int count );
63
64         virtual void VPCALL Dot( float *dst,                    const idVec3 &constant, const idVec3 *src,              const int count );
65         virtual void VPCALL Dot( float *dst,                    const idVec3 &constant, const idPlane *src,             const int count );
66         virtual void VPCALL Dot( float *dst,                    const idVec3 &constant, const idDrawVert *src,  const int count );
67         virtual void VPCALL Dot( float *dst,                    const idPlane &constant,const idVec3 *src,              const int count );
68         virtual void VPCALL Dot( float *dst,                    const idPlane &constant,const idPlane *src,             const int count );
69         virtual void VPCALL Dot( float *dst,                    const idPlane &constant,const idDrawVert *src,  const int count );
70         virtual void VPCALL Dot( float *dst,                    const idVec3 *src0,             const idVec3 *src1,             const int count );
71         virtual void VPCALL Dot( float &dot,                    const float *src1,              const float *src2,              const int count );
72
73         virtual void VPCALL CmpGT( byte *dst,                   const float *src0,              const float constant,   const int count );
74         virtual void VPCALL CmpGT( byte *dst,                   const byte bitNum,              const float *src0,              const float constant,   const int count );
75         virtual void VPCALL CmpGE( byte *dst,                   const float *src0,              const float constant,   const int count );
76         virtual void VPCALL CmpGE( byte *dst,                   const byte bitNum,              const float *src0,              const float constant,   const int count );
77         virtual void VPCALL CmpLT( byte *dst,                   const float *src0,              const float constant,   const int count );
78         virtual void VPCALL CmpLT( byte *dst,                   const byte bitNum,              const float *src0,              const float constant,   const int count );
79         virtual void VPCALL CmpLE( byte *dst,                   const float *src0,              const float constant,   const int count );
80         virtual void VPCALL CmpLE( byte *dst,                   const byte bitNum,              const float *src0,              const float constant,   const int count );
81
82         virtual void VPCALL MinMax( float &min,                 float &max,                             const float *src,               const int count );
83         virtual void VPCALL MinMax( idVec2 &min,                idVec2 &max,                    const idVec2 *src,              const int count );
84         virtual void VPCALL MinMax( idVec3 &min,                idVec3 &max,                    const idVec3 *src,              const int count );
85         virtual void VPCALL MinMax( idVec3 &min,                idVec3 &max,                    const idDrawVert *src,  const int count );
86         virtual void VPCALL MinMax( idVec3 &min,                idVec3 &max,                    const idDrawVert *src,  const int *indexes,             const int count );
87
88         virtual void VPCALL Clamp( float *dst,                  const float *src,               const float min,                const float max,                const int count );
89         virtual void VPCALL ClampMin( float *dst,               const float *src,               const float min,                const int count );
90         virtual void VPCALL ClampMax( float *dst,               const float *src,               const float max,                const int count );
91
92         virtual void VPCALL Zero16( float *dst,                 const int count );
93         virtual void VPCALL Negate16( float *dst,               const int count );
94         virtual void VPCALL Copy16( float *dst,                 const float *src,               const int count );
95         virtual void VPCALL Add16( float *dst,                  const float *src1,              const float *src2,              const int count );
96         virtual void VPCALL Sub16( float *dst,                  const float *src1,              const float *src2,              const int count );
97         virtual void VPCALL Mul16( float *dst,                  const float *src1,              const float constant,   const int count );
98         virtual void VPCALL AddAssign16( float *dst,    const float *src,               const int count );
99         virtual void VPCALL SubAssign16( float *dst,    const float *src,               const int count );
100         virtual void VPCALL MulAssign16( float *dst,    const float constant,   const int count );
101
102         virtual void VPCALL MatX_MultiplyVecX( idVecX &dst, const idMatX &mat, const idVecX &vec );
103         virtual void VPCALL MatX_MultiplyAddVecX( idVecX &dst, const idMatX &mat, const idVecX &vec );
104         virtual void VPCALL MatX_MultiplySubVecX( idVecX &dst, const idMatX &mat, const idVecX &vec );
105         virtual void VPCALL MatX_TransposeMultiplyVecX( idVecX &dst, const idMatX &mat, const idVecX &vec );
106         virtual void VPCALL MatX_TransposeMultiplyAddVecX( idVecX &dst, const idMatX &mat, const idVecX &vec );
107         virtual void VPCALL MatX_TransposeMultiplySubVecX( idVecX &dst, const idMatX &mat, const idVecX &vec );
108         virtual void VPCALL MatX_MultiplyMatX( idMatX &dst, const idMatX &m1, const idMatX &m2 );
109         virtual void VPCALL MatX_TransposeMultiplyMatX( idMatX &dst, const idMatX &m1, const idMatX &m2 );
110         virtual void VPCALL MatX_LowerTriangularSolve( const idMatX &L, float *x, const float *b, const int n, int skip = 0 );
111         virtual void VPCALL MatX_LowerTriangularSolveTranspose( const idMatX &L, float *x, const float *b, const int n );
112         virtual bool VPCALL MatX_LDLTFactor( idMatX &mat, idVecX &invDiag, const int n );
113
114         virtual void VPCALL BlendJoints( idJointQuat *joints, const idJointQuat *blendJoints, const float lerp, const int *index, const int numJoints );
115         virtual void VPCALL ConvertJointQuatsToJointMats( idJointMat *jointMats, const idJointQuat *jointQuats, const int numJoints );
116         virtual void VPCALL ConvertJointMatsToJointQuats( idJointQuat *jointQuats, const idJointMat *jointMats, const int numJoints );
117         virtual void VPCALL TransformJoints( idJointMat *jointMats, const int *parents, const int firstJoint, const int lastJoint );
118         virtual void VPCALL UntransformJoints( idJointMat *jointMats, const int *parents, const int firstJoint, const int lastJoint );
119         virtual void VPCALL TransformVerts( idDrawVert *verts, const int numVerts, const idJointMat *joints, const idVec4 *weights, const int *index, const int numWeights );
120         virtual void VPCALL TracePointCull( byte *cullBits, byte &totalOr, const float radius, const idPlane *planes, const idDrawVert *verts, const int numVerts );
121         virtual void VPCALL DecalPointCull( byte *cullBits, const idPlane *planes, const idDrawVert *verts, const int numVerts );
122         virtual void VPCALL OverlayPointCull( byte *cullBits, idVec2 *texCoords, const idPlane *planes, const idDrawVert *verts, const int numVerts );
123         virtual void VPCALL DeriveTriPlanes( idPlane *planes, const idDrawVert *verts, const int numVerts, const int *indexes, const int numIndexes );
124         virtual void VPCALL DeriveTangents( idPlane *planes, idDrawVert *verts, const int numVerts, const int *indexes, const int numIndexes );
125         virtual void VPCALL DeriveUnsmoothedTangents( idDrawVert *verts, const dominantTri_s *dominantTris, const int numVerts );
126         virtual void VPCALL NormalizeTangents( idDrawVert *verts, const int numVerts );
127         virtual void VPCALL CreateTextureSpaceLightVectors( idVec3 *lightVectors, const idVec3 &lightOrigin, const idDrawVert *verts, const int numVerts, const int *indexes, const int numIndexes );
128         virtual void VPCALL CreateSpecularTextureCoords( idVec4 *texCoords, const idVec3 &lightOrigin, const idVec3 &viewOrigin, const idDrawVert *verts, const int numVerts, const int *indexes, const int numIndexes );
129         virtual int  VPCALL CreateShadowCache( idVec4 *vertexCache, int *vertRemap, const idVec3 &lightOrigin, const idDrawVert *verts, const int numVerts );
130         virtual int  VPCALL CreateVertexProgramShadowCache( idVec4 *vertexCache, const idDrawVert *verts, const int numVerts );
131
132         virtual void VPCALL UpSamplePCMTo44kHz( float *dest, const short *pcm, const int numSamples, const int kHz, const int numChannels );
133         virtual void VPCALL UpSampleOGGTo44kHz( float *dest, const float * const *ogg, const int numSamples, const int kHz, const int numChannels );
134         virtual void VPCALL MixSoundTwoSpeakerMono( float *mixBuffer, const float *samples, const int numSamples, const float lastV[2], const float currentV[2] );
135         virtual void VPCALL MixSoundTwoSpeakerStereo( float *mixBuffer, const float *samples, const int numSamples, const float lastV[2], const float currentV[2] );
136         virtual void VPCALL MixSoundSixSpeakerMono( float *mixBuffer, const float *samples, const int numSamples, const float lastV[6], const float currentV[6] );
137         virtual void VPCALL MixSoundSixSpeakerStereo( float *mixBuffer, const float *samples, const int numSamples, const float lastV[6], const float currentV[6] );
138         virtual void VPCALL MixedSoundToSamples( short *samples, const float *mixBuffer, const int numSamples );
139
140 #endif
141 };
142
143 #endif /* !__MATH_SIMD_SSE_H__ */