x86_64 - support for AVX instructions
[dragonfly.git] / sys / cpu / x86_64 / include / npx.h
1 /*-
2  * Copyright (c) 1990 The Regents of the University of California.
3  * Copyright (c) 2008 The DragonFly Project.
4  * All rights reserved.
5  *
6  * This code is derived from software contributed to Berkeley by
7  * William Jolitz.
8  *
9  * Redistribution and use in source and binary forms, with or without
10  * modification, are permitted provided that the following conditions
11  * are met:
12  * 1. Redistributions of source code must retain the above copyright
13  *    notice, this list of conditions and the following disclaimer.
14  * 2. Redistributions in binary form must reproduce the above copyright
15  *    notice, this list of conditions and the following disclaimer in the
16  *    documentation and/or other materials provided with the distribution.
17  * 3. All advertising materials mentioning features or use of this software
18  *    must display the following acknowledgement:
19  *      This product includes software developed by the University of
20  *      California, Berkeley and its contributors.
21  * 4. Neither the name of the University nor the names of its contributors
22  *    may be used to endorse or promote products derived from this software
23  *    without specific prior written permission.
24  *
25  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
26  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
27  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
28  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
29  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
30  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
31  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
32  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
33  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
34  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
35  * SUCH DAMAGE.
36  *
37  *      from: @(#)npx.h 5.3 (Berkeley) 1/18/91
38  * $FreeBSD: src/sys/i386/include/npx.h,v 1.18.2.1 2001/08/15 01:23:52 peter Exp $
39  */
40
41 /*
42  * 287/387 NPX Coprocessor Data Structures and Constants
43  * W. Jolitz 1/90
44  */
45
46 #ifndef _CPU_NPX_H_
47 #define _CPU_NPX_H_
48
49 #include "opt_cpu.h"
50
51 #ifndef _SYS_TYPES_H_
52 #include <sys/types.h>
53 #endif
54
55 /* Environment information of floating point unit */
56 struct  env87 {
57         int32_t en_cw;          /* control word (16bits) */
58         int32_t en_sw;          /* status word (16bits) */
59         int32_t en_tw;          /* tag word (16bits) */
60         int32_t en_fip;         /* floating point instruction pointer */
61         u_short en_fcs;         /* floating code segment selector */
62         u_short en_opcode;      /* opcode last executed (11 bits ) */
63         int32_t en_foo;         /* floating operand offset */
64         int32_t en_fos;         /* floating operand segment selector */
65 };
66
67 /* Contents of each floating point accumulator */
68 struct  fpacc87 {
69 #ifdef dontdef /* too unportable */
70         u_int32_t fp_mantlo;    /* mantissa low (31:0) */
71         u_int32_t fp_manthi;    /* mantissa high (63:32) */
72         int     fp_exp:15;      /* exponent */
73         int     fp_sgn:1;       /* mantissa sign */
74 #else
75         u_char  fp_bytes[10];
76 #endif
77 };
78
79 /* Floating point context */
80 struct  save87 {
81         struct  env87 sv_env;   /* floating point control/status */
82         struct  fpacc87 sv_ac[8];       /* accumulator contents, 0-7 */
83         u_int32_t       sv_unused001;
84         /*
85          * Bogus padding for emulators.  Emulators should use their own
86          * struct and arrange to store into this struct (ending here)
87          * before it is inspected for ptracing or for core dumps.  Some
88          * emulators overwrite the whole struct.  We have no good way of
89          * knowing how much padding to leave.  Leave just enough for the
90          * GPL emulator's i387_union (176 bytes total).
91          */
92         u_char  sv_pad[64];     /* padding; used by emulators */
93 };
94
95 struct  envxmm {
96         u_int16_t       en_cw;          /* control word (16bits) */
97         u_int16_t       en_sw;          /* status word (16bits) */
98         u_int16_t       en_tw;          /* tag word (16bits) */
99         u_int16_t       en_opcode;      /* opcode last executed (11 bits ) */
100         u_int32_t       en_fip;         /* floating point instruction pointer */
101         u_int16_t       en_fcs;         /* floating code segment selector */
102         u_int16_t       en_pad0;        /* padding */
103         u_int32_t       en_foo;         /* floating operand offset */
104         u_int16_t       en_fos;         /* floating operand segment selector */
105         u_int16_t       en_pad1;        /* padding */
106         u_int32_t       en_mxcsr;       /* SSE sontorol/status register */
107         u_int32_t       en_pad2;        /* padding */
108 };
109
110 /* Contents of each SSE extended accumulator */
111 struct  xmmacc {
112         u_char  xmm_bytes[16];
113 };
114
115 /*
116  * savexmm is a 512-byte structure
117  */
118 struct  savexmm {
119         struct  envxmm  sv_env;                 /* 32 */
120         struct {
121                 struct fpacc87  fp_acc;         /* 10 */
122                 u_char          fp_pad[6];      /* 6  (padding) */
123         } sv_fp[8];
124         struct xmmacc   sv_xmm[8];              /* 128 */
125         u_int32_t       sv_unused001;
126         u_char sv_pad[220];
127 } __attribute__((aligned(16)));
128
129 #ifndef  CPU_DISABLE_AVX
130 struct  saveymm {
131         u_char xsavedata[832];
132 } __attribute__((aligned(64)));
133
134 #endif
135
136 union   savefpu {
137         struct  save87  sv_87;
138         struct  savexmm sv_xmm;
139 #ifndef CPU_DISABLE_AVX
140         struct  saveymm sv_ymm;
141 #endif
142 };
143
144 /*
145  * The hardware default control word for i387's and later coprocessors is
146  * 0x37F, giving:
147  *
148  *      round to nearest
149  *      64-bit precision
150  *      all exceptions masked.
151  *
152  * We modify the affine mode bit and precision bits in this to give:
153  *
154  *      affine mode for 287's (if they work at all) (1 in bitfield 1<<12)
155  *      53-bit precision (2 in bitfield 3<<8)
156  *
157  * 64-bit precision often gives bad results with high level languages
158  * because it makes the results of calculations depend on whether
159  * intermediate values are stored in memory or in FPU registers.
160  */
161 #define __INITIAL_NPXCW__       0x127F
162
163 #define __INITIAL_FPUCW__       0x037F  /* used by libm/arch/x86_64/fenv.c */
164 #define __INITIAL_FPUCW_I386__  0x127F
165 #define __INITIAL_MXCSR__       0x1F80  /* used by libm/arch/x86_64/fenv.c */
166 #define __INITIAL_MXCSR_MASK__  0xFFBF
167
168 #ifdef _KERNEL
169
170 struct proc;
171 struct trapframe;
172
173 void    npxexit (void);
174 void    npxinit (u_short control);
175 void    npxsave (union savefpu *addr);
176 #endif
177
178 #endif /* !_CPU_NPX_H_ */