nfe(4): Always set high part of the address if the NIC supports
[dragonfly.git] / sys / dev / netif / nfe / if_nfe.c
1 /*      $OpenBSD: if_nfe.c,v 1.63 2006/06/17 18:00:43 brad Exp $        */
2 /*      $DragonFly: src/sys/dev/netif/nfe/if_nfe.c,v 1.46 2008/10/28 07:30:49 sephe Exp $       */
3
4 /*
5  * Copyright (c) 2006 The DragonFly Project.  All rights reserved.
6  * 
7  * This code is derived from software contributed to The DragonFly Project
8  * by Sepherosa Ziehau <sepherosa@gmail.com> and
9  * Matthew Dillon <dillon@apollo.backplane.com>
10  * 
11  * Redistribution and use in source and binary forms, with or without
12  * modification, are permitted provided that the following conditions
13  * are met:
14  * 
15  * 1. Redistributions of source code must retain the above copyright
16  *    notice, this list of conditions and the following disclaimer.
17  * 2. Redistributions in binary form must reproduce the above copyright
18  *    notice, this list of conditions and the following disclaimer in
19  *    the documentation and/or other materials provided with the
20  *    distribution.
21  * 3. Neither the name of The DragonFly Project nor the names of its
22  *    contributors may be used to endorse or promote products derived
23  *    from this software without specific, prior written permission.
24  * 
25  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
26  * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
27  * LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS
28  * FOR A PARTICULAR PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE
29  * COPYRIGHT HOLDERS OR CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT,
30  * INCIDENTAL, SPECIAL, EXEMPLARY OR CONSEQUENTIAL DAMAGES (INCLUDING,
31  * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
32  * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED
33  * AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY,
34  * OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT
35  * OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
36  * SUCH DAMAGE.
37  */
38
39 /*
40  * Copyright (c) 2006 Damien Bergamini <damien.bergamini@free.fr>
41  * Copyright (c) 2005, 2006 Jonathan Gray <jsg@openbsd.org>
42  *
43  * Permission to use, copy, modify, and distribute this software for any
44  * purpose with or without fee is hereby granted, provided that the above
45  * copyright notice and this permission notice appear in all copies.
46  *
47  * THE SOFTWARE IS PROVIDED "AS IS" AND THE AUTHOR DISCLAIMS ALL WARRANTIES
48  * WITH REGARD TO THIS SOFTWARE INCLUDING ALL IMPLIED WARRANTIES OF
49  * MERCHANTABILITY AND FITNESS. IN NO EVENT SHALL THE AUTHOR BE LIABLE FOR
50  * ANY SPECIAL, DIRECT, INDIRECT, OR CONSEQUENTIAL DAMAGES OR ANY DAMAGES
51  * WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN
52  * ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF
53  * OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.
54  */
55
56 /* Driver for NVIDIA nForce MCP Fast Ethernet and Gigabit Ethernet */
57
58 #include "opt_polling.h"
59
60 #include <sys/param.h>
61 #include <sys/endian.h>
62 #include <sys/kernel.h>
63 #include <sys/bus.h>
64 #include <sys/interrupt.h>
65 #include <sys/proc.h>
66 #include <sys/rman.h>
67 #include <sys/serialize.h>
68 #include <sys/socket.h>
69 #include <sys/sockio.h>
70 #include <sys/sysctl.h>
71
72 #include <net/ethernet.h>
73 #include <net/if.h>
74 #include <net/bpf.h>
75 #include <net/if_arp.h>
76 #include <net/if_dl.h>
77 #include <net/if_media.h>
78 #include <net/ifq_var.h>
79 #include <net/if_types.h>
80 #include <net/if_var.h>
81 #include <net/vlan/if_vlan_var.h>
82 #include <net/vlan/if_vlan_ether.h>
83
84 #include <bus/pci/pcireg.h>
85 #include <bus/pci/pcivar.h>
86 #include <bus/pci/pcidevs.h>
87
88 #include <dev/netif/mii_layer/mii.h>
89 #include <dev/netif/mii_layer/miivar.h>
90
91 #include "miibus_if.h"
92
93 #include <dev/netif/nfe/if_nfereg.h>
94 #include <dev/netif/nfe/if_nfevar.h>
95
96 #define NFE_CSUM
97 #define NFE_CSUM_FEATURES       (CSUM_IP | CSUM_TCP | CSUM_UDP)
98
99 static int      nfe_probe(device_t);
100 static int      nfe_attach(device_t);
101 static int      nfe_detach(device_t);
102 static void     nfe_shutdown(device_t);
103 static int      nfe_resume(device_t);
104 static int      nfe_suspend(device_t);
105
106 static int      nfe_miibus_readreg(device_t, int, int);
107 static void     nfe_miibus_writereg(device_t, int, int, int);
108 static void     nfe_miibus_statchg(device_t);
109
110 #ifdef DEVICE_POLLING
111 static void     nfe_poll(struct ifnet *, enum poll_cmd, int);
112 #endif
113 static void     nfe_intr(void *);
114 static int      nfe_ioctl(struct ifnet *, u_long, caddr_t, struct ucred *);
115 static int      nfe_rxeof(struct nfe_softc *);
116 static int      nfe_txeof(struct nfe_softc *, int);
117 static int      nfe_encap(struct nfe_softc *, struct nfe_tx_ring *,
118                           struct mbuf *);
119 static void     nfe_start(struct ifnet *);
120 static void     nfe_watchdog(struct ifnet *);
121 static void     nfe_init(void *);
122 static void     nfe_stop(struct nfe_softc *);
123 static struct nfe_jbuf *nfe_jalloc(struct nfe_softc *);
124 static void     nfe_jfree(void *);
125 static void     nfe_jref(void *);
126 static int      nfe_jpool_alloc(struct nfe_softc *, struct nfe_rx_ring *);
127 static void     nfe_jpool_free(struct nfe_softc *, struct nfe_rx_ring *);
128 static int      nfe_alloc_rx_ring(struct nfe_softc *, struct nfe_rx_ring *);
129 static void     nfe_reset_rx_ring(struct nfe_softc *, struct nfe_rx_ring *);
130 static int      nfe_init_rx_ring(struct nfe_softc *, struct nfe_rx_ring *);
131 static void     nfe_free_rx_ring(struct nfe_softc *, struct nfe_rx_ring *);
132 static int      nfe_alloc_tx_ring(struct nfe_softc *, struct nfe_tx_ring *);
133 static void     nfe_reset_tx_ring(struct nfe_softc *, struct nfe_tx_ring *);
134 static int      nfe_init_tx_ring(struct nfe_softc *, struct nfe_tx_ring *);
135 static void     nfe_free_tx_ring(struct nfe_softc *, struct nfe_tx_ring *);
136 static int      nfe_ifmedia_upd(struct ifnet *);
137 static void     nfe_ifmedia_sts(struct ifnet *, struct ifmediareq *);
138 static void     nfe_setmulti(struct nfe_softc *);
139 static void     nfe_get_macaddr(struct nfe_softc *, uint8_t *);
140 static void     nfe_set_macaddr(struct nfe_softc *, const uint8_t *);
141 static void     nfe_powerup(device_t);
142 static void     nfe_mac_reset(struct nfe_softc *);
143 static void     nfe_tick(void *);
144 static void     nfe_buf_dma_addr(void *, bus_dma_segment_t *, int, bus_size_t,
145                                  int);
146 static void     nfe_set_paddr_rxdesc(struct nfe_softc *, struct nfe_rx_ring *,
147                                      int, bus_addr_t);
148 static void     nfe_set_ready_rxdesc(struct nfe_softc *, struct nfe_rx_ring *,
149                                      int);
150 static int      nfe_newbuf_std(struct nfe_softc *, struct nfe_rx_ring *, int,
151                                int);
152 static int      nfe_newbuf_jumbo(struct nfe_softc *, struct nfe_rx_ring *, int,
153                                  int);
154 static void     nfe_enable_intrs(struct nfe_softc *);
155 static void     nfe_disable_intrs(struct nfe_softc *);
156
157 static int      nfe_sysctl_imtime(SYSCTL_HANDLER_ARGS);
158
159 #define NFE_DEBUG
160 #ifdef NFE_DEBUG
161
162 static int      nfe_debug = 0;
163 static int      nfe_rx_ring_count = NFE_RX_RING_DEF_COUNT;
164 static int      nfe_tx_ring_count = NFE_TX_RING_DEF_COUNT;
165 /* hw timer simulated interrupt moderation @8000Hz */
166 static int      nfe_imtime = -125;
167
168 TUNABLE_INT("hw.nfe.rx_ring_count", &nfe_rx_ring_count);
169 TUNABLE_INT("hw.nfe.tx_ring_count", &nfe_tx_ring_count);
170 TUNABLE_INT("hw.nfe.imtimer", &nfe_imtime);
171 TUNABLE_INT("hw.nfe.debug", &nfe_debug);
172
173 #define DPRINTF(sc, fmt, ...) do {              \
174         if ((sc)->sc_debug) {                   \
175                 if_printf(&(sc)->arpcom.ac_if,  \
176                           fmt, __VA_ARGS__);    \
177         }                                       \
178 } while (0)
179
180 #define DPRINTFN(sc, lv, fmt, ...) do {         \
181         if ((sc)->sc_debug >= (lv)) {           \
182                 if_printf(&(sc)->arpcom.ac_if,  \
183                           fmt, __VA_ARGS__);    \
184         }                                       \
185 } while (0)
186
187 #else   /* !NFE_DEBUG */
188
189 #define DPRINTF(sc, fmt, ...)
190 #define DPRINTFN(sc, lv, fmt, ...)
191
192 #endif  /* NFE_DEBUG */
193
194 struct nfe_dma_ctx {
195         int                     nsegs;
196         bus_dma_segment_t       *segs;
197 };
198
199 static const struct nfe_dev {
200         uint16_t        vid;
201         uint16_t        did;
202         const char      *desc;
203 } nfe_devices[] = {
204         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_NFORCE_LAN,
205           "NVIDIA nForce Fast Ethernet" },
206
207         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_NFORCE2_LAN,
208           "NVIDIA nForce2 Fast Ethernet" },
209
210         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_NFORCE3_LAN1,
211           "NVIDIA nForce3 Gigabit Ethernet" },
212
213         /* XXX TGEN the next chip can also be found in the nForce2 Ultra 400Gb
214            chipset, and possibly also the 400R; it might be both nForce2- and
215            nForce3-based boards can use the same MCPs (= southbridges) */
216         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_NFORCE3_LAN2,
217           "NVIDIA nForce3 Gigabit Ethernet" },
218
219         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_NFORCE3_LAN3,
220           "NVIDIA nForce3 Gigabit Ethernet" },
221
222         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_NFORCE3_LAN4,
223           "NVIDIA nForce3 Gigabit Ethernet" },
224
225         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_NFORCE3_LAN5,
226           "NVIDIA nForce3 Gigabit Ethernet" },
227
228         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_CK804_LAN1,
229           "NVIDIA CK804 Gigabit Ethernet" },
230
231         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_CK804_LAN2,
232           "NVIDIA CK804 Gigabit Ethernet" },
233
234         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP04_LAN1,
235           "NVIDIA MCP04 Gigabit Ethernet" },
236
237         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP04_LAN2,
238           "NVIDIA MCP04 Gigabit Ethernet" },
239
240         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP51_LAN1,
241           "NVIDIA MCP51 Gigabit Ethernet" },
242
243         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP51_LAN2,
244           "NVIDIA MCP51 Gigabit Ethernet" },
245
246         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP55_LAN1,
247           "NVIDIA MCP55 Gigabit Ethernet" },
248
249         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP55_LAN2,
250           "NVIDIA MCP55 Gigabit Ethernet" },
251
252         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP61_LAN1,
253           "NVIDIA MCP61 Gigabit Ethernet" },
254
255         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP61_LAN2,
256           "NVIDIA MCP61 Gigabit Ethernet" },
257
258         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP61_LAN3,
259           "NVIDIA MCP61 Gigabit Ethernet" },
260
261         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP61_LAN4,
262           "NVIDIA MCP61 Gigabit Ethernet" },
263
264         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP65_LAN1,
265           "NVIDIA MCP65 Gigabit Ethernet" },
266
267         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP65_LAN2,
268           "NVIDIA MCP65 Gigabit Ethernet" },
269
270         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP65_LAN3,
271           "NVIDIA MCP65 Gigabit Ethernet" },
272
273         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP65_LAN4,
274           "NVIDIA MCP65 Gigabit Ethernet" },
275
276         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP67_LAN1,
277           "NVIDIA MCP67 Gigabit Ethernet" },
278
279         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP67_LAN2,
280           "NVIDIA MCP67 Gigabit Ethernet" },
281
282         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP67_LAN3,
283           "NVIDIA MCP67 Gigabit Ethernet" },
284
285         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP67_LAN4,
286           "NVIDIA MCP67 Gigabit Ethernet" },
287
288         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP73_LAN1,
289           "NVIDIA MCP73 Gigabit Ethernet" },
290
291         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP73_LAN2,
292           "NVIDIA MCP73 Gigabit Ethernet" },
293
294         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP73_LAN3,
295           "NVIDIA MCP73 Gigabit Ethernet" },
296
297         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP73_LAN4,
298           "NVIDIA MCP73 Gigabit Ethernet" },
299
300         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP77_LAN1,
301           "NVIDIA MCP77 Gigabit Ethernet" },
302
303         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP77_LAN2,
304           "NVIDIA MCP77 Gigabit Ethernet" },
305
306         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP77_LAN3,
307           "NVIDIA MCP77 Gigabit Ethernet" },
308
309         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP77_LAN4,
310           "NVIDIA MCP77 Gigabit Ethernet" },
311
312         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP79_LAN1,
313           "NVIDIA MCP79 Gigabit Ethernet" },
314
315         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP79_LAN2,
316           "NVIDIA MCP79 Gigabit Ethernet" },
317
318         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP79_LAN3,
319           "NVIDIA MCP79 Gigabit Ethernet" },
320
321         { PCI_VENDOR_NVIDIA, PCI_PRODUCT_NVIDIA_MCP79_LAN4,
322           "NVIDIA MCP79 Gigabit Ethernet" },
323
324         { 0, 0, NULL }
325 };
326
327 static device_method_t nfe_methods[] = {
328         /* Device interface */
329         DEVMETHOD(device_probe,         nfe_probe),
330         DEVMETHOD(device_attach,        nfe_attach),
331         DEVMETHOD(device_detach,        nfe_detach),
332         DEVMETHOD(device_suspend,       nfe_suspend),
333         DEVMETHOD(device_resume,        nfe_resume),
334         DEVMETHOD(device_shutdown,      nfe_shutdown),
335
336         /* Bus interface */
337         DEVMETHOD(bus_print_child,      bus_generic_print_child),
338         DEVMETHOD(bus_driver_added,     bus_generic_driver_added),
339
340         /* MII interface */
341         DEVMETHOD(miibus_readreg,       nfe_miibus_readreg),
342         DEVMETHOD(miibus_writereg,      nfe_miibus_writereg),
343         DEVMETHOD(miibus_statchg,       nfe_miibus_statchg),
344
345         { 0, 0 }
346 };
347
348 static driver_t nfe_driver = {
349         "nfe",
350         nfe_methods,
351         sizeof(struct nfe_softc)
352 };
353
354 static devclass_t       nfe_devclass;
355
356 DECLARE_DUMMY_MODULE(if_nfe);
357 MODULE_DEPEND(if_nfe, miibus, 1, 1, 1);
358 DRIVER_MODULE(if_nfe, pci, nfe_driver, nfe_devclass, 0, 0);
359 DRIVER_MODULE(miibus, nfe, miibus_driver, miibus_devclass, 0, 0);
360
361 static int
362 nfe_probe(device_t dev)
363 {
364         const struct nfe_dev *n;
365         uint16_t vid, did;
366
367         vid = pci_get_vendor(dev);
368         did = pci_get_device(dev);
369         for (n = nfe_devices; n->desc != NULL; ++n) {
370                 if (vid == n->vid && did == n->did) {
371                         struct nfe_softc *sc = device_get_softc(dev);
372
373                         switch (did) {
374                         case PCI_PRODUCT_NVIDIA_NFORCE_LAN:
375                         case PCI_PRODUCT_NVIDIA_NFORCE2_LAN:
376                         case PCI_PRODUCT_NVIDIA_NFORCE3_LAN1:
377                                 sc->sc_caps = NFE_NO_PWRCTL |
378                                               NFE_FIX_EADDR;
379                                 break;
380                         case PCI_PRODUCT_NVIDIA_NFORCE3_LAN2:
381                         case PCI_PRODUCT_NVIDIA_NFORCE3_LAN3:
382                         case PCI_PRODUCT_NVIDIA_NFORCE3_LAN4:
383                         case PCI_PRODUCT_NVIDIA_NFORCE3_LAN5:
384                                 sc->sc_caps = NFE_JUMBO_SUP |
385                                               NFE_HW_CSUM |
386                                               NFE_NO_PWRCTL |
387                                               NFE_FIX_EADDR;
388                                 break;
389                         case PCI_PRODUCT_NVIDIA_MCP51_LAN1:
390                         case PCI_PRODUCT_NVIDIA_MCP51_LAN2:
391                                 sc->sc_caps = NFE_FIX_EADDR;
392                                 /* FALL THROUGH */
393                         case PCI_PRODUCT_NVIDIA_MCP61_LAN1:
394                         case PCI_PRODUCT_NVIDIA_MCP61_LAN2:
395                         case PCI_PRODUCT_NVIDIA_MCP61_LAN3:
396                         case PCI_PRODUCT_NVIDIA_MCP61_LAN4:
397                         case PCI_PRODUCT_NVIDIA_MCP67_LAN1:
398                         case PCI_PRODUCT_NVIDIA_MCP67_LAN2:
399                         case PCI_PRODUCT_NVIDIA_MCP67_LAN3:
400                         case PCI_PRODUCT_NVIDIA_MCP67_LAN4:
401                         case PCI_PRODUCT_NVIDIA_MCP73_LAN1:
402                         case PCI_PRODUCT_NVIDIA_MCP73_LAN2:
403                         case PCI_PRODUCT_NVIDIA_MCP73_LAN3:
404                         case PCI_PRODUCT_NVIDIA_MCP73_LAN4:
405                                 sc->sc_caps |= NFE_40BIT_ADDR;
406                                 break;
407                         case PCI_PRODUCT_NVIDIA_CK804_LAN1:
408                         case PCI_PRODUCT_NVIDIA_CK804_LAN2:
409                         case PCI_PRODUCT_NVIDIA_MCP04_LAN1:
410                         case PCI_PRODUCT_NVIDIA_MCP04_LAN2:
411                                 sc->sc_caps = NFE_JUMBO_SUP |
412                                               NFE_40BIT_ADDR |
413                                               NFE_HW_CSUM |
414                                               NFE_NO_PWRCTL |
415                                               NFE_FIX_EADDR;
416                                 break;
417                         case PCI_PRODUCT_NVIDIA_MCP65_LAN1:
418                         case PCI_PRODUCT_NVIDIA_MCP65_LAN2:
419                         case PCI_PRODUCT_NVIDIA_MCP65_LAN3:
420                         case PCI_PRODUCT_NVIDIA_MCP65_LAN4:
421                                 sc->sc_caps = NFE_JUMBO_SUP |
422                                               NFE_40BIT_ADDR;
423                                 break;
424                         case PCI_PRODUCT_NVIDIA_MCP55_LAN1:
425                         case PCI_PRODUCT_NVIDIA_MCP55_LAN2:
426                                 sc->sc_caps = NFE_JUMBO_SUP |
427                                               NFE_40BIT_ADDR |
428                                               NFE_HW_CSUM |
429                                               NFE_HW_VLAN |
430                                               NFE_FIX_EADDR;
431                                 break;
432                         case PCI_PRODUCT_NVIDIA_MCP77_LAN1:
433                         case PCI_PRODUCT_NVIDIA_MCP77_LAN2:
434                         case PCI_PRODUCT_NVIDIA_MCP77_LAN3:
435                         case PCI_PRODUCT_NVIDIA_MCP77_LAN4:
436                         case PCI_PRODUCT_NVIDIA_MCP79_LAN1:
437                         case PCI_PRODUCT_NVIDIA_MCP79_LAN2:
438                         case PCI_PRODUCT_NVIDIA_MCP79_LAN3:
439                         case PCI_PRODUCT_NVIDIA_MCP79_LAN4:
440                                 sc->sc_caps = NFE_40BIT_ADDR |
441                                               NFE_HW_CSUM;
442                                 break;
443                         }
444
445                         device_set_desc(dev, n->desc);
446                         device_set_async_attach(dev, TRUE);
447                         return 0;
448                 }
449         }
450         return ENXIO;
451 }
452
453 static int
454 nfe_attach(device_t dev)
455 {
456         struct nfe_softc *sc = device_get_softc(dev);
457         struct ifnet *ifp = &sc->arpcom.ac_if;
458         uint8_t eaddr[ETHER_ADDR_LEN];
459         bus_addr_t lowaddr;
460         int error;
461
462         if_initname(ifp, device_get_name(dev), device_get_unit(dev));
463         lwkt_serialize_init(&sc->sc_jbuf_serializer);
464
465         /*
466          * Initialize sysctl variables
467          */
468         sc->sc_rx_ring_count = nfe_rx_ring_count;
469         sc->sc_tx_ring_count = nfe_tx_ring_count;
470         sc->sc_debug = nfe_debug;
471         if (nfe_imtime < 0) {
472                 sc->sc_flags |= NFE_F_DYN_IM;
473                 sc->sc_imtime = -nfe_imtime;
474         } else {
475                 sc->sc_imtime = nfe_imtime;
476         }
477         sc->sc_irq_enable = NFE_IRQ_ENABLE(sc);
478
479         sc->sc_mem_rid = PCIR_BAR(0);
480
481         if (sc->sc_caps & NFE_40BIT_ADDR)
482                 sc->rxtxctl_desc = NFE_RXTX_DESC_V3;
483         else if (sc->sc_caps & NFE_JUMBO_SUP)
484                 sc->rxtxctl_desc = NFE_RXTX_DESC_V2;
485
486 #ifndef BURN_BRIDGES
487         if (pci_get_powerstate(dev) != PCI_POWERSTATE_D0) {
488                 uint32_t mem, irq;
489
490                 mem = pci_read_config(dev, sc->sc_mem_rid, 4);
491                 irq = pci_read_config(dev, PCIR_INTLINE, 4);
492
493                 device_printf(dev, "chip is in D%d power mode "
494                     "-- setting to D0\n", pci_get_powerstate(dev));
495
496                 pci_set_powerstate(dev, PCI_POWERSTATE_D0);
497
498                 pci_write_config(dev, sc->sc_mem_rid, mem, 4);
499                 pci_write_config(dev, PCIR_INTLINE, irq, 4);
500         }
501 #endif  /* !BURN_BRIDGE */
502
503         /* Enable bus mastering */
504         pci_enable_busmaster(dev);
505
506         /* Allocate IO memory */
507         sc->sc_mem_res = bus_alloc_resource_any(dev, SYS_RES_MEMORY,
508                                                 &sc->sc_mem_rid, RF_ACTIVE);
509         if (sc->sc_mem_res == NULL) {
510                 device_printf(dev, "cound not allocate io memory\n");
511                 return ENXIO;
512         }
513         sc->sc_memh = rman_get_bushandle(sc->sc_mem_res);
514         sc->sc_memt = rman_get_bustag(sc->sc_mem_res);
515
516         /* Allocate IRQ */
517         sc->sc_irq_rid = 0;
518         sc->sc_irq_res = bus_alloc_resource_any(dev, SYS_RES_IRQ,
519                                                 &sc->sc_irq_rid,
520                                                 RF_SHAREABLE | RF_ACTIVE);
521         if (sc->sc_irq_res == NULL) {
522                 device_printf(dev, "could not allocate irq\n");
523                 error = ENXIO;
524                 goto fail;
525         }
526
527         /* Disable WOL */
528         NFE_WRITE(sc, NFE_WOL_CTL, 0);
529
530         if ((sc->sc_caps & NFE_NO_PWRCTL) == 0)
531                 nfe_powerup(dev);
532
533         nfe_get_macaddr(sc, eaddr);
534
535         /*
536          * Allocate top level DMA tag
537          */
538         if (sc->sc_caps & NFE_40BIT_ADDR)
539                 lowaddr = NFE_BUS_SPACE_MAXADDR;
540         else
541                 lowaddr = BUS_SPACE_MAXADDR_32BIT;
542         error = bus_dma_tag_create(NULL,        /* parent */
543                         1, 0,                   /* alignment, boundary */
544                         lowaddr,                /* lowaddr */
545                         BUS_SPACE_MAXADDR,      /* highaddr */
546                         NULL, NULL,             /* filter, filterarg */
547                         BUS_SPACE_MAXSIZE_32BIT,/* maxsize */
548                         0,                      /* nsegments */
549                         BUS_SPACE_MAXSIZE_32BIT,/* maxsegsize */
550                         0,                      /* flags */
551                         &sc->sc_dtag);
552         if (error) {
553                 device_printf(dev, "could not allocate parent dma tag\n");
554                 goto fail;
555         }
556
557         /*
558          * Allocate Tx and Rx rings.
559          */
560         error = nfe_alloc_tx_ring(sc, &sc->txq);
561         if (error) {
562                 device_printf(dev, "could not allocate Tx ring\n");
563                 goto fail;
564         }
565
566         error = nfe_alloc_rx_ring(sc, &sc->rxq);
567         if (error) {
568                 device_printf(dev, "could not allocate Rx ring\n");
569                 goto fail;
570         }
571
572         /*
573          * Create sysctl tree
574          */
575         sysctl_ctx_init(&sc->sc_sysctl_ctx);
576         sc->sc_sysctl_tree = SYSCTL_ADD_NODE(&sc->sc_sysctl_ctx,
577                                              SYSCTL_STATIC_CHILDREN(_hw),
578                                              OID_AUTO,
579                                              device_get_nameunit(dev),
580                                              CTLFLAG_RD, 0, "");
581         if (sc->sc_sysctl_tree == NULL) {
582                 device_printf(dev, "can't add sysctl node\n");
583                 error = ENXIO;
584                 goto fail;
585         }
586         SYSCTL_ADD_PROC(&sc->sc_sysctl_ctx,
587                         SYSCTL_CHILDREN(sc->sc_sysctl_tree),
588                         OID_AUTO, "imtimer", CTLTYPE_INT | CTLFLAG_RW,
589                         sc, 0, nfe_sysctl_imtime, "I",
590                         "Interrupt moderation time (usec).  "
591                         "0 to disable interrupt moderation.");
592         SYSCTL_ADD_INT(&sc->sc_sysctl_ctx,
593                        SYSCTL_CHILDREN(sc->sc_sysctl_tree), OID_AUTO,
594                        "rx_ring_count", CTLFLAG_RD, &sc->sc_rx_ring_count,
595                        0, "RX ring count");
596         SYSCTL_ADD_INT(&sc->sc_sysctl_ctx,
597                        SYSCTL_CHILDREN(sc->sc_sysctl_tree), OID_AUTO,
598                        "tx_ring_count", CTLFLAG_RD, &sc->sc_tx_ring_count,
599                        0, "TX ring count");
600         SYSCTL_ADD_INT(&sc->sc_sysctl_ctx,
601                        SYSCTL_CHILDREN(sc->sc_sysctl_tree), OID_AUTO,
602                        "debug", CTLFLAG_RW, &sc->sc_debug,
603                        0, "control debugging printfs");
604
605         error = mii_phy_probe(dev, &sc->sc_miibus, nfe_ifmedia_upd,
606                               nfe_ifmedia_sts);
607         if (error) {
608                 device_printf(dev, "MII without any phy\n");
609                 goto fail;
610         }
611
612         ifp->if_softc = sc;
613         ifp->if_mtu = ETHERMTU;
614         ifp->if_flags = IFF_BROADCAST | IFF_SIMPLEX | IFF_MULTICAST;
615         ifp->if_ioctl = nfe_ioctl;
616         ifp->if_start = nfe_start;
617 #ifdef DEVICE_POLLING
618         ifp->if_poll = nfe_poll;
619 #endif
620         ifp->if_watchdog = nfe_watchdog;
621         ifp->if_init = nfe_init;
622         ifq_set_maxlen(&ifp->if_snd, sc->sc_tx_ring_count);
623         ifq_set_ready(&ifp->if_snd);
624
625         ifp->if_capabilities = IFCAP_VLAN_MTU;
626
627         if (sc->sc_caps & NFE_HW_VLAN)
628                 ifp->if_capabilities |= IFCAP_VLAN_HWTAGGING;
629
630 #ifdef NFE_CSUM
631         if (sc->sc_caps & NFE_HW_CSUM) {
632                 ifp->if_capabilities |= IFCAP_HWCSUM;
633                 ifp->if_hwassist = NFE_CSUM_FEATURES;
634         }
635 #else
636         sc->sc_caps &= ~NFE_HW_CSUM;
637 #endif
638         ifp->if_capenable = ifp->if_capabilities;
639
640         callout_init(&sc->sc_tick_ch);
641
642         ether_ifattach(ifp, eaddr, NULL);
643
644         error = bus_setup_intr(dev, sc->sc_irq_res, INTR_MPSAFE, nfe_intr, sc,
645                                &sc->sc_ih, ifp->if_serializer);
646         if (error) {
647                 device_printf(dev, "could not setup intr\n");
648                 ether_ifdetach(ifp);
649                 goto fail;
650         }
651
652         ifp->if_cpuid = ithread_cpuid(rman_get_start(sc->sc_irq_res));
653         KKASSERT(ifp->if_cpuid >= 0 && ifp->if_cpuid < ncpus);
654
655         return 0;
656 fail:
657         nfe_detach(dev);
658         return error;
659 }
660
661 static int
662 nfe_detach(device_t dev)
663 {
664         struct nfe_softc *sc = device_get_softc(dev);
665
666         if (device_is_attached(dev)) {
667                 struct ifnet *ifp = &sc->arpcom.ac_if;
668
669                 lwkt_serialize_enter(ifp->if_serializer);
670                 nfe_stop(sc);
671                 bus_teardown_intr(dev, sc->sc_irq_res, sc->sc_ih);
672                 lwkt_serialize_exit(ifp->if_serializer);
673
674                 ether_ifdetach(ifp);
675         }
676
677         if (sc->sc_miibus != NULL)
678                 device_delete_child(dev, sc->sc_miibus);
679         bus_generic_detach(dev);
680
681         if (sc->sc_sysctl_tree != NULL)
682                 sysctl_ctx_free(&sc->sc_sysctl_ctx);
683
684         if (sc->sc_irq_res != NULL) {
685                 bus_release_resource(dev, SYS_RES_IRQ, sc->sc_irq_rid,
686                                      sc->sc_irq_res);
687         }
688
689         if (sc->sc_mem_res != NULL) {
690                 bus_release_resource(dev, SYS_RES_MEMORY, sc->sc_mem_rid,
691                                      sc->sc_mem_res);
692         }
693
694         nfe_free_tx_ring(sc, &sc->txq);
695         nfe_free_rx_ring(sc, &sc->rxq);
696         if (sc->sc_dtag != NULL)
697                 bus_dma_tag_destroy(sc->sc_dtag);
698
699         return 0;
700 }
701
702 static void
703 nfe_shutdown(device_t dev)
704 {
705         struct nfe_softc *sc = device_get_softc(dev);
706         struct ifnet *ifp = &sc->arpcom.ac_if;
707
708         lwkt_serialize_enter(ifp->if_serializer);
709         nfe_stop(sc);
710         lwkt_serialize_exit(ifp->if_serializer);
711 }
712
713 static int
714 nfe_suspend(device_t dev)
715 {
716         struct nfe_softc *sc = device_get_softc(dev);
717         struct ifnet *ifp = &sc->arpcom.ac_if;
718
719         lwkt_serialize_enter(ifp->if_serializer);
720         nfe_stop(sc);
721         lwkt_serialize_exit(ifp->if_serializer);
722
723         return 0;
724 }
725
726 static int
727 nfe_resume(device_t dev)
728 {
729         struct nfe_softc *sc = device_get_softc(dev);
730         struct ifnet *ifp = &sc->arpcom.ac_if;
731
732         lwkt_serialize_enter(ifp->if_serializer);
733         if (ifp->if_flags & IFF_UP)
734                 nfe_init(sc);
735         lwkt_serialize_exit(ifp->if_serializer);
736
737         return 0;
738 }
739
740 static void
741 nfe_miibus_statchg(device_t dev)
742 {
743         struct nfe_softc *sc = device_get_softc(dev);
744         struct mii_data *mii = device_get_softc(sc->sc_miibus);
745         uint32_t phy, seed, misc = NFE_MISC1_MAGIC, link = NFE_MEDIA_SET;
746
747         ASSERT_SERIALIZED(sc->arpcom.ac_if.if_serializer);
748
749         phy = NFE_READ(sc, NFE_PHY_IFACE);
750         phy &= ~(NFE_PHY_HDX | NFE_PHY_100TX | NFE_PHY_1000T);
751
752         seed = NFE_READ(sc, NFE_RNDSEED);
753         seed &= ~NFE_SEED_MASK;
754
755         if ((mii->mii_media_active & IFM_GMASK) == IFM_HDX) {
756                 phy  |= NFE_PHY_HDX;    /* half-duplex */
757                 misc |= NFE_MISC1_HDX;
758         }
759
760         switch (IFM_SUBTYPE(mii->mii_media_active)) {
761         case IFM_1000_T:        /* full-duplex only */
762                 link |= NFE_MEDIA_1000T;
763                 seed |= NFE_SEED_1000T;
764                 phy  |= NFE_PHY_1000T;
765                 break;
766         case IFM_100_TX:
767                 link |= NFE_MEDIA_100TX;
768                 seed |= NFE_SEED_100TX;
769                 phy  |= NFE_PHY_100TX;
770                 break;
771         case IFM_10_T:
772                 link |= NFE_MEDIA_10T;
773                 seed |= NFE_SEED_10T;
774                 break;
775         }
776
777         NFE_WRITE(sc, NFE_RNDSEED, seed);       /* XXX: gigabit NICs only? */
778
779         NFE_WRITE(sc, NFE_PHY_IFACE, phy);
780         NFE_WRITE(sc, NFE_MISC1, misc);
781         NFE_WRITE(sc, NFE_LINKSPEED, link);
782 }
783
784 static int
785 nfe_miibus_readreg(device_t dev, int phy, int reg)
786 {
787         struct nfe_softc *sc = device_get_softc(dev);
788         uint32_t val;
789         int ntries;
790
791         NFE_WRITE(sc, NFE_PHY_STATUS, 0xf);
792
793         if (NFE_READ(sc, NFE_PHY_CTL) & NFE_PHY_BUSY) {
794                 NFE_WRITE(sc, NFE_PHY_CTL, NFE_PHY_BUSY);
795                 DELAY(100);
796         }
797
798         NFE_WRITE(sc, NFE_PHY_CTL, (phy << NFE_PHYADD_SHIFT) | reg);
799
800         for (ntries = 0; ntries < 1000; ntries++) {
801                 DELAY(100);
802                 if (!(NFE_READ(sc, NFE_PHY_CTL) & NFE_PHY_BUSY))
803                         break;
804         }
805         if (ntries == 1000) {
806                 DPRINTFN(sc, 2, "timeout waiting for PHY %s\n", "");
807                 return 0;
808         }
809
810         if (NFE_READ(sc, NFE_PHY_STATUS) & NFE_PHY_ERROR) {
811                 DPRINTFN(sc, 2, "could not read PHY %s\n", "");
812                 return 0;
813         }
814
815         val = NFE_READ(sc, NFE_PHY_DATA);
816         if (val != 0xffffffff && val != 0)
817                 sc->mii_phyaddr = phy;
818
819         DPRINTFN(sc, 2, "mii read phy %d reg 0x%x ret 0x%x\n", phy, reg, val);
820
821         return val;
822 }
823
824 static void
825 nfe_miibus_writereg(device_t dev, int phy, int reg, int val)
826 {
827         struct nfe_softc *sc = device_get_softc(dev);
828         uint32_t ctl;
829         int ntries;
830
831         NFE_WRITE(sc, NFE_PHY_STATUS, 0xf);
832
833         if (NFE_READ(sc, NFE_PHY_CTL) & NFE_PHY_BUSY) {
834                 NFE_WRITE(sc, NFE_PHY_CTL, NFE_PHY_BUSY);
835                 DELAY(100);
836         }
837
838         NFE_WRITE(sc, NFE_PHY_DATA, val);
839         ctl = NFE_PHY_WRITE | (phy << NFE_PHYADD_SHIFT) | reg;
840         NFE_WRITE(sc, NFE_PHY_CTL, ctl);
841
842         for (ntries = 0; ntries < 1000; ntries++) {
843                 DELAY(100);
844                 if (!(NFE_READ(sc, NFE_PHY_CTL) & NFE_PHY_BUSY))
845                         break;
846         }
847
848 #ifdef NFE_DEBUG
849         if (ntries == 1000)
850                 DPRINTFN(sc, 2, "could not write to PHY %s\n", "");
851 #endif
852 }
853
854 #ifdef DEVICE_POLLING
855
856 static void
857 nfe_poll(struct ifnet *ifp, enum poll_cmd cmd, int count)
858 {
859         struct nfe_softc *sc = ifp->if_softc;
860
861         ASSERT_SERIALIZED(ifp->if_serializer);
862
863         switch(cmd) {
864         case POLL_REGISTER:
865                 nfe_disable_intrs(sc);
866                 break;
867
868         case POLL_DEREGISTER:
869                 nfe_enable_intrs(sc);
870                 break;
871
872         case POLL_AND_CHECK_STATUS:
873                 /* fall through */
874         case POLL_ONLY:
875                 if (ifp->if_flags & IFF_RUNNING) {
876                         nfe_rxeof(sc);
877                         nfe_txeof(sc, 1);
878                 }
879                 break;
880         }
881 }
882
883 #endif
884
885 static void
886 nfe_intr(void *arg)
887 {
888         struct nfe_softc *sc = arg;
889         struct ifnet *ifp = &sc->arpcom.ac_if;
890         uint32_t r;
891
892         r = NFE_READ(sc, NFE_IRQ_STATUS);
893         if (r == 0)
894                 return; /* not for us */
895         NFE_WRITE(sc, NFE_IRQ_STATUS, r);
896
897         DPRINTFN(sc, 5, "%s: interrupt register %x\n", __func__, r);
898
899         if (r & NFE_IRQ_LINK) {
900                 NFE_READ(sc, NFE_PHY_STATUS);
901                 NFE_WRITE(sc, NFE_PHY_STATUS, 0xf);
902                 DPRINTF(sc, "link state changed %s\n", "");
903         }
904
905         if (ifp->if_flags & IFF_RUNNING) {
906                 int ret;
907
908                 /* check Rx ring */
909                 ret = nfe_rxeof(sc);
910
911                 /* check Tx ring */
912                 ret |= nfe_txeof(sc, 1);
913
914                 if (sc->sc_flags & NFE_F_DYN_IM) {
915                         if (ret && (sc->sc_flags & NFE_F_IRQ_TIMER) == 0) {
916                                 /*
917                                  * Assume that using hardware timer could reduce
918                                  * the interrupt rate.
919                                  */
920                                 NFE_WRITE(sc, NFE_IRQ_MASK, NFE_IRQ_IMTIMER);
921                                 sc->sc_flags |= NFE_F_IRQ_TIMER;
922                         } else if (!ret && (sc->sc_flags & NFE_F_IRQ_TIMER)) {
923                                 /*
924                                  * Nothing needs to be processed, fall back to
925                                  * use TX/RX interrupts.
926                                  */
927                                 NFE_WRITE(sc, NFE_IRQ_MASK, NFE_IRQ_NOIMTIMER);
928                                 sc->sc_flags &= ~NFE_F_IRQ_TIMER;
929
930                                 /*
931                                  * Recollect, mainly to avoid the possible race
932                                  * introduced by changing interrupt masks.
933                                  */
934                                 nfe_rxeof(sc);
935                                 nfe_txeof(sc, 1);
936                         }
937                 }
938         }
939 }
940
941 static int
942 nfe_ioctl(struct ifnet *ifp, u_long cmd, caddr_t data, struct ucred *cr)
943 {
944         struct nfe_softc *sc = ifp->if_softc;
945         struct ifreq *ifr = (struct ifreq *)data;
946         struct mii_data *mii;
947         int error = 0, mask, jumbo_cap;
948
949         ASSERT_SERIALIZED(ifp->if_serializer);
950
951         switch (cmd) {
952         case SIOCSIFMTU:
953                 if ((sc->sc_caps & NFE_JUMBO_SUP) && sc->rxq.jbuf != NULL)
954                         jumbo_cap = 1;
955                 else
956                         jumbo_cap = 0;
957
958                 if ((jumbo_cap && ifr->ifr_mtu > NFE_JUMBO_MTU) ||
959                     (!jumbo_cap && ifr->ifr_mtu > ETHERMTU)) {
960                         return EINVAL;
961                 } else if (ifp->if_mtu != ifr->ifr_mtu) {
962                         ifp->if_mtu = ifr->ifr_mtu;
963                         if (ifp->if_flags & IFF_RUNNING)
964                                 nfe_init(sc);
965                 }
966                 break;
967         case SIOCSIFFLAGS:
968                 if (ifp->if_flags & IFF_UP) {
969                         /*
970                          * If only the PROMISC or ALLMULTI flag changes, then
971                          * don't do a full re-init of the chip, just update
972                          * the Rx filter.
973                          */
974                         if ((ifp->if_flags & IFF_RUNNING) &&
975                             ((ifp->if_flags ^ sc->sc_if_flags) &
976                              (IFF_ALLMULTI | IFF_PROMISC)) != 0) {
977                                 nfe_setmulti(sc);
978                         } else {
979                                 if (!(ifp->if_flags & IFF_RUNNING))
980                                         nfe_init(sc);
981                         }
982                 } else {
983                         if (ifp->if_flags & IFF_RUNNING)
984                                 nfe_stop(sc);
985                 }
986                 sc->sc_if_flags = ifp->if_flags;
987                 break;
988         case SIOCADDMULTI:
989         case SIOCDELMULTI:
990                 if (ifp->if_flags & IFF_RUNNING)
991                         nfe_setmulti(sc);
992                 break;
993         case SIOCSIFMEDIA:
994         case SIOCGIFMEDIA:
995                 mii = device_get_softc(sc->sc_miibus);
996                 error = ifmedia_ioctl(ifp, ifr, &mii->mii_media, cmd);
997                 break;
998         case SIOCSIFCAP:
999                 mask = (ifr->ifr_reqcap ^ ifp->if_capenable) & IFCAP_HWCSUM;
1000                 if (mask && (ifp->if_capabilities & IFCAP_HWCSUM)) {
1001                         ifp->if_capenable ^= mask;
1002                         if (IFCAP_TXCSUM & ifp->if_capenable)
1003                                 ifp->if_hwassist = NFE_CSUM_FEATURES;
1004                         else
1005                                 ifp->if_hwassist = 0;
1006
1007                         if (ifp->if_flags & IFF_RUNNING)
1008                                 nfe_init(sc);
1009                 }
1010                 break;
1011         default:
1012                 error = ether_ioctl(ifp, cmd, data);
1013                 break;
1014         }
1015         return error;
1016 }
1017
1018 static int
1019 nfe_rxeof(struct nfe_softc *sc)
1020 {
1021         struct ifnet *ifp = &sc->arpcom.ac_if;
1022         struct nfe_rx_ring *ring = &sc->rxq;
1023         int reap;
1024         struct mbuf_chain chain[MAXCPU];
1025
1026         reap = 0;
1027         bus_dmamap_sync(ring->tag, ring->map, BUS_DMASYNC_POSTREAD);
1028
1029         ether_input_chain_init(chain);
1030
1031         for (;;) {
1032                 struct nfe_rx_data *data = &ring->data[ring->cur];
1033                 struct mbuf *m;
1034                 uint16_t flags;
1035                 int len, error;
1036
1037                 if (sc->sc_caps & NFE_40BIT_ADDR) {
1038                         struct nfe_desc64 *desc64 = &ring->desc64[ring->cur];
1039
1040                         flags = le16toh(desc64->flags);
1041                         len = le16toh(desc64->length) & 0x3fff;
1042                 } else {
1043                         struct nfe_desc32 *desc32 = &ring->desc32[ring->cur];
1044
1045                         flags = le16toh(desc32->flags);
1046                         len = le16toh(desc32->length) & 0x3fff;
1047                 }
1048
1049                 if (flags & NFE_RX_READY)
1050                         break;
1051
1052                 reap = 1;
1053
1054                 if ((sc->sc_caps & (NFE_JUMBO_SUP | NFE_40BIT_ADDR)) == 0) {
1055                         if (!(flags & NFE_RX_VALID_V1))
1056                                 goto skip;
1057
1058                         if ((flags & NFE_RX_FIXME_V1) == NFE_RX_FIXME_V1) {
1059                                 flags &= ~NFE_RX_ERROR;
1060                                 len--;  /* fix buffer length */
1061                         }
1062                 } else {
1063                         if (!(flags & NFE_RX_VALID_V2))
1064                                 goto skip;
1065
1066                         if ((flags & NFE_RX_FIXME_V2) == NFE_RX_FIXME_V2) {
1067                                 flags &= ~NFE_RX_ERROR;
1068                                 len--;  /* fix buffer length */
1069                         }
1070                 }
1071
1072                 if (flags & NFE_RX_ERROR) {
1073                         ifp->if_ierrors++;
1074                         goto skip;
1075                 }
1076
1077                 m = data->m;
1078
1079                 if (sc->sc_flags & NFE_F_USE_JUMBO)
1080                         error = nfe_newbuf_jumbo(sc, ring, ring->cur, 0);
1081                 else
1082                         error = nfe_newbuf_std(sc, ring, ring->cur, 0);
1083                 if (error) {
1084                         ifp->if_ierrors++;
1085                         goto skip;
1086                 }
1087
1088                 /* finalize mbuf */
1089                 m->m_pkthdr.len = m->m_len = len;
1090                 m->m_pkthdr.rcvif = ifp;
1091
1092                 if ((ifp->if_capenable & IFCAP_RXCSUM) &&
1093                     (flags & NFE_RX_CSUMOK)) {
1094                         if (flags & NFE_RX_IP_CSUMOK_V2) {
1095                                 m->m_pkthdr.csum_flags |= CSUM_IP_CHECKED |
1096                                                           CSUM_IP_VALID;
1097                         }
1098
1099                         if (flags &
1100                             (NFE_RX_UDP_CSUMOK_V2 | NFE_RX_TCP_CSUMOK_V2)) {
1101                                 m->m_pkthdr.csum_flags |= CSUM_DATA_VALID |
1102                                                           CSUM_PSEUDO_HDR |
1103                                                           CSUM_FRAG_NOT_CHECKED;
1104                                 m->m_pkthdr.csum_data = 0xffff;
1105                         }
1106                 }
1107
1108                 ifp->if_ipackets++;
1109                 ether_input_chain(ifp, m, chain);
1110 skip:
1111                 nfe_set_ready_rxdesc(sc, ring, ring->cur);
1112                 sc->rxq.cur = (sc->rxq.cur + 1) % sc->sc_rx_ring_count;
1113         }
1114
1115         if (reap) {
1116                 bus_dmamap_sync(ring->tag, ring->map, BUS_DMASYNC_PREWRITE);
1117                 ether_input_dispatch(chain);
1118         }
1119         return reap;
1120 }
1121
1122 static int
1123 nfe_txeof(struct nfe_softc *sc, int start)
1124 {
1125         struct ifnet *ifp = &sc->arpcom.ac_if;
1126         struct nfe_tx_ring *ring = &sc->txq;
1127         struct nfe_tx_data *data = NULL;
1128
1129         bus_dmamap_sync(ring->tag, ring->map, BUS_DMASYNC_POSTREAD);
1130         while (ring->next != ring->cur) {
1131                 uint16_t flags;
1132
1133                 if (sc->sc_caps & NFE_40BIT_ADDR)
1134                         flags = le16toh(ring->desc64[ring->next].flags);
1135                 else
1136                         flags = le16toh(ring->desc32[ring->next].flags);
1137
1138                 if (flags & NFE_TX_VALID)
1139                         break;
1140
1141                 data = &ring->data[ring->next];
1142
1143                 if ((sc->sc_caps & (NFE_JUMBO_SUP | NFE_40BIT_ADDR)) == 0) {
1144                         if (!(flags & NFE_TX_LASTFRAG_V1) && data->m == NULL)
1145                                 goto skip;
1146
1147                         if ((flags & NFE_TX_ERROR_V1) != 0) {
1148                                 if_printf(ifp, "tx v1 error 0x%4b\n", flags,
1149                                           NFE_V1_TXERR);
1150                                 ifp->if_oerrors++;
1151                         } else {
1152                                 ifp->if_opackets++;
1153                         }
1154                 } else {
1155                         if (!(flags & NFE_TX_LASTFRAG_V2) && data->m == NULL)
1156                                 goto skip;
1157
1158                         if ((flags & NFE_TX_ERROR_V2) != 0) {
1159                                 if_printf(ifp, "tx v2 error 0x%4b\n", flags,
1160                                           NFE_V2_TXERR);
1161                                 ifp->if_oerrors++;
1162                         } else {
1163                                 ifp->if_opackets++;
1164                         }
1165                 }
1166
1167                 if (data->m == NULL) {  /* should not get there */
1168                         if_printf(ifp,
1169                                   "last fragment bit w/o associated mbuf!\n");
1170                         goto skip;
1171                 }
1172
1173                 /* last fragment of the mbuf chain transmitted */
1174                 bus_dmamap_sync(ring->data_tag, data->map,
1175                                 BUS_DMASYNC_POSTWRITE);
1176                 bus_dmamap_unload(ring->data_tag, data->map);
1177                 m_freem(data->m);
1178                 data->m = NULL;
1179 skip:
1180                 ring->queued--;
1181                 KKASSERT(ring->queued >= 0);
1182                 ring->next = (ring->next + 1) % sc->sc_tx_ring_count;
1183         }
1184
1185         if (sc->sc_tx_ring_count - ring->queued >=
1186             sc->sc_tx_spare + NFE_NSEG_RSVD)
1187                 ifp->if_flags &= ~IFF_OACTIVE;
1188
1189         if (ring->queued == 0)
1190                 ifp->if_timer = 0;
1191
1192         if (start && !ifq_is_empty(&ifp->if_snd))
1193                 if_devstart(ifp);
1194
1195         if (data != NULL)
1196                 return 1;
1197         else
1198                 return 0;
1199 }
1200
1201 static int
1202 nfe_encap(struct nfe_softc *sc, struct nfe_tx_ring *ring, struct mbuf *m0)
1203 {
1204         struct nfe_dma_ctx ctx;
1205         bus_dma_segment_t segs[NFE_MAX_SCATTER];
1206         struct nfe_tx_data *data, *data_map;
1207         bus_dmamap_t map;
1208         struct nfe_desc64 *desc64 = NULL;
1209         struct nfe_desc32 *desc32 = NULL;
1210         uint16_t flags = 0;
1211         uint32_t vtag = 0;
1212         int error, i, j, maxsegs;
1213
1214         data = &ring->data[ring->cur];
1215         map = data->map;
1216         data_map = data;        /* Remember who owns the DMA map */
1217
1218         maxsegs = (sc->sc_tx_ring_count - ring->queued) - NFE_NSEG_RSVD;
1219         if (maxsegs > NFE_MAX_SCATTER)
1220                 maxsegs = NFE_MAX_SCATTER;
1221         KASSERT(maxsegs >= sc->sc_tx_spare,
1222                 ("no enough segments %d,%d\n", maxsegs, sc->sc_tx_spare));
1223
1224         ctx.nsegs = maxsegs;
1225         ctx.segs = segs;
1226         error = bus_dmamap_load_mbuf(ring->data_tag, map, m0,
1227                                      nfe_buf_dma_addr, &ctx, BUS_DMA_NOWAIT);
1228         if (!error && ctx.nsegs == 0) {
1229                 bus_dmamap_unload(ring->data_tag, map);
1230                 error = EFBIG;
1231         }
1232         if (error && error != EFBIG) {
1233                 if_printf(&sc->arpcom.ac_if, "could not map TX mbuf\n");
1234                 goto back;
1235         }
1236         if (error) {    /* error == EFBIG */
1237                 struct mbuf *m_new;
1238
1239                 m_new = m_defrag(m0, MB_DONTWAIT);
1240                 if (m_new == NULL) {
1241                         if_printf(&sc->arpcom.ac_if,
1242                                   "could not defrag TX mbuf\n");
1243                         error = ENOBUFS;
1244                         goto back;
1245                 } else {
1246                         m0 = m_new;
1247                 }
1248
1249                 ctx.nsegs = maxsegs;
1250                 ctx.segs = segs;
1251                 error = bus_dmamap_load_mbuf(ring->data_tag, map, m0,
1252                                              nfe_buf_dma_addr, &ctx,
1253                                              BUS_DMA_NOWAIT);
1254                 if (error || ctx.nsegs == 0) {
1255                         if (!error) {
1256                                 bus_dmamap_unload(ring->data_tag, map);
1257                                 error = EFBIG;
1258                         }
1259                         if_printf(&sc->arpcom.ac_if,
1260                                   "could not map defraged TX mbuf\n");
1261                         goto back;
1262                 }
1263         }
1264
1265         error = 0;
1266
1267         /* setup h/w VLAN tagging */
1268         if (m0->m_flags & M_VLANTAG)
1269                 vtag = m0->m_pkthdr.ether_vlantag;
1270
1271         if (sc->arpcom.ac_if.if_capenable & IFCAP_TXCSUM) {
1272                 if (m0->m_pkthdr.csum_flags & CSUM_IP)
1273                         flags |= NFE_TX_IP_CSUM;
1274                 if (m0->m_pkthdr.csum_flags & (CSUM_TCP | CSUM_UDP))
1275                         flags |= NFE_TX_TCP_CSUM;
1276         }
1277
1278         /*
1279          * XXX urm. somebody is unaware of how hardware works.  You 
1280          * absolutely CANNOT set NFE_TX_VALID on the next descriptor in
1281          * the ring until the entire chain is actually *VALID*.  Otherwise
1282          * the hardware may encounter a partially initialized chain that
1283          * is marked as being ready to go when it in fact is not ready to
1284          * go.
1285          */
1286
1287         for (i = 0; i < ctx.nsegs; i++) {
1288                 j = (ring->cur + i) % sc->sc_tx_ring_count;
1289                 data = &ring->data[j];
1290
1291                 if (sc->sc_caps & NFE_40BIT_ADDR) {
1292                         desc64 = &ring->desc64[j];
1293                         desc64->physaddr[0] =
1294                             htole32(NFE_ADDR_HI(segs[i].ds_addr));
1295                         desc64->physaddr[1] =
1296                             htole32(NFE_ADDR_LO(segs[i].ds_addr));
1297                         desc64->length = htole16(segs[i].ds_len - 1);
1298                         desc64->vtag = htole32(vtag);
1299                         desc64->flags = htole16(flags);
1300                 } else {
1301                         desc32 = &ring->desc32[j];
1302                         desc32->physaddr = htole32(segs[i].ds_addr);
1303                         desc32->length = htole16(segs[i].ds_len - 1);
1304                         desc32->flags = htole16(flags);
1305                 }
1306
1307                 /* csum flags and vtag belong to the first fragment only */
1308                 flags &= ~(NFE_TX_IP_CSUM | NFE_TX_TCP_CSUM);
1309                 vtag = 0;
1310
1311                 ring->queued++;
1312                 KKASSERT(ring->queued <= sc->sc_tx_ring_count);
1313         }
1314
1315         /* the whole mbuf chain has been DMA mapped, fix last descriptor */
1316         if (sc->sc_caps & NFE_40BIT_ADDR) {
1317                 desc64->flags |= htole16(NFE_TX_LASTFRAG_V2);
1318         } else {
1319                 if (sc->sc_caps & NFE_JUMBO_SUP)
1320                         flags = NFE_TX_LASTFRAG_V2;
1321                 else
1322                         flags = NFE_TX_LASTFRAG_V1;
1323                 desc32->flags |= htole16(flags);
1324         }
1325
1326         /*
1327          * Set NFE_TX_VALID backwards so the hardware doesn't see the
1328          * whole mess until the first descriptor in the map is flagged.
1329          */
1330         for (i = ctx.nsegs - 1; i >= 0; --i) {
1331                 j = (ring->cur + i) % sc->sc_tx_ring_count;
1332                 if (sc->sc_caps & NFE_40BIT_ADDR) {
1333                         desc64 = &ring->desc64[j];
1334                         desc64->flags |= htole16(NFE_TX_VALID);
1335                 } else {
1336                         desc32 = &ring->desc32[j];
1337                         desc32->flags |= htole16(NFE_TX_VALID);
1338                 }
1339         }
1340         ring->cur = (ring->cur + ctx.nsegs) % sc->sc_tx_ring_count;
1341
1342         /* Exchange DMA map */
1343         data_map->map = data->map;
1344         data->map = map;
1345         data->m = m0;
1346
1347         bus_dmamap_sync(ring->data_tag, map, BUS_DMASYNC_PREWRITE);
1348 back:
1349         if (error)
1350                 m_freem(m0);
1351         return error;
1352 }
1353
1354 static void
1355 nfe_start(struct ifnet *ifp)
1356 {
1357         struct nfe_softc *sc = ifp->if_softc;
1358         struct nfe_tx_ring *ring = &sc->txq;
1359         int count = 0, oactive = 0;
1360         struct mbuf *m0;
1361
1362         ASSERT_SERIALIZED(ifp->if_serializer);
1363
1364         if ((ifp->if_flags & (IFF_OACTIVE | IFF_RUNNING)) != IFF_RUNNING)
1365                 return;
1366
1367         for (;;) {
1368                 int error;
1369
1370                 if (sc->sc_tx_ring_count - ring->queued <
1371                     sc->sc_tx_spare + NFE_NSEG_RSVD) {
1372                         if (oactive) {
1373                                 ifp->if_flags |= IFF_OACTIVE;
1374                                 break;
1375                         }
1376
1377                         nfe_txeof(sc, 0);
1378                         oactive = 1;
1379                         continue;
1380                 }
1381
1382                 m0 = ifq_dequeue(&ifp->if_snd, NULL);
1383                 if (m0 == NULL)
1384                         break;
1385
1386                 ETHER_BPF_MTAP(ifp, m0);
1387
1388                 error = nfe_encap(sc, ring, m0);
1389                 if (error) {
1390                         ifp->if_oerrors++;
1391                         if (error == EFBIG) {
1392                                 if (oactive) {
1393                                         ifp->if_flags |= IFF_OACTIVE;
1394                                         break;
1395                                 }
1396                                 nfe_txeof(sc, 0);
1397                                 oactive = 1;
1398                         }
1399                         continue;
1400                 } else {
1401                         oactive = 0;
1402                 }
1403                 ++count;
1404
1405                 /*
1406                  * NOTE:
1407                  * `m0' may be freed in nfe_encap(), so
1408                  * it should not be touched any more.
1409                  */
1410         }
1411         if (count == 0) /* nothing sent */
1412                 return;
1413
1414         /* Sync TX descriptor ring */
1415         bus_dmamap_sync(ring->tag, ring->map, BUS_DMASYNC_PREWRITE);
1416
1417         /* Kick Tx */
1418         NFE_WRITE(sc, NFE_RXTX_CTL, NFE_RXTX_KICKTX | sc->rxtxctl);
1419
1420         /*
1421          * Set a timeout in case the chip goes out to lunch.
1422          */
1423         ifp->if_timer = 5;
1424 }
1425
1426 static void
1427 nfe_watchdog(struct ifnet *ifp)
1428 {
1429         struct nfe_softc *sc = ifp->if_softc;
1430
1431         ASSERT_SERIALIZED(ifp->if_serializer);
1432
1433         if (ifp->if_flags & IFF_RUNNING) {
1434                 if_printf(ifp, "watchdog timeout - lost interrupt recovered\n");
1435                 nfe_txeof(sc, 1);
1436                 return;
1437         }
1438
1439         if_printf(ifp, "watchdog timeout\n");
1440
1441         nfe_init(ifp->if_softc);
1442
1443         ifp->if_oerrors++;
1444 }
1445
1446 static void
1447 nfe_init(void *xsc)
1448 {
1449         struct nfe_softc *sc = xsc;
1450         struct ifnet *ifp = &sc->arpcom.ac_if;
1451         uint32_t tmp;
1452         int error;
1453
1454         ASSERT_SERIALIZED(ifp->if_serializer);
1455
1456         nfe_stop(sc);
1457
1458         if ((sc->sc_caps & NFE_NO_PWRCTL) == 0)
1459                 nfe_mac_reset(sc);
1460
1461         /*
1462          * NOTE:
1463          * Switching between jumbo frames and normal frames should
1464          * be done _after_ nfe_stop() but _before_ nfe_init_rx_ring().
1465          */
1466         if (ifp->if_mtu > ETHERMTU) {
1467                 sc->sc_flags |= NFE_F_USE_JUMBO;
1468                 sc->rxq.bufsz = NFE_JBYTES;
1469                 sc->sc_tx_spare = NFE_NSEG_SPARE_JUMBO;
1470                 if (bootverbose)
1471                         if_printf(ifp, "use jumbo frames\n");
1472         } else {
1473                 sc->sc_flags &= ~NFE_F_USE_JUMBO;
1474                 sc->rxq.bufsz = MCLBYTES;
1475                 sc->sc_tx_spare = NFE_NSEG_SPARE;
1476                 if (bootverbose)
1477                         if_printf(ifp, "use non-jumbo frames\n");
1478         }
1479
1480         error = nfe_init_tx_ring(sc, &sc->txq);
1481         if (error) {
1482                 nfe_stop(sc);
1483                 return;
1484         }
1485
1486         error = nfe_init_rx_ring(sc, &sc->rxq);
1487         if (error) {
1488                 nfe_stop(sc);
1489                 return;
1490         }
1491
1492         NFE_WRITE(sc, NFE_TX_POLL, 0);
1493         NFE_WRITE(sc, NFE_STATUS, 0);
1494
1495         sc->rxtxctl = NFE_RXTX_BIT2 | sc->rxtxctl_desc;
1496
1497         if (ifp->if_capenable & IFCAP_RXCSUM)
1498                 sc->rxtxctl |= NFE_RXTX_RXCSUM;
1499
1500         /*
1501          * Although the adapter is capable of stripping VLAN tags from received
1502          * frames (NFE_RXTX_VTAG_STRIP), we do not enable this functionality on
1503          * purpose.  This will be done in software by our network stack.
1504          */
1505         if (sc->sc_caps & NFE_HW_VLAN)
1506                 sc->rxtxctl |= NFE_RXTX_VTAG_INSERT;
1507
1508         NFE_WRITE(sc, NFE_RXTX_CTL, NFE_RXTX_RESET | sc->rxtxctl);
1509         DELAY(10);
1510         NFE_WRITE(sc, NFE_RXTX_CTL, sc->rxtxctl);
1511
1512         if (sc->sc_caps & NFE_HW_VLAN)
1513                 NFE_WRITE(sc, NFE_VTAG_CTL, NFE_VTAG_ENABLE);
1514
1515         NFE_WRITE(sc, NFE_SETUP_R6, 0);
1516
1517         /* set MAC address */
1518         nfe_set_macaddr(sc, sc->arpcom.ac_enaddr);
1519
1520         /* tell MAC where rings are in memory */
1521         if (sc->sc_caps & NFE_40BIT_ADDR) {
1522                 NFE_WRITE(sc, NFE_RX_RING_ADDR_HI,
1523                           NFE_ADDR_HI(sc->rxq.physaddr));
1524         }
1525         NFE_WRITE(sc, NFE_RX_RING_ADDR_LO, NFE_ADDR_LO(sc->rxq.physaddr));
1526
1527         if (sc->sc_caps & NFE_40BIT_ADDR) {
1528                 NFE_WRITE(sc, NFE_TX_RING_ADDR_HI,
1529                           NFE_ADDR_HI(sc->txq.physaddr));
1530         }
1531         NFE_WRITE(sc, NFE_TX_RING_ADDR_LO, NFE_ADDR_LO(sc->txq.physaddr));
1532
1533         NFE_WRITE(sc, NFE_RING_SIZE,
1534             (sc->sc_rx_ring_count - 1) << 16 |
1535             (sc->sc_tx_ring_count - 1));
1536
1537         NFE_WRITE(sc, NFE_RXBUFSZ, sc->rxq.bufsz);
1538
1539         /* force MAC to wakeup */
1540         tmp = NFE_READ(sc, NFE_PWR_STATE);
1541         NFE_WRITE(sc, NFE_PWR_STATE, tmp | NFE_PWR_WAKEUP);
1542         DELAY(10);
1543         tmp = NFE_READ(sc, NFE_PWR_STATE);
1544         NFE_WRITE(sc, NFE_PWR_STATE, tmp | NFE_PWR_VALID);
1545
1546         NFE_WRITE(sc, NFE_SETUP_R1, NFE_R1_MAGIC);
1547         NFE_WRITE(sc, NFE_SETUP_R2, NFE_R2_MAGIC);
1548         NFE_WRITE(sc, NFE_SETUP_R6, NFE_R6_MAGIC);
1549
1550         /* update MAC knowledge of PHY; generates a NFE_IRQ_LINK interrupt */
1551         NFE_WRITE(sc, NFE_STATUS, sc->mii_phyaddr << 24 | NFE_STATUS_MAGIC);
1552
1553         NFE_WRITE(sc, NFE_SETUP_R4, NFE_R4_MAGIC);
1554
1555         sc->rxtxctl &= ~NFE_RXTX_BIT2;
1556         NFE_WRITE(sc, NFE_RXTX_CTL, sc->rxtxctl);
1557         DELAY(10);
1558         NFE_WRITE(sc, NFE_RXTX_CTL, NFE_RXTX_BIT1 | sc->rxtxctl);
1559
1560         /* set Rx filter */
1561         nfe_setmulti(sc);
1562
1563         nfe_ifmedia_upd(ifp);
1564
1565         /* enable Rx */
1566         NFE_WRITE(sc, NFE_RX_CTL, NFE_RX_START);
1567
1568         /* enable Tx */
1569         NFE_WRITE(sc, NFE_TX_CTL, NFE_TX_START);
1570
1571         NFE_WRITE(sc, NFE_PHY_STATUS, 0xf);
1572
1573 #ifdef DEVICE_POLLING
1574         if ((ifp->if_flags & IFF_POLLING))
1575                 nfe_disable_intrs(sc);
1576         else
1577 #endif
1578         nfe_enable_intrs(sc);
1579
1580         callout_reset(&sc->sc_tick_ch, hz, nfe_tick, sc);
1581
1582         ifp->if_flags |= IFF_RUNNING;
1583         ifp->if_flags &= ~IFF_OACTIVE;
1584
1585         /*
1586          * If we had stuff in the tx ring before its all cleaned out now
1587          * so we are not going to get an interrupt, jump-start any pending
1588          * output.
1589          */
1590         if (!ifq_is_empty(&ifp->if_snd))
1591                 if_devstart(ifp);
1592 }
1593
1594 static void
1595 nfe_stop(struct nfe_softc *sc)
1596 {
1597         struct ifnet *ifp = &sc->arpcom.ac_if;
1598         uint32_t rxtxctl = sc->rxtxctl_desc | NFE_RXTX_BIT2;
1599         int i;
1600
1601         ASSERT_SERIALIZED(ifp->if_serializer);
1602
1603         callout_stop(&sc->sc_tick_ch);
1604
1605         ifp->if_timer = 0;
1606         ifp->if_flags &= ~(IFF_RUNNING | IFF_OACTIVE);
1607         sc->sc_flags &= ~NFE_F_IRQ_TIMER;
1608
1609 #define WAITMAX 50000
1610
1611         /*
1612          * Abort Tx
1613          */
1614         NFE_WRITE(sc, NFE_TX_CTL, 0);
1615         for (i = 0; i < WAITMAX; ++i) {
1616                 DELAY(100);
1617                 if ((NFE_READ(sc, NFE_TX_STATUS) & NFE_TX_STATUS_BUSY) == 0)
1618                         break;
1619         }
1620         if (i == WAITMAX)
1621                 if_printf(ifp, "can't stop TX\n");
1622         DELAY(100);
1623
1624         /*
1625          * Disable Rx
1626          */
1627         NFE_WRITE(sc, NFE_RX_CTL, 0);
1628         for (i = 0; i < WAITMAX; ++i) {
1629                 DELAY(100);
1630                 if ((NFE_READ(sc, NFE_RX_STATUS) & NFE_RX_STATUS_BUSY) == 0)
1631                         break;
1632         }
1633         if (i == WAITMAX)
1634                 if_printf(ifp, "can't stop RX\n");
1635         DELAY(100);
1636
1637 #undef WAITMAX
1638
1639         NFE_WRITE(sc, NFE_RXTX_CTL, NFE_RXTX_RESET | rxtxctl);
1640         DELAY(10);
1641         NFE_WRITE(sc, NFE_RXTX_CTL, rxtxctl);
1642
1643         /* Disable interrupts */
1644         NFE_WRITE(sc, NFE_IRQ_MASK, 0);
1645
1646         /* Reset Tx and Rx rings */
1647         nfe_reset_tx_ring(sc, &sc->txq);
1648         nfe_reset_rx_ring(sc, &sc->rxq);
1649 }
1650
1651 static int
1652 nfe_alloc_rx_ring(struct nfe_softc *sc, struct nfe_rx_ring *ring)
1653 {
1654         int i, j, error, descsize;
1655         bus_dmamem_t dmem;
1656         void **desc;
1657
1658         if (sc->sc_caps & NFE_40BIT_ADDR) {
1659                 desc = (void **)&ring->desc64;
1660                 descsize = sizeof(struct nfe_desc64);
1661         } else {
1662                 desc = (void **)&ring->desc32;
1663                 descsize = sizeof(struct nfe_desc32);
1664         }
1665
1666         ring->bufsz = MCLBYTES;
1667         ring->cur = ring->next = 0;
1668
1669         error = bus_dmamem_coherent(sc->sc_dtag, PAGE_SIZE, 0,
1670                                     BUS_SPACE_MAXADDR, BUS_SPACE_MAXADDR,
1671                                     sc->sc_rx_ring_count * descsize,
1672                                     BUS_DMA_WAITOK | BUS_DMA_ZERO, &dmem);
1673         if (error) {
1674                 if_printf(&sc->arpcom.ac_if,
1675                           "could not create RX desc ring\n");
1676                 return error;
1677         }
1678         ring->tag = dmem.dmem_tag;
1679         ring->map = dmem.dmem_map;
1680         *desc = dmem.dmem_addr;
1681         ring->physaddr = dmem.dmem_busaddr;
1682
1683         if (sc->sc_caps & NFE_JUMBO_SUP) {
1684                 ring->jbuf =
1685                 kmalloc(sizeof(struct nfe_jbuf) * NFE_JPOOL_COUNT(sc),
1686                         M_DEVBUF, M_WAITOK | M_ZERO);
1687
1688                 error = nfe_jpool_alloc(sc, ring);
1689                 if (error) {
1690                         if_printf(&sc->arpcom.ac_if,
1691                                   "could not allocate jumbo frames\n");
1692                         kfree(ring->jbuf, M_DEVBUF);
1693                         ring->jbuf = NULL;
1694                         /* Allow jumbo frame allocation to fail */
1695                 }
1696         }
1697
1698         ring->data = kmalloc(sizeof(struct nfe_rx_data) * sc->sc_rx_ring_count,
1699                              M_DEVBUF, M_WAITOK | M_ZERO);
1700
1701         error = bus_dma_tag_create(sc->sc_dtag, 1, 0,
1702                                    BUS_SPACE_MAXADDR, BUS_SPACE_MAXADDR,
1703                                    NULL, NULL,
1704                                    MCLBYTES, 1, MCLBYTES,
1705                                    BUS_DMA_ALLOCNOW | BUS_DMA_WAITOK,
1706                                    &ring->data_tag);
1707         if (error) {
1708                 if_printf(&sc->arpcom.ac_if,
1709                           "could not create RX mbuf DMA tag\n");
1710                 return error;
1711         }
1712
1713         /* Create a spare RX mbuf DMA map */
1714         error = bus_dmamap_create(ring->data_tag, BUS_DMA_WAITOK,
1715                                   &ring->data_tmpmap);
1716         if (error) {
1717                 if_printf(&sc->arpcom.ac_if,
1718                           "could not create spare RX mbuf DMA map\n");
1719                 bus_dma_tag_destroy(ring->data_tag);
1720                 ring->data_tag = NULL;
1721                 return error;
1722         }
1723
1724         for (i = 0; i < sc->sc_rx_ring_count; i++) {
1725                 error = bus_dmamap_create(ring->data_tag, BUS_DMA_WAITOK,
1726                                           &ring->data[i].map);
1727                 if (error) {
1728                         if_printf(&sc->arpcom.ac_if,
1729                                   "could not create %dth RX mbuf DMA mapn", i);
1730                         goto fail;
1731                 }
1732         }
1733         return 0;
1734 fail:
1735         for (j = 0; j < i; ++j)
1736                 bus_dmamap_destroy(ring->data_tag, ring->data[i].map);
1737         bus_dmamap_destroy(ring->data_tag, ring->data_tmpmap);
1738         bus_dma_tag_destroy(ring->data_tag);
1739         ring->data_tag = NULL;
1740         return error;
1741 }
1742
1743 static void
1744 nfe_reset_rx_ring(struct nfe_softc *sc, struct nfe_rx_ring *ring)
1745 {
1746         int i;
1747
1748         for (i = 0; i < sc->sc_rx_ring_count; i++) {
1749                 struct nfe_rx_data *data = &ring->data[i];
1750
1751                 if (data->m != NULL) {
1752                         if ((sc->sc_flags & NFE_F_USE_JUMBO) == 0)
1753                                 bus_dmamap_unload(ring->data_tag, data->map);
1754                         m_freem(data->m);
1755                         data->m = NULL;
1756                 }
1757         }
1758         bus_dmamap_sync(ring->tag, ring->map, BUS_DMASYNC_PREWRITE);
1759
1760         ring->cur = ring->next = 0;
1761 }
1762
1763 static int
1764 nfe_init_rx_ring(struct nfe_softc *sc, struct nfe_rx_ring *ring)
1765 {
1766         int i;
1767
1768         for (i = 0; i < sc->sc_rx_ring_count; ++i) {
1769                 int error;
1770
1771                 /* XXX should use a function pointer */
1772                 if (sc->sc_flags & NFE_F_USE_JUMBO)
1773                         error = nfe_newbuf_jumbo(sc, ring, i, 1);
1774                 else
1775                         error = nfe_newbuf_std(sc, ring, i, 1);
1776                 if (error) {
1777                         if_printf(&sc->arpcom.ac_if,
1778                                   "could not allocate RX buffer\n");
1779                         return error;
1780                 }
1781
1782                 nfe_set_ready_rxdesc(sc, ring, i);
1783         }
1784         bus_dmamap_sync(ring->tag, ring->map, BUS_DMASYNC_PREWRITE);
1785
1786         return 0;
1787 }
1788
1789 static void
1790 nfe_free_rx_ring(struct nfe_softc *sc, struct nfe_rx_ring *ring)
1791 {
1792         if (ring->data_tag != NULL) {
1793                 struct nfe_rx_data *data;
1794                 int i;
1795
1796                 for (i = 0; i < sc->sc_rx_ring_count; i++) {
1797                         data = &ring->data[i];
1798
1799                         if (data->m != NULL) {
1800                                 bus_dmamap_unload(ring->data_tag, data->map);
1801                                 m_freem(data->m);
1802                         }
1803                         bus_dmamap_destroy(ring->data_tag, data->map);
1804                 }
1805                 bus_dmamap_destroy(ring->data_tag, ring->data_tmpmap);
1806                 bus_dma_tag_destroy(ring->data_tag);
1807         }
1808
1809         nfe_jpool_free(sc, ring);
1810
1811         if (ring->jbuf != NULL)
1812                 kfree(ring->jbuf, M_DEVBUF);
1813         if (ring->data != NULL)
1814                 kfree(ring->data, M_DEVBUF);
1815
1816         if (ring->tag != NULL) {
1817                 void *desc;
1818
1819                 if (sc->sc_caps & NFE_40BIT_ADDR)
1820                         desc = ring->desc64;
1821                 else
1822                         desc = ring->desc32;
1823
1824                 bus_dmamap_unload(ring->tag, ring->map);
1825                 bus_dmamem_free(ring->tag, desc, ring->map);
1826                 bus_dma_tag_destroy(ring->tag);
1827         }
1828 }
1829
1830 static struct nfe_jbuf *
1831 nfe_jalloc(struct nfe_softc *sc)
1832 {
1833         struct ifnet *ifp = &sc->arpcom.ac_if;
1834         struct nfe_jbuf *jbuf;
1835
1836         lwkt_serialize_enter(&sc->sc_jbuf_serializer);
1837
1838         jbuf = SLIST_FIRST(&sc->rxq.jfreelist);
1839         if (jbuf != NULL) {
1840                 SLIST_REMOVE_HEAD(&sc->rxq.jfreelist, jnext);
1841                 jbuf->inuse = 1;
1842         } else {
1843                 if_printf(ifp, "no free jumbo buffer\n");
1844         }
1845
1846         lwkt_serialize_exit(&sc->sc_jbuf_serializer);
1847
1848         return jbuf;
1849 }
1850
1851 static void
1852 nfe_jfree(void *arg)
1853 {
1854         struct nfe_jbuf *jbuf = arg;
1855         struct nfe_softc *sc = jbuf->sc;
1856         struct nfe_rx_ring *ring = jbuf->ring;
1857
1858         if (&ring->jbuf[jbuf->slot] != jbuf)
1859                 panic("%s: free wrong jumbo buffer\n", __func__);
1860         else if (jbuf->inuse == 0)
1861                 panic("%s: jumbo buffer already freed\n", __func__);
1862
1863         lwkt_serialize_enter(&sc->sc_jbuf_serializer);
1864         atomic_subtract_int(&jbuf->inuse, 1);
1865         if (jbuf->inuse == 0)
1866                 SLIST_INSERT_HEAD(&ring->jfreelist, jbuf, jnext);
1867         lwkt_serialize_exit(&sc->sc_jbuf_serializer);
1868 }
1869
1870 static void
1871 nfe_jref(void *arg)
1872 {
1873         struct nfe_jbuf *jbuf = arg;
1874         struct nfe_rx_ring *ring = jbuf->ring;
1875
1876         if (&ring->jbuf[jbuf->slot] != jbuf)
1877                 panic("%s: ref wrong jumbo buffer\n", __func__);
1878         else if (jbuf->inuse == 0)
1879                 panic("%s: jumbo buffer already freed\n", __func__);
1880
1881         atomic_add_int(&jbuf->inuse, 1);
1882 }
1883
1884 static int
1885 nfe_jpool_alloc(struct nfe_softc *sc, struct nfe_rx_ring *ring)
1886 {
1887         struct nfe_jbuf *jbuf;
1888         bus_dmamem_t dmem;
1889         bus_addr_t physaddr;
1890         caddr_t buf;
1891         int i, error;
1892
1893         /*
1894          * Allocate a big chunk of DMA'able memory.
1895          */
1896         error = bus_dmamem_coherent(sc->sc_dtag, PAGE_SIZE, 0,
1897                                     BUS_SPACE_MAXADDR, BUS_SPACE_MAXADDR,
1898                                     NFE_JPOOL_SIZE(sc),
1899                                     BUS_DMA_WAITOK, &dmem);
1900         if (error) {
1901                 if_printf(&sc->arpcom.ac_if,
1902                           "could not create jumbo buffer\n");
1903                 return error;
1904         }
1905         ring->jtag = dmem.dmem_tag;
1906         ring->jmap = dmem.dmem_map;
1907         ring->jpool = dmem.dmem_addr;
1908         physaddr = dmem.dmem_busaddr;
1909
1910         /* ..and split it into 9KB chunks */
1911         SLIST_INIT(&ring->jfreelist);
1912
1913         buf = ring->jpool;
1914         for (i = 0; i < NFE_JPOOL_COUNT(sc); i++) {
1915                 jbuf = &ring->jbuf[i];
1916
1917                 jbuf->sc = sc;
1918                 jbuf->ring = ring;
1919                 jbuf->inuse = 0;
1920                 jbuf->slot = i;
1921                 jbuf->buf = buf;
1922                 jbuf->physaddr = physaddr;
1923
1924                 SLIST_INSERT_HEAD(&ring->jfreelist, jbuf, jnext);
1925
1926                 buf += NFE_JBYTES;
1927                 physaddr += NFE_JBYTES;
1928         }
1929
1930         return 0;
1931 }
1932
1933 static void
1934 nfe_jpool_free(struct nfe_softc *sc, struct nfe_rx_ring *ring)
1935 {
1936         if (ring->jtag != NULL) {
1937                 bus_dmamap_unload(ring->jtag, ring->jmap);
1938                 bus_dmamem_free(ring->jtag, ring->jpool, ring->jmap);
1939                 bus_dma_tag_destroy(ring->jtag);
1940         }
1941 }
1942
1943 static int
1944 nfe_alloc_tx_ring(struct nfe_softc *sc, struct nfe_tx_ring *ring)
1945 {
1946         int i, j, error, descsize;
1947         bus_dmamem_t dmem;
1948         void **desc;
1949
1950         if (sc->sc_caps & NFE_40BIT_ADDR) {
1951                 desc = (void **)&ring->desc64;
1952                 descsize = sizeof(struct nfe_desc64);
1953         } else {
1954                 desc = (void **)&ring->desc32;
1955                 descsize = sizeof(struct nfe_desc32);
1956         }
1957
1958         ring->queued = 0;
1959         ring->cur = ring->next = 0;
1960
1961         error = bus_dmamem_coherent(sc->sc_dtag, PAGE_SIZE, 0,
1962                                     BUS_SPACE_MAXADDR, BUS_SPACE_MAXADDR,
1963                                     sc->sc_tx_ring_count * descsize,
1964                                     BUS_DMA_WAITOK | BUS_DMA_ZERO, &dmem);
1965         if (error) {
1966                 if_printf(&sc->arpcom.ac_if,
1967                           "could not create TX desc ring\n");
1968                 return error;
1969         }
1970         ring->tag = dmem.dmem_tag;
1971         ring->map = dmem.dmem_map;
1972         *desc = dmem.dmem_addr;
1973         ring->physaddr = dmem.dmem_busaddr;
1974
1975         ring->data = kmalloc(sizeof(struct nfe_tx_data) * sc->sc_tx_ring_count,
1976                              M_DEVBUF, M_WAITOK | M_ZERO);
1977
1978         error = bus_dma_tag_create(sc->sc_dtag, 1, 0,
1979                         BUS_SPACE_MAXADDR, BUS_SPACE_MAXADDR,
1980                         NULL, NULL,
1981                         NFE_JBYTES, NFE_MAX_SCATTER, MCLBYTES,
1982                         BUS_DMA_ALLOCNOW | BUS_DMA_WAITOK | BUS_DMA_ONEPAGE,
1983                         &ring->data_tag);
1984         if (error) {
1985                 if_printf(&sc->arpcom.ac_if,
1986                           "could not create TX buf DMA tag\n");
1987                 return error;
1988         }
1989
1990         for (i = 0; i < sc->sc_tx_ring_count; i++) {
1991                 error = bus_dmamap_create(ring->data_tag,
1992                                 BUS_DMA_WAITOK | BUS_DMA_ONEPAGE,
1993                                 &ring->data[i].map);
1994                 if (error) {
1995                         if_printf(&sc->arpcom.ac_if,
1996                                   "could not create %dth TX buf DMA map\n", i);
1997                         goto fail;
1998                 }
1999         }
2000
2001         return 0;
2002 fail:
2003         for (j = 0; j < i; ++j)
2004                 bus_dmamap_destroy(ring->data_tag, ring->data[i].map);
2005         bus_dma_tag_destroy(ring->data_tag);
2006         ring->data_tag = NULL;
2007         return error;
2008 }
2009
2010 static void
2011 nfe_reset_tx_ring(struct nfe_softc *sc, struct nfe_tx_ring *ring)
2012 {
2013         int i;
2014
2015         for (i = 0; i < sc->sc_tx_ring_count; i++) {
2016                 struct nfe_tx_data *data = &ring->data[i];
2017
2018                 if (sc->sc_caps & NFE_40BIT_ADDR)
2019                         ring->desc64[i].flags = 0;
2020                 else
2021                         ring->desc32[i].flags = 0;
2022
2023                 if (data->m != NULL) {
2024                         bus_dmamap_sync(ring->data_tag, data->map,
2025                                         BUS_DMASYNC_POSTWRITE);
2026                         bus_dmamap_unload(ring->data_tag, data->map);
2027                         m_freem(data->m);
2028                         data->m = NULL;
2029                 }
2030         }
2031         bus_dmamap_sync(ring->tag, ring->map, BUS_DMASYNC_PREWRITE);
2032
2033         ring->queued = 0;
2034         ring->cur = ring->next = 0;
2035 }
2036
2037 static int
2038 nfe_init_tx_ring(struct nfe_softc *sc __unused,
2039                  struct nfe_tx_ring *ring __unused)
2040 {
2041         return 0;
2042 }
2043
2044 static void
2045 nfe_free_tx_ring(struct nfe_softc *sc, struct nfe_tx_ring *ring)
2046 {
2047         if (ring->data_tag != NULL) {
2048                 struct nfe_tx_data *data;
2049                 int i;
2050
2051                 for (i = 0; i < sc->sc_tx_ring_count; ++i) {
2052                         data = &ring->data[i];
2053
2054                         if (data->m != NULL) {
2055                                 bus_dmamap_unload(ring->data_tag, data->map);
2056                                 m_freem(data->m);
2057                         }
2058                         bus_dmamap_destroy(ring->data_tag, data->map);
2059                 }
2060
2061                 bus_dma_tag_destroy(ring->data_tag);
2062         }
2063
2064         if (ring->data != NULL)
2065                 kfree(ring->data, M_DEVBUF);
2066
2067         if (ring->tag != NULL) {
2068                 void *desc;
2069
2070                 if (sc->sc_caps & NFE_40BIT_ADDR)
2071                         desc = ring->desc64;
2072                 else
2073                         desc = ring->desc32;
2074
2075                 bus_dmamap_unload(ring->tag, ring->map);
2076                 bus_dmamem_free(ring->tag, desc, ring->map);
2077                 bus_dma_tag_destroy(ring->tag);
2078         }
2079 }
2080
2081 static int
2082 nfe_ifmedia_upd(struct ifnet *ifp)
2083 {
2084         struct nfe_softc *sc = ifp->if_softc;
2085         struct mii_data *mii = device_get_softc(sc->sc_miibus);
2086
2087         ASSERT_SERIALIZED(ifp->if_serializer);
2088
2089         if (mii->mii_instance != 0) {
2090                 struct mii_softc *miisc;
2091
2092                 LIST_FOREACH(miisc, &mii->mii_phys, mii_list)
2093                         mii_phy_reset(miisc);
2094         }
2095         mii_mediachg(mii);
2096
2097         return 0;
2098 }
2099
2100 static void
2101 nfe_ifmedia_sts(struct ifnet *ifp, struct ifmediareq *ifmr)
2102 {
2103         struct nfe_softc *sc = ifp->if_softc;
2104         struct mii_data *mii = device_get_softc(sc->sc_miibus);
2105
2106         ASSERT_SERIALIZED(ifp->if_serializer);
2107
2108         mii_pollstat(mii);
2109         ifmr->ifm_status = mii->mii_media_status;
2110         ifmr->ifm_active = mii->mii_media_active;
2111 }
2112
2113 static void
2114 nfe_setmulti(struct nfe_softc *sc)
2115 {
2116         struct ifnet *ifp = &sc->arpcom.ac_if;
2117         struct ifmultiaddr *ifma;
2118         uint8_t addr[ETHER_ADDR_LEN], mask[ETHER_ADDR_LEN];
2119         uint32_t filter = NFE_RXFILTER_MAGIC;
2120         int i;
2121
2122         if ((ifp->if_flags & (IFF_ALLMULTI | IFF_PROMISC)) != 0) {
2123                 bzero(addr, ETHER_ADDR_LEN);
2124                 bzero(mask, ETHER_ADDR_LEN);
2125                 goto done;
2126         }
2127
2128         bcopy(etherbroadcastaddr, addr, ETHER_ADDR_LEN);
2129         bcopy(etherbroadcastaddr, mask, ETHER_ADDR_LEN);
2130
2131         LIST_FOREACH(ifma, &ifp->if_multiaddrs, ifma_link) {
2132                 caddr_t maddr;
2133
2134                 if (ifma->ifma_addr->sa_family != AF_LINK)
2135                         continue;
2136
2137                 maddr = LLADDR((struct sockaddr_dl *)ifma->ifma_addr);
2138                 for (i = 0; i < ETHER_ADDR_LEN; i++) {
2139                         addr[i] &= maddr[i];
2140                         mask[i] &= ~maddr[i];
2141                 }
2142         }
2143
2144         for (i = 0; i < ETHER_ADDR_LEN; i++)
2145                 mask[i] |= addr[i];
2146
2147 done:
2148         addr[0] |= 0x01;        /* make sure multicast bit is set */
2149
2150         NFE_WRITE(sc, NFE_MULTIADDR_HI,
2151             addr[3] << 24 | addr[2] << 16 | addr[1] << 8 | addr[0]);
2152         NFE_WRITE(sc, NFE_MULTIADDR_LO,
2153             addr[5] <<  8 | addr[4]);
2154         NFE_WRITE(sc, NFE_MULTIMASK_HI,
2155             mask[3] << 24 | mask[2] << 16 | mask[1] << 8 | mask[0]);
2156         NFE_WRITE(sc, NFE_MULTIMASK_LO,
2157             mask[5] <<  8 | mask[4]);
2158
2159         filter |= (ifp->if_flags & IFF_PROMISC) ? NFE_PROMISC : NFE_U2M;
2160         NFE_WRITE(sc, NFE_RXFILTER, filter);
2161 }
2162
2163 static void
2164 nfe_get_macaddr(struct nfe_softc *sc, uint8_t *addr)
2165 {
2166         uint32_t lo, hi;
2167
2168         lo = NFE_READ(sc, NFE_MACADDR_LO);
2169         hi = NFE_READ(sc, NFE_MACADDR_HI);
2170         if (sc->sc_caps & NFE_FIX_EADDR) {
2171                 addr[0] = (lo >> 8) & 0xff;
2172                 addr[1] = (lo & 0xff);
2173
2174                 addr[2] = (hi >> 24) & 0xff;
2175                 addr[3] = (hi >> 16) & 0xff;
2176                 addr[4] = (hi >>  8) & 0xff;
2177                 addr[5] = (hi & 0xff);
2178         } else {
2179                 addr[0] = (hi & 0xff);
2180                 addr[1] = (hi >>  8) & 0xff;
2181                 addr[2] = (hi >> 16) & 0xff;
2182                 addr[3] = (hi >> 24) & 0xff;
2183
2184                 addr[4] = (lo & 0xff);
2185                 addr[5] = (lo >>  8) & 0xff;
2186         }
2187 }
2188
2189 static void
2190 nfe_set_macaddr(struct nfe_softc *sc, const uint8_t *addr)
2191 {
2192         NFE_WRITE(sc, NFE_MACADDR_LO,
2193             addr[5] <<  8 | addr[4]);
2194         NFE_WRITE(sc, NFE_MACADDR_HI,
2195             addr[3] << 24 | addr[2] << 16 | addr[1] << 8 | addr[0]);
2196 }
2197
2198 static void
2199 nfe_tick(void *arg)
2200 {
2201         struct nfe_softc *sc = arg;
2202         struct ifnet *ifp = &sc->arpcom.ac_if;
2203         struct mii_data *mii = device_get_softc(sc->sc_miibus);
2204
2205         lwkt_serialize_enter(ifp->if_serializer);
2206
2207         mii_tick(mii);
2208         callout_reset(&sc->sc_tick_ch, hz, nfe_tick, sc);
2209
2210         lwkt_serialize_exit(ifp->if_serializer);
2211 }
2212
2213 static void
2214 nfe_buf_dma_addr(void *arg, bus_dma_segment_t *segs, int nsegs,
2215                  bus_size_t mapsz __unused, int error)
2216 {
2217         struct nfe_dma_ctx *ctx = arg;
2218         int i;
2219
2220         if (error)
2221                 return;
2222
2223         if (nsegs > ctx->nsegs) {
2224                 ctx->nsegs = 0;
2225                 return;
2226         }
2227
2228         ctx->nsegs = nsegs;
2229         for (i = 0; i < nsegs; ++i)
2230                 ctx->segs[i] = segs[i];
2231 }
2232
2233 static int
2234 nfe_newbuf_std(struct nfe_softc *sc, struct nfe_rx_ring *ring, int idx,
2235                int wait)
2236 {
2237         struct nfe_rx_data *data = &ring->data[idx];
2238         struct nfe_dma_ctx ctx;
2239         bus_dma_segment_t seg;
2240         bus_dmamap_t map;
2241         struct mbuf *m;
2242         int error;
2243
2244         m = m_getcl(wait ? MB_WAIT : MB_DONTWAIT, MT_DATA, M_PKTHDR);
2245         if (m == NULL)
2246                 return ENOBUFS;
2247         m->m_len = m->m_pkthdr.len = MCLBYTES;
2248
2249         ctx.nsegs = 1;
2250         ctx.segs = &seg;
2251         error = bus_dmamap_load_mbuf(ring->data_tag, ring->data_tmpmap,
2252                                      m, nfe_buf_dma_addr, &ctx,
2253                                      wait ? BUS_DMA_WAITOK : BUS_DMA_NOWAIT);
2254         if (error || ctx.nsegs == 0) {
2255                 if (!error) {
2256                         bus_dmamap_unload(ring->data_tag, ring->data_tmpmap);
2257                         error = EFBIG;
2258                         if_printf(&sc->arpcom.ac_if, "too many segments?!\n");
2259                 }
2260                 m_freem(m);
2261
2262                 if (wait) {
2263                         if_printf(&sc->arpcom.ac_if,
2264                                   "could map RX mbuf %d\n", error);
2265                 }
2266                 return error;
2267         }
2268
2269         /* Unload originally mapped mbuf */
2270         bus_dmamap_unload(ring->data_tag, data->map);
2271
2272         /* Swap this DMA map with tmp DMA map */
2273         map = data->map;
2274         data->map = ring->data_tmpmap;
2275         ring->data_tmpmap = map;
2276
2277         /* Caller is assumed to have collected the old mbuf */
2278         data->m = m;
2279
2280         nfe_set_paddr_rxdesc(sc, ring, idx, seg.ds_addr);
2281
2282         bus_dmamap_sync(ring->data_tag, data->map, BUS_DMASYNC_PREREAD);
2283         return 0;
2284 }
2285
2286 static int
2287 nfe_newbuf_jumbo(struct nfe_softc *sc, struct nfe_rx_ring *ring, int idx,
2288                  int wait)
2289 {
2290         struct nfe_rx_data *data = &ring->data[idx];
2291         struct nfe_jbuf *jbuf;
2292         struct mbuf *m;
2293
2294         MGETHDR(m, wait ? MB_WAIT : MB_DONTWAIT, MT_DATA);
2295         if (m == NULL)
2296                 return ENOBUFS;
2297
2298         jbuf = nfe_jalloc(sc);
2299         if (jbuf == NULL) {
2300                 m_freem(m);
2301                 if_printf(&sc->arpcom.ac_if, "jumbo allocation failed "
2302                     "-- packet dropped!\n");
2303                 return ENOBUFS;
2304         }
2305
2306         m->m_ext.ext_arg = jbuf;
2307         m->m_ext.ext_buf = jbuf->buf;
2308         m->m_ext.ext_free = nfe_jfree;
2309         m->m_ext.ext_ref = nfe_jref;
2310         m->m_ext.ext_size = NFE_JBYTES;
2311
2312         m->m_data = m->m_ext.ext_buf;
2313         m->m_flags |= M_EXT;
2314         m->m_len = m->m_pkthdr.len = m->m_ext.ext_size;
2315
2316         /* Caller is assumed to have collected the old mbuf */
2317         data->m = m;
2318
2319         nfe_set_paddr_rxdesc(sc, ring, idx, jbuf->physaddr);
2320
2321         bus_dmamap_sync(ring->jtag, ring->jmap, BUS_DMASYNC_PREREAD);
2322         return 0;
2323 }
2324
2325 static void
2326 nfe_set_paddr_rxdesc(struct nfe_softc *sc, struct nfe_rx_ring *ring, int idx,
2327                      bus_addr_t physaddr)
2328 {
2329         if (sc->sc_caps & NFE_40BIT_ADDR) {
2330                 struct nfe_desc64 *desc64 = &ring->desc64[idx];
2331
2332                 desc64->physaddr[0] = htole32(NFE_ADDR_HI(physaddr));
2333                 desc64->physaddr[1] = htole32(NFE_ADDR_LO(physaddr));
2334         } else {
2335                 struct nfe_desc32 *desc32 = &ring->desc32[idx];
2336
2337                 desc32->physaddr = htole32(physaddr);
2338         }
2339 }
2340
2341 static void
2342 nfe_set_ready_rxdesc(struct nfe_softc *sc, struct nfe_rx_ring *ring, int idx)
2343 {
2344         if (sc->sc_caps & NFE_40BIT_ADDR) {
2345                 struct nfe_desc64 *desc64 = &ring->desc64[idx];
2346
2347                 desc64->length = htole16(ring->bufsz);
2348                 desc64->flags = htole16(NFE_RX_READY);
2349         } else {
2350                 struct nfe_desc32 *desc32 = &ring->desc32[idx];
2351
2352                 desc32->length = htole16(ring->bufsz);
2353                 desc32->flags = htole16(NFE_RX_READY);
2354         }
2355 }
2356
2357 static int
2358 nfe_sysctl_imtime(SYSCTL_HANDLER_ARGS)
2359 {
2360         struct nfe_softc *sc = arg1;
2361         struct ifnet *ifp = &sc->arpcom.ac_if;
2362         uint32_t flags;
2363         int error, v;
2364
2365         lwkt_serialize_enter(ifp->if_serializer);
2366
2367         flags = sc->sc_flags & ~NFE_F_DYN_IM;
2368         v = sc->sc_imtime;
2369         if (sc->sc_flags & NFE_F_DYN_IM)
2370                 v = -v;
2371
2372         error = sysctl_handle_int(oidp, &v, 0, req);
2373         if (error || req->newptr == NULL)
2374                 goto back;
2375
2376         if (v < 0) {
2377                 flags |= NFE_F_DYN_IM;
2378                 v = -v;
2379         }
2380
2381         if (v != sc->sc_imtime || (flags ^ sc->sc_flags)) {
2382                 int old_imtime = sc->sc_imtime;
2383                 uint32_t old_flags = sc->sc_flags;
2384
2385                 sc->sc_imtime = v;
2386                 sc->sc_flags = flags;
2387                 sc->sc_irq_enable = NFE_IRQ_ENABLE(sc);
2388
2389                 if ((ifp->if_flags & (IFF_POLLING | IFF_RUNNING))
2390                     == IFF_RUNNING) {
2391                         if (old_imtime * sc->sc_imtime == 0 ||
2392                             (old_flags ^ sc->sc_flags)) {
2393                                 ifp->if_init(sc);
2394                         } else {
2395                                 NFE_WRITE(sc, NFE_IMTIMER,
2396                                           NFE_IMTIME(sc->sc_imtime));
2397                         }
2398                 }
2399         }
2400 back:
2401         lwkt_serialize_exit(ifp->if_serializer);
2402         return error;
2403 }
2404
2405 static void
2406 nfe_powerup(device_t dev)
2407 {
2408         struct nfe_softc *sc = device_get_softc(dev);
2409         uint32_t pwr_state;
2410         uint16_t did;
2411
2412         /*
2413          * Bring MAC and PHY out of low power state
2414          */
2415
2416         pwr_state = NFE_READ(sc, NFE_PWR_STATE2) & ~NFE_PWRUP_MASK;
2417
2418         did = pci_get_device(dev);
2419         if ((did == PCI_PRODUCT_NVIDIA_MCP51_LAN1 ||
2420              did == PCI_PRODUCT_NVIDIA_MCP51_LAN2) &&
2421             pci_get_revid(dev) >= 0xa3)
2422                 pwr_state |= NFE_PWRUP_REV_A3;
2423
2424         NFE_WRITE(sc, NFE_PWR_STATE2, pwr_state);
2425 }
2426
2427 static void
2428 nfe_mac_reset(struct nfe_softc *sc)
2429 {
2430         uint32_t rxtxctl = sc->rxtxctl_desc | NFE_RXTX_BIT2;
2431         uint32_t macaddr_hi, macaddr_lo, tx_poll;
2432
2433         NFE_WRITE(sc, NFE_RXTX_CTL, NFE_RXTX_RESET | rxtxctl);
2434
2435         /* Save several registers for later restoration */
2436         macaddr_hi = NFE_READ(sc, NFE_MACADDR_HI);
2437         macaddr_lo = NFE_READ(sc, NFE_MACADDR_LO);
2438         tx_poll = NFE_READ(sc, NFE_TX_POLL);
2439
2440         NFE_WRITE(sc, NFE_MAC_RESET, NFE_RESET_ASSERT);
2441         DELAY(100);
2442
2443         NFE_WRITE(sc, NFE_MAC_RESET, 0);
2444         DELAY(100);
2445
2446         /* Restore saved registers */
2447         NFE_WRITE(sc, NFE_MACADDR_HI, macaddr_hi);
2448         NFE_WRITE(sc, NFE_MACADDR_LO, macaddr_lo);
2449         NFE_WRITE(sc, NFE_TX_POLL, tx_poll);
2450
2451         NFE_WRITE(sc, NFE_RXTX_CTL, rxtxctl);
2452 }
2453
2454 static void
2455 nfe_enable_intrs(struct nfe_softc *sc)
2456 {
2457         /*
2458          * NFE_IMTIMER generates a periodic interrupt via NFE_IRQ_TIMER.
2459          * It is unclear how wide the timer is.  Base programming does
2460          * not seem to effect NFE_IRQ_TX_DONE or NFE_IRQ_RX_DONE so
2461          * we don't get any interrupt moderation.  TX moderation is
2462          * possible by using the timer interrupt instead of TX_DONE.
2463          *
2464          * It is unclear whether there are other bits that can be
2465          * set to make the NFE device actually do interrupt moderation
2466          * on the RX side.
2467          *
2468          * For now set a 128uS interval as a placemark, but don't use
2469          * the timer.
2470          */
2471         if (sc->sc_imtime == 0)
2472                 NFE_WRITE(sc, NFE_IMTIMER, NFE_IMTIME_DEFAULT);
2473         else
2474                 NFE_WRITE(sc, NFE_IMTIMER, NFE_IMTIME(sc->sc_imtime));
2475
2476         /* Enable interrupts */
2477         NFE_WRITE(sc, NFE_IRQ_MASK, sc->sc_irq_enable);
2478
2479         if (sc->sc_irq_enable & NFE_IRQ_TIMER)
2480                 sc->sc_flags |= NFE_F_IRQ_TIMER;
2481         else
2482                 sc->sc_flags &= ~NFE_F_IRQ_TIMER;
2483 }
2484
2485 static void
2486 nfe_disable_intrs(struct nfe_softc *sc)
2487 {
2488         /* Disable interrupts */
2489         NFE_WRITE(sc, NFE_IRQ_MASK, 0);
2490         sc->sc_flags &= ~NFE_F_IRQ_TIMER;
2491 }