Initial import from FreeBSD RELENG_4:
[dragonfly.git] / gnu / usr.bin / ptx / examples / ignore / README
1 From beebe@math.utah.edu Wed Oct 27 19:37:22 1993
2 Date: Tue, 26 Oct 93 15:43:19 MDT
3 From: "Nelson H. F. Beebe" <beebe@math.utah.edu>
4 To: pinard@iro.umontreal.ca
5 Subject: Re: Another short comment on gptx 0.2
6
7 /usr/lib/eign:          DECstation 5000, ULTRIX 4.3
8                         HP 9000/735, HP-UX 9.0
9                         IBM RS/6000, AIX 2.3
10                         IBM 3090, AIX MP370 2.1
11                         Stardent 1520, OS 2.2
12                         Sun SPARCstation, SunOS 4.x
13
14 No eign anywhere on:    HP 375, BSD 4.3 (ptx.c is in /usr/src/usr.bin,
15                                 and the source code refers to /usr/lib/eign,
16                                 but I could not find it in the source tree)
17                         NeXT, Mach 3.0 (though documented in man pages)
18                         Sun SPARCstation, Solaris 2.x
19                         SGI Indigo, IRIX 4.0.x
20                         
21 The contents of the eign files that I found on the above machines were
22 almost identical.  With the exception of the Stardent and the IBM
23 3090, there were only two such files, one with 150 words, and the
24 other with 133, with only a few differences between them (some words
25 in the 133-word file were not in the 150-word file).  I found the
26 133-word variant in groff-1.06/src/indxbib.  I used archie to search
27 for eign, and it found 7 sites, all with the groff versions.
28
29 The Stardent and IBM 3090 eign files have the same contents as the
30 150-word version, but have a multiline copyright comment at the
31 beginning.  None of the others contains a copyright.
32
33 I recently had occasion to build a similar list of words for bibindex,
34 which indexes a BibTeX .bib file, and for which omission of common
35 words, like articles and prepositions, helps to reduce the size of the
36 index.  I didn't use eign to build that list, but instead, went
37 through the word lists from 3.8MB of .bib files in the tuglib
38 collection on ftp.math.utah.edu:pub/tex/bib, and collected words to be
39 ignored.  That list includes words from several languages.  I'll leave
40 it up to you to decide whether you wish to merge them or not; I
41 suspect it may be a better design choice to keep a separate eign file
42 for each language, although in my own application of ptx-ing
43 bibliographies, the titles do occur in multiple languages, so a
44 mixed-language eign is appropriate.  Since there are standard ISO
45 2-letter abbreviations for every country, perhaps one could have
46 eign.xy for country xy (of course, only approximately is country ==
47 language).  The exact list of words in eign is not so critical; its
48 only purpose is to reduce the size of the output by not indexing words
49 that occur very frequently and have little content in themselves.
50
51 I'm enclosing a shar bundle at the end of this message with the merger
52 of the multiple eign versions (duplicates eliminated, and the list
53 sorted into 179 unique words), followed by the bibindex list.
54
55
56
57 ========================================================================
58 Nelson H. F. Beebe                      Tel: +1 801 581 5254
59 Center for Scientific Computing         FAX: +1 801 581 4148
60 Department of Mathematics, 105 JWB      Internet: beebe@math.utah.edu
61 University of Utah
62 Salt Lake City, UT 84112, USA
63 ========================================================================
64
65