Ravenports generated: 04 Feb 2024 03:31
[ravenports.git] / bucket_6B / python-pandas
1 # Buildsheet autogenerated by ravenadm tool -- Do not edit.
2
3 NAMEBASE=               python-pandas
4 VERSION=                2.1.1
5 KEYWORDS=               python
6 VARIANTS=               v11 v12
7 SDESC[v11]=             Data structures for time series, statistics (3.11)
8 SDESC[v12]=             Data structures for time series, statistics (3.12)
9 HOMEPAGE=               https://pandas.pydata.org
10 CONTACT=                Python_Automaton[python@ironwolf.systems]
11
12 DOWNLOAD_GROUPS=        main
13 SITES[main]=            PYPI/p/pandas
14 DISTFILE[1]=            pandas-2.1.1.tar.gz:main
15 DF_INDEX=               1
16 SPKGS[v11]=             single
17 SPKGS[v12]=             single
18
19 OPTIONS_AVAILABLE=      PY312 PY311
20 OPTIONS_STANDARD=       none
21 VOPTS[v11]=             PY312=OFF PY311=ON
22 VOPTS[v12]=             PY312=ON PY311=OFF
23
24 BROKEN[all]=            No wheel and difficult to build from source, WIP
25
26 BUILD_DEPENDS=          python-Cython:single:python_used
27
28 USES=                   cpe meson c++:single
29
30 DISTNAME=               pandas-2.1.1
31
32 CPE_PRODUCT=            pandas
33 CPE_VENDOR=             numfocus
34 GENERATED=              yes
35
36 [PY311].BUILDRUN_DEPENDS_ON=            python-python-dateutil:single:v11
37                                         python-pytz:single:v11
38                                         python-numpy:single:v11
39 [PY311].BUILD_DEPENDS_ON=               python-versioneer:single:v11
40 [PY311].USES_ON=                        python:v11,sutools
41
42 [PY312].BUILDRUN_DEPENDS_ON=            python-python-dateutil:single:v12
43                                         python-pytz:single:v12
44                                         python-numpy:single:v12
45 [PY312].BUILD_DEPENDS_ON=               python-versioneer:single:v12
46 [PY312].USES_ON=                        python:v12,sutools
47
48 [FILE:3351:descriptions/desc.single]
49
50 **pandas** is a Python package that provides fast, flexible, and expressive
51 data
52 structures designed to make working with structured (tabular,
53 multidimensional,
54 potentially heterogeneous) and time series data both easy and intuitive. It
55 aims to be the fundamental high-level building block for doing practical,
56 **real world** data analysis in Python. Additionally, it has the broader
57 goal
58 of becoming **the most powerful and flexible open source data analysis /
59 manipulation tool available in any language**. It is already well on its
60 way
61 toward this goal.
62
63 pandas is well suited for many different kinds of data:
64
65   - Tabular data with heterogeneously-typed columns, as in an SQL table or
66     Excel spreadsheet
67   - Ordered and unordered (not necessarily fixed-frequency) time series
68 data.
69   - Arbitrary matrix data (homogeneously typed or heterogeneous) with row
70 and
71     column labels
72   - Any other form of observational / statistical data sets. The data
73 actually
74     need not be labeled at all to be placed into a pandas data structure
75
76 The two primary data structures of pandas, Series (1-dimensional) and
77 DataFrame
78 (2-dimensional), handle the vast majority of typical use cases in finance,
79 statistics, social science, and many areas of engineering. For R users,
80 DataFrame provides everything that R's ``data.frame`` provides and much
81 more. pandas is built on top of [NumPy] and is
82 intended to integrate well within a scientific computing environment with
83 many
84 other 3rd party libraries.
85
86 Here are just a few of the things that pandas does well:
87
88   - Easy handling of **missing data** (represented as NaN) in floating
89 point as
90     well as non-floating point data
91   - Size mutability: columns can be **inserted and deleted** from DataFrame
92 and
93     higher dimensional objects
94   - Automatic and explicit **data alignment**: objects can be explicitly
95     aligned to a set of labels, or the user can simply ignore the labels
96 and
97     let `Series`, `DataFrame`, etc. automatically align the data for you in
98     computations
99   - Powerful, flexible **group by** functionality to perform
100     split-apply-combine operations on data sets, for both aggregating and
101     transforming data
102   - Make it **easy to convert** ragged, differently-indexed data in other
103     Python and NumPy data structures into DataFrame objects
104   - Intelligent label-based **slicing**, **fancy indexing**, and
105 **subsetting**
106     of large data sets
107   - Intuitive **merging** and **joining** data sets
108   - Flexible **reshaping** and pivoting of data sets
109   - **Hierarchical** labeling of axes (possible to have multiple labels per
110     tick)
111   - Robust IO tools for loading data from **flat files** (CSV and
112 delimited),
113     Excel files, databases, and saving / loading data from the ultrafast
114 **HDF5
115     format**
116   - **Time series**-specific functionality: date range generation and
117 frequency
118     conversion, moving window statistics, date shifting and lagging.
119
120 Many of these principles are here to address the shortcomings frequently
121 experienced using other languages / scientific research environments. For
122 data
123 scientists, working with data is typically divided into multiple stages:
124 munging and cleaning data, analyzing / modeling it, then organizing the
125 results
126 of the analysis into a form suitable for plotting or tabular display.
127 pandas is
128 the ideal tool for all of these tasks.
129
130
131 [FILE:98:distinfo]
132 fecb198dc389429be557cde50a2d46da8434a17fe37d7d41ff102e3987fd947b      4266250 pandas-2.1.1.tar.gz
133