Numpy：加入结构化数组

使用Numpy的结构化数组可以方便地处理具有不同数据类型的数据。结构化数组是一种可以包含不同数据类型的多维数组，每个元素可以由多个字段组成。这使得我们可以将表格数据或数据库的数据导入到Numpy数组中，并且可以通过字段名称来访问和操作数据。接下来，我们将介绍如何创建和使用结构化数组，并通过一个案例代码来演示其用法。

创建结构化数组

要创建结构化数组，我们可以使用`numpy.array()`函数，并在`dtype`参数中指定每个字段的名称和数据类型。每个字段需要以元组的形式表示，其中包含字段名称和字段数据类型。下面是一个例子：

python
import numpy as np
# 创建结构化数组
data = np.array([(1, "John", 28), (2, "Alice", 32), (3, "Bob", 25)],
                dtype=[("id", int), ("name", "U10"), ("age", int)])
print(data)

输出结果为：


[(1, 'John', 28) (2, 'Alice', 32) (3, 'Bob', 25)]

可以看到，结构化数组中的每个元素由三个字段组成：id、name和age。id和age的数据类型为整数，name的数据类型为Unicode字符串。

访问结构化数组

通过字段名称，我们可以方便地访问结构化数组中的数据。例如，要访问name字段的所有值，我们可以使用以下方式：

python
names = data["name"]
print(names)

输出结果为：


['John' 'Alice' 'Bob']

我们也可以通过索引来访问结构化数组中的具体元素。例如，要访问第一个元素的age字段，可以使用以下方式：

python
age = data[0]["age"]
print(age)

输出结果为：

使用结构化数组进行计算

结构化数组可以像普通的Numpy数组一样进行计算。例如，我们可以计算所有人的平均年龄：

python
average_age = np.mean(data["age"])
print(average_age)

输出结果为：

28.333333333333332

我们还可以使用布尔索引来选择满足特定条件的元素。例如，我们可以选择年龄大于30岁的人：

python
older_than_30 = data[data["age"] > 30]
print(older_than_30)

输出结果为：


[(2, 'Alice', 32)]

案例代码

下面是一个完整的案例代码，演示了如何使用结构化数组处理学生的成绩数据。每个学生有姓名、年龄和三门科目的成绩。

python
import numpy as np
# 创建结构化数组
students = np.array([("John", 20, 80, 90, 85),
                     ("Alice", 22, 75, 95, 88),
                     ("Bob", 21, 90, 85, 92)],
                    dtype=[("name", "U10"), ("age", int), ("math", float), ("english", float), ("physics", float)])
# 计算每个学生的平均成绩
average_scores = np.mean([students["math"], students["english"], students["physics"]], axis=0)
# 添加平均成绩字段到结构化数组
students = np.lib.recfunctions.append_fields(students, "average", average_scores, usemask=False)
print(students)

输出结果为：


[('John', 20, 80., 90., 85., 85.) ('Alice', 22, 75., 95., 88., 86.) ('Bob', 21, 90., 85., 92., 89.)]

可以看到，我们计算了每个学生的平均成绩，并将其作为一个新的字段添加到结构化数组中。

上一篇：Py.Test 为所有测试添加标记下一篇：numpy：如果 numpy 数组是视图，则可靠（非保守）指示器

=

PyPI 很慢。我如何运行自己的服务器: 　　　　如何运行自己的 PyPI 服务器PyPI（Python Package Index）作为Python的软件包仓库，提供了大量的开源软件包供开发者使用。然而，由于网络问题，有时访问PyPI会非常缓慢。为...... ...
PyPI 包的安装数量统计: 　　　　PyPI 包的安装数量统计PyPI（Python Package Index）是一个存储Python包的仓库，开发者可以通过PyPI安装和发布自己的Python包。PyPI的包含了各种各样的Python包，涵盖了从数...... ...
pypdf 将多个pdf文件合并为一个pdf: 　　　　使用Python的pypdf库可以很方便地将多个PDF文件合并为一个PDF。下面是一个案例代码，演示了如何使用pypdf库进行PDF文件合并：pythonimport PyPDF2# 创建一个PDF写入对象out...... ...
Pyparsing：空格有时很重要...有时则不然: 　　　　Pyparsing：空格有时很重要...有时则不然在计算机编程中，文本解析是一个常见的任务。无论是处理日志文件、解析配置文件还是分析自然语言，我们经常需要将一段文本按照特定...... ...
python 3.4 版本不支持 'ur' 前缀: 　　　　Python 3.4版本不再支持以'ur'前缀来表示Unicode字符串，这意味着我们不能再简单地在字符串前添加'ur'前缀来表示Unicode字符串了。不过，Python 3.4及之后的版本默认支持Un...... ...
Python 3.4 多处理队列比管道更快，出乎意料[重复]: 　　　　Python 3.4 多处理队列比管道更快，出乎意料在Python编程中，使用多处理技术可以提高程序的运行效率。Python 3.4引入了一种新的多处理队列，通过对比测试发现，这种队列比传...... ...
python 3.4 和 3.5 之间的协程，如何保持后台兼容性: 　　　　Python 3.4和3.5之间的协程已经发生了一些变化，因此如何保持后台兼容性成为了一个重要的问题。协程是一种轻量级的并发编程方式，可以提高程序的性能和响应能力。在Python中...... ...
Python 3.4 和 2.7 安装没有 Script 文件夹并且没有安装 pip: 　　　　Python是一种广泛使用的高级编程语言，可以应用于多个领域，包括科学计算、数据分析、人工智能等。Python的版本有很多，其中比较常见的是Python 3.4和Python 2.7。不同版本...... ...
PyOpenGL glutInit NullFunctionError: 　　　　使用PyOpenGL时，可能会遇到glutInit NullFunctionError的错误。这个错误通常是由于在使用PyOpenGL之前没有正确初始化GLUT库所导致的。为了解决这个问题，我们需要在程序的...... ...
pyodbc插入sql: 　　　　使用Python进行数据库操作是非常常见的需求之一。而在Python中，pyodbc是一个常用的库，可以方便地连接和操作各种数据库。本文将介绍如何使用pyodbc插入SQL语句，并给出一个...... ...
Pyodbc 错误未找到数据源名称且未指定默认驱动程序悖论: 　　　　解决Pyodbc错误：未找到数据源名称且未指定默认驱动程序悖论在使用Pyodbc进行数据库连接时，有时会遇到"未找到数据源名称且未指定默认驱动程序"的错误。这个错误通常发生在...... ...
Pyodbc - “未找到数据源名称，并且未指定默认驱动程序”: 　　　　在使用Pyodbc连接数据库时，有时候会遇到一个常见的错误信息：“未找到数据源名称，并且未指定默认驱动程序”。这个错误通常意味着我们在连接数据库时出现了一些问题，需要...... ...
Python 3.4 中的“异步”: 　　　　在Python 3.4中，引入了一种新的编程模型——异步编程。这种编程模型的设计目的是为了更好地处理并发和并行任务，以提升程序的性能和响应能力。异步编程的概念是基于协程（...... ...
Python 3.4 中从 PDF 中提取文本的最佳工具 [关闭]: 　　　　使用Python 3.4从PDF中提取文本的最佳工具自然语言生成文章在Python编程语言中，有许多工具可用于从PDF文件中提取文本。然而，对于Python 3.4版本而言，其中一种最佳的工具...... ...
Python 3.4 中“强制转换”为 int: 　　　　Python是一种简单易学的编程语言，它提供了丰富的内置函数和库，使得开发者能够轻松地处理各种任务。在Python 3.4中，我们可以使用内置函数int来进行强制类型转换，将一个数...... ...