python pandas中describe()各项含义及求值

如图，25%,75%是如何求出来的... 如图，25%,75%是如何求出来的展开

 我来答

5个回答

#热议# 什么是淋病？哪些行为会感染淋病？

小白聊电子科技

高粉答主

2020-02-22 · 专注电子数码问题解答

小白聊电子科技

采纳数：775 获赞数：75458

向TA提问私信TA

关注

展开全部

1、在pandas中，我们采用了R语言中的惯用法，即将缺失值表示为NA，它表示不可用not available。

2、pandas项目中还在不断优化内部细节以更好处理缺失数据。

3、过滤掉缺失数据的办法有很多种。可以通过pandas.isnull或布尔索引的手工方法，但dropna可能会更实用一些。对于一个Series，dropna返回一个仅含非空数据和索引值的Series。

4、而对于DataFrame对象，可能希望丢弃全NA或含有NA的行或列。dropna默认丢弃任何含有缺失值的行。

5、最后通过一个常数调用fillna就会将缺失值替换为那个常数值，若是通过一个字典调用fillna，就可以实现对不同的列填充不同的值。这样就完成了。

已赞过 已踩过<

评论收起

百度网友0540a06
2020-02-13

知道答主

回答量：4

采纳率：0%

帮助的人：4986

我也去答题访问个人页

关注

展开全部

python pandas中，对于一维数组，describe会返回一系列参数，count，mean，std，min，25%，50%，75%，max。

针对该问题，对于describe()返回值的解释如下：

1、count：返回数组的个数，如上述为4个元素，所以返回为4；

2、mean：返回数组的平均值，1 3 5 9的平均值为4.5；

3、std：返回数组的标准差；

4、min：返回数组的最小值；

5、25%，50%，75%：返回数组的三个不同百分位置的数值，也就是统计学中的四分位数。首先需要确定三个四分位数的位置，第一个四分位数Q1所在的位置是：(1+4)/4 = 1.25，同理Q2的位置是：(1+4)/4×2 = 2.5，Q3的位置是：(1+4)/4×3 = 3.75，则三个位置所对应的数分别为：

1×0.25+3×0.75＝2.5

3×0.5+5×0.5 = 4

5×0.75+9×0.25 = 6

即为函数返回的相应的值，其中50%对应的是中位数。

6、max：返回列表的最大值。

扩展资料：

describe()函数有三个参数可以指定，分别是percentiles, include, exclude，三者的含义如下：

1、percentiles：默认是返回四分位数，即25%，50%和75%，可以修改：describe(percentiles=[.75, 0.8])，则返回的是50%，75%，80%位置的数，可以根据需要进行相应的处理。

2、include：默认只计算数值型特征的统计量，当参数为'all'时，显示所有类型的数据；当参数为numpy.number时，返回的是数值类型的数据；当参数为numpy.object，返回的是object类型的数据；当include=['category']时，返回的是category；当include=['O']时，返回统计的是字符串型的数据。

3、exclude：include可以指定返回类型，而exclude则可以指定不返回某种类型，即返回除指定类型之外的数据。

参考资料来源：python API-describe

参考资料来源：百度百科-四分位数

本回答被网友采纳

已赞过 已踩过<

评论收起

匿名用户
2017-08-14

展开全部

python pandas describe 怎么没有描述性统计了
你遇到的问题一看就是少装了包。在windows下安装pandas，只安装pandas一个包显然是不够的，它并没有把用到的相关包都打进去，这点是很麻烦的，只有等错误信息出来后才知道少了哪些包。

我总结了一下，一共需要安装如下包：
pyparsing-2.0.2.win32-py2.7.exe
matplotllib-1.3.1.win32-py2.7.exe
openpyxl-openpyxl-5d2c0c8704d2.tar.gz
setuptools-3.8.1.win32-py2.7.exe
numpy-MKL-1.8.1.win32-py2.7.exe
six-1.7.3.win32-py2.7.exe
python-dateutil-2.2.win32-py2.7.exe

已赞过 已踩过<

评论收起

000Kirito000
2019-07-14

知道答主

回答量：1

采纳率：0%

帮助的人：721

我也去答题访问个人页

关注

展开全部

将数据从小到大排列，处在1/4点和3/4点的数字，类似中位数也就是50%
count 计数， mean 平均值， std 标准差， min 最小值, 25% 下四分位， 50% 中位数， 75% 上四分位， max 最大值

已赞过 已踩过<

评论收起

DB的沐浴器
2018-01-31 · 超过10用户采纳过TA的回答

知道答主

回答量：57

采纳率：0%

帮助的人：10.5万

我也去答题访问个人页

关注

展开全部

If you go a quarter way through the list, you'll find a number that is bigger than 25% of the values and smaller than 75% of the values. That is the 25% value (pronounced "25th percentile"). The 50th and 75th percentiles are defined analgously.

已赞过 已踩过<

评论收起

更多回答（3）

推荐律师服务：若未解决您的问题，请您详细描述您的问题，通过百度律临进行免费专业咨询

python pandas中describe()各项含义及求值

其他类似问题

为你推荐：