数据分析与可视化 实践基础练习三(NumPy)
数据分析与可视化 实践基础练习三 (NumPy)
一、实训要求
实训:葡萄酒品质数据NumPy基础分析
本次案例使用葡萄酒品质数据,该数据集包含1599种红葡萄酒的各种信息,如酒的固定酸度、挥发性酸度和pH值等测量值,也包括一个酒的品质得分,该得分是至少三类口味测试者给该款酒打分的平均值。该数据来源于公开数据库UCI,更多详细信息可以查看 https://archive.ics.uci.edu/ml/datasets/Wine+Quality 。
数据集下载,DataSet。
数据说明:
二、练习题目
请完成以下操作:
1、提取第一种葡萄酒的所有数据;
2、将葡萄酒数据降为一维数据;
3、将降维后的数组重新恢复成以前的形状;
4、我们计划引入一种新的葡萄酒品质打分方法,同时保留原来的品质得分,所以需要添加一列新值在原始数组后,初始值全为0;
5、我们认为葡萄酒数据中的品质得分普遍偏低,打算将所有葡萄酒的品质得分加10;
6、我们想要选择最大化酒精含量和品质的葡萄酒(我们想喝醉,但我们想喝好酒),需要计算各葡萄酒酒精度数乘以品质得分的值;
7、计算品质得分数据的标准差;
8、哪些葡萄酒的酒精度数高于10 ,并统计其个数。
三、题解
1 | # 基础实训3:葡萄酒品质数据NumPy基础分析 |
1 | array([[ 7.4 , 0.7 , 0. , ..., 0.56 , 9.4 , 5. ], |
1 | # 1、提取第一种葡萄酒的所有数据; |
1 | array([ 7.4 , 0.7 , 0. , 1.9 , 0.076 , 11. , 34. , |
1 | # 2、将葡萄酒数据降为一维数据; |
1 | array([ 7.4 , 0.7 , 0. , ..., 0.66, 11. , 6. ]) |
1 | wines.shape |
1 | (1599, 12) |
1 | # 方法二 |
1 | array([[ 7.4 , 0.7 , 0. , ..., 0.66, 11. , 6. ]]) |
1 | # 3、将降维后的数组重新恢复成以前的形状; |
1 | array([[ 7.4 , 0.7 , 0. , ..., 0.56 , 9.4 , 5. ], |
1 | # 4、我们计划引入一种新的葡萄酒品质打分方法,同时保留原来的品质得分,所以需要添加一列新值在原始数组后,初始值全为0; |
1 | array([[ 7.4 , 0.7 , 0. , ..., 9.4 , 5. , 0. ], |
1 | # 5、我们认为葡萄酒数据中的品质得分普遍偏低,打算将所有葡萄酒的品质得分加10; |
1 | array([[ 7.4 , 0.7 , 0. , ..., 9.4 , 15. , 0. ], |
1 | # 6、我们想要选择最大化酒精含量和品质的葡萄酒(我们想喝醉,但我们想喝好酒),需要计算各葡萄酒酒精度数乘以品质得分的值。 |
1 | [141. 147. 147. ... 176. 153. 176.] |
1 | # 7、计算品质得分数据的标准差。 |
1 | 0.8073168769639513 |
1 | # 8、哪些葡萄酒的酒精度数高于10 ,并统计其个数。 |
1 | 852 |
四、参考资料
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 AriesfunのBlog!
评论