中国大学moocpython数据分析实践最新考试答案-凯发k8天生赢家

选修课题库 6538
数据分析之numpy库入门

numpy库入门练习

1、请上传练习的代码文件,支持pdf,doc,txt等格式。 根据提交的练习情况的详实程度判定成绩: 练习内容覆盖了全部课堂所讲内容,并加上相应的注释,则成绩可以达到良好,即80分~89分。 练习内容除覆盖了课程所讲内容外,并加上相应的注释,还自行进行了相应的扩展,则成绩可以达到优秀,即90分以上 如未能满足上述要求,则分数在80分以下

数据分析之pandas库入门

pandas数据分析作业

1、请按下面实验任务书的要求完成对应的数据分析任务 实验作业 读取并查看p2p网络贷款数据主表的基本信息 注:主表是training_master 1.实验要求 (1)掌握csv数据的读取方法 (2)掌握dataframe的常用属性和方法 (3)掌握pandas的描述性统计方法 (4)掌握基本的可视化方法 2.需求说明 p2p网络贷款主表数据主要用于存放网贷用户的基本信息。探索数据的基本信息,能够洞察数据的整体分布、数据的类属关系,从而发现数据间的关联。 3.实现思路及步骤 (1)使用ndim,shape,memory_usage属性查看数据的维度、大小、占用内容等信息。 (2)使用describe方法进行描述性统计 (3)剔除全空的列 (4)统计出userinfo_2字段的频数(任选一种方法) (5)按照userinfo_2字段给出直方图

pandas数据分析作业补交处

1、题目要求同前

python数据分析实践综合作业

1、任务一:实现网站资源的http请求 任务描述:一个爬虫的基本功能是读取url和抓取网页内容,这需要爬虫具备实现http请求的功能。请求过程包括生成请求、请求头处理、超时设置、请求重试、查看状态码等,请用request库实现网站(不指定)发送get类型的http请求。 任务要求: (1)查看网站robots协议 (2)使用requests库生成http请求 (3)使用requests库查看状态码与编码 (4)使用requests库采用合适的技巧和方法,如伪装浏览器等获取网页资源 任务二:解析网页 通过解析网页可以获取网页包含的数据信息,如文本、图片、视频等。这需要爬虫能够定位网页中信息的位置并解析网页内容的功能。请利用beautiful soup解析任务一中获取的网络资源的网页内容,获取并解析其中的元素及相关信息。 任务要求: (1)将任务一中获取的网页内容转化为beautifulsoup对象 (2)解析或获取网页的页面的主题内容 (3)根据页面内容的提取需要采用合适的查找方法如findall,find方法等进行网页页面的遍历,必要时使用正则表达式库re (4)将解析出的网页数据进行输出展示并存储,可以根据提取的数据内容,存储到csv,txt,excel或json文件中 任务三(选项1):数据分析 针对网页内容包含数据的,采用pandas进行数据分析 任务要求: (1)利用pandas读取将任务二中存储的数据读取到dataframe对象中 (2)利用dataframe的常用属性进行数据概览,包括但不限于数据维度、数据类型等。 (3)对数据进行预处理工作,包括处理空值、处理重复值等、数据类型变换、数据加工变换等。 (4)对数据进行描述性分析,并给出一些你认为有意义的结论。 (5)在上述分析过程中,给出必要的可视化展示。 任务三(选项2):文本分析 针对网页内容包含文本的,采用jieba进行文本分析 任务要求: (1)对文本进行分析处理 (2)通过观察,利用增加停用词表,增加专业领域词典等方式对改进分词效果 (3)统计词频 (4)利用wordcloud给出文本分析的词云图。 ps:报告模板请见附件

python等级考试模拟题练习

组合数据类型

1、字典 d ={ 'abc' :123,'def':456,'ghi':789 } ,len ( d ) 的结果是
    a、3
    b、6
    c、9
    d、12

2、列表ls=[[2,1],[3,[1,5]],[0,9]],len(ls)的结果是
    a、3
    b、4
    c、5
    d、6

3、关于 python 的元组类型,以下选项中描述错误的是
    a、元组一旦创建就不能被修改
    b、python 中元组采用逗号和圆括号(可选)来表示
    c、元组中元素不可以是不同类型
    d、一个元组可以作为另一个元组的元素 ,可以采用多级索引获取信息

4、s 和 t 是两个集合 ,对 s&t 的描述正确的是
    a、s 和 t 的并运算,包括在集合s和t中的所有元素
    b、s 和 t 的差运算 ,包括在集合s但不在t中的元素
    c、s 和 t 的交运算 ,包括同时在集合s和t中的元素
    d、s 和 t 的补运算 ,包括集合s和t中的非相同元素

5、s 和 t 是两个集合 ,对 sit 的描述正确的是
    a、s 和 t 的并运算 ,包括在集合s 和 t中的所有元素
    b、s 和 t 的差运符 ,包括在集合s 但不在t中的元素
    c、s 和 t 的交运算 ,包括同时在集合s 和t中的元素
    d、s 和 t 的补运算 ,包括集合s 和 t中的非相同元素

6、以下选项中,不是具体的 python 序列类型的是
    a、字符串类型
    b、元组类型
    c、数组类型
    d、列表类型

7、对于序列 s 能够返回序列 s 中第 t 到 j 以 k 为步长的元素子序列的表达是
    a、s[i,j,k]
    b、s[i;j;k]
    c、s[i:j:k]
    d、s(i,j,k)

8、设序列 s,以下选项中对 max(s) 的描述正确的是
    a、一定能够返回序列 s 的最大元素
    b、返回序列 s 的最大元素,但要求 s 中元素之间可比较
    c、返回序列 s 的最大元素 ,如果有多个相同 ,则返回一个元组类型
    d、返回序列 s 的最大元素,如果有多个相同 ,则返回一个列表类型

9、元组变量 t = ("cat", "dog", "tiger", "human" ), t[ :: -1] 的结果是
    a、('human','tiger','dog','cat')
    b、['human' , 'tiger', 'dog' , 'cat']
    c、{'human', 'tiger ', 'dog', 'cat'}
    d、运行出错

10、以下选项中不能生成一个空字典的是
    a、{ }
    b、dict()
    c、dict([])
    d、{[ ]}

11、给出如下代码: import random as ran listv = [ ] ran.seed (100) for i in range(10): i = ran. randint( 100 , 999 ) listv .append (i) 以下选项中能输出随机列表元素最大值的是
    a、print(listv.reverse(i))
    b、prinl(listv.max())
    c、prinl(listv. pop(i))
    d、prinl(max(listv))

12、下面代码的输出结果是 list1 =[ ] for i in range ( 1, 11 ) : list1. append (i **2) print (list1)
    a、[1, 4, 9, 16, 25, 36, 49, 64, 81,100]
    b、[ 2, 4 ,6 , 8 ,10, 12, 14, 16, 18, 20 ]
    c、错误
    d、1,4 ,9, 16 ,25 ,36 ,49 ,64 ,81, 100

13、下面代码的输出结果是 list1 = [ 1 , 2, 3] list2 = [ 4 , 5 , 6 ] print(list1 list2)
    a、[5,7,9]
    b、[1,2,3]
    c、[1,2,3,4,5,6]
    d、[4,5,6]

14、下面代码的输出结果是 a=[1,2,3] b = a[ : ] print(b)
    a、[]
    b、[1, 2, 3]
    c、[3,2,1]
    d、0xf0a9

15、下面代码 的输出结果是 s= [ " seashell ","gold","pink","brown","purple","tomato" ] print (s [1 : 4 : 2 ] )
    a、[ ' gold ' , 'brown' ]
    b、[ ' gold ' , 'pink' , 'brown' ]
    c、[ ' gold ' , 'brown' , 'tomato' ]
    d、[ ' gold ' , 'pink' , 'brown' , 'purple' , 'tomato' ]

16、下面代码的输出结果是 vlist = list (range (5)) for e in vlist: print ( e,end="," )
    a、[0, 1 , 2, 3, 4 ]
    b、0 1 2 3 4
    c、0,1,2,3,4,
    d、0;1;2;3;4

17、下面代码的输出结果是 vlist = list (range (5)) print ( vlist )
    a、[0,1,2,3,4]
    b、0 1 2 3 4
    c、0,1,2,3,4,
    d、(0,1,2,3,4)

18、下面代码的输出结果是 s = [ " seashell ", " gold"," pink"," brown"," purple" , " tomalo" ] print( len ( s ) ,min(s) , max ( s ) )
    a、6 seashell gold
    b、6 brown tomato
    c、5 pink brown
    d、5 purple tomato

19、关于 python 序列类型的通用操作符和函数,以下选项中描述错误的是
    a、如果 s 是一个序列 ,x 是 s 的元素,x in s 返回 true
    b、如果 s 是一个序列 ,x 不是s的元素 ,x not in s 返回 true
    c、如果 s 是一个序列 ,s =[1,"kate" ,true] , s[3] 返回 true
    d、如果 s 是一个序列 ,s = [1, kate" ,true] , s[-1] 返回 true

20、关于 python的列表 ,以下选项中描述错误的是
    a、python 列表是一个可以修改数据项的序列类型
    b、python 列表是包含 0 个或者多 个对象引用的有序序列
    c、python 列表的长度不可变
    d、python 列表用中括号[ ]表示

21、关于 python 的元组类型 ,以下选项中描述错误的是
    a、元组一旦创建就不能被修改
    b、python 中元组采用逗号 和圆括号(可选)来表示
    c、元组中元素不可以是不同类型
    d、一个元组可以作为另一 个元组的元素,可以采用多级索引获取信息

22、关于 python组合数据类型,以下选项中描述错误的是
    a、python 组合数据类型能够将多个同类型或不同类型的 数据组织起来,通过单一的表示使数据操作更有序、更容易
    b、组合数据类型可以分为 3 类:序列类型、集合类型和映射类型
    c、序列类型是二维元素向量,元素之间存在先后关系,通过序号访问
    d、python 的 str、tuple 和 list 类型都属于序列类型

23、给定字典 d,以下选项中可以清空该字典并保留变量的是
    a、d.remove()
    b、d.pop()
    c、d.clear()
    d、del d

24、给定字典 d, 以下选项中对 x in d 的描述正确的是
    a、x 是一个二元元组,判断 x 是否是字典 d 中的键值对
    b、判断 x 是否是字典 d 中的键
    c、判断 x 是否是 字典 d 中的值
    d、判断 x 是否是 在字典 d 中以键或值方式存在

25、.给定字典 d , 以下选项中对 d.get( x , y) 的描述正确的是
    a、返回字典 d 中键值对为 x: y 的值
    b、返回字典 d 中键为 x 的值,如果不存在,则返回 y
    c、返回字典 d 中键为 x 的值,如果不存在,则返回空
    d、返回字典 d 中值为 y 的值,如果不存在,则返回 x

26、给定字典 d , 以下 选项中对 d. items ( ) 的描述正确的是
    a、返回—种 dict_items 类型,包括字典 d 中所有键值对
    b、返回一个列表类型 ,每个元素是一个二元元组,包括字典 d 中所有键值对
    c、返回一个元组类型 ,每个元素是一个二元元组,包括字典 d 中所有键值对
    d、返回一个集合类型 ,每个元 素是一个二元元组,包括字典 d 中所有键值对

27、给定字典d , 以下选项中对 d. values ( ) 的描述正确的是
    a、返回一种 dict_ values 类型 ,包括字典 d 中所有值
    b、返回一个列表类型,包括字典 d 中所有值
    c、返回一个元组类型 ,包括字典d中所有值
    d、返回一个集合类型,包括字典d中所有值

网站地图