| 
                         Excel 中通过选中单元格并查看开始菜单中的数值类型来判断数据的格式。Python 中使用 dtypes 函数来返回数据格式。 
 
Dtypes 是一个查看数据格式的函数,可以一次性查看数据表中所有数据的格式,也可以指定一列来单独查看。 
- #查看数据表各列格式 
 - df.dtypes 
 -   
 - id                   int64 
 - date        datetime64[ns] 
 - city                object 
 - category            object 
 - age                  int64 
 - price              float64 
 - dtype: object 
 - #查看单列格式 
 - df['B'].dtype 
 -   
 - dtype('int64') 
 
  
查看空值 
Excel 中查看空值的方法是使用“定位条件”功能对数据表中的空值进行定位。“定位条件”在“开始”目录下的“查找和选择”目录中。 
 
Isnull 是 Python 中检验空值的函数,返回的结果是逻辑值,包含空值返回 True,不包含则返回  False。可以对整个数据表进行检查,也可以单独对某一列进行空值检查。 
- #检查数据空值 
 - df.isnull() 
 
  
 
- #检查特定列空值 
 - df['price'].isnull() 
 -   
 - 0    False 
 - 1     True 
 - 2    False 
 - 3    False 
 - 4     True 
 - 5    False 
 - Name: price, dtype: bool 
 
  
查看唯一值 
Excel 中查看唯一值的方法是使用“条件格式”对唯一值进行颜色标记。Python 中使用 unique 函数查看唯一值。 
 
Unique 是查看唯一值的函数,只能对数据表中的特定列进行检查。下面是代码,返回的结果是该列中的唯一值。类似与 Excel  中删除重复项后的结果。 
- #查看city列中的唯一值 
 - df['city'].unique() 
 -   
 - array(['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '], dtype=object) 
 
  
查看数据表数值 
Python 中的 Values 函数用来查看数据表中的数值。以数组的形式返回,不包含表头信息。 
- #查看数据表的值 
 - df.values 
 -   
 - array([[1001, Timestamp('2013-01-02 00:00:00'), 'Beijing ', '100-A', 23, 
 -         1200.0], 
 -        [1002, Timestamp('2013-01-03 00:00:00'), 'SH', '100-B', 44, nan], 
 -        [1003, Timestamp('2013-01-04 00:00:00'), ' guangzhou ', '110-A', 54, 
 -         2133.0], 
 -        [1004, Timestamp('2013-01-05 00:00:00'), 'Shenzhen', '110-C', 32, 
 -         5433.0], 
 -        [1005, Timestamp('2013-01-06 00:00:00'), 'shanghai', '210-A', 34, 
 -         nan], 
 -        [1006, Timestamp('2013-01-07 00:00:00'), 'BEIJING ', '130-F', 32, 
 -         4432.0]], dtype=object) 
 
  
查看列名称                         (编辑:泰州站长网) 
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! 
                     |