| 
                         Excel 中的数据分析功能中提供协方差的计算,python 中通过 cov 函数计算两个字段或数据表中各字段间的协方差。 
 
Cov 函数用来计算两个字段间的协方差,可以只对特定字段进行计算,也可以对整个数据表中各个列之间进行计算。 
- #两个字段间的协方差 
 - df_inner['price'].cov(df_inner['m-point']) 
 - 17263.200000000001 
 - #数据表中所有字段间的协方差 
 - df_inner.cov() 
 
  
 
相关分析 
Excel 的数据分析功能中提供了相关系数的计算功能,python 中则通过 corr 函数完成相关分析的操作,并返回相关系数。 
 
Corr 函数用来计算数据间的相关系数,可以单独对特定数据进行计算,也可以对整个数据表中各个列进行计算。相关系数在-1 到 1 之间,接近 1  为正相关,接近-1 为负相关,0 为不相关。 
- #相关性分析 
 - df_inner['price'].corr(df_inner['m-point']) 
 - 0.77466555617085264 
 - #数据表相关性分析 
 - df_inner.corr() 
 
  
 
09 数据输出 
第九部分是数据输出,处理和分析完的数据可以输出为 xlsx 格式和 csv 格式。 
写入 excel 
- #输出到 excel 格式  
 - df_inner.to_excel('excel_to_python.xlsx', sheet_name='bluewhale_cc') 
 
  
  
excel
写入 csv 
- #输出到 CSV 格式 
 - df_inner.to_csv('excel_to_python.csv') 
 
  
在数据处理的过程中,大部分基础工作是重复和机械的,对于这部分基础工作,我们可以使用自定义函数进行自动化。以下简单介绍对数据表信息获取自动化处理。 
- 创建数据表 
 - df = pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006], 
 - "date":pd.date_range('20130102', periods=6), 
 - "city":['Beijing ', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '], 
 - "age":[23,44,54,32,34,32], 
 - "category":['100-A','100-B','110-A','110-C','210-A','130-F'], 
 - "price":[1200,np.nan,2133,5433,np.nan,4432]}, 
 - columns =['id','date','city','category','age','price']) 
 -  
 - Read more: http://bluewhale.cc/2017-04-21/use-python-for-data-analysis-like-excel-3.html#ixzz5rvBC8kaw 
 - #创建自定义函数 
 - def table_info(x): 
 -     shape=x.shape 
 -     types=x.dtypes 
 -     colums=x.columns 
 -     print("数据维度(行,列):n",shape) 
 -     print("数据格式:n",types) 
 -     print("列名称:n",colums) 
 -  
 - Read more: http://bluewhale.cc/2017-04-21/use-python-for-data-analysis-like-excel-3.html#ixzz5rvBC8kaw 
 - #调用自定义函数获取df数据表信息并输出结果 
 - table_info(df) 
 -   
 - 数据维度(行,列): 
 - (6, 6) 
 - 数据格式: 
 - id int64 
 - date datetime64[ns] 
 - city object 
 - category object 
 - age int64 
 - price float64 
 - dtype: object 
 - 列名称: 
 - Index(['id', 'date', 'city', 'category', 'age', 'price'], dtype='object') 
 -  
 - Read more: http://bluewhale.cc/2017-04-21/use-python-for-data-analysis-like-excel-3.html#ixzz5rvBJs6Fv 
 
  
以上就是用 Python 做数据分析的基本内容。                          (编辑:泰州站长网) 
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! 
                     |