- 博客(12)
- 收藏
- 关注
原创 解决deepmatch安装问题:ERROR: Could not find a version that satisfies the requirement deepmatch
使用国内的镜像源来加速。pip install deepmatch -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com这个是豆瓣源--trusted-host pypi.douban.com 这是为了获得ssl证书的认证,要不然会报错参考链接
2020-12-13 21:31:59 382 1
原创 红酒数据集分析(纯数字数据集)
目标:了解影响红酒品质的主要理化因素导入相关包#import相关的库%matplotlib inlineimport numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snssns.set(style="darkgrid") #这是seaborn默认的风格pd.set_option('precision',3) #设置数据精度导入数据及总览df = pd.read_csv(
2020-12-06 16:14:29 7958 2
原创 Pandas内容回顾
python,pandas,numpy内容回顾pandas基础1.数据结构Series和Dataframe2.数据索引行index与列columns3.查询数据4.利用pandas的DataFrames进行统计分析5.利用pandas实现SQL操作6. 利用pandas进行缺失值的处理7. 利用pandas实现Excel的数据透视表功能8. 多层索引的使用pandas基础1.数据结构Series和DataframeSeries类似numpy中的一维数组可调用一维数组的函数与方法DataFrame为多维
2020-12-02 20:00:44 135
原创 关于错误AttributeError: 'str' object has no attribute 'str'
问题:想要检查DataFrame中是否包含某一字符串数据如下图(第二列为a)运行代码cframe.a.apply(lambda x: "Windows" if x.str.contains("Windows") else "Not Windows")出错,显示AttributeError: ‘str’ object has no attribute ‘str’ ,即str.conta...
2019-09-06 16:50:59 46016 1
原创 模型融合stacking资源汇总
https://blog.csdn.net/wstcjf/article/details/77989963 了解stacking过程https://www.cnblogs.com/jiaxin359/p/8559029.html 代码实现http://wulc.me/2018/01/21/stacking 的基本思想及代码实现/ 代码实现https://www.kaggle.com/arth...
2019-07-05 20:17:15 344
原创 训练集划分集建模
1.划分训练测试集from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split( sample_train,label_train, test_size=0.3, random_state=0)clf = svm.SVC(kernel='...
2019-06-19 12:29:41 525
原创 关于错误ValueError: Expected 2D array, got 1D array instead: Reshape your data either using array.reshap
1.在归一化Age时出现scaler = preprocessing.StandardScaler()scaler_age = scaler.fit(df["Age"])df["Age"] = scaler.fit_transform(df["Age"])#显示错误ValueError: Expected 2D array, got 1D array instead: Reshape y...
2019-06-19 10:04:36 2055
原创 数据挖掘比赛流程(新手向)--基于kaggle房价预测
1.评价指标本次kaggle房价预测采用大多数回归问题常用的RMSE指标示例代码def rmse_cv(model,X,y): rmse = np.sqrt(-cross_val_score(model, X, y, scoring="neg_mean_squared_error", cv=5)) return rmse2.数据可视化sns.displot() #绘制...
2019-06-03 15:12:01 570
原创 python面对对象的属性和方法的概念(总结自黑马)
属性类属性:直接在class关键字下使用赋值语句定义的属性。适用范围:只用来记录与这个类相关的特征,而不需要用来记录对象的特征。调用格式: 类名.属性实例属性:在初始化方法__init__中定义的属性。适用范围:类中应该具有的满足某些需求的特征调用格式:对象名.实例属性(参数)方法实例方法:通常在类下使用格式为def +方法名+(self)的方法适用范围:方法内部需要访问对象的实...
2019-03-20 19:13:07 182
转载 python-面对对象-继承
面向对象私有属性和方法私有属性和方法通过在属性和方法名前添加__得到。私有属性和方法是对象的隐私,不能通过外界和子类直接访问在外界无法访问到私有属性和方法(不能直接print打印)可以通过在对象的方法内部访问私有属性子类对象可以通过父类的公有方法间接访问到私有属性或私有方法eg:class A: def __init__(self): self.num1 = 11 #定义...
2019-03-18 15:51:19 127
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人