自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

乐观的摸摸头的博客

新手小白的坎坷路

  • 博客(32)
  • 收藏
  • 关注

原创 Tensorboard

一.问题汇总1.tensorboard标量图中的鬼线 Tensorflow中标量汇总图的图像,绘制了两条橙色线。根据图例,一个对应于实际值(幻影线),另一个对应于平滑值(主线)。 平滑是随时间(x轴),不超过每个迭代多个值。当损失可能非常不稳定时,这会产生更一致的曲线。如果您想要查看每个时间步骤的实际损失值,请关闭平滑滑块。2.tensorboard无法显示的...

2019-08-23 16:46:21 246

转载 linux关于bashrc与profile的区别(转)

/etc/profile,/etc/bashrc 是系统全局环境变量设定~/.profile,~/.bashrc用户家目录下的私有环境变量设定当登入系统时候获得一个shell进程时,其读取环境设定档有三步1首先读入的是全局环境变量设定档/etc/profile,然后根据其内容读取额外的设定的文档,如/etc/profile.d和/etc/inputrc2然后根据不同使用者帐号,去其家目录...

2018-12-24 17:05:02 1049

原创 python : copy() & deepcopy()

       在高级语言中,变量是对内存及其地址的抽象。对于python而言,python的一切变量都是对象,变量的存储,采用了引用语义的方式,存储的只是一个变量的值所在的内存地址,而不是这个变量的只本身。     1.  copy() 浅拷贝:不管多么复杂的数据结构,浅拷贝都只会copy一层       >>> import copy>>> c...

2018-08-08 11:14:54 183

原创 python 正则匹配中文字符

  正则匹配中文,固定形式:\u4E00-\u9FA5 # -*- coding:utf-8 -*-import re'''python 3.5版本'''words = 'study in 山海大学'regex_str = ".*?([\u4E00-\u9FA5]+大学)"match_obj = re.match(regex_str, words)if match_ob...

2018-08-02 16:06:03 2829

原创 python 格式化输出

python格式化输出有两种方式:百分号和formatformat的功能要比百分号方式强大,其中format独有的可以自定义字符填充空白、字符串居中显示、转换二进制、整数自动分割、百分比显示 等功能是百分号方式不能相比的1.百分号方式#!/usr/bin/env python# -*- coding: UTF-8 -*-s1 = "i am %s, i am %d years o...

2018-08-02 16:04:55 315

原创 机器学习:sklearn.svm.SVC 参数说明

1.参考文献:SVM基本原理  https://www.cnblogs.com/vipyoumay/p/7560061.html2.sklearn.svm.SVC()参数参数:l  C:C-SVC的惩罚参数C?默认值是1.0C越大,相当于惩罚松弛变量,希望松弛变量接近0,即对误分类的惩罚增大,趋向于对训练集全分对的情况,这样对训练集测试时准确率很高,但泛化能力弱。C值小,对误分类的...

2018-07-30 17:18:17 2955

翻译 机器学习:Stacking融合模型

一.参考文献知乎(必读):Kaggle机器学习之模型融合(stacking)心得 MrLevo520的Blog:  Stacking Learning在分类问题中的使用 Blog:Stacking Models for Improved Predictions Blog:KAGGLE ENSEMBLING GUIDE(注脚) Blog:如何在 Kaggle 首战中进入前 10% Gi...

2018-07-30 17:13:09 2093 1

翻译 python3中内建函数map()与reduce()

map()的使用   map()的使用方法形如map(f(x),Itera).对,它有两个参数,第一个参数为某个函数,第二个为可迭代对象。如果不懂什么是函数,不懂什么是可迭代对象没关系,记住下面的例子就可以了:1 >>> def g(x):2 return 3 * x3 4 >>> l=map(g,[1,3,4,5,7,10])5 &g...

2018-07-30 16:59:13 148

原创 python 数据处理——Numpy

1.Numpy之array用法ndarray:N维数组对象(矩阵),所有元素必须是相同类型。ndarray属性:ndim属性,表示维度个数;shape属性,表示各维度大小;dtype属性,表示数据类型。创建ndarray数组from numpy import *a1 = [0,1,2,3,4,5] #一维数组a2 = [[0,1,2,3,...

2018-07-30 16:55:47 338

原创 python可视化——matplotlib绘制条形图方法

1.首先要绘制一个简单的条形图import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import mlabfrom matplotlib import rcParamsfig1 = plt.figure(2)rects =plt.bar(left = (0.2,1),height = (1,0.5),wid...

2018-07-30 16:19:40 5945

翻译 python数据可视化——matplotlib

1、绘制简单折线#a.pyimport matplotlib.pyplot as pltsquares=[1,4,9,16,25]plt.plot(squares)plt.show()#函数plot()尝试根据数字绘制出有意义的图形#plt.show()打开matplotlib查看器,并显示绘制的图形2、修改标签文字和线条粗细1)使用参数linewidth决定plot()...

2018-07-30 15:15:46 983

原创 算法:快速排序稳定性

快速排序(Quick Sort)使用分治法策略它的基本思想是:选择一个基准数,通过一趟排序将要排序的数据分割成独立的两部分;其中一部分的所有数据都比另外一部分的所有数据都要小。然后,再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列。快速排序流程:(1) 从数列中挑出一个基准值。(2) 将所有比基准值小的摆放在基准前面,所有比基准值大的摆在基...

2018-07-27 11:40:53 10875

原创 算法初级:二分查找

二分查找又称折半查找,它是一种效率较高的查找方法。       二分查找要求:线性表是有序表,即表中结点按关键字有序,并且要用向量作为表的存储结构。不妨设有序表是递增有序的。/*折半查找*/int Binary_Search(int a*,int n,int key){ int low,high,mid; low=1; /*定义最底下标为记录首位*/ ...

2018-07-27 10:35:34 420

原创 sql :case when & if 表达式

CASE WHEN 及 SELECT CASE WHEN的用法一,已知数据按照另外一种方式进行分组,分析。有如下数据:(为了看得更清楚,我并没有使用国家代码,而是直接用国家名作为Primary Key)根据这个国家人口数据,统计亚洲和北美洲的人口数量。应该得到下面这个结果。   解决这个问题,你会怎么做?生成一个带有洲Code的View是一个解决方法,但是这样很难动态的改变统计...

2018-07-26 14:35:13 20982 2

转载 sql

--数据库多表的连接查询一、外连接1.左连接 left join / left outer join左外连接包含left join 左表里的所有行,若左表在右表没有匹配,则结果中对应行的右表部分全部为空select * from student left join course on student.ID =course.ID  2. 右连接 right join/ right out...

2018-07-25 16:29:22 135

原创 机器学习:matplotlib包

 1.  在python的matplotlib库中分别可用bar、barh、plot函数来构建它们,再使用xticks与yticks(设置坐标轴刻度)、xlabel与ylabel(设置坐标轴标签)、title(标题)、legend(图例)、xlim与ylim(设置坐标轴数据范围)、grid(设置网格线)等命令来装饰图形作者:博观厚积链接:https://www.jianshu.com/p/5a...

2018-07-24 15:07:39 180

原创 机器学习:PANDAS 数据合并与重塑

example:

2018-07-11 10:24:49 303

转载 机器学习: dropna()

清理无效数据df[df.isnull()] #返回的是个true或false的Series对象(掩码对象),进而筛选出我们需要的特定数据。df[df.notnull()]df.dropna() #将所有含有nan项的row删除df.dropna(axis=1,thresh=3) #将在列的方向上三个为NaN的项删除df.dropna(how='ALL') #将全...

2018-07-11 10:07:07 2901

原创 机器学习:pandas 库drop()函数,astype()函数

1.drop函数的使用(1)drop函数的使用:删除行、删除列print frame.drop(['a'])print frame.drop(['Ohio'], axis = 1)12drop函数默认删除行,列需要加axis = 1(2)drop函数的使用:inplace参数采用drop方法,有下面三种等价的表达式:1. DF= DF.drop('column_name', axis=1);2...

2018-07-11 10:04:49 5310

原创 机器学习:to_csv函数

1.to_csv函数重要参数:path_or_buf,columns 参数详解: http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.to_csv.htmlexample:[source]

2018-07-11 09:58:40 2406

原创 机器学习:pandas的Dataframe

1.字典转化为Dataframe一个key只有一个value的字典如果直接转化成数据框会报错1 pd.DataFrame(my_dict)2 ValueError: If using all scalar values, you must pass an index应该做如下转换1 pd.DataFrame.from_dict(my_dict,orient='index').T2. 字典转化为S...

2018-06-29 21:02:17 250

原创 机器学习:Spyder使用单独窗口画图

参考:http://www.datastudy.cc/article/3cfc3aff3b2c5948b938456e00376276https://www.cnblogs.com/JZ-Ser/p/8124099.html       1. 在菜单的 Tools中,我们选择 Preferences 菜单,弹出设置窗口。                2.选择 IPython Console 的配...

2018-06-29 09:53:09 16129 3

原创 机器学习:pandas库

 1.Dataframe单列的数据变换map()函数,apply()函数:df[c[1]].map(lambda x : x+1)df[c[1]].map(func)df[c[1]].apply(func)def cardnumToPlace(item): result = re.match(r'^([0-9]{2})[0-9]+.*',item).group(1...

2018-06-28 14:40:35 180

原创 机器学习:文本文件读取

 a和a+、w和r有什么区别? 1.  r 打开只读文件,该文件必须存在。 2.  w 打开只写文件,若文件存在则该文件内容覆盖。若文件不存在则建立该文件。 3. a  只能写,若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾。   a+ 读写,若文件不存在,则会建立该文件,如果文件存在,写入的数据会被加到文件尾后,即文件原先的内容会被保留。...

2018-06-27 11:05:38 885

原创 机器学习:python 文本读取操作

1.readlines()  整文件读取,返回列列表   strip用于去除字符串的首尾字符,lstrip用于去除左边的字符,rstrip用于去除右边的字符。例:with open('read.txt','r') as f:        for line in f.readlines():            item = line.rstrip('\n').split(';')...

2018-06-26 21:58:55 383

转载 机器学习:IDE anaconda Spyder

Spyder——科学的Python开发环境2017年08月10日 21:26:14阅读数:4511 刚开始接触Python的时候,网上找到的资料基本上上来就是介绍Python语言,很少有对开发环境进行讲解的,但如果在学习的过程中不断练习,这样效率会更高,所以特意将一个Python的开发环境Spyder自带的入门教程翻译出来,希望可以帮助到和我有同样困惑的你。个人水平有限,会有...

2018-06-25 20:34:07 5563

转载 机器学习:sklearn实战-乳腺癌细胞数据挖掘

sklearn实战-乳腺癌细胞数据挖掘https://study.163.com/course/introduction.htm?courseId=1005269003&utm_campaign=commission&utm_source=cp-400000000398149&utm_medium=share  医药统计项目联系QQ:231469242 如果样本量太小,数据...

2018-06-25 20:28:11 4520

转载 机器学习:模型评估-sklearn中的评估函数

1.介绍有三种不同的方法来评估一个模型的预测质量:estimator的score方法:sklearn中的estimator都具有一个score方法,它提供了一个缺省的评估法则来解决问题。Scoring参数:使用cross-validation的模型评估工具,依赖于内部的scoring策略。见下。Metric函数:metrics模块实现了一些函数,用来评估预测误差。见下。2. scoring参数模型...

2018-06-25 20:24:48 8682 2

原创 机器学习:特征工程 pandas 模块(一)

1.DataFrame类型数据操作函数df = DataFrame() #创建DataFrame对象df.dtypes #查看各行的数据格式df['列名'].astype(int)#转换某列的数据类型df.index #查看索引df.columns #查看列名df.values #查看数据值df.value_count() 列元素统计分布df.describe() #描述性统计...

2018-06-25 20:17:51 846

原创 机器学习:特征工程 datetime 模块

1.to_datetime()object转化为datetime类型例:pd.to_datetime(data[c[i]],format = '%Y-%m-%d')2.isoweekday() /dayofweek()  转化为星期几3.strptime()  字符串转化为datetime

2018-06-25 19:59:38 340

转载 **Ubuntu中interfaces文件设置失效的问题!**

**Ubuntu中interfaces文件设置失效的问题!**【Server版本】 在UbuntuServer版本中,因为只存有命令行模式,所以要想进行网络参数设置,只能通过修改/etc/network/interfaces。具体设置方法如下: (1) UbuntuServer 修改 IP地址 打开/etc/network/interfaces sudo vim/etc/network/i

2017-09-21 13:43:05 9302 1

原创 Ubuntu 15.10快速搭建本地源服务器

我们将使用APT-Mirror来实现。这里,我们将把默认的镜像包镜像到我们本地的服务器或个人电脑中,并且在你的本地或外置硬盘中,我们至少需要120GB或更多的可用空间才行。我们可以通过配置一个 HTTP或FTP服务器来与本地系统客户端共享这个软件仓库。   实验环境:64位的Ubuntu15.10系统安装apt-mirrorsudoapt-get ins

2017-09-21 09:50:30 1021

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除