自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 2022年下半年规划

2022年下半年计划

2022-07-29 14:45:54 79

原创 关于读取某文件夹下所有文件的Python与R代码

import os #os模块导入path = "E:\ywl_sysu_term\校对汇总" #文件夹目录files = os.listdir(path) #得到文件夹下的所有文件及文件夹名称(这里注意文件和文件夹都有!)s = []for file in files: if not os.path.isdir(file):#判断是文件夹,不是文件夹即为文件 f...

2018-08-21 15:55:16 711

原创 有趣的python排序模块:bisect

使用这个模块的函数前先确保操作的列表是已排序的。dir(bisect)Out[42]: ['__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'bisect', 'bisect_left', 'bisect_r...

2018-08-02 18:01:49 271

原创 python itertools模块

  python  itertools模块各种花里胡哨 哦不 丰富好用的迭代方式,了解下:http://funhacks.net/2017/02/13/itertools/什么不想打开?提醒你一下:常用的有  count(firstval = 0,step = 1)        cycle(iterable)     repeat(object,nums)import ...

2018-08-02 17:00:48 232

翻译 count(1)count(*)count(columnname)区别

1.内容count(1),所有行都用1代替,统计行数count(*)所有行数包括NULLcount(columnname) columnname非NULL的行数2.速度列名为主键,count(列名)优于count(1) 列名不为主键,count(1)会比count(列名)快  如果表多个列并且没有主键,则 count(1) 的执行效率优于 count(*)  如果有主...

2018-07-20 15:50:04 767 1

原创 使用Hive随机抽样

rand() 函数 生成一个0-1之间的随机数,可设定随机种子。利用这个函数在hive 中进行随机抽样。test1  简单随机抽样SELECT t.varx,t.aFROM( SELECT varx,rand() a FROM tablename)tWHERE t.a BETWEEN 0 AND 0.2这样就抽取了五分之一的数据。--或者像这...

2018-07-19 18:38:58 22293 2

转载 分布式 -- 幂等性

概述幂等性原本是数学上的概念,即使公式:f(x)=f(f(x)) 能够成立的数学性质。用在编程领域,则意为对同一个系统,使用同样的条件,一次请求和重复的多次请求对系统资源的影响是一致的。幂等性是分布式系统设计中十分重要的概念,具有这一性质的接口在设计时总是秉持这样的一种理念:调用接口发生异常并且重复尝试时,总是会造成系统所无法承受的损失,所以必须阻止这种现象的发生。幂等有两个维度:一是空间维度上的...

2018-07-11 17:10:43 660

原创 嘻嘻哈哈

嘻嘻哈哈 之 剑指offer日记:     写在前面的一些闲话,23岁没几天手机拿去修了,然后马上来学校手机还没修好,各种小毛病无可奈何之下寄了回去。现在处于等手机没啥可玩的  日子枯燥又漫长 未来不知道在哪里  、以及明天是人生中第一次面试 的悲惨境遇之下,竟然想记录自己这种凄凉的状况,希望日后读起来会觉得此时的自己多么脆弱无知吧。   知乎上看到一个skiptomylou 的大佬的回答深觉是与...

2018-07-11 10:24:01 420

原创 求一个list里相距最近但不相等的两个数。(若存在多对,还没解决)

现将list排序,求差值,然后找到差值最小值,记录下来。代码很简单:>>> def getdmin2(list): list = sorted(list) dd = float("inf") listmin=[] for i in range(len(list)-1): lmin,lmax = list[i],list[i+1] diff = lmax - lmi...

2018-07-11 10:23:49 191

转载 Ubuntu中root用户和user用户的相互切换

Ubuntu中root用户和user用户的相互切换Ubuntu是最近很流行的一款Linux系统,因为Ubuntu默认是不启动root用户,现在介绍如何进入root的方法。(1)从user用户切换到root用户不管是用图形模式登录Ubuntu,还是命令行模式登录,我们会发现缺省的用户是user但是当我们需要执行一些具有root权限的操作(如修还系统文件)时,经常需要用sudo授权,感觉很麻烦此时我们...

2018-07-11 10:23:24 176 1

原创 最大连续子数组之和问题

def max_arry(alist): res = alist[0] sumi = alist[0] for item in alist: if sumi >0: sumi += item else: sumi = item if sumi>res: res=sumi return res                  求一个数组里的连续子数...

2018-05-22 10:19:49 153

原创 SQL(简单基础)---需要了解的简单语句(二)(上)

select 语句select * from 表名select 列名 from 表名distinct select distinct 列名 from 表名where select 列名 from 表名 where 表 运算符 值运算符有哪些呢,上个笔记上的通配符别忘啦 LIKE~ 嘿嘿and  和 orwhere后面的判断语句加上and ,or 可以表示复杂的条件order byorder by ...

2018-05-13 15:43:55 173 3

原创 SQL首次瞎写之------------基础知识(1)

本科是学过这门课 却只是坐在后面和儿子一起玩,哈哈终于明白当年自己欠的帐还是要还的~那么开始咯!呃呃,这次是先简单的过一遍,很多细节先略过没有时间啦~~结构化查询语言是  Structured Query Language 简称SQL(发音:/ˈes kjuː ˈel/ "S-Q-L"),是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统;同时...

2018-05-12 16:45:02 149

原创 python基础笔记

一些常用的函数:abs(number)              返回指定数的绝对值bytes(string, encoding[, errors])    对指定的字符串进行编码,并以指定的方式处理错误cmath.sqrt(number)                     返回平方根;可用于负数math.sqrt(number)             返回平方根;不能用于负数float(...

2018-03-27 10:57:16 141

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除