自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(70)
  • 收藏
  • 关注

原创 jupyter notebook指定虚拟环境

首先,确保已经安装了 Jupyter notebook 和虚拟环境工具(比如 virtualenv 或 conda)。这里的 “myenv” 是你的虚拟环境的名称,你可以根据实际情况进行替换。在命令行中,激活你想要使用的虚拟环境。

2024-03-26 16:29:00 351

原创 环比与同比

假如我们对比依据选择 今日&周同比,那么也就是今日(假设是周二)和上周的周二比较,假如我们选择的 今日&月同比,那么就是今日(假设是27号)和上月的27号比较。假如对比依据选的是今日,上周期是昨日,假如选的是本周,上周期就是上周,假如选的是本月,上周期是上月。同比有周同比、月同比、年同比,环比是本周期对比上周期,

2024-02-27 17:45:22 123

转载 网络抓包原理及常用抓包工具

混合模式,即可以监听所有经过该网卡的数据(关闭混合模式可以过滤掉一些垃圾数据)如果抓非HTTP(S)协议的包,如TCP包,则使用wireShark。如果是linux平台(手机或后台),使用tcpdump。wireShark、tcpdump属于网卡抓包工具。fidder、charles属于代理类的抓包工具。如果是windows平台,使用fidder。如果是Mac平台,使用charles。-i any 监听任意网络接口。-s 0 抓去完整的数据包。-vv 产生更详细的输出。-w 将抓去的包保存文件。

2024-02-21 11:38:28 45

原创 【学习笔记】python仅拷贝list的值,引出浅拷贝与深拷贝

在上面的代码中,c = copy.copy(a) 是浅拷贝,它只会拷贝 a 的一层对象,而不会拷贝 a 中嵌套的可变对象(如列表 [‘a’, ‘b’])。具体来说,在修改 a 中的 [‘a’, ‘b’] 数组对象后,c 中对应的元素也发生了变化,因为 c 和 a 中都引用了同一个 [‘a’, ‘b’] 数组对象。在上面的代码中,我们使用列表的 copy() 方法来拷贝列表 a 的值,生成了一个新的列表 b。在上面的代码中,我们使用切片来拷贝列表 a 的值,生成了一个新的列表 b。

2023-12-08 10:28:08 158

原创 【学习草稿】pid控制基础实现--往水桶注水

其中r(t)表示给定输入值,c(t)表示实际输出值,e(t)表示信号偏差量=r(t)-c(t),u(t)表示修正量。------- https://www.cnblogs.com/cv-pr/p/4785195.html PID控制原理和算法。PID调节器是一种线性调节器,它将给定值r(t)与实际输出值c(t)的偏差e(t)的比例§、积分(I)、微分(D)通过线性组合构成控制量u(t),对控制对象进行控制。球场上运动至指定地点(比例控制):有图【很直观的帮助理解】&有文字分析。

2023-11-24 17:29:27 242

原创 【学习草稿】

对变量之间相关关系的分析,即相关性分析。其中比较常用的是线性相关分析,用来衡量它的指标是线性相关系数,又叫皮尔逊相关系数,通常用r表示,取值范围是[-1,1]。在excel中,可以用CORREL函数来计算相关系数。r的绝对值

2023-11-06 20:08:38 189

原创 【学习草稿】bert文本分类

https://github.com/google-research/berthttps://github.com/CyberZHG/keras-bert

2023-10-20 15:35:40 514

原创 时间复杂度与空间复杂度

执行函数与问题规模n的大小是否有关。

2023-10-08 16:25:23 71

原创 TODO transformer

The Illustrated Transformer【译】Transformer模型详解(图解最完整版)Transformer 知识点理解。十分钟理解Transformer。Transformer 原理解析。Transformer原理详解。

2023-09-25 21:35:47 38

原创 精简版->优化版|01背包、完全背包、多重背包

有n种物品和一个容量为W的背包,第i种物品的数量为s(i),体积是w(i),价值是v(i)。有n种物品和一个容量为W的背包,第i种物品的体积是w(i),价值是v(i)。有n个物品,它们有各自的体积w和价值v,现有给定容量W的背包,在总体积不超过背包承载上限的情况下,如何让背包里装入的物品具有最大的价值总和?装入第i个商品, 则dp[i,j] = dp[i-1, j-w(i)] + v(i),w(i) 表示第i个物品的体积,v(i) 表示第i个物品的价值,#k为装入第i种物品的件数,k

2023-09-25 21:07:12 232

原创 【学习草稿】背包问题

2.包的总容量大于等于该商品,但若拿出其它商品来获得容量装该商品,此时价值不一定大于前i-1个商品的最大价值,所以在装与不装该商品之间选定一个,即V(i,j)=max{V(i-1,j),V(i-1,j-w(i))+v(i)}1.包的总容量比商品体积小,即使不装其他商品也不可能装得下该商品,此时价值与前i-1个商品的价值一样,即v[i][j]=v[i-1][j];二、【动态规划】01背包问题(通俗易懂,超基础讲解)一、01背包问题 图解+详细解析 (转载)为什么是这样的公式呢?

2023-09-22 11:15:46 282

原创 vim显示不可见字符

默认情况下,vim是不会显示space,tabs,newlines,trailing space,wrapped lines等不可见字符的。通过以上命令的设置TAB键显示为^I,而行尾则标识为$。:set nolist //隐藏不可见字符。:set list //显示不可见字符。

2023-07-24 12:46:32 513

原创 SQL count(1)、count(*) 与 count(列名) 到底有什么区别?

count(列名)只包括列名那一列,在统计结果的时候,会忽略列值为空(这里的空不是指空字符串或者0,而是表示null)的计数,即某个字段值为NULL时,不统计。count(1)包括了忽略所有列,用1代表代码行,在统计结果的时候,不会忽略为NULL的值。count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略为NULL的值。如果表多个列并且没有主键,则 count(1 的执行效率优于 count(如果有主键,则 select count(主键)的执行效率是最优的。

2023-06-27 21:46:35 660

原创 SQL count(1)、count(*) 与 count(列名) 到底有什么区别?

count(列名)只包括列名那一列,在统计结果的时候,会忽略列值为空(这里的空不是指空字符串或者0,而是表示null)的计数,即某个字段值为NULL时,不统计。count(1)包括了忽略所有列,用1代表代码行,在统计结果的时候,不会忽略为NULL的值。count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略为NULL的值。如果表多个列并且没有主键,则 count(1 的执行效率优于 count(如果有主键,则 select count(主键)的执行效率是最优的。

2023-06-27 21:43:49 697

原创 SQL count(1)、count(*) 与 count(列名) 到底有什么区别?

count(列名)只包括列名那一列,在统计结果的时候,会忽略列值为空(这里的空不是指空字符串或者0,而是表示null)的计数,即某个字段值为NULL时,不统计。count(1)包括了忽略所有列,用1代表代码行,在统计结果的时候,不会忽略为NULL的值。count(*)包括了所有的列,相当于行数,在统计结果的时候,不会忽略为NULL的值。如果表多个列并且没有主键,则 count(1 的执行效率优于 count(如果有主键,则 select count(主键)的执行效率是最优的。

2023-06-27 21:43:13 504

原创 hive row_number()对单列进行去重

学到一个高级用法 row_number()

2023-06-27 21:41:37 147

原创 Sublime使用技巧

方法:快捷键ctrl+h打开替换框,并选中如下图所示,字符串前后所使用的符号不一致,前面是 ^ ,末尾是$ ,输入后点击Replace All。使用场景:在排查数据库时经常可能会遇到需要使用多个id查询数据的情况,但是导出的id需要加引号,一个一个加很麻烦,可以用到下面这个小技巧。选中字符串, shift + "1、自动为字符串添加前后双引号。

2023-06-15 10:41:47 208

原创 Anaconda-用conda创建python虚拟环境

anaconda命令创建python版本为x.x,名字为your_env_name的虚拟环境。your_env_name文件可以在Anaconda安装目录envs文件下找到。1、查看当前存在哪些虚拟环境。2、Python创建虚拟环境。

2023-06-06 20:43:54 55

原创 vim使用技巧

1、在vim的普通模式下键入“ggdG”即可删除其中全部内容。

2023-06-06 20:40:22 28

原创 小白成长之路in网络

*HTTPS 协议(Hyper Text Transfer Protocol Secure),是 HTTP 的加强安全版本。**HTTPS 是基于 HTTP 的,也是用 TCP 作为底层协议,并额外使用 SSL/TLS 协议用作加密和安全认证。默认端口号是 443.HTTP 是应用层协议,他以 TCP(传输层)作为底层协议,默认端口为 80.7 张图带你搞懂 HTTP 和 HTTPS 的区别!1、HTTP 和 HTTPS 的区别。

2023-06-06 20:31:52 27

原创 实践积累之excel的使用

若是 A2 A5 A8 可改为 mod(row(A1:A100)=2。在EXCEL中,如何对有规律间隔单元格进行求平均值运算?求 A1 A4 A7。假设数据 在A1:A100。

2023-06-04 13:36:29 47

原创 新人版git用法

git checkout -b 本地分支名x origin/远程分支名x。#这样远程仓库中也就创建了一个test分支。#拉取远程分支并创建本地分支。

2023-05-26 21:58:47 41

原创 python 元祖添加元素与正则表达式

使用加法 (+) 运算符将元素添加到元组,例如 new_tuple = my_tuple + (‘new’, )。元组是不可变的,因此为了向元组添加元素,我们必须创建一个包含该元素的新元组。#通过创建新元组将元素添加到元组参考:https://www.jiyik.com/w/python3/python3-tuple-add-element。

2023-05-26 21:44:13 1065

原创 【好用】linux MySQL账号密码弱口令管理|不记得密码也可

其中,new_password为新密码,username为要修改密码的账号的用户名,hostname为要修改密码的账号的主机名。以root身份登录MySQL:在终端输入 mysql -u root -p 命令,然后输入root用户的密码进行登录。以root身份登录MySQL:在终端输入 mysql -u root -p 命令,然后输入root用户的密码进行登录。注意,删除账号并不会删除该账号创建的库和表,需要另外进行处理。切换到要修改密码的账号所在的数据库:在MySQL命令行中输入 use mysql;

2023-05-12 14:57:48 916 1

原创 Flask中Jinja2模板|如何在Jinja2中格式化一个日期

(由于i18n方面的原因,这个过滤器是基于babel的,但你也可以使用strftime)。这个过滤器的优点是,有两种方法可以做到这一点。直接的方法是在你的模板中简单地调用(并打印)strftime()方法,比如说。使用Jinja2,我如何格式化一个日期字段?我知道在Python中我可以简单地做到这一点。

2023-04-28 10:37:49 480

原创 学习之路哈哈

当一个分支被推送并合并到远程分支后,-d 才会本地删除该分支。如果一个分支还没有被推送或者合并,那么可以使用-D强制删除它。【Linux网络编程笔记】TCP短连接产生大量TIME_WAIT导致无法对外建立新TCP连接的原因及解决方法—基础知识篇。如果你还在一个分支上,那么 Git 是不允许你删除这个分支的。TCP短连接产生大量TIME_WAIT导致无法对外建立新TCP连接的原因及解决方法—基础知识篇。Unix 时间戳是从1970年1月1日(UTC/GMT的午夜)开始所经过的秒数,不考虑闰秒。

2023-03-30 20:58:47 121

原创 python学习

python 导入同级目录文件、上级目录文件以及下级目录数据集和模块包。python 调用其他文件的类和函数以及避坑指南。python 调用当前路径下文件夹里的类。python调用其他文件的类和函数。python调用其他文件函数或类。Python中import的用法。python调用其他文件的类。

2023-03-21 11:28:07 293

原创 python中的反射--TODO

当需要的判断比较少的时候,这样做是没有问题的,但当需要判断的代码比较多的时候,代码就会变的非常长。反射:是字符串类型的数据,去操作变量、方法、函数等。这时我们可以利用反射来快速实现这一功能。

2023-03-14 09:55:54 72

原创 Python中将类似list的字符串’[168, 185]’转换成list--json.loads(data)&ast.literal_eval(data)

使用ast包:ast是python源码到字节码的一种中间产物,借助ast模块可以从语法树的角度分析源码结构。print(type(data_new)) # 输出新数据的类型。print(data_new) # 输出转化为list的数据。print(type(data)) # 输出原始数据的类型。

2023-03-06 15:36:18 316

原创 好用的linux数据分析命令awk、grep

Linux命令去重统计排序(awk命令去重,sort, uniq命令去重统计)https://blog.csdn.net/feng973/article/details/73849586。a[$0]++代表先使用a[$0]的值,然后a[$0]的值自增1。的情况下,该语法用于打印重复项,看下面的例子↓。awk -F “:” ‘{print $1, $3}’ #以“:”为分隔符分割列,然后打印第一列和第三列。++: 与C/C++中的++一个含义,i++先使用i后i自增1,++i代表i先自增1然后被使用。

2023-03-03 16:43:31 500

原创 python 读取xlsx,写入xls

【代码】python 读取xlsx,写入xls。

2023-02-02 22:30:47 305

原创 罗列遇到的问题

top命令的TIME/TIME+是指的进程所使用的CPU时间,不是进程启动到现在的时间,因此,如果一个进程使用的cpu很少,那即使这个进程已经存在N长时间,TIME/TIME+也是很小的数值。reboot 用来重启Linux系统和Windows系统中的restart一样。但是机器重启必须要root用户才有权限。此外,如果你的系统有多个CPU,或者是多核CPU的话,那么,进程占用多个cpu的时间是累加的。2、linux中top性能分析工具中的TIME+257是分钟,14.655是秒。

2023-01-16 11:34:58 267

原创 [学习笔记] flask-jinja2

{% if loop.index==3 %} xx {% endif %} //如果是循环的第三个元素就会xx。{% if loop.last %} xx {% endif %} //如果是循环的最后一个元素就会 xx。{% if loop.first %} xx {% endif %} //如果是循环的第一个元素就会 xx。loop.index 从1开始升序(循环迭代)jinja2的循环内置变量主要有。

2022-12-27 18:54:29 236

原创 以curl为切入点学习计算机网络

curl CURLOPT_TIMEOUT_MS 小于1秒 解决方案:CURLOPT_TIMEOUT_MS 设置cURL允许执行的最长毫秒数。所以使用的时候请先查看libcurl版本 curl --version ,但是这个函数有个bug,如果时间小于1000毫秒也就是1秒的话,会立马报错,查看说明:https://www.cnblogs.com/sky20081816/archive/2013/05/30/3108657.html,1)CURLOPT_TIMEOUT_MS 设置。如果设置为0,则无限等待;

2022-12-27 16:48:26 89

原创 linux下passwd命令修改用户密码

passwd: all authentication tokens updated successfully. 注:修改root密码成功;普通用户如果想更改自己的密码,直接运行passwd即可;(current) UNIX password: 注:请输入当前密码;Retype new UNIX password: 注:验证新密码;New UNIX password: 注:请输入新密码;New UNIX password: 注:请输入新密码;New UNIX password: 注:请输入新密码;

2022-12-15 20:36:28 2479

原创 进程管理程序supervisor->gunicorn->flask

它是通过fork/exec的方式把这些被管理的进程当作supervisor的子进程来启动,这样只要在supervisor的配置文件中,把要管理的进程的可执行文件的路径写进去即可。supervisor非常好用,配置也简单方便,它是一个用 Python 写的进程管理工具,可以很方便的用来启动、重启、关闭进程(不仅仅是 Python 进程)。Nginx可以缓存住请求,然后内网再次发起请求,并且可以配置负载均衡,如果一台机器 的多进程(Gunicorn就是多进程)吃不消的情况下,负载均衡可以把请求打向多个机器。

2022-12-14 15:41:59 447

原创 linux常用命令和关注指标

crontab -e修改完后再加锁回去chattr +i /var/spool/cron/root。你先解锁chattr -i /var/spool/cron/root,查看crontab -l。

2022-10-30 11:59:08 53

原创 余弦相似度和余弦距离的计算方式

余弦相似度,就是计算两个向量间的夹角的余弦值。余弦相似度的取值范围是[-1,1]。余弦距离就是用1减去这个获得的余弦相似度。余弦距离的取值范围为[0,2]。计算余弦相似度,只需要将vec L2范数归一化后,使用内积度量。

2022-10-20 15:45:09 2080

原创 rapidJson输出时保留指定小数位

/PrettyWriter是格式化的json,如果是Writer则是换行空格压缩后的json。rapidJson输出时 保留小数位。

2022-10-09 16:37:25 302

原创 c++ 打印线程id

c++ 打印线程id。

2022-09-06 20:42:38 2462

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除