自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

nefu_ljw的博客

欢迎访问我的个人网站:www.jwblog.xyz

  • 博客(265)
  • 资源 (15)
  • 收藏
  • 关注

原创 Python实现批量导入Markdown文件到WordPress(博客搬家工具,代码已开源)

本文同步发布于我的个人网站:https://jwblog.xyz代码已开源:https://github.com/nefu-ljw/python-markdown-to-wordpress1. 熟悉安装和使用python-wordpress-xmlrpcpython-wordpress-xmlrpc,这个其实就是别人写好的包,直接调用了 WordPress 的 xmlrpc 接口发布文章。首先安装这个包,对于python3,用 pip3 install python-wordpress-xmlrpc

2021-11-21 18:12:15 1476

原创 2021 从零开始学Git【新版本Git - 8000字详细介绍】

我写的这篇文章,主要是记录自己的学习过程,也希望帮助读者少踩坑(比如不同版本可能命令不兼容等)。本文面向git零基础初学者,建议读者按照文中命令自己全部操作一遍(注意运行环境)。我的运行环境:win10 + VMware + ubuntu 18.04 + git 2.33.0(所有命令均在root用户下执行)本文参考资料:[1] 廖雪峰 Git教程[2] 博客园 一个小时学会Git[3] Git中文官方文档资料在精不在多,以上3个资料足以详细解释git的各项命令,建议把这些资料都看一下。从时效性

2021-10-24 20:51:56 560

原创 2021年计算机保研经历:人大信院、南大软院、华师数据院、厦大软件、湖大信院【7000字详细介绍】

今年准备保研期间,我在网上看了许多保研经验贴,受益匪浅。如今尘埃落定,那么我也将自身经历详细写出,希望对学弟学妹们能有所帮助。(如果觉得有用就点个赞吧~)文章目录科普个人背景夏令营情况1. 中国人民大学 信息学院 专硕2. 湖南大学 信息科学与工程学院 学硕3. 厦门大学 信息学院软件工程系 专硕4. 华东师范大学 数据科学与工程学院 专硕5. 南京大学 软件学院 专硕预推免情况Ending

2021-09-25 21:51:36 10945 20

原创 解决Ubuntu20.04启动MySQL报错(Job for mysql.service failed because the control process exited with error)

mysql启动时报错情况sudo service mysql start # 启动Job for mysql.service failed because the control process exited with error code.See “systemctl status mysql.service” and “journalctl -xe” for details.

2024-02-28 14:33:33 1867

原创 解决github ping不通的问题(1024程序员节快乐!

1024程序员节快乐!

2023-10-24 11:02:04 2744 1

原创 基于Flink CDC实时同步PostgreSQL与Tidb【Flink SQL Client模式下亲测可行,详细教程】

只要这个flink作业是正常runnning,那么对source_table的任何修改都会同步到sink_table。注意这种是单向同步,source_table的变动(增/删/改)会同步到sink_table,但反过来sink_table的变动不会影响到source_table(不会触发source_table->sink_table的同步)。

2023-08-20 20:38:30 1751

原创 wsl1 ubuntu通过宿主机代理连接外网

背景:公司电脑是局域网,通过走代理来连接外网wsl1 ubuntu想要通过来连接宿主机的局域网代理,访问外网可以先在ubuntu上测试下走代理的网络,注意不能用ping(ping不走代理),可用curl测试。

2023-08-11 15:56:17 1761

原创 git通过ssh代理连接github(gitee不支持),并更改端口

Hostname ssh.github.com和ProxyCommand nc -X connect -x 127.0.0.1:3128 %h %p 定义对服务器 github.com 的 ssh 调用应该重新路由到端口 3128 上的代理服务器 127.0.0.1,并且服务器不应该是 github.com 而是更改为ssh.github.com。这是 github 允许使用 git 或 ssh 协议通过 https(端口 443)连接到服务器(That is the server where github

2023-06-20 17:56:17 3003

原创 银行从业资格证(初级) 5天零基础拿证攻略【个人经历,亲测】

教材可买可不买,时间不够可以不看教材。可以买天一金融的真题汇编,它附赠一个考点整理的小册子。一定要自己整理知识框架。看个人习惯选择网上做真题卷还是买纸质版的真题。我是直接在233网校上做真题,做完之后把错题整理到文档里,这时可以自把多个不同错题合并到同一个知识点,举个例子,一/二/三版巴塞尔协定的内容和改进、信用证与备用信用证、抵押权与质权等等。做了几套真题就知道有些知识点是会重复考的,虽然题可能表面上不一样,但是知识点都大差不差。

2023-06-03 21:36:46 572 1

原创 银行从业资格证 个人理财 各种年金计算公式总结

银行从业资格证 个人理财 各种年金计算公式总结

2023-06-02 18:08:45 602

原创 SQL笔试题 分组计算比例+保留小数不够补0+连接字符串【cast、round、decimal、concat函数】

要求分组计算每个pay_ability中违期还款的比例(overdue_days不为空);大致思路就是两表连接,分组,然后比较麻烦的是算比例。最初始计算方法是`count(overdue_days)/count(*)`,分子选出overdue_days不为空的行,分母选出所有的行。然后还需要各种细节处理,比如...

2023-04-11 11:25:54 634 1

原创 力扣 每日一题 1017. 负二进制转换【难度:中等,rating: 1697】(负二进制)

类似十进制转二进制%2,改成%(-2),可能的余数为0,1,-1。想办法把-1给转换掉:就是余数-1变成+1,然后商+1

2023-04-06 12:35:20 383

原创 windows11 conda 创建/删除/查看环境命令 + 换源 + 换环境安装路径

如果没有sudo权限,创建虚拟环境,就还是会装到C盘用户目录,显然这就是权限问题!env子目录右键-属性-安全-Users修改权限-完全控制(全部打勾)。即可让非sudo权限的用户写入。看来windows修改父目录的权限并不会递归修改子目录的权限。

2023-03-28 20:52:17 1961 1

原创 【2023最新】Windows11 wsl2 ubuntu22.04安装与配置

(1)这行命令之后安装的所有 Linux 发行版都默认 WSL2 执行。(2)`wsl --list --online` 以查看可用发行版列表并运行 `wsl --install -d ` 以安装发行版。 (3)设置进入ubuntu的默认用户(4)从主机win11拷贝文件

2023-03-24 16:14:03 5172 2

原创 力扣 每日一题 1326. 灌溉花园的最少水龙头数目【难度:困难,rating: 1885】(动态规划)

得到所有区间,按左端点L、右端点R进行排序。然后遍历这些区间覆盖的每个点i,保证L

2023-02-21 15:40:27 180

原创 力扣 每日一题 1250. 检查「好数组」【难度:困难,rating: 1983】(数论)

这题关键在于发现最大公因数(gcd)起到的作用,将原问题转换为“判断是否存在多个数,它们的gcd=1”。更形式化的定理称为“裴蜀定理”

2023-02-15 19:43:43 115

原创 spark 内存管理机制与相关参数调优

执行内存是指用于洗牌(shuffle)、连接、排序和聚合中的计算,而存储内存是指用于在集群中缓存和传播内部数据的内存。在 Spark 中,执行和存储共享一个统一的区域(M)。spark 可以通过jdbc操作关系数据库,但是若是没有分散数据的依据,则将所有数据都读到driver节点上时,这时,强烈建议先看一下表的数据量和集群中对spark的内存设置参数。Spark 1.6 之后引入的统一内存管理机制,与静态内存管理的区别在于存储内存和执行内存共享同一块空间,可以动态占用对方的空闲区域。

2023-02-03 15:59:15 639

原创 scala 集合总结(Seq、Map、Set、List、Tuple、Option)

从较高的层次来看 Scala 集合,主要有以下三个类别可供选择:Sequences是元素的顺序集合,可以是索引的(如数组)或线性的(如链表);Maps包含键/值对的集合,类似于Java的Map、Python的dict;Sets是唯一元素的无序集合;所有这些都是基本类型,并且具有用于特定目的的子类型,例如并发、缓存和流式处理。除了这三个主要类别之外,还有其他有用的集合类型,包括ranges, stacks, queues。

2023-01-04 14:01:20 1281

原创 spark sql Dataframe 的 union、reduce、reduce(_ union _)

union返回一个新的数据集,其中包含此数据集中的行和另一个数据集中的行的并集。这相当于 SQL 中的 UNION ALL。 要执行 SQL 样式的集合并集(对元素进行重复数据删除),请使用此函数,后跟一个不同的。

2023-01-03 18:04:15 822

原创 scala vararg( * 与 _* 的用法)

:_*作为一个整体,告诉编译器你希望将某个参数当作参数序列处理!例如val s = sum(1 to 5:_*)就是将1 to 5当作参数序列处理。在spark sql Column中isin函数的定义是:def isin(list: Any*): Column。函数外部传入:参数序列;函数内定义:vararg。

2023-01-03 17:17:00 436

原创 spark sql DataFrame 的 groupBy+agg 与 groupByKey+mapGroups

groupBy 对比 groupByKey;groupByKey + mapGroups / groupBy + agg

2023-01-03 17:01:00 1592

原创 从spark WordCount demo中学习算子:map、flatMap、reduceByKey

从spark WordCount demo中学习算子:map、flatMap、reduceByKey;转换与聚合

2023-01-03 16:54:06 477

原创 spark sql - Dataset数据类型

Dataset是特定领域对象的强类型集合,可以使用函数或关系操作并行转换。 每个Dataset还有一个无类型的视图,称为DataFrame,它是一个Dataset of Row。DataFrame = Dataset[Row]。Dataset上可用的操作分为转换(transformation)和操作(action)。 转换是产生新数据集的,动作是触发计算并返回结果的。

2023-01-03 16:51:26 789

原创 力扣 每日一题 862. 和至少为 K 的最短子数组【难度:困难,rating: 2306】(前缀和+单调队列)

可以想办法维护放入队列的下标 i 对应的前缀和 sum[i] 依然单调递增。为了做到这一点,考虑在加入当前下标 i 到队列之前,弹出不影响后续答案的元素。结论:假设 sum[i] 的前面有一些 sum[j] (j < i),满足sum[j]>=sum[i],那么这些 j 被弹出并不会影响答案。

2022-10-27 20:49:34 341

原创 力扣 每日一题 934. 最短的桥【难度:中等,rating: 1825】(dfs / bfs)

题目要求的实际上是两个由1组成的连通块之间的最小距离。那么直接可以想到:把这两个连通块内的所有点分别求出来,然后O(n2)遍历这些点,求它们的最小距离即为答案。两次dfs(深度优先搜索)即可得到两个连通块内的所有点。

2022-10-25 12:25:11 170

原创 leetcode笔记(自用)

1024 程序员节快乐!

2022-10-24 20:57:36 1018

原创 力扣 每日一题 1235. 规划兼职工作【难度:困难,rating: 2022】(动态规划+二分查找)

将所有工作按结束时间排序,然后考虑动态规划:1. 直接放弃第 i 个工作,那么保持前 i-1 个工作的收益,dp[i]=dp[i-1]。2. 设法选上第 i 个工作,那么dp[i]=dp[k]+profit[i],其中 k 必须满足 end[k]

2022-10-22 12:14:12 513 2

原创 力扣 每日一题 902. 最大为 N 的数字组合【难度:困难,rating: 1989】(数学 / 数位dp)

设 n 的位数(长度)为 len_n,digits 的长度为 len_d,那么长度小于 len_n 的从 digits 中取出的所有任意组合均满足条件,方案数

2022-10-18 13:20:52 610

原创 力扣 每日一题 886. 可能的二分法【难度:中等,rating: 1794】(并查集 / 拆点优化的扩展域并查集)

文章目录题目链接思路一(建图+并查集)代码一思路二(扩展域并查集)代码二其他解法补充资料:并查集的时间复杂度

2022-10-17 19:59:05 407

原创 力扣 每日一题 768. 最多能完成排序的块 II【难度:困难,rating: 1787】(区间合并+区间计数)

只需合并小区间成大区间,然后统计大区间个数即可。原数组中的每个位置 start_pos,需要进行升序排序得到一个新位置 end_pos。这样能固定一个最小块的区间[min(start_pos,end_pos), max(start_pos,end_pos)],也就是说,至少在这个范围内的数必须划分在同一个块里面,这是必要条件,否则就不满足所有块连接起来之后升序。那么我们可以存储所有最小块的区间,它们之间可能有交集,对于有交集的,就把这些区间并在一起(小的块合并成大的块);

2022-10-13 17:36:35 155

原创 【NLP实践】用预训练的词向量处理词的相似性和类比任务

请事先下载数据集,https://nlp.stanford.edu/projects/glove 下载glove.6B.zip文件并解压。本文使用数据集为glove.6B.50d.txt,其必须保存到项目路径的./data子目录下。以下是跑通glove.6B.50d.txt数据集的python代码(对于书中的原代码有改动,并加上了自己的注释)

2022-10-12 11:18:22 883 1

原创 力扣 每日一题 801. 使序列递增的最小交换次数【难度:困难,rating: 2066】(动态规划)

对于每个位置 i,都有两种可能的操作(交换、不交换)。可以用一个数组记录每个位置 i,在 交换/不交换 操作后满足递增关系时的总操作次数。假设从位置 0 到位置 i 满足递增关系所需总操作次数为dp[i][0](位置 i 不交换),从位置 0 到位置 i 满足递增关系所需总操作次数为dp[i][1](位置 i 交换),考虑其前一个相邻位置 i-1,那么它们满足以下关系:

2022-10-10 20:29:03 385

原创 力扣 第314场周赛 Q3 使用机器人打印字典序最小的字符串【难度:中等,rating: 1953】(栈+贪心)

字符串 t 后进先出,可以看成是一个栈。贪心思想:遍历字符串 s,操作如下:若 当前栈顶

2022-10-10 00:04:31 184

原创 力扣 每日一题 856. 括号的分数【难度:中等,rating: 1562】(栈 / 思维计数&括号深度)

可以发现每次加上的值总是2的幂(幂次设为n,即2^n),那么不妨考虑幂次n与括号的关系:n=左括号的个数−右括号的个数左括号减去右括号的个数其实就是“括号的深度”。只在括号形式为"()"时进行计数,因为这是被包裹在最里面的成对括号,只要记录它的深度并且计数即可

2022-10-09 17:32:51 561

原创 力扣 每日一题 870. 优势洗牌【难度:中等,rating: 1648】(贪心+双指针)

贪心、双指针。贪心策略类似于田忌赛马(大的匹配大的,匹配不上就用小的匹配大的)。首先,肯定要把nums1, nums2排序,对于nums2还要额外记一下排序前的原坐标(可以用pair存到vector里面),存入s2。然后,以下图为例,用双指针i, j比较两个数组尾部的大小,逆序遍历s2,如果nums1>s2,那么直接匹配上;反之,则将s2匹配上nums1的首部,这个首部的坐标可以再加一个指针k来维护。

2022-10-08 11:54:59 172

原创 力扣 每日一题 927. 三等分【难度:困难,rating: 1994】(思维+后缀字符串+bitset技巧)

本题的关键在于发现:1.字符串能被三等分 => 1的总个数必须是3的倍数。必须满足这个必要条件。2.第3个子串的结束位置被固定在串的末尾,那么第3个子串的后缀0的个数suffix_zero_count,能用于限制前面第1、2个子串的后缀0个数。因为第3个子串的后缀0是固定的,而前面的两个子串的后缀0是可以往后调整的,只要它们的后缀0个数>=suffix_zero_count,多余的后缀0就可以划分给下一个子串作为前导0。通过这种调整,确定了第1、2个子串的结束位置,同时也确定了第2、3个子串的开始位置。

2022-10-06 21:06:12 552 1

原创 力扣 每日一题 811. 子域名访问计数【难度:中等,rating: 1377】(字符串切分+哈希表计数)

字符串切分,哈希表计数。

2022-10-06 17:07:07 184

原创 力扣 每日一题 777. 在LR字符串中交换相邻字符【难度:中等,rating: 1938】(思维)

题意的浅层描述是:start串的XL能被替换为LX,RX能被替换为XR。对于start串的替换操作,稍加扩展可以得到:L能够越过左边的若干个X,但是不能越过L或R。R能够越过右边的若干个X,但是不能越过L或R。例如 start=RXXLRXRXL -> RLXXXXRRL。

2022-10-03 11:20:49 257

原创 剑指 Offer 06. 从尾到头打印链表【难度:简单】(链表翻转)

非常经典的单向链表翻转。思路就是固定原来的头结点init_head,把init_head后面的结点依次移动到链表首部,直到init_head后面没有结点,即init_head变成了链表尾部。

2022-09-30 16:08:22 173

原创 剑指 Offer 04. 二维数组中的查找【难度:中等】(类二叉查找树)

主要有三种思路:1.暴力找,时间复杂度O(n*m)。2.二分找,时间复杂度O(n*logm)。3.看成是二叉排序树的查找,时间复杂度O(n+m)。第三种思路比较巧妙,利用该矩阵的特殊性质(行元素递增、列元素递增),将矩阵看成是二叉排序树,每个元素是树中的一个结点,其左边的元素都比它小,下边的元素都比它大。 右上角的元素看成是根结点。注:二叉查找树 (BST,Binary Search Tree),又称二叉搜索树、二叉排序树。

2022-09-30 00:05:40 552

【机器学习】线性回归(最小二乘法or梯度下降法)、多项式回归、logistic回归、softmax回归.zip

https://blog.csdn.net/ljw_study_in_CSDN/article/details/117775766 博客配套代码+数据集文件

2021-06-10

2021年第十二届蓝桥杯决赛 C++大学A组 真题.zip

2021年第十二届蓝桥杯决赛C++大学A组 试题(2021.6.5) 比赛时间:2021.6.5

2021-06-05

【机器学习】python构建ID3决策树+pygraphviz可视化(代码详解,附注释)

机器学习实验,python代码,全部是我自己写的。 python实现ID3算法构建决策树,并用pygraphviz进行可视化操作; 数据集使用西瓜数据集2.0; 建议配套我的博客文章使用:https://blog.csdn.net/ljw_study_in_CSDN/article/details/116375359

2021-05-04

2021年第十二届蓝桥杯省赛 C++大学A组 真题.zip

2021年第十二届蓝桥杯省赛 C++大学A组 试题(2021.4.18第一场) 比赛时间:2021.4.18

2021-04-18

Apriori算法代码和原数据集.zip

数据挖掘实验,matlab代码,全部是我自己写的。 详见我的这篇文章:https://blog.csdn.net/ljw_study_in_CSDN/article/details/110139596

2020-11-25

2020年第十一届蓝桥杯决赛 C++大学A组 真题

2020年第十一届蓝桥杯决赛 C++大学A组真题(2020.11.14) 比赛时间:2020.11.14

2020-11-14

汇编语言运行环境所需文件(masm5,DOSBox0.74)

汇编语言运行环境所需文件,资源来自于老师的分享。 其中包括masm5可执行文件、DOSBox0.74安装包。

2020-10-21

2020年第十一届蓝桥杯省赛C++大学A组真题(第三场)

2020年第十一届蓝桥杯省赛 C++大学A组 试题(2020.10.18第三场) 比赛时间:2020.10.18

2020-10-18

2020年第十一届蓝桥杯省赛C++大学A组真题(第二场)

2020年第十一届蓝桥杯省赛 C++大学A组 试题(2020.10.17第二场) 比赛时间:2020.10.17

2020-10-17

https://blog.csdn.net/ljw_study_in_CSDN/article/details/108484853 配套excel原始数据

https://blog.csdn.net/ljw_study_in_CSDN/article/details/108484853 配套excel原始数据

2020-09-10

计算机组成原理课设:8条指令模型机(logisim文件和主存数据).zip

计算机组成原理课程设计内容,跟着老师的讲解,自己一步步做的。 Logisim模拟以下八条指令: (1)LDA 操作码000X (2)ADD 操作码001X (3)SUB 操作码010X (4)SHR 操作码011X (5)STA 操作码100X (6)DEC 操作码101X (7)JNZ 操作码110X (8)STP 操作码111X 注:X(1位)此位未定义。 要求设计主存数据实现循环功能(变址寻址),利用有条件跳转指令JNZ,实现循环程序,当符合特定条件后停机。 压缩包内含有logisim文件和主存数据,运行程序前需要先加载主存数据。

2020-07-09

计算机组成原理课设:原码一位乘、补码一位乘(logisim文件).circ

计算机组成原理课程设计内容,跟着老师的讲解,自己一步步做的。 (1)Logisim仿真乘法器,原码一位乘。 (2)Logisim仿真乘法器,补码一位乘。

2020-07-09

数字逻辑课设:数字时钟(logisim文件).circ

注意:先按快捷键Ctrl+K让时钟自动跳动!!! 利用logisim软件实现数字时钟。 要求: 1. 利用logisim自带的元器件:各种逻辑门(Gate)、触发器(Flip-Flop)、7段数码管(7-Segment Display)等实现显示时、分、秒的数字钟。 2. 两位数码管显示小时并满24进位,两位显示分钟和两位显示秒钟的数码管满60进位。 3. 制作子电路芯片实现7490/74390(计数/分频)、4511/7448(7段数码管译码)的功能。不可以使用logisim自带工具:计数器(Counter)和十六进制显示器(Hex Digit Display)。 4. 方波信号使用Clock工具产生,自行设置电路时钟频率和分频电路,使计时贴近真实时间。

2020-06-24

数字逻辑课设:简易秒表设计(logisim文件).circ

注意:先按快捷键Ctrl+K让时钟自动跳动!!! 利用logisim软件完成简易秒表设计。 要求: 1、具有时钟源产生1S的信号 2、能够通过数码管显示,显示最大值为59,具有时间暂停功能 3、能够通过按键清除上次计数时间值

2020-06-24

信息学奥赛课课通(C++)配套资料【完整版】

信息学奥赛课课通(C++)配套资料完整版,只需要1积分带走! 本书配套资源包括电子课件PPT、习题答案、习题参考代码、测试数据共4部分。

2019-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除