自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python提升总结

Python非大佬向的技术总结,主要是对常见算法和问题、常用库包、提高效率等进行整理,以后还可能不定期更新,直接甩地址:https://github.com/NekoGaHoshiyi/Python_Advance

2021-05-09 22:49:50 122

原创 记一次肯定是失败了的腾讯面试

一开始面试官问的问题比较基础,但是可能是为了后面厉害的问题和题目做铺垫把难的问题没有答上最后让我做了机试,但是我没有做多少题,考的是找到最大不重复子串前面基础的问题有的其实还可以再说说但是中午也没睡 很困 比如索引讲了数据结构但是没有提mysql索引何时用何时失效,也不敢提太多,免得耽误面试官时间,脑瓜子有点钝不过这也无伤大雅,只是暖场内容厉害的面试题是 超长日志如何有限小内存空间统计ip和分布式锁实现,我真的只能想到 redis的hyperloglog按天记录哪些访问,审题又有问题,然后想到

2021-04-27 18:19:34 142

原创 记录深信服python后端面试

从上家单位离职有段时间,此后一直在充电扩充知识,寻求方向调整,现在才开始面试。深信服面试 Python后端,说实话这是我人生第四次面试面试官一开始慢热偏友好,但是一旦那我们开始面试把,那就是认真咯1.先简单了解一下上家工作和学历,我下次不会认为强调二学位有证可查可能是优势了,说到底,可能面试官是本专业的,而且我其实个人也觉得这没什么用包括学校,开发是强者的舞台,学历能提供的是面试和跟大佬学习的机会2.问一下项目和mysql,索引覆盖,如何知道索引是否覆盖,还有联合索引最左前缀。问到项目感觉被考察到w

2021-04-19 17:05:07 443

原创 Python图形化 Textrank小工具

学习一下tkinter,过程有复用别人的某些代码 ????做了个pythonGUI的textrank小工具可以给一篇文章,txt格式获取词频和textrank降序地址:textranktool

2021-01-15 17:23:39 181

转载 操作系统复习笔记C1概述

课程来自中国大学mooc 2020版华科的操作系统原理,仅供个人学习记录交流课程地址:[操作系统原理 苏曙光老师](https://www.icourse163.org/learn/HUST-1003405007?tid=1450237469#/learn/content?type=detail&id=1214423433&cid=1218120382)1.2 操作系统功能和定义操作系统的功能:功能一 进程管理(CPU管理)进程控制:创建、暂停、唤醒、撤销;进程调度:调度

2021-01-13 11:42:32 230

原创 离线导入iris鸢尾花数据集简单处理和sklearn在线导入的data和target一致

from sklearn.datasets import load_irisimport pandas as pdiris=pd.read_csv(r'../Irisdata/iris.csv') X=np.array(iris[['Sepal.Length','Sepal.Width','Petal.Length','Petal.Width']].values.tolist()) #前四列属性简化为sl,sw,pl,pw Y=np.array(iris['Species'].value

2021-01-05 11:21:31 1214 3

转载 pip安装出现PermissionError: [WinError 32] 另一个程序正在使用此文件,进程无法访问。

打开c:\program files\python36\lib\site-packages\pip\compat__init__.py在第75行,把return s.decode(‘utf_8’)改为return s.decode(‘cp936’) 即可。转载自:https://blog.csdn.net/qq_35203425/article/details/80455243

2021-01-04 15:24:54 1334 3

原创 python调用百度翻译api+离线语种检测

百度翻译api调用(具体参考的哪篇博文找不到了,好几篇太像了,原作者留意到可以告知我改转载附上链接):import urllib, hashlibimport randomimport requests, sysdef getTransText(in_text): q = in_text fromLang = 'auto' # 翻译源语言=自动检测 toLang1 = 'en' # 译文语言 = 英文 appid = '' # APP ID salt

2020-12-29 10:20:18 705

原创 环球新闻数据拆分单篇不易命名,创建索引目录

import osflist = os.listdir('./original')count = 1index = open('index.txt', 'w', encoding='utf-8')for filename in flist: print(filename) with open('./original/'+filename,'r', encoding='utf-8') as news: while True: .

2020-12-24 15:21:13 84

原创 Python对Json列表的字典对象按某个键排序

json_list.sort(key = lambda x:x["需要排序的键"])

2020-12-24 09:07:14 551

原创 Python正则表达式对社交文本进行清洗

我这里处理场景是推文,其他平台应该需要有所调整处理表情:import redef filter_emoji(content): try: cont = re.compile(u'['u'\U0001F300-\U0001F64F' u'\U0001F680-\U0001F6FF'u'\u2600-\u2B55]+') except re.error: cont = re.compile(u'('u'\ud83c[\udf00-\udfff]|'u'\u

2020-12-23 09:08:43 338 1

原创 Python爬虫:按分类批量爬取环球新闻

from lxml import etree'''by Sanlee'''import randomimport requestsimport jsonuser_agents = [ 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36 OPR/26.0.1656.60', 'Opera/8.0 (Windows NT .

2020-12-23 08:40:54 1010 5

原创 Win10 ZooKeeper安装配置启动

1.下载zookeeper:http://zookeeper.apache.org/releases.html2.解压3.修改conf下zoo_sample.cfg重命名成zoo.cfg,管理员模式打开notepad++,修改dataDir=D:/Program Files/apache-zookeeper-3.6.2-bin/tmp为实际路径,需要创建tmp文件夹4.在安装目录和bin同目录创建logs文件夹5.将D:\Program Files\apache-zookeeper-3.6.2-b

2020-12-21 17:00:28 773

原创 requests+urlencode+UA Googleapis谷歌翻译,在线菲英互翻

import requestsimport jsonfrom urllib.parse import urlencodedef get_trans(sl='tl',tl='en',q='Pwede mo bang bagalan ang iyong pagsasalita?'): heads = {} heads['User-Agent'] = 'Mozilla/5.0 ' \ '(Macintosh; U; Intel Mac

2020-12-09 09:00:48 209 2

原创 记录语言检测开源proj的gihub地址

Python(language-detector):https://github.com/DanielJDufour/language-detectorNode.js(franc):https://github.com/wooorm/franc

2020-12-08 10:55:25 95

原创 Win下php+apache+dm达梦配置

环境配置要点1.php和apache版本安装适配:先下载php,php文件夹里的php5apache2_4.dll能够说明适配的apache版本,例如php5apache2_4.dll,说明适配的是2.4的apache版本,安装或者解压完php后应该下载这个对应版本的apache2.php配置(先复制一份php.ini-development改名为php.ini):修改extension_dir = “D:/php5.4/ext”,如果注释则取消注释添加extension=php54_dm.dll

2020-11-25 17:39:22 405

原创 DM8达梦数据库win10/ubuntu16安装,以及dmPython踩坑记

DM8达梦数据库win10/ubuntu16安装,以及dmPython踩坑记部分参考:https://www.cndba.cn/dave/article/3827首先dm8需要jdk环境,win下不做赘述,linux最快的是:sudo apt-get updatesudo apt-get install openjdk-8-jdkWin10数据库安装就不提了1.安装VC++2017(一般大家都装全家桶,steam和3A玩耍必备),把达梦的bin目录配到系统path环境变量里2.安装VS201

2020-11-24 11:34:37 1874 3

原创 更改jupyter默认workspace

1.cmd内jupyter notebook --generate-config查看输出的配置文件目录2.到输出的配置文件找到c.NotebookApp.notebook_dir取消注释并修改路径3.找到快捷方式修改属性,把目标” 最后面的 “%USERPROFILE%” 删除

2020-07-30 19:34:06 400

原创 sklearn机器学习入门(部分聚类、分类、回归)

机器学习入门整理内容总结来自网课和部分博客,代码数据集来自中国大学mooc北理的机器学习课程,大赞这个课程。链接想起来再更新上去,私戳可以发评论里,毕竟体积也不算很小。仅学习总结,侵删。一、无监督学习-聚类聚类就是对大量未知标注的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小,属于无监督学习。聚类算法的重点是计算样本项之间的相似度,有时候也称为样本间的距离。1.K-means算法K-means算法以k为参数,将n个对象分为k个簇

2020-07-24 15:33:33 728 3

塔加洛语词典(无释译)

语种检测

2020-12-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除