自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 资源 (4)
  • 收藏
  • 关注

原创 WPS开发 宏代码 按数据类别划分数据保存至新的工作簿

尝试了一下代码,先拆分数据至不同sheet,但是在复制标题时报错,头疼,怎么改!以下代码可以跑通,就是标题没有复制成功。

2024-01-26 16:30:01 400

原创 word常用技巧

1. 关于参考文献——交叉引用插入文献综述,可以使用引用中的交叉引用,即可将标号和参考文献进行对应,同时点击标号可直接超链接到对应的文献——1.如需在中间插入参考文献,仅需要选中文本右键更新域即可更新所有的参考文献标号。2.如需取消相应的标号与参考文献之间的超链接关系,选中文字ctrl+A然后ctrl+shift+F9就可以使得标号与超链接之间没有关系了。2. 关于页码设置——页面布局-分隔符-下一页当需要设置页码,同时想要另起页码时,使用页面布局-分隔符-下一页即可对应设置新的页码,当然需要在

2022-03-14 22:18:08 423

原创 Bert模型获得词向量和句子向量表示

text = "After stealing money from the bank vault, the bank robber was seen fishing on the Mississippi river bank." marked_text = "[CLS] " + text + " [SEP]" tokenizer = BertTokenizer.from_pretrained('bert-base-uncased') tokenized_text = tokenizer.token.

2022-02-22 17:28:51 5605 3

原创 dataframe删除值的长度小于某个值的行

c_df=c_df[c_df.column.str.len()>5]

2022-02-16 16:00:49 1440

原创 词频统计&排序

#词频统计sent = "python is my favoriate language,you're so cute ,someone like you ~~,do what shhhh"#最新output = {k:sent.count(k) for k in set(sent)}#快捷获得词频统计print(output)output = {k:sent.count(k) for k in set(sent.split(" "))}#快捷获得词频统计print(output)...

2022-02-14 00:57:36 335

原创 pytorch_pretrained_bert将tensorflow模型转化为pytorch模型

参考:使用pytorch_pretrained_bert将tensorflow模型转化为pytorch模型_sunyueqinghit的博客-CSDN博客_bert tensorflow转pytorch1. 下载bert安装包GitHub - google-research/bert: TensorFlow code and pre-trained models for BERT2. 下载转换的py文件transformers/convert_bert_original_tf_checkpoint_

2022-01-29 22:54:34 1836

原创 安装pytorch,使用gpu

1. nvcc --version #查看cuda的版本,在prompt可查看,在cmd进入终端也可以查看2. python --version #查看当前的python版本根据cuda版本和python版本选择pytorch wheel下载安装pip install http://download.pytorch.org/whl/cu90/torch-1.0.1-cp36-cp36m-win_amd64.whl(或http://download.pytorch.org/whl/torch.

2022-01-24 00:28:33 1328

原创 spyder常用快捷方式--方便使用

按住ctrl,用鼠标点击函数可直接跳转到定义函数的位置Ctrl+R 替换文本 Ctrl+] 选择部分代码,点击后批量缩进,同理ctrl+[Ctrl+1 单行注释,单次注释,双次取消注释Ctrl+4 块注释,单次注释,双次取消注释F9 选中运行部分代码,按F9运行程序,部分电脑需要Fn+F9Ctrl+P 文件切换Ctrl+L 清除shellCtrl+I 查看某个函数的帮助文档Ctrl+Shift+V 调出变量窗口Ctrl+up...

2022-01-21 21:25:19 1701

原创 python读取文件的常用方法

1.FILE_OBJECT= open('order.log','r', encoding='UTF-8')2. inf= open('order.log','rb') for line in inf: parts = line.decode().rstrip().split(' ')3. 文件名为中文时,需要使用open先打开再读取4.读取excel:c_data = pd.read_excel(xlsx_file)5.读取csv:f = open(csv_file,e...

2022-01-20 17:52:07 898

转载 自然语言处理相关数据语料

转载From:自然语言处理中文数据集入口整理_zhurui_xiaozhuzaizai的博客-程序员ITS401 - 程序员ITS4011 github 链接 https://github.com/SophonPlus/ChineseNlpCorpus 包括:情感分类,推荐,问答 https://github.com/CLUEbenchmark/CLUEDatasetSearch NER、QA、情感分析、文本分类、文本分配、文本摘要、机器翻译、知识图谱、...

2022-01-20 05:32:02 282

原创 python--pip install安装失败可尝试

1. pip install XX2.pip install --user XX3.python -m pip install --user XX4.下载轮子,即相应的安装包,参考其他博客(后续补充)

2022-01-20 03:50:00 908

原创 查找电脑是否支持GPU&GPU使用

在任务管理器和设备管理器查看自己的gpu配置在代码中设置使用gpu运行代码import os# 使用第一张与第三张GPU卡os.environ["CUDA_VISIBLE_DEVICES"] = "0, 2"具体安装和配置可参考:怎样知道自己的电脑是否支持GPU?_进阶女学霸-CSDN博客_怎么看电脑有没有gpuCUDA指定GPU的使用方法_haima1998的专栏-CSDN博客_指定cuda...

2022-01-15 14:19:07 1873

原创 无法打开chrome,要求使用命令行sxstrace.exe工具

在chrome官网下载一个chrome安装到C:\Users\18742\AppData\Local\Google\Chrome\Application查看chrome安装情况,可点击new_chrome即解决图片中存在的问题

2022-01-11 16:14:42 3256 2

原创 python Array基本操作

embedding_i = np.vsplit(embedding_i,10)#将原本的array进行垂直分割,水平分割使用hsplit反向操作:pad= np.vstack(embedding_i )#将分列的数据垂直合并,或使用hstack

2022-01-11 15:43:41 536

原创 CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anaconda/pk

conda 报错CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/win-64/repod.c盘用户下的C:\Users\18742找.condarc文件删除default并将https换成http即可

2022-01-01 20:53:18 2142 2

原创 OSError: [WinError 126] 找不到指定的模块。 Error loading “D:\Python\Anaconda3\lib\site-packages\torch\lib\asm

安装python -m spacy download xx_ent_wiki_sm报错OSError: [WinError 126] 找不到指定的模块。 Error loading "D:\Python\Anaconda3\lib\site-packages\torch\lib\asmjit.dll" or one of its dependencies.在https://aka.ms/vs/16/release/vc_redist.x64.exe下载C++进行安装后出现新的错误 ra..

2022-01-01 20:38:32 5630

原创 ERROR: Could not install packages due to an OSError: [WinError 5] 拒绝访问。: ‘C:\\Users\\18742\\AppData\

pip install --user spacy报错ERROR: Could not install packages due to an OSError: [WinError 5] 拒绝访问。: 'C:\\Users\\18742\\AppData\在前面加入python -m pip install spacy成功

2022-01-01 20:14:14 2668

原创 twitter数据爬取

继上次(爬取twitter数据_Chloris_的博客-CSDN博客)在github上寻找代码看不懂的后续尝试:其中包含selenium登录&异步加载&xpathfrom selenium import webdriverimport timefrom datetime import datetimefrom datetime import timedeltaimport pandas as pdimport requestsimport jsonfrom fak..

2021-12-15 15:44:50 3471

原创 selenium爬取数据

查看自己安装的chrome版本对应到chromedriver官网去找对应版本的chromedriver【通过点击chrome浏览器右上角进入帮助--关于chrome可以查看版本号】或输入网址可查看版本:chrome://version/selenium浏览器爬虫:官网下载:ChromeDriver - WebDriver for Chrome - Downloads或ChromeDriver Mirror使用json解析可以获得清晰地格式来获取数据:https://www.jso..

2021-12-05 00:40:32 1410

原创 获取代理ip-进行爬虫

import urllib.requestimport jsonimport timeimport urllib.errorimport requestsfrom bs4 import BeautifulSoup import randomimport reimport httpximport requestsfrom bs4 import BeautifulSoupimport timeimport jsonimport randomdef get_ip_list(u.

2021-12-03 00:06:01 2158

原创 当当网数据爬取

##尝试爬取当当网上的各种信息import requestsfrom bs4 import BeautifulSoupimport timeimport jsonheader = {"Referer":"http://search.dangdang.com/?key=python&%253Bact=input&%253Bpage_index=%7B%7D&_ddclickunion=P-295132-199857_64_0_ZGljdHNfZ29vZ2xl_1%7Cad.

2021-11-28 21:15:52 1199

原创 软件&电脑使用总结

关于mac电脑使用:电脑安装python idle后,可pip安装notebook和spyder,进入jupyter:终端输入python3 -m IPython notebooktxt方法/步骤: 打开文本编辑的app. 选择新建文本 然后按快捷键shift+command+T. 让文本成为纯文本格式 或者在顶部菜单选择格式一项,保存为纯文本格式 如果想保存为多信息文本,重复此快捷键 最后按command+s保存文档 保存之后就是.txt..

2021-10-02 21:14:39 98

原创 关于数据可视化,你应该知道些什么?(展示图表)

桑基图作为1种表达数据流动方向的可视化方式,在商业数据分析,地理可视化,生物医学领域有着广泛应用。比如:在基因组学领域,有研究利用桑基图来表示生物分子之间的调控关系,因此可以作为信息流转的可视化工具!桑基图逐渐成为科学和工程领域,代表平衡、能量流、物质流的标准模型,在一些产品的生命周期评估中也常被使用...

2021-09-23 00:28:49 122

原创 关于词云绘制你应该知道什么?

1、原理词云图是文本数据可视化的一种形式,视觉冲击力较强,迎合现在快节奏的生活,能够让人聚焦主旨,眼前一亮。其原理是对输入的文本数据进行词频统计,根据词汇出现频率的不同,按不同比例显示词汇,生成图片,频率高的词汇显示的字号大颜色深,频率低的词汇显示的字号小颜色浅。1)优点应用广泛:可以应用到用户画像、舆情分析等场景下,还可以直接嵌入到PPT报告、数据分析类产品中,是对文本数据价值变现的一种手段。制作简单:制作词云图的难度不高,没有数据处理技术背景的人也能做出有效的词云图来。内容直接:词云

2021-09-13 15:38:13 2482

原创 互联网常用术语&指标&经验总结

CTR(Click-Through-Rate)即点击通过率,是互联网广告常用的术语,指网络广告(图片广告/文字广告/关键词广告/排名广告/视频广告等)的点击到达率,即实际点击次数/曝光次数。UV(Unique visitor)访问页面的人数,需要对user_id进行去重PV(page view)网页浏览量,直接计数即可...

2021-09-13 11:43:33 1015

原创 SQL-DDL语言-数据定义语言-库和表的管理

#DDL语言 数据定义语言P110/*#库和管理创建、修改、删除#标的管理创建、修改、删除创建:create修改:alter删除:drop*/#一、创建库#语法:create database 库名;#if not exists表示如果该库存在,就报错以进行提醒CREATE DATABASE IF NOT EXISTS books;#不可以更改库的名字,可以更改字符集ALTER DATABASE books CHARACTER SET gbk;#修改字符集#删除库DR.

2021-07-15 00:00:05 94

原创 EXCEL常用技巧

ctrl+E可以自动填充相当于数据中的快速填充ctr+上下左右箭头到数据上下左右位置,+shift可以选中相应的数据ctrl+shift+L可以直接进行筛选在单元格设置自定义格式就可以输入1对应男,2对应女,需要一小段代码,请查找其他文章(1)数据有效性和验证:即提醒输入格式是否正确,选中表格,数据,数据验证,设置,验证,出错信息设置(2)设置下拉框,选中表格,数据,数据验证,设置,来源(使用逗号隔开)(3)设置级联菜单...

2021-07-14 23:58:31 174

原创 SQL常见函数以及使用

窗口函数:over()select rank() over(partition by b order by a )–排序按照1134#好像需要先partition再order?逻辑是先group by再提取select所以要注意后面是否有group byselect dense_rank() over(partition by b order by a)–排序1123select row_number() over(partition by b order by a)–排序1234select l

2021-07-06 01:01:55 3698

原创 sql业务相关的主要语句--时间

创建临时表:create table name_table(列1 数据类型,...)insert intoname_table(列1,列2,...)values(值1,值2)时间不能直接做差,时间统计主要如下:系统当前日期:date_sub(current_date(),0) #间隔日期为0,即当前日期取前一天的日期:date_sub(current_date(),1)取字段日期:to_date(字段)取两个日期之间相差天数:datediff(字段1,字段2)...

2021-05-13 20:10:41 171

原创 DataFrame相关代码记录--实操

删除dataframe某一列: df = df.drop(columns = ['date'])横向拼接两个dataframe:trainX2 = concatenate((trainX,trainX1),axis=1)纵向拼接两个dataframe:df = df1.append(df2)或df= pd.concat([df1, df2])

2021-05-12 22:11:46 251

原创 python读取不同文档

读取excel数据:dataframe = pd.read_excel('C:\Users\dell\Desktop\zs\code_jinjiu\分析.xlsx',sheet_name='新数据')读取txt文件为dataframe:all1 = pd.read_csv(r"C:\Users\dell\Desktop\zs\sample.txt",sep=',',encoding='utf-8')读取csv文件:all1 = pd.read_csv(r"C:\Users\dell\Desktop\

2021-05-07 21:34:51 119

原创 《python深度学习》学习笔记

《python深度学习》第一章:参数化,先随机设置权重,通过损失函数来反向传播信息,对设置的权重进行调整。第一章简要的介绍了关于深度学习、机器学习的由来与争议,从概念上对深度学习进行了简要的解释,简单的描述了深度学习的核心所在。第二章:简要介绍关于深度学习的基本的数学概念、张量(输入网络的数据存储对象)、张量运算(层的组成要素)和梯度下降(可以让网络从训练样本中进行学习)0D张量是仅包含一个数字——标量,1D张量是向量,2D张量是矩阵(张量是轴的...

2021-04-27 00:25:40 1206

原创 实用工具

绘制分类图的工具:plotlyseabornnetwordkxigraph3D network显示绘制图:%matplotlib qt进行自然语言处理的工具:SpaCyHanlp

2021-04-27 00:06:29 77

原创 迁移学习相关概念理解

迁移学习与主动学习:http://www.mamicode.com/info-detail-2720488.html迁移学习不迁移个体特有的特征,迁移那些对所有个体都有贡献的特征归纳迁移学习inductive(任务不同,域可能相同可能不同),直推式迁移学习transductive(任务相同,域可能相同可能不同),无监督迁移学习(源和目标均没有标签)主动学习:使用较少的数据获得性能较好的分类器。active learning(在于选择样本)通过算法查询最有用的未标记数据,然后使用查询到的样本训练分类

2021-03-24 21:39:36 265

原创 excel-数据可视化

使用excel画了几个图,重在积累重在积累!

2021-02-19 00:53:44 247

原创 SQL-基础知识

DB:database保存有组织比较规范的数据DBMS:database manage system数据库管理系统,数据库软件(产品),SQL:structure query Language,与数据库通信的语言下载路径:http://dev.mysql.com/downloads/mysql安装:双击mysql.msi开始安装—>Custom—>配置(精确配置)—>开发机(第一个)后面都选第一个—>配置端口号【默认3306】+严格语法模式—>语言选..

2021-02-11 15:48:04 117 1

原创 SQL-变量&存储过程&函数应用

#变量#系统变量:系统、会话 自定义变量:用户、局部#1.show global 【session会话级别】 variables;#后面还可以加模糊查询是可以的#2.select @@global.系统变量名#查看某个特定的系统变量的值#3.赋值:set global 【session】系统变量名=值;SHOW GLOBAL VARIABLES;#查看全局变量SHOW GLOBAL VARIABLES LIKE 'char%';SELECT @@global.autocommit;.

2021-02-11 15:42:34 290 1

原创 SQL-TCL事务控制语言&视图相关了解

#TCL语言事务控制语言P134/*一个或一组sql语句组成一个执行单元,这个执行单元要么全部执行,要么全部不执行案例:转账张三:余额1000李四:余额1000update 表 set 张三的余额=500 where name = '张三';update 表 set 李四的余额=1500 where name = '李四';两者需要同时执行,如果其中一个失败那么久全部失败innodb存储引擎支持事务事务的acid属性:1.原子性:事务不可再分割,事务中执行单元要么全部执行,要么都.

2021-02-08 23:58:10 92

原创 SQL-DDL-数据定义语言-库与表的管理

#DDL语言 数据定义语言P110/*#库和管理创建、修改、删除#标的管理创建、修改、删除创建:create修改:alter删除:drop*/#一、创建库#语法:create database 库名;#if not exists表示如果该库存在,就报错以进行提醒CREATE DATABASE IF NOT EXISTS books;#不可以更改库的名字,可以更改字符集ALTER DATABASE books CHARACTER SET gbk;#修改字符集#删除库DR.

2021-02-06 13:11:25 118

原创 sql学习查询语法与分类

#DAL语言#进阶1:基础查询#select 查询列表 from 表名;#System.out.println(打印东西);/*一、查询的列表可以是:表中字段、常量值、表达式、函数二、查询的结果是一个虚拟表格。*/USE sakila;#最好在最开始指定自己要使用的库,sakila是库,address是表,phone是列名也是字段#1.查询表中的单个字段SELECT phone FROM address;#2.查询表中的多个字段SELECT phone,city_id FROM.

2021-01-31 17:08:00 368

WPS开发 宏代码 按数据类别划分数据保存至新的工作簿

直接替换数据点击按钮实现拆分到文件夹中

2024-01-29

WPS开发 宏代码 按数据类别划分数据保存至新的工作簿

直接替换数据点击按钮实现拆分到文件夹中

2024-01-29

cuda9.0对应需要的torch&torchvision

需要保证driver version和cuda也适配,安装对应轮子即可使用cuda

2022-01-24

自然语言处理入门随书代码

自然语言处理入门随书代码

2022-01-24

主题模型LDA相关代码

主题模型代码(LDA),完全可以跑通

2021-07-08

moview-review survey影评情感分析综述

只是一篇文章

2021-04-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除