自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (4)
  • 收藏
  • 关注

原创 利用正则表达式以及re模块进行一些文本处理工作(应用说明)

本篇文章主要讲解一些基础的python正则表达式的应用,以及re模块中的几个方法,关于正则表达式和个函数的详细解释,参看链接:Python 正则表达式,这个网址讲述的非常清楚,我这篇文章只是为了更清晰的讲述一下它的应用。需要先掌握的几个函数为re.match()、re.dearch()、re.compile()、re.findall()、re.finditer()、内置函数replace()、strip(),在上边的链接里都有,我再赘述没有什么意义。 首先我们从一个问题...

2022-05-07 20:28:52 678

原创 从excel转换成的csv文件,放到pycharm中显示编码错误——彻底解决此类编码解码问题

一、问题分析1. 问题发现最近在进行一项研究,刚刚开始最初的数据预处理阶段。我的原始数据是存放在excel表格中的,我先把excel表格转换成csv文件,然后利用python代码进行预处理。当我想把csv文件放到pycharm目录下时,pycharm每次都会提示我编码错误,请求reload in 'GBK',如图所示。2.问题解释 出现这种情况,说明我的这个csv文件的解码方式错误,此时pycharm的解码方式用的是utf-8格式,这里建议我reload in GBK,意思...

2022-04-28 22:48:38 4708 2

原创 训练word2vec模型时碰到的两个问题:AttributeError和 UnicodeDecodeError,即属性错误和编码问题

一、属性错误1.报错:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd7 in position 12.报错解析:3.解决办法:二、编码问题1.报错:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xd7 in position 12.报错解析:3.解决办法:......

2022-04-22 23:05:38 3686

原创 word2vec简介、原理、缺陷及应用。

一、什么是word2vec? word2vec及word to vector,翻译过来就是从单词到向量,它是将自然语言中的单词转化为向量的一种方法。为什么要把单词转化为向量呢?这是由于在进行自然语言处理时,我们有可能要比较两个短语或者语句的相似性,比较他们的语义信息,而让机器理解句子就比较困难,所以要转化成计算机能看懂的语言——数字,从而我们就能进行后面的一系列操作。这种方法更像是自然语言处理的一个前序工作、一个桥梁,有了这种方法,文本与后面的研究就被连接了起来。 它是一种语...

2022-04-22 22:37:36 12923

转载 PHP、JSP、ASP简介与区别

PHPPHP(Hypertext Preprocessor)是一种嵌入HTML页面中的脚本语言。它大量地借用C和Perl语言的语法, 并结合PHP自己的特性,使Web开发者能够快速地写出动态产生页面。PHP是完全免费的开源产品,不用花钱,Apache和MYSQL也是用样免费开源,在国外非常流行,PHP和MYSQL搭配使用,可以非常快速的搭建一套不错的动态网站系统,因此国外大多数主机系统都配有免费的APACHE+PHP+MYSQL。通常认为这种搭配的执行效率比IIS+ASP+ACCESS要高,而后者的使用

2022-04-21 21:21:17 2514

原创 python读取csv文件的几种方式(含实例说明)

一、使用pandas库举个例子:直接利用read_csv()方法读取,文=文本被转化成了dataframe格式。import pandas as pddf = pd.read_csv('../data_pro/audito_whole.csv')print(df)结果:二、使用csv库举个例子:先利用codecs.open方法读取文件audito_whole.csv,采用utf-8字符编码,再利用csv.DictReader()方法读取。这里可以换成python内置的open()方法,也

2022-04-21 21:19:43 159685 3

原创 关于pycharm中Debugger失败的问题,报错:Connection to Python debugger failed Interrupted function call: accept fa

这个问题的主要解决方法有两种,你如果遇到这个问题,可以依次尝试下面两个步骤。如果问题没有解决,再加油找找,然后分享出来,我来更新一下这篇文章;如果解决了,记得点个赞再走哦~**步骤一:**这也是网上流传的较多的一种方法,按照下边图片顺序进行操作即可啦。①②步骤二:如果上边的方法不行,你可以翻看一下你的python文件名里边有没有看起来比较敏感的、像关键词的,比如code、thread之类的,如果有,把它改成别的名字或者删掉就可以啦...

2021-09-22 19:51:15 3527 1

原创 JAVA中的printf用法

java沿用了C语言中的printf方法,其用法与C中的printf方法一致。下面通过几个例子来说明他的用法:(1)用于printf的转换符有如下(这里只列出了部分):%n  换行  相当于 \n%c  单个字符%d  十进制整数%u  无符号十进制数%f  十进制浮点数%o  八进制数%x  十六进制数%s  字符串%%  输出百分号转换符的类型要与打印的内容数据类型相同,如下例子中我要打印浮点数,就要使用%f double x = 1000.0 / 3.0; ...

2021-07-05 16:51:51 10668

原创 JAVA中的printf方法

java沿用了C语言中的printf方法,其用法与C中的printf方法一致。下面通过几个例子来说明他的用法:(1)用于printf的转换符有如下(这里只列出了部分):%n  换行  相当于 \n%c  单个字符%d  十进制整数%u  无符号十进制数%f  十进制浮点数%o  八进制数%x  十六进制数%s  字符串%%  输出百分号转换符的类型要与打印的内容数据类型相同,如下例子中我要打印浮点数,就要使用%fdouble x = 1000.0 / 3.0;System.out.

2021-07-05 16:50:11 6044

原创 charAt(int index)方法与codePointAt(int index)方法的用法

(1)charAt(int index)方法*****charAt(int index)方法返回给定位置的代码单元,例如下面代码中 String c = "??a"; System.out.println(c.charAt(0)); //返回英文问号 ? System.out.println(c.charAt(1)); //返回中文问号 ? System.out.println(c.charAt(2));...

2021-06-28 10:24:03 594

pyltp_binary-0.2.1.0-cp39-cp39-win_amd64.whl

pyltp_binary-0.2.1.0-cp39-cp39-win_amd64.whl

2022-05-25

pyltp_binary-0.2.1.0-cp38-cp38-win_amd64.whl

pyltp_binary-0.2.1.0-cp38-cp38-win_amd64.whl

2022-05-25

pyltp_binary-0.2.1.0-cp37-cp37m-win_amd64.whl

pyltp_binary-0.2.1.0-cp37-cp37m-win_amd64.whl

2022-05-25

pyltp_binary-0.2.1.0-cp36-cp36m-win_amd64.whl

pyltp_binary-0.2.1.0-cp36-cp36m-win_amd64.whl

2022-05-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除