自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(207)
  • 资源 (2)
  • 收藏
  • 关注

原创 python3 用相对路径搜索文件,和用相对路径搜索module,搜索基准的差异

目录结构每一个py文件中都打印如下信息:cwd:执行命令的目录、文件相对路径的起始点在哪个目录执行命令,cwd就是这个目录。和被执行的文件在哪个目录没关系。测试1:在relative_path根目录执行命令可以看出:不管被执行的文件在哪个目录中,cwd都是relative_path根目录。因为python命令在这个目录下执行测试2:在test_12子目录执...

2020-03-30 16:22:28 758

原创 python3 使用相对路径 import模块

目录结构.├── apt_root.py├── __init__.py├── mod/ └── test.py └── __init__.py└── sub/ └── test.py └── __init__.py任务一:在mod/test.py中import 上级目录下的apt_root.py任务二:在mod/test.py中import 上级...

2020-03-30 01:45:06 12089 2

转载 漫话GPT:原理篇

预训练语言模型是什么?能对NLP的任务起到什么作用?是如何训练出来的?这篇文章将给出答案

2020-02-01 17:12:05 3526

原创 【开源python模块使用】sklearn feature_extraction.text 统计中文文档n-gram的出现次数

【使用场景】有100+的专业文档,需要通过n-gram的方式统计出专业强相关的词汇【主要方向】sklearn feature_extraction.text的CountVectorizer类【使用方式】#coding=utf-8from sklearn.feature_extraction.text import CountVectorizercontent = '詹姆...

2019-01-30 15:15:19 1228 1

原创 【宾州中文树库CTB】数据读取

CTB8.0 共有如下类型文件:   Newswire: [0001-0325, 0400-0454, 0500-0540, 0600-0885, 0900-0931, 4000-4050]——后缀.nw.raw   Magazine articles: [0590-0596, 1001-1151]——后缀.mz.raw   Broadcast news:[2000-3145, 4051...

2018-11-14 18:52:12 2709 1

翻译 论文导读《Chinese Word Segmentation as Character Tagging》--Nianwen Xue

  【摘要】本文展示了一种基于监督学习的中文分词算法。算法在人工标注数据上训练了一个最大熵标注器(maximum entropy tagger),用于对新句子中的每一个汉字进行位置标注(LL,LR,MM,RR)。然后将标注后的新句子转换为分词结果,进行评价。初步实验显示,本算法相对其他基于监督学习的算法也是很有竞争力的,基于237K-word的训练样本,取得了95.01%的precis...

2018-08-15 11:46:33 956

原创 PCFG构造语法结构树相关问题思考

【目录】如何从语料库提取PCFG(概率上下文无关)规则? 提取的规则存在什么数据结构中更好? 提取的规则为什么要转化为Chomsky Norm Form(CNF)? 提取的PCFG规则如何转化为CNF? 任意PCFG规则真的能像CFG一样转换为CNF吗? 如何根据符合CNF的规则生成新句子的结构树?关于这些问题,如果大家知道有已经成熟的结论和推导过程,希望能留言告诉作者,帮助作...

2018-08-05 19:04:04 1064

翻译 【宾州中文树库CTB】分词手册导读《The Segmentation Guidelines for the Penn Chinese TreeBank(3.0)》

说明:宾州中文树库分词手册下载地址https://download.csdn.net/download/tong_xin2010/10576849 Chap1:Introduction本文是Penn Chinese Treebank Project中的一篇文档。这个文档目标是对100-thousand的普通话材料进行句法结构分析(syntactic bracketing)。标注(ann...

2018-08-01 11:59:17 2520

原创 【gensim.word2vec使用】

基于官方网站:https://radimrehurek.com/gensim/models/word2vec.html#gensim.models.word2vec 【示例】训练模型from gensim.test.utils import common_texts, get_tmpfilefrom gensim.models import Word2Vecmodel = ...

2018-07-25 14:35:27 3984

原创 【matplotlib常用函数】

【subplot】语法:http://blog.sciencenet.cn/blog-251664-800766.html【subplots_adjust】:调整subplot的参数【画图的线型和颜色】:https://stackoverflow.com/questions/22408237/named-colors-in-matplotlib【plot】语法:示例:plot(1,4,'g.')如...

2018-04-08 06:47:07 527

原创 【sklearn常用的函数】

【pairwise_distances_argmin】语法:示例:k_means_labels = pairwise_distances_argmin(X, k_means_cluster_centers,axis=1)X.shape:(3000,2);k_means_cluster_centers.shape:(3,2)k_means_labels.shape:(3000,)返回结果是X中的每一...

2018-04-08 06:28:01 2379

转载 数据库的认证与证书

http://bbs.csdn.net/topics/320030422

2017-12-01 09:35:44 4902

原创 [线性代数]遗留问题

矩阵的求导:ML in action的regression那章

2017-11-12 22:44:14 253

原创 【Machine Learning in Action】Chap8|Predict numeric values--regression

8.4 Shrinking coefficients to understand our data引入原因是:when we have more features than data points, then we cannot matrix inverse to retrieve the regression results.解决办法:总的来说是shrinkage methods. 而s

2017-10-23 14:01:34 263

原创 机器学习一些资源

机器学习比赛:http://blog.csdn.net/Mr_Lyang/article/details/51620627什么是框架:http://www.sohu.com/a/142729922_642762机器学习开源框架(TensorFLoww,Caffe等):http://blog.csdn.net/zkl99999/article/details/51193075机器学习

2017-10-21 08:45:53 410

原创 【Machine Learning in Action】Chap1|Classification|kNN

Comprehension of Listing 2.1

2017-10-13 10:18:05 256

原创 定积分的问题

很久没自己做过定积分了,看数字通信又有定积分的问题了。问题出在,题1.7需要判断一个给定函数是否可能是一个信号的功率谱。第三和第四个条件都是看这个函数在负无穷到正无穷是否可积。因此需要自己计算定积分。

2015-06-28 14:02:17 624

原创 功率信号的傅立叶级数的存在问题和能量信号的傅立叶变换存在问题

2015-06-28 11:15:57 1911

转载 输出文章的格式word与pdf

word转pdfhttp://jingyan.baidu.com/article/dca1fa6f866c26f1a44052ea.htmlword转pdf出错经过一段一段的编译定位,结果是因为我文章中有公式一部分是mathtype编辑的,一部分是word直接编辑的。将所有这样的公式都统一用mathtype编辑就可以了多个pdf合成一个pdf

2015-04-14 16:00:04 456

转载 数据去重复

data deduplication 技术简介http://qing.blog.sina.com.cn/tj/88ca09aa33000uyo.html

2015-04-10 09:03:50 360

转载 写论文时word2007的一些问题

——》word首行缩进两字符http://jingyan.baidu.com/article/c85b7a64201ef2003bac95a1.html——》设置磅值http://zhidao.baidu.com/link?url=Y0ogWSyEFsBVtbbHTe5cE18yZToi56PpVAoYfpFAbg2GnM2Xjs_xglGv_NoSTIlciwZppL8Fykpg

2015-04-08 15:59:07 944

转载 word2007添加参考文献

http://www.cnblogs.com/chaosimple/archive/2013/07/04/3171251.html点击打开链接

2015-04-01 10:36:31 1001

转载 visio插入图像

首先,要有一副已经做好的visio绘图,然后在word中,先用光标定位要插入绘图的地方,然后在菜单中选择“插入”“对象”,在弹出窗口中选择“由文件创建”,选择你建立的visio绘图,然后选中“链接到文件”,这样才可以在visio更新后方便的更新word的图片。插入图片后,如果你的visio有更新,则只要在word中右键插入的图片,在菜单中选择“更新链接”,就可以看到

2015-03-30 20:44:53 1024

转载 word2007自动生成目录

http://jingyan.baidu.com/article/2a13832868c0c7074a134fc0.html

2015-03-29 10:44:43 378

转载 C语言位域:结构体中冒号

http://bbs.csdn.net/topics/90470040

2015-03-23 09:11:13 417

转载 word2007中如何删除脚注尾注

http://jingyan.baidu.com/article/c85b7a640531df003bac9592.html

2015-03-20 21:11:12 918

转载 汇编语言推荐书籍

汇编语言(第2版)王爽   http://book.douban.com/subject/3037562/

2015-03-18 16:33:42 933

转载 内存泄漏以及常见的解决方法

内存泄露概念(百度百科)内存泄漏也称作“存储渗漏”,用动态存储分配函数动态开辟的空间,在使用完毕后未释放,结果导致一直占据该内存单元。直到程序结束。(其实说白了就是该内存空间使用完毕之后未回收)即所谓内存泄漏。内存泄漏形象的比喻是“操作系统可提供给所有进程的存储空间正在被某个进程榨干”,最终结果是程序运行时间越长,占用存储空间越来越多,最终用尽全部存储空间,整个系统崩溃。所以“内存泄漏”是

2015-03-17 19:27:03 763

原创 VC++ 2010debugging

Chapter 11(Basic Debugging operations)make sure the current build configuration is"debug", not"release";in debug mode, the compiler inhibits the optimizationoption.(with reason);

2015-03-17 09:45:59 407

转载 连接规范

转自:http://blog.csdn.net/yuanzhangmei1/article/details/7894051启动函数main()main函数时系统内部默认调用的,即应用程序的启动函数在末尾调用了main名称,然后以它们的返回值为参数调用库函数exit函数,因此也就默认了main应该作为它的连接对象。如此看来main其实就是一个回调函数。main函数限制:1

2015-03-16 18:28:18 865

转载 C函数声明要不要加extern(未解)

http://bbs.csdn.net/topics/300023386有个讨论。主要意思是函数声明默认是extern,加static时更有意义

2015-03-16 18:23:32 963

转载 C语言学习博客

http://www.cnblogs.com/haore147/p/3647466.html

2015-03-16 18:18:59 412

转载 C语言中的声明与定义的区别

陈正冲老师讲c语言之声明和定义的区别:点击打开链接C语言中的声明与定义的区别  点击打开链接点击打开链接  点击打开链接  点击打开链接

2015-03-16 17:06:21 530

转载 16种C语言编译警告(Warning)类型的解决方法

http://www.jb51.net/article/54024.htm由于编译的警告各种各样,根本不可以一一罗列出来,下面只是列举出比较典型的十六种警告,还有一些警告,大家只要根据字面意思,就可以很快的查找出来,并解决之。希望对大家有所帮助。

2015-03-16 16:57:23 1486

原创 下载论文的网站

cnkiCiteSeerX

2015-01-19 10:21:47 399

原创 matlab画出的图除了图之外的部分是灰色,如果去除

1.用save。(加上后缀可以存为各种不同的格式)这样保存下来的图片背景为白色2.但是保存下来图片的太小,直接粘贴在word中会看不清字体,怎么办:可以先打开图片——》把图片拉大——》用截图工具截图下来保存

2015-01-18 19:45:23 1353

原创 自动化读入批量数据,进行实验

int main(){ int i; double a; for(i = 1;i <62; ++i) { char inputname[10]; char outputname[20]; double a = 0; FILE* record; char datafile[20]; sprintf(inputname,"%d.txt",i); sprin

2015-01-16 21:16:56 477

原创 【程序问题】函数计算值正确,但是返回值赋给另一个变量却变成另一个值

出现问题程序如下:#include "LZAP.h"#include "string.h"int main(){ int i; double a; for(i = 1;i <62; ++i) { FILE* record; char datafile[20]; sprintf(datafile, "out-2048-LZAP-%d.txt",i);

2015-01-16 21:06:24 1165

原创 写文章需要的一些信息检索

1:有些期刊引用文献需要卷号。但是cnki上检索出来的信息一般只有年,月,期。没有卷号。解决办法:上这个期刊的官网,一般都有查阅往年期刊的栏目。卷号一般是一年一卷,所以查查看,如果2015年是32卷,那么2005年就是22卷了。因为很多期刊的网站上只保存了最近几年的期刊信息。

2015-01-15 10:35:26 443

转载 Horner法则

http://www.cnblogs.com/tanky_woo/archive/2010/11/11/1874980.html   点击打开链接

2015-01-10 20:32:54 413

宾州中文树库分词指导手册《The Segmentation Guidelines for the Penn Chinese TreeBank(3.0)》

宾州中文树库的文档之一:描述中文树库的分词准则是什么 文档导读:https://blog.csdn.net/tong_xin2010/article/details/81328070

2018-08-01

sklearn的官方文档(0.16)

sklearn的官方文档(0.16),是全的,包括监督学习,非监督学习等方法

2018-04-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除