自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(23)
  • 资源 (15)
  • 收藏
  • 关注

原创 BERT小试

2020年6月16日 初次实践,尝试在自己的数据上简单跑Bert fine-tune;过程参考:https://zhuanlan.zhihu.com/p/50774647试验设置:将每个triple转化为形如"ptext : vtext"的文本,要求判断两triple间相似程度(分类问题,三种label:["contradiction", "entailment", "neutral"] 分别对应不相似、相似、中等);监督数据构造:根据某种已有文本相似度打分对triple pair打标签(例如.

2020-06-16 21:31:58 674

原创 presentation视频录制与编辑

任务:录制ppt报告视频(要求有ppt演示和讲解),生成1920*1080p的视频文件;1、视频录制:(1)推荐方式:ppt放映+zoom录制操作:①录制:将ppt调到放映模式,在zoom “会议->我的会议”中开启个人会议,选择"屏幕共享"ppt放映所在窗口,确认未静音,准备好后即可点击“录制”;②导出:zoom会自动生成mp4文件到会议默认路径,在“会议->会议录制”中即可看到有录制视频的会议的列表,选择某个会议,在右边按钮中“打开”即可打开视频文件保存的目录;tip

2020-05-16 12:55:25 2971

原创 Virtuoso Jena Provider对count的支持问题

现象:执行count语句时报错(即使将count部分去掉括号,或者改为 count distinct ?x 或 count ?x 或 count(?x)依然会报类似的错误)qstr:  select (count(distinct ?x) as ?cx) where { ?s ?x. }Exception in thread "main" com.hp.hpl.jena.qu

2017-11-03 22:09:39 401

原创 从多项分布采样的Java实现

思路:将每个概率值对应到[0,1]区间内的各个子区间(概率值大小体现在子区间的长度上),每次采样时,按照均匀分布随机生成一个[0,1]区间内的值,其落到哪个区间,则该区间概率值对应的元素即为被采样的元素;算法:1、先对概率值从大到小排列(不是必要过程,是便于加速的技巧,这样每次查找时优先检测随机数是否落在大概率的区间内,减少比较次数);2、生成一个[0,1)区间内的随机

2017-10-16 12:35:04 2652

原创 Virtuoso Jena Provider查询日期型数据的bug修正

(该bug在使用virt_jena2.jar时出现,在使用virt_jena3.jar时则不会出现该bug,所以另一种避免该bug的方式是使用新版本的Virtuoso Jena Provider )现象:用jenaAPI检索出的与日期相关的literal(主要是datatype为date或year的literal),检索出来的值比原始值推迟5天;例如:Virtuoso中原始

2017-09-16 17:22:48 437

翻译 Java8官方文档学习笔记

文档地址:http://docs.oracle.com/javase/8/docs/Oracle有两个实现了Java平台标准版本(Java SE)8,即Java标准开发工具(JDK)8和Java标准运行时环境(JRE)8.JDK8是JRE8的超集,包含了JRE8的所有内容,还包括诸如编译器和调试器等在开发applet和application时必要的开发环境。JRE8提供函数库,

2017-03-06 19:34:40 2058

原创 Matlab使用技巧记录

1. matlab连mysql数据库http://bbs.pinggu.org/thread-3564639-1-1.html

2017-01-20 21:47:41 365

翻译 用户密码的加密方式

可以采用以下几种加密方式:①MD5:存在冲突的情况;②SHA1:可能被破解;③PHP的crypt()函数;可以额外传入一个salt字符串,则生成的加密字符串前两个字符取自salt字符串的前两个字符;上述几种方式均有被破解的可能,为了提高破解难度,可以将用户名和密码字符串链接起来作为加密的输入;注意:当用户忘记密码时,不要将用户设置的密码邮件给用户,而可以代之以临时密码,

2016-04-08 21:33:46 1177

翻译 Vrituoso安装经验总结

参考:https://tw.rpi.edu//web/node/3625/一、安装:目标:将Virtuoso安装到/home/目录下(默认安装在/usr/local/)Building from Upstream Source1. Installing the required build dependencies: sudo aptitude i

2016-04-02 21:21:16 3961

转载 Java 类的热替换 —— 概念、设计与实现

转载自: https://www.ibm.com/developerworks/cn/java/j-lo-hotswapcls/Java 类的热替换 —— 概念、设计与实现构建基于 Java 的在线升级系统对于许多关键性业务或者庞大的 Java 系统来说,如果必须暂停系统服务才能进行系统升级,既会大大影响到系统的可用性

2016-04-01 11:00:21 461

原创 在word中插入显示在同一行的两张图片(且各自带有题注)

先将两张图片均导入word中,位置设置为“嵌入文本行中”,调整t图片大小使得两图片刚好可以呈现在同一行。如果图片不需要题注,或者两图片共用一个题注,那么就此就可以了;而如果两图片各自要有题注,则继续进行如下操作:然后分别选中两张图片(即该操作对两张图片都要各做一次):页面布局->分栏->两栏。设置好后,将后面一张图片拖至前一张照片紧随其后,即可看到两张照片并列呈现的样子,然后分别对两张

2015-06-30 20:02:55 50983 6

原创 unicode编码转换为字符的形式

问题:在从数据库中取出数据用来建立Lucene索引时,遇到形如“\u041A\u0430\u0441\u0442\u0438\u043B\u0438\u044F - \u041B\u0430 \u041C\u0430\u043D\u0447\u0430”的字符串,length为94,而其实是字符串“Кастилия - Ла Манча”的Unicode形式(length为19)。若直接存入Luc

2013-08-07 10:51:22 1786

转载 [转] Ubuntu安装搜狗拼音输入法-sogoupinyin

http://www.ubuntuhome.com/ubuntu-install-sogoupinyin.html先要在language里下载中文伴随着Deepin 12.12 beta的发布,搜狗输入法也与我们见面了。在发布前几日Deepiner也通过各种途径向我们展示了搜狗Linux输入法,当然也掉足了胃口。来自官方的截图:当然令很多Ubuntu用户期待的是,搜狗输

2013-08-05 09:14:51 1605

转载 ubuntu安装java环境

http://www.douban.com/people/jingchaochen/ubuntu 12.10中MyEclipse 10.6+下载+安装+破解http://www.lihuoqing.cn/code/689.htmlubuntu scphttp://hi.baidu.com/zhangchu0702/item/07becf1

2013-08-05 09:13:18 626

转载 [转]windows远程登陆到ubuntu

Connect to Ubuntu 12.04 (Precise Pangolin) via Windows Remote Desktophttp://www.liberiangeek.net/2012/05/connect-to-ubuntu-12-04-precise-pangolin-via-windows-remote-desktop/Want to conne

2013-08-05 08:47:29 1238

转载 myeclipse使用技巧记录

1、保存myeclipse控制台内容到文件: Run-->Run Configurations-->Common-->Standard input and output (可能不同版本的Eclipse位置会有所不同)项中勾选 File 再选择你想要保存的文件路径(比如:E:\result.txt) (来源:http://zhidao.baidu.com/question/3287382

2013-08-03 16:37:42 633

原创 修改pdf注释中的作者

Adobe Acrobat设置注释的作者,默认情况下使用登录名作为作者,可在菜单栏“编辑”->“首选项”->“身份信息” 中看到,登录名默认为系统账户名,不可更改。如果想改注释的作者,先在身份信息中填写姓名信息,然后在“编辑”->“首选项”->“注释”->“建立注释”中,把“总是使用登录名作为作者名”去选,以后就都默认用姓名作为注释作者了

2013-06-24 16:40:14 24718 3

转载 爬虫学习笔记1--代码示例

资料1:java网络爬虫的实现  (http://developer.51cto.com/art/201103/248141.htm )爬虫框架      传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。对于垂直搜索来说,聚焦爬虫,即有针对性地爬取特定主题网页的爬虫,更为适

2013-02-23 20:19:19 718

原创 用java中的java.util.zip包读取压缩文件

最近下载了点数据,压缩包的形式下几十兆,一解压就1G左右了,如果一个个解压再看内容实在是伤不起,于是想有没有不解压而读取压缩文件内容的方式,查阅网上资料,发现java中的java.util.zip包中提供了处理zip文件的API,小练习了一下,代码如下:import java.io.BufferedReader;import java.io.File;import java.io.

2012-04-19 16:08:15 7246

原创 NLTK与DataWiki

最近在做机器翻译的作业,学习一个自然语言工具包NLTK(http://www.nltk.org/),用python做的一个项目,虽然是以教学为目的的项目,但看过去做得很大很全,据说有十万行代码,而且是python代码,我对大型项目的规模没有一个定量的概念,但至少这代码行数于我而言就已经算是巨大了。文档更是非常清楚和详尽,从安装到代码和数据下载,到python的基本知识和调用语法到自然语言分析处

2011-12-06 11:03:54 1007

原创 关于工厂模式

今天受打击了,晚上回来的时候,师兄看我在看设计模式,于是问我“工厂模式”有什么好?一时语塞,顿时想不起来,只记得貌似是在里面产生一堆东西的,减少代码修改量的,又想起貌似挺多设计模式都是用来解耦合的,于是犹犹豫豫地回答“解耦合?”然后就再想不出任何实质的能够回答师兄的疑问的东西,用蕾蕾的话说,就是“又没有通过师兄的考验”。。。好在另一个学长貌似对这个还挺有研究,于是一路上都在讲解,在他的讲解中我总算

2011-11-08 20:56:46 572

原创 k-折交叉验证(k-fold CrossValidation)

k-折交叉验证(k-fold crossValidation):在机器学习中,将数据集A分为训练集(training set)B和测试集(test set)C,在样本量不充足的情况下,为了充分利用数据集对算法效果进行测试,将数据集A随机分为k个包,每次将其中一个包作为测试集,剩下k-1个包作为训练集进行训练。在matlab中,可以利用:indices=crossvalind('Kfol

2011-10-26 12:16:48 11442 9

原创 用MATLAB做T检验(ttest)

t-检验:t-检验,又称student‘s t-test,可以用于比较两组数据是否来自同一分布(可以用于比较两组数据的区分度),假设了数据的正态性,并反应两组数据的方差在统计上是否有显著差异。matlab中提供了两种相同形式的方法来解决这一假设检验问题,分别为ttest方法和ttest2方法,两者的参数、返回值类型均相同,不同之处在于ttest方法做的是 One-sample and pa

2011-10-26 12:10:46 95061 5

The Human-Computer Interaction Handbook 2ed[2008].pdf

The Human-Computer Interaction Handbook 2ed[2008].pdf

2013-12-03

User Centered System Design New Perspectives on Human-Computer Interaction

User Centered System Design New Perspectives on Human-Computer Interaction, Norman, Draper, 1986

2013-12-03

Linux与unix shell编程指南.pdf

china-pub.com 本书共分五部分,详细介绍了shell编程技巧,各种UNIX命令及语法,还涉及了UNIX下的文字处理以及少量的系统管理问题。本书内容全面、文字简洁流畅,适合Shell编程人员学习、参考。

2013-12-03

Hacking Vim 7.2.pdf

Ready-to-use hacks with solutions for common situations encountered by users of the Vim editor -- Kim Schulz 2010

2013-12-03

java API chm文件 中文版

java API chm文件,Java 2 Platform Standard Edition 6.0 的 API 规范。

2013-04-29

Matlab生成.exe总结

Matlab生成.exe总结

2013-04-29

Java编程技术(谭浩强

Java编程技术,谭浩强编写,人民邮电出版社

2012-04-04

Java手机程序设计入门与应用

Java手机程序设计入门与应用,SUN台湾教育培训特别推荐

2012-04-04

C语言编程跳水高手.doc

C语言编程跳水高手.docC语言编程跳水高手.doc

2009-12-23

系统自带不起眼但又很强的杀毒工具.doc

系统自带不起眼但又很强的杀毒工具.doc

2009-12-23

鸟哥的 Linux 私房菜第00章-计算机概论.pdf

鸟哥的 Linux 私房菜第00章-计算机概论.pdf

2009-12-23

windowsSockets编程.

windowsSockets编程.pdfwindowsSockets编程.pdf

2009-12-23

汇编语言教程(《汇编语言》(Assembly Language)是计算机专业中一门重要的基础课程,是一种面向机器的低级语言。)

一、本课程的地位和教学目的 《汇编语言》(Assembly Language)是计算机专业中一门重要的基础课程,是一种面向机器的低级语言。它依赖于硬件,能通过巧妙的程序设计充分发挥硬件的潜力。汇编语言程序产生的代码运行效率高。因此,到目前为止,许多软件系统(例如操作系统等)的核心部分仍然用汇编语言来编写。 计算机专业所培养的学生,不应仅仅满足于利用他人已开发出来的软件和软件工具来解决实际问题,还应具备有分析、研究原有软件系统,改进、完善、提高原有系统功能供广大用户使用的能力。汇编语言程序设计将使学生受到更严密、更系统的程序设计及其思维方法的训练,为深入分析、研究、开发新的软件系统打下良好的训练基础。 本课程的教学目的是使学生进一步了解计算机的基本组成,汇编指令的格式和使用方法,以及用汇编语言进行程序设计的基本思想和方法。于此同时,希望学生能了解用汇编语言程序来充分发挥计算机性能的基本思想。 本课程的学习也将为后续课程(如操作系统、接口与通信、计算机外围设备等)的学习提供必要的前期知识。 二、本课程与其它课程的联系

2009-12-23

C语言中调用汇编程序

C语言中调用汇编程序,有详细的实例截图汇编程序myadd.asm .386P .model FLAT PUBLIC myadd code SEGMENT myadd PROC NEAR push ebp mov ebp, esp mov eax, [ebp+8] add eax, [ebp+12] pop ebp ret myadd ENDP code ENDS END

2009-12-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除