自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (16)
  • 收藏
  • 关注

原创 按照模板java动态生成word文档

        最近在做一个出卷系统,需要通过试卷模板从数据库中抽取题目,然后按照模板的样式生成完整的试卷,所以研究了一下,通过Java生成word文档的方法。我尝试了不同的方法,1、使用freemarker模板生成word文档;2、使用POI生成word文档;3、使用docx4j生成word文档。文档最后有三种方式的完整代码及所需jar包。1、使用freemarker模板生成word文档...

2019-01-18 16:04:24 4813 3

原创 python实现支持向量机SVM

支持向量机支持向量机有两种:SVC,支持向量分类,用于分类问题;SVR,支持向量回归,用于回归问题。线性支持向量机(Linear SVMs):用一个非常有名的用于分类问题的数据集:鸢尾花数据集。它是基于鸢尾花的花萼的长度和宽度进行分类的。我们只用其中两维特征,这能够方便可视化。kernel="linear"(线性核函数)给了我们线性的决策边界:两类之间的分离边界是直线。 多分类的工作...

2018-12-20 20:40:46 763

原创 python实现Apriori算法

Apriori算法两个概念:支持度:A、B同时发生的概率置信度:若A发生,B发生的概率Apriori算法的实现设定阈值:最小支持度和最小置信度 计算支持度:Supprot(A=>B)=(A与B同时发生的数量)/事件的总数                                                            =Support_count(...

2018-12-08 11:28:54 3044

原创 python人工神经网络

人工神经网络在模块keras中,实现步骤如下:#bp人工神经网络的实现#1、读取数据#2、导入对应模块,keras.models  Sequential(建立模型)  |keras.layers.core Dense(建立层)  Activation#3、Sequential建立模型#4、Dense建立层#5、Activation激活函数#6、compile模型编译...

2018-12-07 22:15:37 1592

原创 python数据分析与挖掘之聚类kmeans算法

聚类不指定类别进行分类(划分(分裂)法,层次分析法、密度分析法)、网格法、模型法    Kmeans算法属于分裂法随机选择k各点作为聚类中心 计算各个点到这K个点的距离   将对应的点聚到与它最近的这个聚类中心 重新计算聚类中心 比较当前聚类中心与前一次聚类中心,如果是同一个点,得到聚类结果,若不同的点,则重复2-5Kmeans算法实现代码:#kmeans算法'''...

2018-12-07 22:11:12 883

原创 python之回归算法

逻辑回归import pandas as pdafname='E:/programCode/huigui.csv'dataf=pda.read_csv(fname)#自变量xx=dataf.iloc[:,1:4].as_matrix()#[:,1:2]中的右边代表列取谁,左边的代表行取谁#因变量yy=dataf.iloc[:,0:1].as_matrix()#.as_matrix...

2018-12-07 22:07:51 1513

原创 python数据分析与挖掘之贝叶斯算法算法实现

代码中有详细的注释训练文件:Txt文件中为0,1矩阵,将图片转换为0,1矩阵见上一篇博客方法import numpy import operatorfrom os import listdirclass Bayes: def __init__(self): self.length=-1 self.labelcount=dict()#各类...

2018-12-07 22:04:26 333

原创 python数据建模与KNN算法实现手写体数字识别

      数据建模指的是对现实世界各类数据的抽象组织,建立一一个适合的模型对数据进行处理。在数据分析与挖掘中,我们通常需要根据一-些数据建 立起特定的模型,然后处理。模型的建立需要依赖于算法, - -般,常见的算法有分类、聚类、关联、回归等。python数据分类实现过程       数据分类主要处理现实生活中的分类问题,一般处理思路如下:1、首先明确需求并对数据进行观察2、其次,...

2018-12-07 21:57:30 355

原创 python文本相似度计算

相似度计算步骤::读取要计算的多篇文档对要计算的文档进行分词 对文档进行整理成指定格式,方便后续计算 计算出词语的频率 【可选】对频率低的词语进行过滤 通过语料库建立词典 加载要对比的文档 将要对比的文档,通过doc2bow转化为稀疏向量 对我们的稀疏向量进行进一步处理得到新语料库 将新语料库通过tfidfmodel进行处理,得到tfidf 通过token2id得到特征数...

2018-12-07 21:49:31 5439 3

原创 python文本挖掘

import jieba#全模式sentence='我喜欢武汉欢乐谷'w1=jieba.cut(sentence,cut_all=True)#(句子,模式[True全模式,False精准模式])for item in w1: print(item)print()#精准模式w2=jieba.cut(sentence,cut_all=False)#去掉cut_all这个参数,默...

2018-11-24 22:26:25 372

原创 python数据探索与数据清洗

      数据探索的目的是及早发现数据的一些简单规律或特征,数据清洗的目的是留下可靠数据,避免脏数据的干扰。这两者没有严格的先后顺序,经常在一个阶段进行。数据探索的核心是: 1、数据质量分析(跟数据清洗密切联系)2、数据特征分析(分布、对比、周期性、相关性、常见统计量等)数据清洗可以按如下步骤进行:      1、缺失值处理(通过describe与len直接发现、通过0数据发现)  ...

2018-11-24 22:23:48 299

原创 python之matplotlib模块画图

#折线图/散点图plotimport matplotlib.pylab as pylimport numpy as npyx=[1,2,3,4,8]y=[5,7,9,6,3]pyl.plot(x,y)    #plot(x轴数据,y轴数据,展现形式)pyl.show()#散点图pyl.plot(x,y,'o')pyl.show()图中颜色设置c-cyan...

2018-11-24 22:20:33 376

原创 数据分析之Python数据导入

'''数据导入'''import pandas as pdai=pda.read_csv('E:/programCode/jd.csv',encoding='gb18030')i.describe()#按照某一列进行排序i.sort_values(by='238')#238为列名import xlrd '''导入excel数据'''j=pda.read_exce...

2018-11-24 22:13:28 324

原创 python数据分析与挖掘模块简介

   所谓数据分析,即对已知的数据进行分析,然后提取出一-些有价值的信息,比如统计出平均数、标准差等信息,数据分析的数据量有时可能不会太大,而数据挖掘,是指对大量的数据进行分析与挖掘,得到一些未知的,有价值的信息等,比如从网站的用户或用户行为数据中挖掘出用户的潜在需求信息,从而对网站进行改善等。数据分析与数据挖掘密不可分,数据挖掘是数据分析的提升。数据分析与挖掘技术能做什么事情?数据挖掘技...

2018-11-24 22:10:00 542

原创 Scrapy框架基于crawl爬取京东商品信息爬虫

Items.py文件# -*- coding: utf-8 -*-# Define here the models for your scraped items# See documentation in:# https://doc.scrapy.org/en/latest/topics/items.htmlimport scrapyclass JingdongItem(scrap...

2018-11-24 22:06:58 577

原创 python当当网爬虫

   最终要实现的是将当当网上面的书籍信息,书籍名字,网址和评论数爬取,存入到数据库中。(首先要做的是创建好数据库,创建的数据库名字为dd,创建的表为books,字段为title,link,comment)。1、创建项目 scrapy startproject dangdang2、进入项目文件夹创建爬虫文件>scrapy genspider –t basic dd dangdan...

2018-11-24 22:03:29 2202

原创 自动模拟登陆爬虫

有时候需要抓取登陆后的页面,让爬虫登陆网址。此程序可以实现模拟登陆爬虫,包括图片验证码的处理。1、在cmd进入项目文件夹,创建爬虫项目和爬虫文件>scrapy startproject douban2、进入项目文件夹创建爬虫文件>scrapy genspider -t crawl db qiushi.com(我创建的爬虫文件为db, qiushi.com为糗事百科网域名...

2018-11-21 09:59:41 571

原创 Scrapy框架糗事百科自动爬虫

糗事百科自动爬虫:1、在cmd进入项目文件夹,创建爬虫项目和爬虫文件>scrapy startproject qsauto2、进入项目文件夹创建爬虫文件>scrapy genspider -t crawl cw qiushi.com(我创建的爬虫文件为cw, qiushi.com为糗事百科网域名)3、用pycharm打开这个项目                   ...

2018-11-21 09:49:28 189

原创 python爬虫Scrapy框架

Scrapy框架是一个Python爬虫框架,适合做一些大型爬虫项目。Scrapy框架常见命令:1、基本格式:scrapy   命令名  -参数(如scrapy fetch –h显示fetch命令帮助,fetch显示爬虫爬取过程)2、Shell命令,启动Scrapy交互终端 >scrapy shell http://www.baidu.com --nolog3、Startp...

2018-11-21 09:43:12 937 4

原创 python多线程爬虫

先记录一下,普通的糗事百科爬虫:import urllib.requestimport reimport timeimport urllib.errorheaders=('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:63.0) Gecko/20100101 Firefox/63.0')opener=urlli...

2018-11-21 09:27:23 261

原创 python微信爬虫

微信网站为http://weixin.sogou.com/微信爬虫,使用代理服务器爬一个网址。注意设置代理服务器时,该代理服务器有可能失效,需要换成新的有效代理服务器。代理服务器可以百度到。import urllib.requestimport reimport timeimport urllib.error# 自定义函数,功能为使用代理服务器爬一个网址def use_pr...

2018-11-20 17:37:18 629

原创 python实现新浪新闻爬虫

1、没有伪装成浏览器进行爬取操作将爬取的新闻网址保存到文件夹e:/sinanews/中,成功后直接通过浏览器打开。import urllib.requestimport redata=urllib.request.urlopen('https://news.sina.com.cn/').read()data2=data.decode('utf-8','ignore')#加第二个参数...

2018-11-20 17:28:50 701

原创 python爬虫,Urllib库

python爬虫学习之Urllib库,自动模拟HTTP请求,异常处理,爬虫的浏览器伪装技术1、Urllib基础1.1 urlretrieve()将一个网页直接爬取保存到本地>>> import urllib.request>>> urllib.request.urlretrieve('https://blog.csdn.net/','e:/sc...

2018-11-16 22:30:42 367

原创 python网络爬虫正则表达式

初学python网络爬虫正则表达式的学习笔记,有不对的地方请批评指正。正则表达式\w匹配字母、数字、下划线(普通字符)\d匹配任意十进制数字\s匹配空格字符\W匹配\w相反的字符,除了字母、数字、下划线的其他字符(其他\(大写)都与其小写匹配相反)元字符:所谓的元字符,就是正则表达式中具有一些特殊含义的字符,比如重复N次前面的字符等。(.匹配任意字符;^匹配字符串的开始位置...

2018-11-16 19:22:54 256

原创 在Pycharm中安装matplotlib

 1.初学python------安装matplotlib在pycharm中安装第三库不需要下载:打开pycharm,点击fileàsettings2.选择Project:dataview(项目名字)àproject Interpreterà点击+号 3.进入后,在输入框中输入matplotlib进行搜索,然后选中要安装的包并点击下方的install package...

2018-10-28 11:26:28 40717 9

原创 读入一个自然数n,计算其各位数字之和,用汉语拼音写出和的每一位数字。 输入格式:每个测试输入包含1个测试用例,即给出自然数n的值。这里保证n小于10100。 源程序

#include#include#includeusing namespace std;int main(){char s[100];cin>>s;int n=strlen(s),b[11];int sum=0,j,t;for(int i=0;i{sum=sum+(s[i]-'0');}coutfor(j=0;sum!=0;j++){

2018-01-11 10:26:00 4037

slf4j-log4j12-1.6.6.jar

slf4j-log4j12-1.6.6.jar。里面包含poi-tl-1.0.0.jar、log4j-1.2.17、slf4j-1.7.25等jar包。

2019-01-18

commons-logging-1.2-bin.rar jar包

commons-logging-1.2-bin.rar jar包,包含commons-compress-1.12.jar、commons-logging-1.2-javadoc.jar、xmlbeans-2.3.0.jar、commons-lang-2.6-bin.zip等jar包

2019-01-18

commons-compress-1.18-bin jar包

commons-compress-1.18-bin jar包,commons-compress-1.18-javadoc.jar、commons-compress-1.18-sources.jar

2019-01-18

mysql-connector-java-5.1.47 jar包

mysql-connector-java-5.1.47 jar包,在利用jdbc连接数据库用

2019-01-18

ApachePoiAllJar包

ApachePoiAllJar包包括POI生成word文档的jar包,以及使用说明。

2019-01-18

xmlbeans-bin-3.0.1-20180824案例及jar包

xmlbeans-bin-3.0.1-20180824案例及jar包,里面包含案例和resolver.jar、xbean.jar、xbean_xpath.jar、xmlpublic.jar,jar包在lib文件中。

2019-01-18

java2word程序代码及jar包

里面包括java2word生成word文档的代码以及所需要的jar包,jacob1.jar Java2Word.jar

2019-01-18

docx4j生成word文档

最近在做一个出卷系统,需要通过试卷模板从数据库中抽取题目,然后按照模板的样式生成完整的试卷,包括试卷格式的排版和图片的写入。这是用docx4j生成word文档。里面包括完整代码和所需jar包。

2019-01-18

POI生成word文档

最近在做一个出卷系统,需要通过试卷模板从数据库中抽取题目,然后按照模板的样式生成完整的试卷,包括试卷格式的排版和图片的写入。这是用POI模板生成word文档。里面包括完整代码和所需jar包。

2019-01-18

freemarker模板生成word文档完整代码

最近在做一个出卷系统,需要通过试卷模板从数据库中抽取题目,然后按照模板的样式生成完整的试卷,包括试卷格式的排版和图片的写入。这是用freemarker模板生成word文档。里面包括完整代码和所需jar包。

2019-01-18

python实现Apriori算法apriori.py和数据

用python实现的Apriori算法和测试用的数据,可以直接将压缩包里面的apriori.py文件放到python安装文件夹lib中,进行调用。

2018-12-08

2014-2017美赛O奖论文和官方解读

参加过美赛,想到快过年顶着严寒准备美赛,还是比较辛苦的。文档中包含了2014-2017年美赛的O奖论文和官方解读,适合学习。

2018-12-06

python入门“学习笔记”Learning_log

python提供了一组开发web应用程序的卓越工具。本web应用程序“学习笔记”(Learning_log)应用Django web框架,包括用户账户,设置应用程序并对其部署,这个压缩包包含项目的完整代码,适合python初学者。

2018-11-06

python入门游戏开发---《外星人入侵》

Python初学,开发的游戏《外星人入侵》。这个游戏的开发工具为Pycharm,安装第三方库Pygame就可以进行开发。在这个游戏中使用pygame开发的一款的2D游戏,完成这个游戏后,将获得用pygame自己动手开发2D游戏的技能。这是《python从入门到实践》这本书中的一个项目,书中介绍了如何从零开发这款游戏。也将获得如何管理包含多个文件的项目,提高编码效率,管理文件内容。在压缩包中包含有这个游戏的完整项目代码和学习python的一本电子书,适合初学python学习。

2018-10-28

MFC文本压缩课程设计项目源码

学习C++,MFC编程,客户端界面设计,根据哈夫曼编码实现文本压缩,文本压缩MFC系统源码

2018-03-03

不凡的夫子c++源代码

题目描述 夫夫有一天对一个数有多少位数感兴趣,但是他又不想跟凡夫俗子一样, 所以他想知道给一个整数n,求n!的在8进制下的位数是多少位。 输入描述: 第一行是一个整数t(0<t<=1000000)(表示t组数据) 接下来t行,每一行有一个整数n(0<=n<=10000000) 输出描述: 输出n!在8进制下的位数。

2018-02-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除