clover521-CSDN博客

原创按照模板java动态生成word文档

最近在做一个出卷系统，需要通过试卷模板从数据库中抽取题目，然后按照模板的样式生成完整的试卷，所以研究了一下，通过Java生成word文档的方法。我尝试了不同的方法，1、使用freemarker模板生成word文档；2、使用POI生成word文档；3、使用docx4j生成word文档。文档最后有三种方式的完整代码及所需jar包。1、使用freemarker模板生成word文档...

2019-01-18 16:04:24 4813 3

原创 python实现支持向量机SVM

支持向量机支持向量机有两种：SVC，支持向量分类，用于分类问题；SVR,支持向量回归，用于回归问题。线性支持向量机（Linear SVMs）：用一个非常有名的用于分类问题的数据集：鸢尾花数据集。它是基于鸢尾花的花萼的长度和宽度进行分类的。我们只用其中两维特征，这能够方便可视化。kernel="linear"（线性核函数）给了我们线性的决策边界：两类之间的分离边界是直线。多分类的工作...

2018-12-20 20:40:46 763

原创 python实现Apriori算法

Apriori算法两个概念：支持度：A、B同时发生的概率置信度：若A发生，B发生的概率Apriori算法的实现设定阈值：最小支持度和最小置信度计算支持度：Supprot（A=>B）=(A与B同时发生的数量)/事件的总数 =Support_count(...

2018-12-08 11:28:54 3044

原创 python人工神经网络

人工神经网络在模块keras中，实现步骤如下：#bp人工神经网络的实现#1、读取数据#2、导入对应模块，keras.models Sequential(建立模型) |keras.layers.core Dense（建立层） Activation#3、Sequential建立模型#4、Dense建立层#5、Activation激活函数#6、compile模型编译...

2018-12-07 22:15:37 1592

原创 python数据分析与挖掘之聚类kmeans算法

聚类不指定类别进行分类（划分（分裂）法，层次分析法、密度分析法）、网格法、模型法 Kmeans算法属于分裂法随机选择k各点作为聚类中心计算各个点到这K个点的距离将对应的点聚到与它最近的这个聚类中心重新计算聚类中心比较当前聚类中心与前一次聚类中心，如果是同一个点，得到聚类结果，若不同的点，则重复2-5Kmeans算法实现代码：#kmeans算法'''...

2018-12-07 22:11:12 883

原创 python之回归算法

逻辑回归import pandas as pdafname='E:/programCode/huigui.csv'dataf=pda.read_csv(fname)#自变量xx=dataf.iloc[:,1:4].as_matrix()#[:,1:2]中的右边代表列取谁，左边的代表行取谁#因变量yy=dataf.iloc[:,0:1].as_matrix()#.as_matrix...

2018-12-07 22:07:51 1513

原创 python数据分析与挖掘之贝叶斯算法算法实现

代码中有详细的注释训练文件：Txt文件中为0，1矩阵，将图片转换为0，1矩阵见上一篇博客方法import numpy import operatorfrom os import listdirclass Bayes: def __init__(self): self.length=-1 self.labelcount=dict()#各类...

2018-12-07 22:04:26 333

原创 python数据建模与KNN算法实现手写体数字识别

数据建模指的是对现实世界各类数据的抽象组织,建立一一个适合的模型对数据进行处理。在数据分析与挖掘中,我们通常需要根据一-些数据建立起特定的模型，然后处理。模型的建立需要依赖于算法, - -般,常见的算法有分类、聚类、关联、回归等。python数据分类实现过程数据分类主要处理现实生活中的分类问题,一般处理思路如下:1、首先明确需求并对数据进行观察2、其次,...

2018-12-07 21:57:30 355

原创 python文本相似度计算

相似度计算步骤：：读取要计算的多篇文档对要计算的文档进行分词对文档进行整理成指定格式，方便后续计算计算出词语的频率【可选】对频率低的词语进行过滤通过语料库建立词典加载要对比的文档将要对比的文档，通过doc2bow转化为稀疏向量对我们的稀疏向量进行进一步处理得到新语料库将新语料库通过tfidfmodel进行处理，得到tfidf 通过token2id得到特征数...

2018-12-07 21:49:31 5439 3

原创 python文本挖掘

import jieba#全模式sentence='我喜欢武汉欢乐谷'w1=jieba.cut(sentence,cut_all=True)#(句子，模式[True全模式,False精准模式])for item in w1: print(item)print()#精准模式w2=jieba.cut(sentence,cut_all=False)#去掉cut_all这个参数，默...

2018-11-24 22:26:25 372

原创 python数据探索与数据清洗

数据探索的目的是及早发现数据的一些简单规律或特征,数据清洗的目的是留下可靠数据,避免脏数据的干扰。这两者没有严格的先后顺序，经常在一个阶段进行。数据探索的核心是: 1、数据质量分析(跟数据清洗密切联系)2、数据特征分析(分布、对比、周期性、相关性、常见统计量等)数据清洗可以按如下步骤进行: 1、缺失值处理(通过describe与len直接发现、通过0数据发现) ...

2018-11-24 22:23:48 299

原创 python之matplotlib模块画图

#折线图/散点图plotimport matplotlib.pylab as pylimport numpy as npyx=[1,2,3,4,8]y=[5,7,9,6,3]pyl.plot(x,y) #plot（x轴数据，y轴数据，展现形式）pyl.show()#散点图pyl.plot(x,y,'o')pyl.show()图中颜色设置c-cyan...

2018-11-24 22:20:33 376

原创数据分析之Python数据导入

'''数据导入'''import pandas as pdai=pda.read_csv('E:/programCode/jd.csv',encoding='gb18030')i.describe()#按照某一列进行排序i.sort_values(by='238')#238为列名import xlrd '''导入excel数据'''j=pda.read_exce...

2018-11-24 22:13:28 324

原创 python数据分析与挖掘模块简介

所谓数据分析,即对已知的数据进行分析,然后提取出一-些有价值的信息，比如统计出平均数、标准差等信息,数据分析的数据量有时可能不会太大，而数据挖掘，是指对大量的数据进行分析与挖掘,得到一些未知的,有价值的信息等,比如从网站的用户或用户行为数据中挖掘出用户的潜在需求信息,从而对网站进行改善等。数据分析与数据挖掘密不可分,数据挖掘是数据分析的提升。数据分析与挖掘技术能做什么事情？数据挖掘技...

2018-11-24 22:10:00 542

原创 Scrapy框架基于crawl爬取京东商品信息爬虫

Items.py文件# -*- coding: utf-8 -*-# Define here the models for your scraped items# See documentation in:# https://doc.scrapy.org/en/latest/topics/items.htmlimport scrapyclass JingdongItem(scrap...

2018-11-24 22:06:58 577

原创 python当当网爬虫

最终要实现的是将当当网上面的书籍信息，书籍名字，网址和评论数爬取，存入到数据库中。（首先要做的是创建好数据库，创建的数据库名字为dd,创建的表为books,字段为title,link,comment）。1、创建项目 scrapy startproject dangdang2、进入项目文件夹创建爬虫文件>scrapy genspider –t basic dd dangdan...

2018-11-24 22:03:29 2202

原创自动模拟登陆爬虫

有时候需要抓取登陆后的页面，让爬虫登陆网址。此程序可以实现模拟登陆爬虫，包括图片验证码的处理。1、在cmd进入项目文件夹，创建爬虫项目和爬虫文件>scrapy startproject douban2、进入项目文件夹创建爬虫文件>scrapy genspider -t crawl db qiushi.com（我创建的爬虫文件为db, qiushi.com为糗事百科网域名...

2018-11-21 09:59:41 571

原创 Scrapy框架糗事百科自动爬虫

糗事百科自动爬虫：1、在cmd进入项目文件夹，创建爬虫项目和爬虫文件>scrapy startproject qsauto2、进入项目文件夹创建爬虫文件>scrapy genspider -t crawl cw qiushi.com（我创建的爬虫文件为cw, qiushi.com为糗事百科网域名）3、用pycharm打开这个项目 ...

2018-11-21 09:49:28 189

原创 python爬虫Scrapy框架

Scrapy框架是一个Python爬虫框架，适合做一些大型爬虫项目。Scrapy框架常见命令：1、基本格式：scrapy 命令名 -参数（如scrapy fetch –h显示fetch命令帮助，fetch显示爬虫爬取过程）2、Shell命令，启动Scrapy交互终端 >scrapy shell http://www.baidu.com --nolog3、Startp...

2018-11-21 09:43:12 937 4

原创 python多线程爬虫

先记录一下，普通的糗事百科爬虫：import urllib.requestimport reimport timeimport urllib.errorheaders=('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:63.0) Gecko/20100101 Firefox/63.0')opener=urlli...

2018-11-21 09:27:23 261

原创 python微信爬虫

微信网站为http://weixin.sogou.com/微信爬虫，使用代理服务器爬一个网址。注意设置代理服务器时，该代理服务器有可能失效，需要换成新的有效代理服务器。代理服务器可以百度到。import urllib.requestimport reimport timeimport urllib.error# 自定义函数，功能为使用代理服务器爬一个网址def use_pr...

2018-11-20 17:37:18 629

原创 python实现新浪新闻爬虫

1、没有伪装成浏览器进行爬取操作将爬取的新闻网址保存到文件夹e:/sinanews/中，成功后直接通过浏览器打开。import urllib.requestimport redata=urllib.request.urlopen('https://news.sina.com.cn/').read()data2=data.decode('utf-8','ignore')#加第二个参数...

2018-11-20 17:28:50 701

原创 python爬虫，Urllib库

python爬虫学习之Urllib库，自动模拟HTTP请求，异常处理，爬虫的浏览器伪装技术1、Urllib基础1.1 urlretrieve()将一个网页直接爬取保存到本地>>> import urllib.request>>> urllib.request.urlretrieve('https://blog.csdn.net/','e:/sc...

2018-11-16 22:30:42 367

原创 python网络爬虫正则表达式

初学python网络爬虫正则表达式的学习笔记，有不对的地方请批评指正。正则表达式\w匹配字母、数字、下划线（普通字符）\d匹配任意十进制数字\s匹配空格字符\W匹配\w相反的字符，除了字母、数字、下划线的其他字符（其他\（大写）都与其小写匹配相反）元字符：所谓的元字符，就是正则表达式中具有一些特殊含义的字符，比如重复N次前面的字符等。（.匹配任意字符；^匹配字符串的开始位置...

2018-11-16 19:22:54 256

原创在Pycharm中安装matplotlib

1.初学python------安装matplotlib在pycharm中安装第三库不需要下载：打开pycharm，点击fileàsettings2.选择Project:dataview(项目名字)àproject Interpreterà点击+号 3.进入后，在输入框中输入matplotlib进行搜索，然后选中要安装的包并点击下方的install package...

2018-10-28 11:26:28 40717 9

原创读入一个自然数n，计算其各位数字之和，用汉语拼音写出和的每一位数字。输入格式：每个测试输入包含1个测试用例，即给出自然数n的值。这里保证n小于10100。源程序

#include#include#includeusing namespace std;int main(){char s[100];cin>>s;int n=strlen(s),b[11];int sum=0,j,t;for(int i=0;i{sum=sum+(s[i]-'0');}coutfor(j=0;sum!=0;j++){

2018-01-11 10:26:00 4037

slf4j-log4j12-1.6.6.jar

slf4j-log4j12-1.6.6.jar。里面包含poi-tl-1.0.0.jar、log4j-1.2.17、slf4j-1.7.25等jar包。

2019-01-18

commons-logging-1.2-bin.rar jar包

commons-logging-1.2-bin.rar jar包，包含commons-compress-1.12.jar、commons-logging-1.2-javadoc.jar、xmlbeans-2.3.0.jar、commons-lang-2.6-bin.zip等jar包

2019-01-18

commons-compress-1.18-bin jar包

commons-compress-1.18-bin jar包，commons-compress-1.18-javadoc.jar、commons-compress-1.18-sources.jar

2019-01-18

mysql-connector-java-5.1.47 jar包

mysql-connector-java-5.1.47 jar包,在利用jdbc连接数据库用

2019-01-18

ApachePoiAllJar包

ApachePoiAllJar包包括POI生成word文档的jar包，以及使用说明。

2019-01-18

xmlbeans-bin-3.0.1-20180824案例及jar包

xmlbeans-bin-3.0.1-20180824案例及jar包，里面包含案例和resolver.jar、xbean.jar、xbean_xpath.jar、xmlpublic.jar，jar包在lib文件中。

2019-01-18

java2word程序代码及jar包

里面包括java2word生成word文档的代码以及所需要的jar包，jacob1.jar Java2Word.jar

2019-01-18

docx4j生成word文档

最近在做一个出卷系统，需要通过试卷模板从数据库中抽取题目，然后按照模板的样式生成完整的试卷，包括试卷格式的排版和图片的写入。这是用docx4j生成word文档。里面包括完整代码和所需jar包。

2019-01-18

POI生成word文档

最近在做一个出卷系统，需要通过试卷模板从数据库中抽取题目，然后按照模板的样式生成完整的试卷，包括试卷格式的排版和图片的写入。这是用POI模板生成word文档。里面包括完整代码和所需jar包。

2019-01-18

freemarker模板生成word文档完整代码

最近在做一个出卷系统，需要通过试卷模板从数据库中抽取题目，然后按照模板的样式生成完整的试卷，包括试卷格式的排版和图片的写入。这是用freemarker模板生成word文档。里面包括完整代码和所需jar包。

2019-01-18

python实现Apriori算法apriori.py和数据

用python实现的Apriori算法和测试用的数据，可以直接将压缩包里面的apriori.py文件放到python安装文件夹lib中，进行调用。

2018-12-08

2014-2017美赛O奖论文和官方解读

参加过美赛，想到快过年顶着严寒准备美赛，还是比较辛苦的。文档中包含了2014-2017年美赛的O奖论文和官方解读，适合学习。

2018-12-06

python入门“学习笔记”Learning_log

python提供了一组开发web应用程序的卓越工具。本web应用程序“学习笔记”（Learning_log）应用Django web框架，包括用户账户，设置应用程序并对其部署，这个压缩包包含项目的完整代码，适合python初学者。

2018-11-06

Python初学，开发的游戏《外星人入侵》。这个游戏的开发工具为Pycharm,安装第三方库Pygame就可以进行开发。在这个游戏中使用pygame开发的一款的2D游戏，完成这个游戏后，将获得用pygame自己动手开发2D游戏的技能。这是《python从入门到实践》这本书中的一个项目，书中介绍了如何从零开发这款游戏。也将获得如何管理包含多个文件的项目，提高编码效率，管理文件内容。在压缩包中包含有这个游戏的完整项目代码和学习python的一本电子书，适合初学python学习。

2018-10-28

MFC文本压缩课程设计项目源码

学习C++,MFC编程，客户端界面设计，根据哈夫曼编码实现文本压缩，文本压缩MFC系统源码

2018-03-03

不凡的夫子c++源代码

题目描述夫夫有一天对一个数有多少位数感兴趣，但是他又不想跟凡夫俗子一样，所以他想知道给一个整数n，求n！的在8进制下的位数是多少位。输入描述: 第一行是一个整数t(0<t<=1000000)(表示t组数据) 接下来t行，每一行有一个整数n(0<=n<=10000000) 输出描述: 输出n！在8进制下的位数。

2018-02-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

slf4j-log4j12-1.6.6.jar

commons-logging-1.2-bin.rar jar包

commons-compress-1.18-bin jar包

mysql-connector-java-5.1.47 jar包

ApachePoiAllJar包

xmlbeans-bin-3.0.1-20180824案例及jar包

java2word程序代码及jar包

docx4j生成word文档

POI生成word文档

freemarker模板生成word文档完整代码

python实现Apriori算法apriori.py和数据

2014-2017美赛O奖论文和官方解读

python入门“学习笔记”Learning_log

python入门游戏开发---《外星人入侵》

MFC文本压缩课程设计项目源码

不凡的夫子c++源代码

空空如也