自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 收藏
  • 关注

原创 python零基础3——编辑器安装及破解

于Python开发者来说,选择pycharm作为其开发环境真的是一个不错的选择,功能强大、界面美观、支持远程开发等等一些特点帮助开发者更高效的开发。 百度pycharm 第一个就是官网,官网介绍pycharm有两个版本:社区版和专业版。社区版就是不需要钱的,当然也有一些功能限制。专业版是完整的,但是需要付费。对于普通开发者,社区版完全满足其需求,但是有些人就是喜欢使用最好,而且不想出钱,破解是最

2017-10-18 21:29:21 619

转载 python零基础学习2-编辑器选择

上一篇文章记录了怎么安装Python环境,同时也成功的在电脑上安装好了Python环境,可以正式开始自己的编程之旅了。但是现在又有头疼的事情,该用什么来写Python程序呢,该用什么来执行Python程序呢。  其实市面上有很多编辑器都可以来编写代码,甚至是Windows自带的记事本都可以编写代码。俗话说,工欲善其事,必先利其器,找到一个好的Python IDE,就好比剑客手中一把锋利的宝剑。

2017-10-18 20:48:14 413

转载 R语言 RStudio快捷键

Pandas读取数据到Dataframe Python中用Pandas进行数据分析,最常用的就是Dataframe数据结构,之前写过一篇文章介绍Pandas的基本用法,后来有些朋友问Pandas怎么从数据库中读取数据,怎么从文件中读取数据之类的问题,因此单独开篇文章介绍Pandas如何读取数据到Dataframe。Pandas读取Mysql数据要读取Mysql中的数据,首先要安装Mysqldb包

2017-04-26 17:46:58 1358

原创 文本分析-相似文章匹配

概念理解: 推荐:在数据挖掘中,推荐包括相似推荐及系统过滤推荐。 1,相似推荐:指当用户表现出对某人或某物的兴趣是,为他推荐与之相类似的人,或者物,他的核心是,人以群分,物以类聚 2,协同过滤推荐:指利用已有用户群过去的行为和意见,预测当前用户最有可能喜欢那些东西。 余弦相似度: 求两者之间的夹角,得出对应的余弦值,该值可以用来表示两个向量的相似性,夹角越小,余弦值越大,方向更吻合,则

2017-03-03 16:26:26 2141

转载 R语言报错原因

In gsub(sprintf("(*UCP)\\b(%s)\\b", paste(sort(words, decreasing = TRUE),出现这个错误的原因是我的stopwords里存在非UTF-8的元素 可以使用Encoding函数查看,解决方法就是,把那些字符去掉就行. stopwords<-stopwords[Encoding(stopwords)!=”unknown”]#去除未知

2017-02-28 15:07:41 5329

翻译 时间序列模型

kings<-scan("http://robjhyndman.com/tsdldata/misc/kings.dat",skip=3)#读入时间序列数据,忽略前三行kingskingstimeseries<-ts(kings)#将数据存储到一个时间序列对象中去births<-scan("http://robjhyndman.com/tsdldata/data/nybirths.dat")b

2016-11-16 18:20:02 884

转载 数据挖掘书籍

Web数据挖掘 http://book.douban.com/subject/3639345/集体智慧编程 http://book.douban.com/subject/3288908/简单,有代码。这就是搜索引擎 http://book.douban.com/subject/7006719/PageRank 和 Hub算法,讲得比较通俗,比较少使用公式。统计推断 http://book.d

2016-08-30 15:26:59 325

转载 搜索引擎设计一(百度为例)

随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把有代表性的搜索引擎作为研究对象.搜索引擎经济的崛起,又一次向人们证明了网络所蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数据,以及大量等待去费力挖掘的金矿。但是,如何设

2016-08-30 15:15:50 7151

转载 数据挖掘书籍

Web数据挖掘 http://book.douban.com/subject/3639345/集体智慧编程 http://book.douban.com/subject/3288908/简单,有代码。这就是搜索引擎 http://book.douban.com/subject/7006719/PageRank 和 Hub算法,讲得比较通俗,比较少使用公式。统计推断 http://book.d

2016-08-29 15:30:15 367

转载 深入搜索引擎--查询(Query)

1.Query的数据分析 Query即用户在搜索引擎输入查询条件。在通用搜索引擎中,一般是指输入的关键词。而在各类行业或者垂直搜索引擎,还可以输入类目,如优酷网站中可以选择“电影”、“电视剧”这样的类目。在电子商务网站中,各种产品品牌、型号、款式、价格等也是常见的查询条件。 要分析query中每个term的内容,分词是必不可少的工具。分词算法从最简单的最大正向、最大反向分词算法

2016-08-29 15:15:53 1426

原创 关联规则相关学术论文网址

利用shiny包快速搭建可视化原型系统 http://cos.name/2016/06/use-shiny-fleetly-set-up-visual-prototype-system/基于关联规则的图书借阅服务推荐方法 http://www.chnlib.com/LunWen/tushuguanguanli/2015-07-02/34623.html基于PSO的电信业数据关联规则挖掘 htt

2016-08-26 17:02:04 569

转载 R语言Data Frame数据框常用操作

Data Frame一般被翻译为数据框,感觉就像是R中的表,由行和列组成,与Matrix不同的是,每个列可以是不同的数据类型,而Matrix是必须相同的。Data Frame每一列有列名,每一行也可以指定行名。如果不指定行名,那么就是从1开始自增的Sequence来标识每一行。 初始化 使用data.frame函数就可以初始化一个Data Frame。比如我们要初始化一个student的Data

2016-08-26 14:17:58 3264

转载 PLSQL导出大量数据-超出excel限制,使用csv

当数据行数超过6W多的时候,Excel2003版的就无法装下,因而无法导出。此时可以使用export>csv格式…导出的时候使用csv格式对于长度过长的数字会变成科学计数法,因而变短。。这时在导出的查询语句中做如下处理假如一个表有sfzh身份证号,表名tablename:personal select sfzh from personal;这样的结果,身份证导出的结果肯定不是我们想要的

2016-08-24 16:04:25 21080 1

转载 R语言中的并行计算

众所周知,在大数据时代R语言有两个弱项,其中一个就是只能使用单线程计算。但是R在2.14版本之后,R就内置了parallel包,强化了R的并行计算能力。parallel包实际上整合了之前已经比较成熟的snow包和multicore包,multicore无法在windows下运行。parallel包可以很容易的在计算集群上实施并行计算,在多个CPU核心的单机上,也能发挥并行计算的功能。我们今天就来探索

2016-08-15 09:05:36 3793

原创 回归分析以及r语言实现(一)

一、数据探索阶段 1、了解变量类型 做回归分析前,了解数据集是怎样的?那些是数值型变量,那些是分类变量,这一步是相当重要的。 r代码:> class(mydata$Middle_Price)[1] “numeric”> class(mydata$MPG.city.)[1] “factor” 另外我们利用factor函数对各水平进行赋值:status<-factor(status,order=

2016-08-11 10:47:54 3806

原创 R语言:基本变量及其之间关系探索分析

一、查看数据结构dim(iris) # 了解数据集的维度,有多少行多少列?names(iris) # 数据有哪些列?str(iris) # 数据的结构如何?attributes(iris) # 数据的列名、行名和数据结构然后看看数据集前几行和后几行长成什么样子:iris[1:5, ] # 看看数据的前5行head(iris) # 看看数据的前6行tail(iris) # 看看数据的最后6行iri

2016-08-11 10:38:25 7937

原创 用关联规则挖掘超市购物的商品组合

读取文件,存放在csv格式的数据表格中,每一行代表一个购买过程。setwd("D:/myR")G <- read.csv("2014.12.csv", header=T)加载包arules,运行包install.packages("arules")library(arules)将数据转换成稀疏矩阵的数据格式setwd("D:/myR")groceries <- read.transaction

2016-08-10 14:49:50 2573

转载 R语言学习之关联规则算法

R语言学习之关联规则算法 卡卡 2014-03-05 10:42:03library(arules) #加载arules程序包data(Groceries) #调用数据文件frequentsets=eclat(Groceries,parameter=list(support=0.05,maxlen=10)) #求频繁项集inspect(frequentsets[

2016-08-08 18:06:16 3503

转载 R语言批量为行列命名

本文转自:http://www.dataguru.cn/article-2217-1.html;摘要: R语言中经常进行矩阵(表格)数据的处理,在纷繁复杂的数据中,为其行列定义一个名字变得尤为重要。在处理巨量数据时,批量命名将是一个不错的操作方法,下面我们通过一些具体的例子演示怎样在R语言中为矩阵的行列进 ...R语言中经常进行矩阵(表格)数据的处理,在纷繁复杂的数据中,为

2016-08-08 10:56:47 20240

转载 R语言:system.file()函数中文帮助文档(中英文对照)

system.file(base)system.file()所属R语言包:base                                        Find Names of R System Files                                         R系统文件的名称                              

2016-08-08 10:37:02 21070

转载 浅谈数据挖掘中的关联规则挖掘

浅谈数据挖掘中的关联规则挖掘  数据挖掘是指以某种方式分析数据源,从中发现一些潜在的有用的信息,所以数据挖掘又称作知识发现,而关联规则挖掘则是数据挖掘中的一个很重要的课题,顾名思义,它是从数据背后发现事物之间可能存在的关联或者联系。举个最简单的例子,比如通过调查商场里顾客买的东西发现,30%的顾客会同时购买床单和枕套,而购买床单的人中有80%购买了枕套,这里面就隐藏了一条关联:床单—>枕套

2016-08-03 09:08:16 548

转载 sql---str_replace()用法

str_replace函数的语法很简单:                     replace("string_expression1", "string_expression2", "string_expression3") 就是:将字符串1中所包含的所有 的字符串2都用字符串3统统替换。一个简单的例子:[c-sharp] view

2016-07-26 08:58:04 2441

原创 LTrim和RTrim在SQL的用法

LTRIM :  删除起始空格后返回字符表达式。 语法 :  LTRIM ( character_expression ) 参数 character_expression  : 是字符或二进制数据表达式。character_expression 可以是常量、变量或列。character_expression 必须是可以隐性转换为 varchar 的数据类型。否则,使用 CAST

2016-07-25 17:33:44 1384

转载 SQL Server CONVERT() 函数

定义和用法CONVERT() 函数是把日期转换为新数据类型的通用函数。CONVERT() 函数可以用不同的格式显示日期/时间数据。语法CONVERT(data_type(length),data_to_be_converted,style)data_type(length) 规定目标数据类型(带有可选的长度)。data_to_be_converted 含有需要转换的

2016-07-25 11:05:06 234

转载 SQL中的case when then else end用法

Case具有两种格式。简单Case函数和Case搜索函数。--简单Case函数CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女'ELSE '其他' END--Case搜索函数CASE WHEN sex = '1' THEN '男' WHEN sex = '2' THEN '女'ELSE '其他

2016-07-25 10:17:10 264

转载 ETL 浅谈

ETL任务是什么?

2016-07-25 09:50:15 331 1

转载 sql---trace的用法

SQL_TRACE是Oracle提供的用于进行SQL跟踪的手段,是强有力的辅助诊断工具.在日常的数据库问题诊断和解决中,SQL_TRACE是非常常用的方法。本文就SQL_TRACE的使用作简单探讨,并通过具体案例对sql_trace的使用进行说明.一、 基础介绍(a) SQL_TRACE说明SQL_TRACE可以作为初始化参数在全局启用,也可以通过命令行方式

2016-07-22 17:02:59 569

转载 sql---distinct函数用法

SQL中distinct的用法1.作用于单列2.作用于多列3.COUNT统计4.distinct必须放在开头5.其他在表中,可能会包含重复值。这并不成问题,不过,有时您也许希望仅仅列出不同(distinct)的值。关键词 distinct用于返回唯一不同的值。表A:表B:1.作用于单列select distinct

2016-07-22 11:12:21 8154

转载 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用[StackEdit][6]修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用

2016-07-22 10:41:59 161

转载 sql---cast函数

SQL中的cast()函数本文导读:CAST函数用于将某种数据类型的表达式显式转换为另一种数据类型。CAST()函数的参数是一个表达式,它包括用AS关键字分隔的源值和目标数据类型。一、语法:CAST (expression AS data_type)参数说明:expression:任何有效的SQServer表达式。AS:用于分隔两个参

2016-07-21 16:40:52 473

转载 sql---charindex函数

SQL语言中有许多函数,CHARINDEX函数就是其中之一。下文将为您介绍CHARINDEX函数的调用方法和作用,供您参考,希望对您有所帮助。CHARINDEX函数返回字符或者字符串在另一个字符串中的起始位置。CHARINDEX函数调用方法如下:CHARINDEX ( expression1 , expression2 [ , start_location ] )Expre

2016-07-21 15:21:05 213

转载 sql---substring函数

substring 函数用于返回字符表达式、二进制表达式、文本表达式或者图像表达式的一部分。语法格式如下|:substring(value_expression,star_expression,length_expression)substring(a,b,c):         其中a 表示查询的字段;          b表示返回指定字符的起始位置的整数或bigint表达式。如

2016-07-21 14:35:41 637

转载 sql----case函数

SQL中的CASE WHEN语句是经常要用到的,下面将结合实例,为您详解CASE WHEN语句的使用,供您参考,希望对您学习SQL语句能有所帮助。一张表数据如下 1900-1-1 胜 1900-1-1 胜 1900-1-1 负 1900-1-2 胜 1900-1-2 胜 写出一条SQL语句,使检索结果如下:          胜  负 1900-1-1 2   1 1900-

2016-07-20 09:16:11 329

转载 sql------总计

一、基础1、说明:创建数据库CREATE DATABASE database-name 2、说明:删除数据库drop database dbname3、说明:备份sql server--- 创建 备份数据的 deviceUSE masterEXEC sp_addumpdevice 'disk', 'testBack', 'c:\mssql7backup\MyNwin

2016-07-18 18:06:56 410

转载 sql-----STR 函数

sql-----STR 函数STR 函数由数字数据转换来的字符数据。语法STR ( float_expression [ , length [ , decimal ] ] ) 参数float_expression是带小数点的近似数字 (float)数据类型的表达式。不要在 STR 函数中将函数或子查询用作 float_expression。lengt

2016-07-18 17:56:22 2097

转载 sql----cast函数

SQL 语句转换格式函数Cast、Convert  CAST和CONVERT都经常被使用。特别提取出来作为一篇文章,方便查找。  CAST、CONVERT都可以执行数据类型转换。在大部分情况下,两者执行同样的功能,不同的是CONVERT还提供一些特别的日期格式转换,而CAST没有这个功能。  既然CONVERT包括了CAST的所有功能,而且CONVERT还能进行日期转换,那么为

2016-07-18 17:50:38 333

转载 SQL Server中变量的声明和使用方法

SQL Server中变量的声明和使用方法声明局部变量语法:DECLARE @variable_name DataType其中 variable_name为局部变量的名称,DataType为数据类型。给局部变量赋值有两种方法:1、SET @variable_name=value2、SELECT @variable_name=value

2016-07-18 17:36:48 1918

转载 sql------isnull 和 ifnull 函数

SQL Serve的ISNULL函数:    ISNULL(check_expression,replacement_value)    1、check_expression与replacement_value的数据类型必须一致。    2、如果check_expression为NULL,则返回replacement_value。    3、如果check_expr

2016-07-18 17:07:55 643

翻译 SQL------- DATEADD函数

SQL DATEADD函数  语法DATEADD (datepart , number , date ) 将指定 number 时间间隔(有符号整数)与指定 date 的指定 datepart 相加后,返回该 date。参数:datepart:是与number 相加的 date 部分。下表列出了所有有效的 datepart 参数。用户定义的变

2016-07-18 16:54:52 812

转载 SQL DateTime查询与格式

SQL DateTime查询与格式select * from orders where month(orderdate)= (select month(orderdate) from orders where orderid=10248)1.一个月第一天的Select DATEADD(mm, DATEDIFF(mm,0,getdate()), 0)2

2016-07-18 16:29:41 2417

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除