自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 python文件读写总结

0. python 读取excel__author__ = 'HM'#Use the excellent xlrd package, which works on any platform. That means you can read Excel files from Python in Linux! Example usage:#Open the workbookimport

2015-11-14 15:58:34 886

原创 windows下安装系统或者重要程序总结

1. 老毛桃重新安装win http://www.laomaotao.net/help/2013/0930/2194.html注意:最后的时候(重启),将电脑关闭,把u盘拔下来,否则安装失败~!2. python+PyQT+Eric安装配置http://www.2cto.com/kf/201110/106640.html3. 

2015-11-14 15:50:36 450

转载 推荐系统入门(协同过滤 基于内容 基于用户 基于项目 )

http://blog.163.com/lnhenrylee@126/blog/static/2414832520123269713813/

2013-12-12 09:15:02 1164

转载 feature selection (互信息 去掉和类标签无关特征 + PCA)

http://www.cnblogs.com/jerrylead/archive/2011/04/18/2020209.html 真实的训练数据总是存在各种各样的问题:1、[冗余] 比如拿到一个汽车的样本,里面既有以“千米/每小时”度量的最大速度特征,也有“英里/小时”的最大速度特征,显然这两个特征有一个多余。2、 [冗余] 拿到一个数学系的本科生期末考试成绩单,里面有三列

2013-12-02 21:09:38 1493

原创 naive bayesian classifier

__author__ = 'HM'f = open('data.txt','r')first_line = f.readline().split()attributes = first_line[:-1]attr_len = len(attributes)classname = first_line[-1]data_set_raw = []class_label_pool = se

2013-11-30 19:08:19 698

原创 decison tree

__author__ = 'HM'from treelib import *class innerNode(Node): def __init__(self,attribute,parent_node_assert,identifier=None, expanded=True): self.parent_node_assert = parent_node_assert

2013-11-29 21:08:34 738

原创 pyCharm 中有用的tip

1. 改变量的名字:

2013-11-29 19:35:50 854

转载 python 优化

介绍:http://blog.csdn.net/lanphaday/article/category/328657实践:http://blog.csdn.net/gzlaiyonghao/article/details/1502290简而言之: import cProfile,pstats cProfile.run("main()","G:\\asta

2013-11-25 19:46:54 815

原创 heap in python

from heapq import heappop,heappusha = [1,3,5,7,2,34,0,2]heap = []for i in a: heappush(heap,i)for x in range(len(a)): print heappop(heap)

2013-11-25 19:31:53 698

转载 svd

http://www.cnblogs.com/FengYan/archive/2012/05/06/2480664.html

2013-11-25 09:58:06 640

转载 结构之法 算法之道

http://blog.csdn.net/v_july_v

2013-11-16 14:47:14 717

转载 python 性能鸡汤

http://python123.com/thread-42-1-1.html

2013-11-16 14:46:26 570

转载 Python特殊语法:filter、map、reduce、lambda

http://hi.baidu.com/black/item/307001d18715fc322a35c747Python内置了一些非常有趣但非常有用的函数,充分体现了Python的语言魅力!filter(function, sequence):对sequence中的item依次执行function(item),将执行结果为True的item组成一个List/String/Tuple(取决

2013-11-14 16:23:33 410

原创 python 点滴

1.比较set中的内容(fp-growth实现时)a = set(['338','337'])b = [set(['337','338']),set(['339' ,'340'])]if a in b: print 'yes'else: print 'no'

2013-11-13 19:27:25 492

原创 python related web

如果官方没有64-bit的包的话:http://www.lfd.uci.edu/~gohlke/pythonlibs/

2013-11-09 19:37:58 449

原创 call external .exe in python

simple way:import ospathname = "Untitled1.exe"os.system(pathname)with parameter

2013-11-07 11:09:57 642

原创 python 新建文件夹

import ospathname = r'G:\work\2.purchaseInterest\data'if not os.path.isdir(pathname): os.mkdir(pathname)for i in range(10): subname = pathname+'\\'+"u%d"%i if not os.path.isdir(subname

2013-10-31 16:12:16 1155

原创 生成组合、排列数

import itertoolsfor i in range(1,4): for e in itertools.combinations('abc',i): print(e),

2013-10-31 10:43:44 693

原创 python 编码心得

1. 先想后做。慢慢来,比较快。2  起名字很重要。起个简单的没有意义的名字,可能一开始比较爽,但后来就痛苦了。

2013-10-31 10:41:35 591

转载 python中的uuid

http://www.douban.com/note/69073375/概述:    UUID是128位的全局唯一标识符,通常由32字节的字符串表示。    它可以保证时间和空间的唯一性,也称为GUID,全称为:            UUID —— Universally Unique IDentifier Python 中叫 UUID            GUID —

2013-10-31 10:20:56 611

原创 pyTree(tree structure in python )

https://github.com/caesar0301/pyTree

2013-10-31 10:10:21 1729

原创 generate prompt

level = 1num = 70if level==1: a = ' '*(level-1)*4+'#'+'-'*(num-1)else: a = ' '*(level-1)*4+'#'+'-'*(num-1)content = "Specify the input and output "b = ' '*(level-1)*4+'#'+' '*20+content+'

2013-10-31 10:04:46 580

原创 gunplot

http://gnuplot-py.sourceforge.net/

2013-10-30 22:12:56 776

转载 Python中的easy_install

http://hi.baidu.com/thinkinginlamp/item/69cab949518d9aea1e19bcc1如果想使用easy_install工具,可能需要先安装setuptools,不过更酷的方法是使用ez_setup.py脚本:wget -q http://peak.telecommunity.com/dist/ez_setup.pypython ez_se

2013-10-30 20:57:53 796

转载 .py to .exe (by py2exe)

http://blog.sina.com.cn/s/blog_8811d2380101azrr.html三、py2exe的用法如果你有一个名为helloworld.py的python脚本,你想把它转换为运行在windows上的可执行程序,并运行在没有安装python的windows系统上(这个是重点),那么首先你应写一个用于发布程序的设置脚本例如mysetup.py(该文件最好放置在你

2013-10-30 20:54:43 743

原创 fp_growth

import collectionsmin_support = 3def sp(s): return [a for a in s]#=====================================================================# main funtnion

2013-10-26 16:01:00 667

原创 basic apriori method

#=====================================================================# data and parameters |#=========================================================

2013-10-22 20:42:10 599

转载 每天拿出来2小时浪费(文/王路) 作者: 王路

每天拿出来2小时浪费(文/王路) 作者: 王路前文略说了精进的主旨,此文再详说精进的要义。前文是精进的第一义,此文是精进的第二义。 上回提到王阳明讲“杀人须就咽喉上着刀”,我想到《黑道风云二十年》里说,打群架时,最不怕对手拿砍刀,最怕对手拿匕首。砍刀虽然大,只是唬人的,不伤及要害,全身砍上十几二十刀,住院十天半月就没事了,而拿匕首的人是真的想拼命的,一枪刺下去,就能要人

2013-09-07 16:44:52 1429

转载 python中 class 或对象属性转化成dict 、dict转换成对象

http://blog.csdn.net/chenyulancn/article/details/8203763

2013-09-07 10:22:40 876

原创 稍微复杂的分类器(加入了Normalization)

class Classifier: def __init__(self, filename): self.data = [] self.getData(filename) self.dimension = 2 self.medians = [] self.asds = [] self.norma

2013-08-15 15:49:11 595

原创 最简单的分类器(nearest neighbor )

原理:先计算出与物品最近的物品(用manhattan距离),然后以最相似物品的评分来估计现在的。users = {"Angelica": {"Dr Dog/Fate": "L", "Phoenix/Lisztomania": "L", "Heartless Bastards/Out at Sea": "D",

2013-08-15 09:24:17 946

原创 Weighted Slope One (python实现)

chapter 3 (collabative filtering ) of 《guide to db》slope one 算法比较简单:1.先构造 collection of deviation(average deviation)                                                2.weighted slope one ,已经打分的项+该项的

2013-08-14 15:57:57 1156

转载 python 字典的get方法

get()方法。 字典可以直接用a[b]的方式访问字典项,但如果b不存在时,会报异常。为了避免这种情况,可以使用get()方法来访问字典项,a.get(b)当b存在时,结果和a[b]一样,如果b不存在,不会报异常,而是返回None。除此之外,get()方法还可以设置第二个参数,如果b不存在,可以将第二个参数做为默认值返回。==================================

2013-08-14 15:01:35 1423

转载 Python - 列表、字典和元组的排序

地址: http://sjolzy.cn/Python-lists-dictionaries-and-tuples-of-the-sort.htmlPython有几个内建的排序函数能实现排序。1. list列表排序对于Python的列表list进行排序,可以使用内建的sort函数。>>> s=[2,1,3,0]>>> s.sort()[0, 1, 2,

2013-08-13 11:24:35 776

原创 Pearson+Cosine Similarity+K-Nearest Neighbor 代码

这本书比较简单,适合做推荐系统入门级读物。作者写的很仔细,一些复杂的公式都拆开讲。这是他的网站:http://guidetodatamining.com/一、通过用户的相似度(最相似用户)进行推荐。主要有三种方式:1.距离 2.pearson 3.cosine原理就不说了,书中都有,很简单。主要贴下代码: 1 recommend by distancefrom

2013-08-12 15:24:59 1145

转载 LDA 【介绍】※※※

转自http://blog.csdn.net/huagong_adu/article/details/7937616   主题模型有两种:pLSA(ProbabilisticLatent Semantic Analysis)和LDA(Latent Dirichlet Allocation),下面主要介绍LDA。(二)LDA介绍        如何生成M份包含N个单词的文档,

2013-01-27 17:20:42 565

转载 主题模型是什么、工作原理【基础概念】※※※※※

转自:http://blog.sina.com.cn/s/blog_9d7bca9f01015580.html摘要:两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在

2013-01-27 11:35:00 745

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除