自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

我心自在天的博客

学一些技术做的笔记,遇到的技术难题及解决,

  • 博客(42)
  • 资源 (6)
  • 收藏
  • 关注

原创 在QT的Widget中显示OSG:自建osgQt类并显示模型和earth文件

说明:之前学的osg代码都是在win32控制台上运行,使用viewer.run()直接显示模型;也在MFC上成功尝试了osgEarth。最近由于项目需要,需要把osgearth的三维地球重新显示到Qt环境中。但是MFC跟QT在显示的模式上感觉还是有很多不同,特别是在QT上显示的时候大多会使用osgQt这个库,但是从github上下载了之后始终无法编译成功,基本上看了网上所有关于osgQt的博客和使用方法,基本都没有走通,所以自己就想了一个死办法,自建了一个类,在不报错的情况下,把osgQt的源码给复制了一遍

2020-07-26 10:32:56 3512 4

原创 自动生成python项目的requirements.txt项目

自动生成python项目的requirements.txt项目我们为什么要使用requirements.txt呢?主要使用目的:任何应用程序通常需要设置安装所需并依赖一组类库来满足工作要求。要求文件是指定和一次性安装包的依赖项具体一整套方法。安装requirements.txt依赖requirements.txt文件格式:requests==1.2.0 Flask==0.10.1使用下面代码可以安装requirements.txt依赖pip install -r requirements

2020-08-02 20:29:23 249

原创 osgEarth用户手册-笔记

以下笔记来自《osgEarth用户手册》CSDN分享:目录1. osgEarth 安装1.1 获取源码1.2 准备工作1.3 编译osgEarth1.4 测试2. 建立地图2.1 地图文件元素索引2.2.1 简单图像文件1. osgEarth 安装1.1 获取源码github下载osgEarth源码比较方便1.2 准备工作准备osgEarth依赖的第三方库:GDAL CURL GEOS SQLite 3 LibZIP1.3 编译osg

2020-07-31 20:22:08 2024

原创 OSG 与 OSGEarth 开发相关技术博客

OSG 与 OSGEarth 开发的相关技术博客索引osgViewer::Viewer和osgViewer::CompositeViewerhttps://blog.csdn.net/L_Andy/article/details/107418324:向用户说明应该使用哪个Viewer

2020-07-30 15:56:49 424

原创 哑变量与逻辑回归

哑变量与逻辑回归数据部分数据:admit,gre,gpa,rank0,380,3.61,31,660,3.67,31,800,4,11,640,3.19,40,520,2.93,41,760,3,21,560,2.98,10,400,3.08,21,540,3.39,30,700,3.92,20,800,4,40,440,3.22,11,760,4,10,700,3.08,21,700,4,1导入库numpy: Python的语言扩展,定义了数字的数组和矩阵

2020-07-29 19:34:06 2925 2

原创 pandas DataFrame操作(2)

pandas DataFrame操作(2)1. 读取csv格式数据pd.DataFrame.from_csv(“csv_file”)或pd.read_csv(“csv_file”)2. 读取 Excel 数据集pd.read_excel("excel_file")3. 将 DataFrame 直接写入 CSV 文件如下采用逗号作为分隔符,且不带索引:df.to_csv("data.csv", sep=",", index=False)4. 基本的数据集特征信息df.info

2020-07-29 19:15:35 219

原创 pandas DataFrame操作(1)

pandas DataFrame操作(1)导入库import pandas as pdimport numpy as np构建DataFrametuples = [('a', 'v1'), ('a', 'v2'), ('b', 'v1'), ('b', 'v2')]index = pd.MultiIndex.from_tuples(tuples)columns = ['c1', 'c2']values = np.arange(8).reshape(4, 2)df = pd.DataFra

2020-07-29 19:12:27 245

原创 numpy和pandas的一些函数和方法

numpy和pandas的一些函数和方法导入库:import numpy as npimport pandas as pd1. 读取csv或xlsx数据,生成DataFrame数据格式代码:f = open(r'data/example_data_1/stormofswords.csv')df = pd.read_csv(f)2. np.union1d求数组并集,返回一个list格式数据代码: test = np.union1d([-1, 0, 1], [-2, 0, 2])

2020-07-29 19:09:41 246

原创 lamba函数的使用

lamba函数的使用匿名函数lambda的用法Python中,lambda函数也叫匿名函数,及即没有具体名称的函数,它允许快速定义单行函数,类似于C语言的宏,可以用在任何需要函数的地方。这区别于def定义的函数。lambda与def的区别:def创建的方法是有名称的,而lambda没有。lambda会返回一个函数对象,但这个对象不会赋给一个标识符,而def则会把函数对象赋值给一个变量(函数名)。lambda只是一个表达式,而def则是一个语句。lambda表达式” : “后面,只能有一个表达

2020-07-29 19:07:42 675

原创 使用matplotlib绘制图表

使用matplotlib绘制图表绘制误差折线图下图绘制的误差折现图可以定义上下误差说明:%matplotlib inline 加上这句话之后,可以在jupyter notebook上把绘制的图显示出来,否则只能得到一个内存地址绘制出来的图表保存示例:plt.savefig(‘D:/test.png’)plt.errorbar()函数:plt.errorbar( x, # x坐标 y, # y坐标 yerr=None, # 数据误差范围 xerr=None,

2020-07-29 19:05:08 832

原创 二维表排序

二维列表排序方法1 使用 lambda 关键词辅助对二维列表进行排序# 假设有一个学生列表存储了学号,姓名,年龄信息:students = [[3, 'Jack', 12], [2, 'Rose', 13], [1, 'Tom', 10], [5, 'Sam', 12], [4, 'Joy', 8]]# 按学号顺序排序:students_processed = sorted(students, key=(lambda x: x[0]))print(students_pr

2020-07-29 18:59:42 958

原创 10-使用pipeline和不使用pipeline来分别实现推荐系统 pyspark

首先不使用pipeline实现模型的训练from pyspark.mllib.recommendation import Rating # Rating模块from pyspark.mllib.recommendation import ALS # ALS模块# 读取文件 u.data# 数据字段分别为:用户id,项目id,评分,日期,并以\t作为分隔符data_path = '../测试数据/spark/ml-100k/u.data'raw_user_data = sc.text

2020-07-29 18:49:51 433

原创 09-独立程序求学生的平均成绩

问题:编写独立应用程序实现求平均值问题 每个输入文件表示班级学生某个学科的成绩,每行内容由两个字段组成,第一个是学生名字,第二个是学生的成绩;编写Spark独立应用程序求出所有学生的平均成绩,并输出到一个新文件中。下面是输入文件和输出文件的一个样例,供参考。Algorithm成绩:小明 92小红 87小新 82小丽 90Database成绩:小明 95小红 81小新 89小丽 85Python成绩:小明 82小红 83小新 94小丽 91平均成绩如下: (小红,83

2020-07-29 18:45:59 4472

原创 08-案例:学生与课程统计

1. 数据下面这种数据结构,节选了几条数据:Aaron,OperatingSystem,100Aaron,Python,50Aaron,ComputerNetwork,30Aaron,Software,94Abbott,DataBase,18Abbott,Python,82Abbott,ComputerNetwork,76Abel,Algorithm,30Abel,DataStructure,38Abel,OperatingSystem,38Abel,ComputerNetwork,

2020-07-29 18:42:38 1041

原创 07-案例:销售图书

题目:给定一组键值对(“spark”, 2)(“hadoop”, 6)(“hadoop”, 4)(“spark”, 6),键值对的key表示图书名称,value表示某天的图书销量,请计算每个键对应的平均值,也就是计算每种图书的每天平均销量下面利用scala实现:环境是在jupyter notebook中的运行,使用scala语法:命令1:val rdd = sc.parallelize(Array(("spark", 2), ("hadoop", 6), ("hadoop", 4), ("spar

2020-07-29 18:31:20 286

原创 06-推荐引擎

在docker中安装numpy命令:apk add py3-numpy更改pyspark的python版本,根据02的描述其他人提供的一种方法:1.docker exec -it spark-master /bin/sh2.echo http://mirrors.aliyun.com/alpine/v3.7/main/ >> /etc/apk/repositories #配置阿里镜像源3.apk update

2020-07-29 18:26:23 183 4

原创 05-特征抽取:TF-IDF-pyspark实现

from pyspark.ml.feature import HashingTF, IDF, Tokenizerfrom pyspark.sql import SparkSessionspark = SparkSession.builder.master("local").appName("Word Count333").getOrCreate()sentenceData = spark.createDataFrame([ (1, "I heard about Spark and I lov

2020-07-29 18:24:04 469

原创 03-更改pyspark的python版本

把pyspark的python解释器更改为python3找到文件 spark-env.sh.template:docker exec -it spark-master bashcd spark/conf 注:我的spark文件都放在docker中,所以命令对docker进行的操作创建文件命令:touch x.txt删除文件命令:rm x.txt对spark-env.sh.template操作复制并重命名文件cp spark-env.sh.template spark-env.sh

2020-07-29 18:15:36 1175

原创 03-Spark MLib

构建一个机器学习流水线:以逻辑斯蒂回归为例查找出所有包含“spark”的句子,即将包含spark的句子的标签设为1,没有spark的句子标签设备0下面是完整代码,之后分步骤对代码进行解析1. 需要使用SparkSession对象Spark2.0以上的pyspark在启动时会自动创建一个名为spark的SparkSession对象当需要手工创建时,SparkSession可以由其伴生对象的builder()方法创建出来// python代码from pyspark.sql import Spar

2020-07-29 17:35:02 344

原创 02- RDD编程基础

RDD创建从文件系统中加载数据创建RDDspark采用**textFile()**方法来从文件系统中加载数据创建RDD该方法吧文件的URI作为参数,这个URI可以是:本地文件系统的地址或者是分布式文件系统HDFS的地址或者是Amazon S3的地址等等(1)从本地文件系统加载数据创建RDD例如scala代码:注意是3条斜杠scala> val lines = sc.textFile("E:///1-研究生/01-课程/大数据分析应用与实践/运行代码的测试文件/textFile.t

2020-07-29 17:28:14 523

原创 01-启动spark shell

启动spark shellSpark 和 Hadoop的交互Spark部署模式包括:Local 模式:单机模式Standlone模式:使用Spark自带的简单集群管理器YARN 模式:使用YARN作为集群管理器Mesos 模式:使用Mesos作为集群管理器启动spark shell在SPAEK-SHELL中运行代码Spark Shell提供了简单的方式来学习Spark APISpark Shell 可以以实时、交互的方式来分析数据Spark Shell 支持Scala和Pytho

2020-07-29 17:19:02 1254

原创 5. 数据可视化的流程与框架

本文是对浙江大学的陈为老师所讲授的可视化导论课程的笔记。数据可视化基础(上)1. 可视化基本流程1. 可视化基本流程数据可视化,就是用图形化的手段,处理数据,并发现数据中潜在的模式。...

2019-10-12 09:48:45 4712

原创 BeautifulSoup库的学习(2):BeautifulSoup库的基本元素

BeautifulSoup库的基本元素1. BeautifulSoup库的理解2. BeautifulSoup库的解析器3. Beautiful Soup类的基本元素4. 使用代码获取HTML基本元素1. BeautifulSoup库的理解BeautifulSoup库是解析、遍历、维护“标签树”的功能库。BeautifulSoup库的引用BeautifulSoup库,也叫beautif...

2019-10-08 20:58:34 573

原创 BeautifulSoup库的学习(1):库安装与简单使用

BeautifulSoup库学习1. BeautifulSoup的安装2. 获取网页源代码3. 简单使用BeautifulSoup库1. BeautifulSoup的安装BeautifulSoup库一般用来解析网页。安装方法:打开cmd控制台,输入pip install beautifulsoup4BeautifulSoup库的安装测试打开pycharm(我使用的python编译...

2019-10-08 20:19:26 207

原创 案例5:IP地址归属地的自动查询

IP地址查询网站:http://ip138.com查询的url接口是:http://m.ip138.com/ip.sap?ip=ipaddress实现代码:import requestsurl = 'http://m.ip138.com/ip.asp?ip='try: r = requests.get(url + '202.204.80.112') # 增加查询的IP r...

2019-10-08 19:56:14 1274 3

原创 案例4:网络图片的爬取和存储

爬取网上的图片文本使用的图片链接:http://s1.bdstatic.com/r/www/cache/mid/static/xueshu/img/logo_4b1971d.gifimport requestsimport osif __name__ == "__main__": # 爬取的全代码 root = 'D://picutre//' # 设置根目录 ...

2019-10-08 19:50:46 520

原创 案例3:百度/360搜索关键词提交

百度的关键词接口: http://www.baidu.com/s?wd=keyword360的关键词接口: http://www.so.com/s?q=keywordimport requestsif __name__ == "__main__": # 全代码:爬取百度 keyword = 'Python' try: kv = {'wd':...

2019-10-08 19:45:28 499

原创 案例2:亚马逊商品页面的爬取

本节使用Requests库对亚马逊商品的某一个页面进行爬取。爬取代码如下:import requestsif __name__ == "__main__": url = 'https://www.amazon.cn/gp/product/B01M8L5Z3Y' try: # 由于网页会察觉到因为python爬虫的原因而无法访问,使用下面代码更改头信息,模拟一个浏览器...

2019-10-08 11:24:48 2156

原创 案例1:京东商品页面的爬取

本节使用Requests库对京东商品的某一个页面进行爬取。目标网址链接:https://item.jd.com/100002795959.htmlimport requestsif __name__ == "__main__": # 下面是是爬取京东商品页面的全部代码 url = 'https://item.jd.com/100002795959.html' # P30手机...

2019-10-08 11:19:27 3436

原创 Robots协议

Robots协议1. Robots协议基础2.Robots协议的遵守方式1. Robots协议基础Robots协议,即Robots Exclusion Standard 网络爬虫排除协议。作用:网站告知网络爬虫哪些页面可以爬取,哪些不能爬取形式:在网站根目录下的robots.txt文件例:京东的Robots协议http://www.jd.com/robots.txt可以看到京东对爬虫...

2019-10-08 11:11:54 1310

原创 2. 视觉感知和认知

本文是对浙江大学的陈为老师所讲授的可视化导论课程的笔记。1. 视觉感知与认知感知:指客观事物通过人的感觉器官在人脑中形成的直接反映。视觉感知:看到的输入信号的本质。认知:指人们获得知识或应用知识的过程,或信息加工的过程。记忆在人类认知过程中起着至关重要的作用,但工作记忆容量非常有限。可视化可以作为外部辅助来增强工作记忆。感知系统基于相对判断,而非绝对判断。使用相同的参照物或者相互对...

2019-10-07 23:36:37 7993

原创 Requests库学习(3):Requestests库主要方法解析

1. 主要方法requests.request(method, url, **kwargs)method:请求方式,对应get/put/post等七种url:拟获取页面的url链接** kwargs:控制访问的参数,共13个注:以下两个语句作用完全相同# 1:r = requests.request('GET', 'http://www.baidu.com')# 2:r =...

2019-10-07 16:48:40 217

原创 Requests库学习(2):爬取页面的通用代码框架

网络连接有风险,异常处理很重要1. 理解Requests库的异常异常说明requests.ConnectionError网络连接错误异常,如DNS查询失败,拒绝连接等requests.HTTPErrorHTTP错误异常requests.URLRequiredURL缺失requests.TooManyRedirects超过最大重定向次数,产生重定向异...

2019-10-07 16:01:10 252

原创 Requests库学习(1):Requests库基础

the website is APIRequests:自动爬取HTML页面,自动网络提交请求1. Requests库的安装打开控制台,输入:pip install requests更多安装库的方法可见请求库的安装:https://blog.csdn.net/yu1069153913/article/details/1021593542. Requests库的主要方法Request...

2019-10-07 15:49:14 325

原创 3. 可视化深入理解与掌握

本文是对浙江大学的陈为老师所讲授的可视化导论课程的笔记。本节对可视化的三个分支(信息可视化,科学可视化,可视分析学)进行深入理解(主要内容,实用工具)。科学可视化呈现实测或仿真的科学数据中的特征、模式和演化规律。科学可视化主要可分为3类: 标量场可视化 向量场可视化 张量场可视化标量场数据来源扫描或测量设备计算机或机器仿真标量:一阶张量向量:二阶张量信...

2019-10-06 13:50:39 593

原创 1. 可视化的前世今生

本文是对浙江大学的陈为老师所讲授的可视化导论课程的笔记。16世纪:可视化萌芽可视化于16世纪萌芽,并被广泛应用于地图,科学与工程制图,统计图表等应用。图1:第一幅交通图——罗马交通图17世纪:物理测量17世纪产生了基于真实测量数据的可视化方法。制图学被迅速完善和发展。图2:第一幅太阳黑子变化图(1626年)图3:第一幅天气图(1686年)18世界:图形符号18世纪进入统计...

2019-10-06 13:19:17 2200

原创 2.4 会话和Coolies

在浏览网站的过程中,有些页面需要登录才能访问,而且登录之后可以连续访问很多次网站。但是有时候过一段时间就需要重新登录。这些都设计会话(Session)和Cookies的相关知识。2.4.1静态页面和动态页面1. 静态页面一个HTML代码实例:<!DOCTYPE html><html lang="en"><head> <meta cha...

2019-10-05 19:32:19 121

原创 2.3 爬虫的基本原理

2.3.1 爬虫概述爬虫就是获取网页并提取和保存信息的自动化程序一般有4个步骤:获取网页提起信息保存数据自动化程序1. 获取网页获取网页就是获取网页的源代码。源代码里面包含了网页的部分有用信息,只要把源代码获取下来,就能从中提取有用信息。Python提供了许多库来帮助我们实现这个功能,如urllib,requests等。2. 提取信息最常用的方法是采用正则表达式进行提取...

2019-10-05 19:26:28 153

原创 2.2 网页基础

2.2.1 网页的组成网页可以分为3个部分:HTMLCSSJavaScript1. HTMLTML是用来描述网页的一种语言,全称:Hyper Text Markup Language,即超文本标记语言。不同类型的元素通过不同类型的标签来表示,如图片用img标签表示,视频用video标签表示,段落用p表示,它们之间的布局通过布局标签div嵌套组合而成。2. CSSCSS,全称 ...

2019-10-05 19:21:56 162

原创 2.1 HTTP基本原理

2.1.1 URI 和 URLURI : 统一资源标志符(Uniform Resource Identifier)URL : 统一资源定位符(Uneverial Resource Locator)例: https://github.com/favicon.ico 是 GitHub 的网站图标链接,它是一个URL,也是一个URI。URL 是 URI 的子集,也就是说每个URL都是URI,但不...

2019-10-05 19:14:54 418

osgEarth用户手册.pdf

osgEarth用户手册,共享给大家 内容包括:1. osgEarth的安装;2. 建立地图;3. .Earth文件索引;4. Driver驱动;5. 处理数据源;6. Caching缓存;7. osgEarth开发指南(版本2.x);8. Geospatial Data Sources 地理空间数据源;9.

2020-07-31

osgQt的三个类.rar

根据https://github.com/yuqwert/osgQt/tree/topic/Qt4,自建了osgQt中的三个类,包括GraphicsWindowQt,QGraphicsViewAdapter,和QWidgetImage,有.h文件和.cpp文件,使用的时候直接复制到项目里面然后添加即可。这种方法不需要再编译osgQt运行库,大大提高开发效率,详细的步骤可见我的博文https://blog.csdn.net/yu1069153913/article/details/107588965

2020-07-31

美国2010-2015年人口普查数据

压缩文件夹中包含了美国2010-2015年人口普查数据,可用于大数据分析,或者用于hadoop测试

2018-12-24

一元稀疏多项式计算器

使用MFC可视化界面,自定义一个类存储多项式的系数和指数,利用链表动态存储多项式的每一项,可对多项式进行加减

2018-03-23

控制台 生成链表

使用链表; 编写自定义链表存储目标 ;设计存储学生基本信息机构体;实现用链表形式对多名学生信息的存储和访问;以控制台输出练习结果

2017-12-14

MFC 基于单文档 地图投影绘制

基于单文档的MFC编程 包括:墨卡托投影,等角圆锥投影,圆柱投影 可利用对话框设置参数,在视图中绘制投影;鼠标点击获得每一个投影点的变形;可输出每一个交点的投影坐标到文件

2017-12-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除