自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 复仇者联盟3的舆情分析

基于时间序列的舆情分析(复仇者联盟3) 摘要随着移动互联网和信息技术的发展,网络产生了形形色色的自媒体平台。以微博、微信为代表的社交软件受到了网民的热烈追捧,由此每天产生着的海量即时信息,描述着社会中正在发生的热点事件,如能即时发现、追踪这些社会热点事件,将有助于实现网络舆情的实时监控,为决策者提供可靠的数据支持。本次作业通过python爬虫爬取微博以及电影评论,针对某一个事件进行舆情分析。  1...

2018-06-06 21:34:52 1160 4

转载 TensorFlow基础教程

转载的,原文地址: https://blog.csdn.net/Toormi/article/details/53609245介绍TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。TensorFlow 最初由Google大脑小组(隶属于Google机器智能研究机构)的研究员和工程师们开发出来,用于机器学习和深度神经网络方面的研究,但这个系统的...

2018-05-26 12:15:57 351

原创 利用决策树对微信公众号文本进行分类

问题背景:公众平台的公众号每天都会发布大量文章,通过群发图文的形式向用户每天推送内容。由于公众号面向的用户群体、专注的领域不同,图文内容也差异很大。一些公众号主要发布时事政治内容,而另外一些公众号主要发布游戏的视频与周边等。识别公众号的内容对公众平台的运营与新场景应用发挥重要作用,其中对公众号文本的挖掘能力是一个基础能力。本次题目选择时尚类公众号的文章,关注化妆个护领域,要求根据给出的文章内容(已...

2018-05-16 23:21:35 2546 2

原创 配置idea的pom.xml文件遇到的问题

今天在配置idea的pom.xml时遇到了一些问题提示我dependency 'org.apache.spark:spark-core_2.1.4:2.1.0 'not found 我就奇怪了,因为我的版本就是spark2.1.0、scala版本就是2.1.4 ,为什么会提示错误呢?我打开了我的spark文件夹,找一下这个jar包,发现版本果然有问题于是把中scala.version改为2.11就...

2018-04-03 15:26:06 3213

原创 搭建完全分布式平台以及在spark下实现K-Means算法时遇到的问题

       上周五终于完成了第一次数据挖掘大作业的答辩,周末又去参加了蓝桥杯,一直没有时间整理遇到的问题,直到今天才闲下来。尽量把遇到的问题都能记录下来,日后便于自己回看。主要分三个部分:Centos7的基本配置、Hadoop+Spark的配置、K-Means算法的实现。一、Centos7的基本配置      1、不能连接上外网解决方法:最便捷的方法是把虚拟机的ip地址改为动态ip,再把连接方式...

2018-04-02 21:10:42 2334 1

原创 蓝桥杯-字母符串

标题:字母组串由 A,B,C 这3个字母就可以组成许多串。比如:"A","AB","ABC","ABA","AACBB" ....现在,小明正在思考一个问题:如果每个字母的个数有限定,能组成多少个已知长度的串呢?他请好朋友来帮忙,很快得到了代码,解决方案超级简单,然而最重要的部分却语焉不详。请仔细分析源码,填写划线部分缺少的内容。#include <stdio.h>// a个

2018-03-31 10:19:51 204

原创 蓝桥杯-最大公子串

标题:最大公共子串最大公共子串长度问题就是:求两个串的所有子串中能够匹配上的最大长度是多少。比如:"abcdkkk" 和 "baabcdadabc",可以找到的最长的公共子串是"abcd",所以最大公共子串长度为4。下面的程序是采用矩阵法进行求解的,这对串的规模不大的情况还是比较有效的解法。请分析该解法的思路,并补全划线部分缺失的代码。#include <stdio.h>#inclu...

2018-03-31 10:15:15 188

原创 2017蓝桥杯 迷宫(DFS)

标题:迷宫X星球的一处迷宫游乐场建在某个小山坡上。它是由10x10相互连通的小房间组成的。房间的地板上写着一个很大的字母。我们假设玩家是面朝上坡的方向站立,则:L表示走到左边的房间,R表示走到右边的房间,U表示走到上坡方向的房间,D表示走到下坡方向的房间。X星球的居民有点懒,不愿意费力思考。他们更喜欢玩运气类的游戏。这个游戏也是如此!开始的时候,直升机把100名玩家放入一个个小房间内。玩家一定要按...

2018-03-29 11:46:18 824

原创 CentOS7+Hapdoop2.8+spark2.1完全分布式平台的搭建经历

写在前面个人心得与经验:1、关于全分布和伪分布的区别:全分布是指在不同物理主机上搭建平台。伪分布是指一台物理主机中有多台虚拟机,这些虚拟机搭建的平台就是伪分布式平台。2、关于平台版本选择:尽量选择成熟的版本,不要太旧也不要选择最新版本的。版本太旧会出现一些异常,可能是它平台本身存在的问题,也可能会出现与现在的一些主流框架不兼容的情况。最新版本的话会在配置文件上有所不同,网上搜到的资料不也是特别多,...

2018-03-29 01:16:06 696

原创 蓝桥杯——基础练习 分解质因数

问题描述  求出区间[a,b]中所有整数的质因数分解。输入格式  输入两个整数a,b。输出格式  每行输出一个数的分解,形如k=a1*a2*a3...(a1<=a2<=a3...,k也是从小到大的)(具体可看样例)样例输入3 10样例输出3=34=2*25=56=2*37=78=2*2*29=3*310=2*5提示  先筛出所有素数,然后再分解。数据规模和约定  2<=a<...

2018-03-08 16:03:49 405

原创 欢迎使用CSDN-markdown编辑器

#include<stdio.h>int main(){ int A[300]; int i=300; for(i=1;i<=300;i++) { scanf("%d",&A[i]); } int key; for(int j=2;j<=300;j++) { key=A[j]; i=j

2017-09-17 15:00:45 250

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除