自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (9)
  • 收藏
  • 关注

原创 自然语言处理(NLP)技术及其案例(代码)

解决方案:使用CNN架构,将文本表示为单词嵌入向量序列,并将其作为CNN的输入。在CNN的每一层中,通过应用多个卷积核并使用ReLU激活函数,提取文本中的有用特征。最后,通过全连接层和softmax激活函数,将CNN的输出映射到多个类别中的概率分布。在CNN的每一层中,通过应用多个卷积核并使用ReLU激活函数,提取文本中的有用特征。文本分类:NLP技术可以将大量文本分类到它们所属的类别中,例如将电子邮件分类为垃圾邮件或非垃圾邮件,将新闻文章分类为体育、商业或政治新闻等。首先,将文本处理成整数序列,并使用。

2023-09-14 16:02:37 1157 1

原创 Apache Spark 的基本概念和在大数据分析中的应用

机器学习:Spark的MLlib提供了常见的机器学习算法,可以用于分类、回归、聚类和协同过滤等任务。数据清洗和转换:通过Spark的RDD或DataFrame API,可以对大规模数据进行清洗和转换,例如去重、过滤、映射和聚合等操作。总之,Apache Spark是大数据分析领域中常用的工具之一,可以快速处理大数据集合,并提供强大的机器学习和图形计算功能。图形处理:通过Spark的GraphX模块,可以进行图形计算和分析,例如社交网络分析、Web图形分析和生物信息学等领域。

2023-09-12 13:57:38 151

原创 聚类算法之K-均值聚类

镇长通过对聚类结果进行分析,发现商业区和餐饮区比较集中,而娱乐区则比较分散,因此他决定在商业区和餐饮区适当扩建和提升设施,以满足居民的需求。假设现在有一个数据集,包含了5个样本点:(1,1), (1,2), (2,2), (8,8), (9,8)。初始化 首先,我们需要随机初始化两个聚类中心,比如我们可以选择(2,2)和(8,8)作为初始聚类中心。k均值聚类是一种常见的聚类方法,其基本思想是将数据集分成k个集群,并使得每个数据点与距离最近的集群中心点的距离最小化。图像处理:可以用于图像分割、图像分类等。

2023-09-08 16:31:45 531 2

原创 Linux介绍

进程和服务:Linux系统中的每个进程都有一个唯一的进程ID(PID),可以使用命令来查看和控制这些进程。编程环境:Linux提供了多种编程环境和工具,如GCC编译器、VI编辑器等,支持各种编程语言,如C、C++、Java等。软件包管理器:Linux系统可以通过软件包管理器来安装、更新和卸载软件包,这些软件包包含了操作系统、库和应用程序等。用户和组:Linux系统可以有多个用户和组,每个用户和组都有不同的权限和访问控制。开源性:Linux是开源的,可以自由使用、修改和分发,有众多开源社区支持和维护。

2023-09-07 16:35:09 37

原创 Docker的基本概念

可移植性和可扩展性:Docker使用标准化的容器格式,可以在任何支持Docker的平台中运行,包括本地电脑、虚拟机、云服务。容器(Container):Docker容器是一个运行镜像的实例,它是一个独立的、隔离的运行环境。微服务架构:Docker可以将复杂的应用程序拆分成多个微服务,每个微服务都运行在一个独立的Docker容器中,实现更灵活、可控的部署和扩展。轻量级和快速部署:Docker容器可以轻松地在不同的环境中部署,消除了应用程序在不同系统中出现的依赖和配置问题。

2023-09-07 16:31:05 245

KG-demo-for-movie-master.zip

知识图谱本体demo简单案例 初学者

2021-09-14

商品爬虫_电商爬虫_商品详情_数据集_1688-spider-master.zip

1688爬虫 阿里巴巴 商品爬虫,商品详情价格、销量、描述等信息,输入商品分类和页数可以爬

2021-09-14

中国科学院_大学_知识图谱课程_课件全集.rar

最新版中国科学院大学知识图谱课程课件全集 包含了知识图谱课件、Neo4j实战 、事件抽取、事件图谱构建等资料,非常有价值哦,速来围观!

2020-07-24

基于知识图谱的推荐系统项目完整代码(附带数据集)

基于知识图谱的推荐系统项目完整代码 数据集在data文件夹下 数据集为txt模式,分为训练集、验证集以及测试集

2020-03-20

(合工大考研四套卷)合肥工业大学数据结构四套及答案.rar

本资源是合肥工业大学数据结构四套卷,其中的题目证实每年出题的方向,做透了这几套卷子考研不愁,请好好利用

2020-02-27

Java-similarity-master.zip

此项目用来对中文文档计算出对应的 simhash 值。 simhash 是谷歌用来进行文本去重的算法,现在广泛应用在文本处理中。计算完成之后,再求海明距离,得到最终的相似度。

2020-01-13

生成对抗网络(GAN)代码+数据集

生成对抗网络(GAN)实例 代码+数据集 很实用的代码,并且简单易学,对深度学习感兴趣的可以看看 数据集有手写图片的识别,也可以替换成自己的数据集

2020-01-07

jieba.NET-master.zip

分词 jieba.NET版本(C#实现) * 支持三种分词模式: - 精确模式,试图将句子最精确地切开,适合文本分析; - 全模式,把句子中所有的可以成词的词语都扫描出来, **速度非常快,但是不能解决歧义。 具体来说,分词过程不会借助于词频查找最大概率路径,亦不会使用HMM; - 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 * 支持繁体分词 * 支持添加自定义词典和自定义词 * MIT 授权协议

2020-01-07

合肥工业大学计算机组成原理讲义

合工大内部ppt讲义,教学,考研都可以借鉴,内容包括考研全部知识点 是考研的珍贵资料!需要的同学快来看看吧

2018-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除