自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

开着房车去大理的数字游民

博主多年算法实战经验,致力于人工智能,机器学习,深度学习,数据挖掘,强化学习领域

  • 博客(20)
  • 资源 (17)
  • 收藏
  • 关注

原创 使用大模型做网络热点挖掘思路

使用大型机器学习模型进行网络热点挖掘是一项复杂的任务,涉及到数据收集、预处理、特征提取、模型训练和结果分析等多个步骤。使用大模型进行网络热点挖掘是一个动态的过程,需要不断地根据新的数据和反馈来调整和优化模型。此外,由于网络热点的多变性,模型的泛化能力和适应性尤为重要。:首先明确什么是“网络热点”。热点可以是当前流行的讨论话题、广泛传播的新闻事件、社交媒体上的热门标签等。

2024-04-23 14:58:19 276

原创 深度解析:基于隐马尔科夫模型的语音转文字技术

语音识别,即自动语音转文字(Automatic Speech Recognition, ASR),是指将人类的语音信号转换为书面文本的过程。这涉及到对语音信号的自动分析和解释,以识别个体语音单元,即音素或单词。基于HMM的语音识别系统设计是一个复杂但充满挑战的过程。通过精心设计和优化,这样的系统能够在多种应用场景中提供准确的语音识别能力。HMM在语音转文字技术中发挥了重要作用,尤其是在声学模型的构建和解码过程中。然而,随着技术的发展,深度学习方法正在推动语音识别技术的进步。

2024-04-19 09:12:22 1099

原创 OneFlow深度学习框架:引领未来的通用深度学习框架

OneFlow是由一流科技有限公司开发的开源深度学习框架,旨在提供一种全新的架构设计,以解决现有框架在分布式训练、大模型处理和运行时效率方面的挑战【1】【2】。OneFlow的核心设计理念是性能和分布式扩展性,它通过静态编译和流式并行的架构,实现了高效的分布式训练和模型并行【1】。OneFlow深度学习框架以其独特的设计理念、卓越的性能和易用性,正在成为深度学习领域的重要力量。无论是在学术研究还是工业应用中,OneFlow都展现出了其强大的潜力和广阔的前景。

2024-04-10 15:18:09 692

原创 下载b站视频的7种办法总结,亲测

以上六种方法各有千秋,您可以根据个人需求和使用习惯选择最合适的下载方式。无论是使用在线解析网站、下载软件、浏览器插件,还是通过技术手段提取视频文件,都需要注意版权问题,确保合法合规地使用下载的内容。同时,也要注意保护个人隐私和计算机安全,避免下载不明来源的软件或插件。在选择下载工具时,考虑到其易用性、功能丰富度以及安全性,选择最适合自己的方法,享受B站带来的丰富视频资源。

2024-04-09 15:53:37 1935

原创 最简单的Stable Diffusion 本地部署教程

通过本文的教程,你应该已经成功完成了Stable Diffusion的本地部署。在使用过程中,可能会遇到一些问题和挑战,但请不要灰心。多参考官方文档、社区论坛等资源,积极寻求帮助和支持。展望未来,Stable Diffusion将在图像生成、修复、风格迁移等领域发挥越来越重要的作用。随着技术的不断发展和优化,我们相信Stable Diffusion将会为我们带来更多惊喜和可能性。让我们一起期待并探索Stable Diffusion的更多应用场景吧!请注意,这个教程是基于当前可用的资源和信息编写的。

2024-04-08 13:34:01 646

原创 文本转语音常用的几个python库

在Python编程领域,文本到语音(Text-to-Speech, TTS)的转换是一个常见的需求,尤其是在开发能够与用户交互的应用程序时。以下是几个流行的Python库,它们可以帮助开发者实现文本到语音的转换,并且有的可以将转换后的语音保存为MP3文件。

2024-04-08 13:24:15 792 1

原创 深度学习入门指南

深度学习是人工智能领域的一个子领域,它通过模拟人脑神经网络的工作方式,使计算机能够从大量数据中学习和提取特征,进而进行预测和决策。通过本指南的学习,您可以掌握深度学习的基本原理和实践方法,为进一步深入学习和研究打下坚实的基础。3. Keras:Keras是一个高级神经网络API,它可以运行在TensorFlow、CNTK或Theano之上,提供了简洁的接口来快速构建和训练模型。3. 优化器:熟悉常用的优化器,如SGD、Adam等,了解它们的优缺点和适用场景。- 计算机视觉:图像分类、目标检测、人脸识别等。

2024-03-29 18:08:49 224

原创 语言模型的原理、实战与评估

评估语言模型的性能需要综合考虑其在不同任务中的表现,常用的评估指标包括准确率、交叉熵、BLEU分数和ROUGE分数等。语言模型的核心思想是概率分布。具体来说,对于一个给定的词语序列 \( w_1, w_2, \ldots, w_n \),语言模型计算其出现的联合概率 \( P(w_1, w_2, \ldots, w_n) \)。例如,在聊天机器人中,语言模型可以帮助机器人理解用户的意图,并生成相应的回复。在生成过程中,模型根据给定的上下文和已学到的语言规则,逐步生成下一个词语,直到生成完整的文本。

2024-03-29 18:06:43 233

原创 机器学习概念、步骤、分类和实践

无监督学习:无监督学习涉及到没有标签的数据,模型需要自行发现数据中的模式和结构。- 监督学习:在监督学习中,模型通过已知的输入和输出数据进行训练,以便预测未知的输出。5. 模型评估:使用测试数据集对训练好的模型进行评估,以检验模型的预测性能。在实践机器学习时,需要考虑数据的质量、特征的选择、模型的复杂性、过拟合和欠拟合问题以及模型的可解释性等因素。训练过程中,模型会学习数据的特征和规律,以便在未来的预测中做出准确的判断。机器学习的基本步骤包括数据预处理、特征提取、模型选择、模型训练和模型评估。

2024-03-29 18:03:11 332

原创 AI程序员:码农将会失业

总的来说,AI程序员的兴起是编程领域的一场革命。通过与AI的合作,人类程序员可以发挥自己的优势,创造出更加智能、高效和有创意的软件产品。在这个新时代,我们期待看到人类程序员与AI程序员共同推动编程领域的发展,为人类创造更加美好的未来。其次,他们需要培养自己的创新思维和解决问题的能力,以便在复杂的业务场景中提供更具创意的解决方案。然而,我们应该认识到,AI程序员更多地是作为人类程序员的助手和补充存在,而不是替代他们。在处理复杂的业务逻辑、设计创新的用户界面或编写具有艺术性的代码时,人类程序员的优势尤为突出。

2024-03-29 17:17:52 191

原创 AI大模型学习:超越技术壁垒的深度融合

这些模型,如GPT-3、BERT等,凭借其强大的自然语言处理能力,正在重塑我们与信息的互动方式,改变着从搜索引擎优化到内容创作的方方面面。然而,要想充分发挥这些大模型的潜力,研究者不仅需要具备深厚的数学基础和编程能力,还需要对特定领域的业务场景有深入的了解。要想充分发挥这些大模型的潜力,研究者不仅需要具备深厚的数学基础和编程能力,还需要对特定领域的业务场景有深入的了解。此外,研究者还需要关注模型的可解释性,以便更好地理解模型的决策过程,并确保其在实际应用中的可靠性。五、实践案例:AI大模型的成功应用。

2024-03-29 17:13:11 406

原创 35岁程序员大限将至:跨越技术与年龄的鸿沟

未来,随着技术的不断发展和市场需求的不断变化,程序员的职业前景将更加广阔。因此,35岁的程序员应该珍惜自己的优势和经验,不断提升自己的能力和价值,迎接未来的挑战和机遇。尽管35岁的程序员可能不再拥有年轻时的体力和快速学习能力,但他们拥有丰富的经验和深厚的技术积累,这是年轻程序员无法比拟的宝贵财富。那么,35岁的程序员真的面临着职业生涯的分水岭吗?1. 持续学习:技术领域的更新换代速度非常快,为了保持竞争力,35岁的程序员必须保持持续学习的态度。同时,学会调节自己的情绪和压力,保持积极的心态和乐观的态度。

2024-03-29 17:06:32 403

原创 Hive UDF开发流程到调用

Hive UDF开发流程

2024-03-29 16:17:34 199

原创 机器学习模型保存为PMML格式

PMML模型文件可以实现跨平台迁移,python和java都可以生成PMML文件,python和java都可以读取PMML文件

2024-03-25 13:17:47 1115

原创 梯度&散度&旋度&峰度&偏度你分得清楚吗?驻点&鞍点你分得清楚吗?曲率&斜率你分得清楚吗?

本文介绍了四种常见的物理量:加速度,速度,位移和力学功。详细介绍了它们的定义、计算以及在物理学和工程学领域中的应用。此外,本文还介绍了四种与物理量相关的概念:向量、标量、质量和密度。数学,物理,机器学习领域常见概念区分

2024-03-18 12:50:39 1079

原创 基于分布式平台的机器学习模型训练以及上线部署方案总结

于分布式平台的机器学习模型训练以及上线部署方案总结

2024-03-17 11:31:11 451

原创 一种可分批训练的聚类方法

本文介绍了如何将大数据集划分成若干子集,并对每个子集进行聚类分析。为了确保聚类结果的准确性,需要保证每个子集的数据分布相似。文章提出了一种称为“K-均值距离法”的聚类算法,能够有效地解决数据分布不均匀的问题。本篇文章主要介绍了如何将大数据集划分成若干子集,并对每个子集进行聚类分析。在进行子集划分时,需要保证每个子集的数据分布相似,以保证聚类结果的准确性。文章介绍了一种称为“K-均值距离法”的聚类算法,可以有效地解决数据分布不均匀的问题。

2024-03-16 11:31:03 867

原创 可视化JSON数据工具推荐:JSON Viewer Pro和JSONGrid

本文介绍了两款可视化JSON数据的工具:JSON Viewer Pro和JSONGrid。它们都提供了丰富的功能和用户友好的界面,使用户能够更轻松地理解和处理JSON格式的数据。这些功能包括查看和分析、编辑和修改、格式化和美化、折叠和展开、高亮和搜索、排序和过滤、导入和导出等。这些工具对于开发人员、数据分析师和任何需要处理JSON的人都非常实用。

2024-03-15 10:33:20 1526

转载 ActivityManager

ActivityManager        与系统中所有的Activity进行交互的类。官网一句话解释了这个东西,但是有点随意了。ActivityManager的作用很多,我们通过它获得内存信息,进程信息,还可以终止某个进程。当然啦,只能终止用户的进程,系统的进程是杀死不了的。下面我通过实例,一步一步学习它的具体作用,我也是刚学,不能从宏观的角度给大家解释清楚它的具体作用。希望通

2015-04-24 17:18:40 373

转载 Java调用shell脚本并获得结果

`/** * 运行shell脚本 * @param shell 需要运行的shell脚本 */ public static void execShell(String shell){ try { Runtime rt = Runtime.getRuntime(); rt.ex

2015-04-24 16:39:37 595

机器学习领域,聚类算法,kmeans自动计算gap,自动确定k值

机器学习领域涉及多种算法,其中聚类算法是一个重要分支,常见的聚类算法有kmeans,虽然原理简单,简单易用,但通常需要事先确定K值,k值选取与具体数据和业务场景紧密相关,一旦k值选取不合理会导致模型效果出现明显问题,一般k值确定通过在不同k值下多次聚类对比选取出最优k值,但对于计算量有巨大挑战,尤其是当数据量非常大的时候每次聚类花费的时间也很长,另一种常见方式是基于专家经验事前设置k值,但这种方式受限于人工知识,有可能人工知识给算法引入误导,本资源通过算法层面不依赖于人工经验,可以结合具体数据样本实际情况,计算聚类gap评价指标,通过指标变化曲率定位到最优k值,直接输出最优k值,解决了kmeans算法k值选取难的问题,实验验证该方式选区的k值能够表征业务场景实际意义,符合物理世界聚类描述,极大提高了聚类效果,减少了选取k值的人工成本和时间成本 语言:python 算法:kmaens 平台:windows 涉及的库:scipy,sklearn 适用人群:机器学习,数据挖掘,数据分析相关的聚类问题和实践

2024-03-29

Java语言基于eclipse导入隐马尔可夫模型教程

一般做机器学习使用python语言,那么在某些场景下需要使用Java语言,该资源是基于java语言的指导教程,算法是HMM(隐马尔科夫模型),隐马尔科夫模型不同于传统机器学习算法,其诞生更早,在深度学习和传统机器学习出现之前隐马尔科夫模型在机器学习领域占了大半江山,包括天气预测,模式识别,语音识别,文本翻译,异常检测等领域,现如今虽然出现了深度学习,但了解和学习隐马尔科夫模型依然具有深远意义,我们可以将其与现阶段深度学习相结合做更多的应用,也可以借助其巧妙原理优化和改进当前大热的深度学习算法,甚至可以与大数据,人工智能相结合发挥更大能力。 适用范围:该资源是一份基于java语言使用eclipse平台对隐马尔可夫算法的导入和封装,方便非算法专业的java开发人员快速学习隐马尔可夫模型,也可以作为算法专业人员将隐马尔科夫模型应用于Java环境下的工程落地实践。 平台:pc windows;eclipse 语言:java 算法:HMM 欢迎交流学习,有疑问可以私信我!

2024-03-18

windows虚拟环境环境安装pytorch教程,包含虚拟机安装+pytorch安装全流程

做深度学习或人工智能开发可以使用tensorflow或者pytorch,由于pytorch面向流式编程,对于初学者更加友好,该资源是一份面向初学者的pytorch环境搭建教程,从安装windows虚拟机开始到pytorch安装全流程介绍,图文并茂,读者只需要跟随教程图文描述的步骤一步一步操作即可快速搭建windows虚拟环境下的pytorch开发环境 适用人群:深度学习或人工智能初学者,有搭建pytorch环境的需求 平台:PC,windows,pytorch 资源特点:基于Windows虚拟机上的pytorch搭建教程 编程语言:python 特殊说明:由于虚拟机软件和pytorch更新迭代很快,教程文档的核心步骤是确定的,如果与最新官方步骤有差异请按照最新指导来操作,资源也会不断更新,有疑问可以即使留言咨询,乐于给初学者解疑答惑,欢迎一起交流!

2024-03-18

Notepad++8.5安装包

notepad++安装包,notepad++软件相信对于软件开发人员来说并不陌生,其界面简约功能强大,依托插件市场可以满足用户99%的文本及代码编辑工作,对于不同编程语言学习和编辑工作提供便利,但由于多数电脑管家和应用市场并不提供安装包下载,官网下载缓慢等问题,该资源提供notepad++安装包下载,方便自行取用,资源进攻学习交流,请勿用于其他商业活动。 适用人群:代码开发人员,文本编辑人员 支持语言:C,C++,shell,java,python,js,sql,json等大部分编程语言和脚本格式 特殊功能:按语言类型高亮关键字,格式化代码,关联解释器执行代码,快速对比文本差异等; 版本:8.5 平台:PC,windows

2024-03-18

python脚本实现将英文翻译成中文

通常我们对英文文本进行翻译需要借助软件或者翻译api,但前者使用不够灵活,后者需要付费,且对于访问次数和流量有限制,本人尝试了谷歌,百度,腾讯,有道翻译api之后,发现除了访问资费比较贵之外其实翻译的质量也是参差不齐,于是该脚本使用了谷歌翻译的python库,实现免费的,高质量的,不限制访问频次的,免注册的快速翻译,可以嵌入到自己的代码中将英文文本翻译成中文。 适用人群:有翻译需求的,没有经费预算的,对翻译时效要求较高的 请勿用于商业活动,以免造成开源库丧失访问功能 环境:python

2024-03-17

爬虫和网络安全领域+对网络漏洞CVE描述信息进行爬虫+获得关键字段+用于做网络安全方面防护研究方面的数据分析及算法研发作用

该脚本是本人自主开发,实现对网络漏洞CVE数据进行爬取,主要涉及爬虫和网络访问功能,实现对CVE网络漏洞描述的关键字段进行获取,包含CVE编号,危害等级,漏洞类型,供应商,型号,设备类型,固件版本号等信息。爬取数据均来自于开放数据平台,实现自动翻页及关键字位置自动定位功能,主要用于网络安全防护方面的数据分析,算法开发及CVE漏洞描述信息整合梳理。脚本可以根据具体需求新增或删减关键字段,爬虫结果将以表格形式存储,脚本代码以python实现,爬虫过程中时间跨度可以自行设置,最早可以到1999年,支持断点续传,不涉及登录账号密码。 实用人群:从事网络防护或漏洞分析人员或学生,帮助其从整合规范化表格数据,用于后续数据分析或算法开发流程,解决了网络防护领域数据量少获取难度高等问题。 技术栈:python 核心库:requests,BeautifulSoup 核心功能点:跨页爬虫,动态获取页面结构,时间跨度可自定义设置,CVE漏洞描述信息关键字提取

2024-03-16

神经网络与深度学习中文版

国外完备的深度学习用书,新鲜出炉的中文版,是神经网络,深度学习入门最佳配备

2018-02-06

深度学习 21天实战Caffe

最火爆caffe框架实践教程,手把手完美示范各种神经网络搭建过程

2018-02-06

机器学习实践指南:案例应用解析(第二版)

通过详尽案例从理论上到实践完美阐述机器学习实践过程

2018-02-06

Python机器学习(预测分析核心算法)

通过完善例子从理论到实践介绍在机器学习领域怎样预测

2018-02-06

机器学习系统设计[美]willi[译]刘峰

本书在机器学习算法的原理之上,更深入一步去讲机器学习系统的设计流程,怎样让机器学习落地去解决实际问题是本书的特点

2017-12-23

数据挖掘 实用案例分析 [张良均著][机械工业出版社]

数据挖掘 实用案例分析 [张良均著][机械工业出版社],适合数据挖掘初学者入门教材

2017-12-23

干净的数据(数据清洗入门与实践)[澳]Robert

本书主要针对从事机器学习领域,尤其是从事数据挖掘领域的专业人才使用,本书把数据挖掘的特征工程专门拿出来详细介绍,全书是对特征工程的完尽阐述

2017-12-23

深度学习(出版社内部原版电子稿)

从机器学习出发,详细介绍了算法原理和推导,介绍了主流的神经网络原理和实现细节,介绍了人工智能领域的具体方案实施和应用

2017-12-23

人工智能(AI)程序设计(面向对象实现)(原版电子稿)

本书对人工智能领域涉及到的算法进行系统深入讲解吗,阐述在程序设计层面的面向对象的思想提现,适合高校专业领域人才学习参考使用

2017-12-23

机器学习实践(扫描版)

本书是机器学习及数据挖掘领域入门丛书,深受读者喜爱,适合初学者入门使用,本书是纸质版扫描,需要原版电子稿可以在资源上传者主页下载原版电子稿

2017-12-23

Python数据分析与挖掘实战

10余位数据挖掘领域资深专家和科研人员,10余年大数据挖掘咨询与实施经验结晶。从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。, 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。, 基础篇(第1~5章),第1章的主要内容是数据挖掘概述;第2章对本书所用到的数据挖掘建模工具Python语言进行了简明扼要的说明;第3章、第4章、第5章对数据挖掘的建模过程,包括数据探索、数据预处理及挖掘建模的常用算法与原理进行了介绍。, 实战篇(第6~15章),重点对数据挖掘技术在电力、航空、医疗、互联网、生产制造以及公共服务等行业的应用进行了分析。在案例结构组织上,本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程的关键环节,穿插程序实现代码。最后通过上机实践,加深读者对数据挖掘技术在案例应用中的理解。

2017-11-07

时间序列预测实践教程

该教程通过一个简单的实例浅显的描述了时间序列预测的常用方法。选用的方法是EXCEL的插件XLMiner,简单易上手,是新手入门的好帮手。

2017-11-07

Python数据挖掘入门与实践(高清完整版)

本书使用简单易学且拥有丰富第三方库和良好社区氛围的Python语言,由浅入深,以真实数据作为研究对象,真刀实枪地向读者介绍Python数据挖掘的实现方法。通过本书,读者将迈入数据挖掘的殿堂,透彻理解数据挖掘基础知识,掌握解决数据挖掘实际问题的杰出实践!

2017-11-07

SQL基础教程 第3版 冯宇晖&贾文峰 扫描版 pdf

[SQL基础教程 第3版] 冯宇晖&贾文峰 扫描版 pdf

2014-09-29

电子密码锁

电子密码锁

2014-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除