自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大模型天花板

这个时代名为AGI

  • 博客(447)
  • 资源 (8)
  • 收藏
  • 关注

原创 simpletex的api调用代码

【代码】simpletex的api调用代码。

2024-04-22 23:36:02 103

原创 Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名

【代码】Python实现将文件夹下的所有pdf文件合并成一个pdf文件,并用文件夹名字命名。

2024-04-19 21:59:46 287

原创 Python遍历文件夹(包括子文件夹)下所有zip文件进行解压

【代码】Python遍历文件夹(包括子文件夹)下所有zip文件进行解压。

2024-04-15 21:18:00 141

原创 python递归统计文件夹下pdf文件的数量

【代码】python递归统计文件夹下pdf文件的数量。

2024-04-14 16:43:05 336 1

原创 python调用Microsoft Word把文件夹下所有docx或doc批量转化为PDF

请注意,这个脚本会关闭Word应用程序,但在某些情况下,Word进程可能会留在后台。为了避免这种情况,你可以在转换完成后确保Word进程被完全关闭。此外,由于这个方法依赖于Microsoft Word的COM接口,它只能在安装了Microsoft Word的Windows系统上运行。函数接受一个目录路径作为参数,并遍历该目录中的所有DOC和DOCX文件,将它们转换为PDF文件。首先,确保你的系统上安装了Microsoft Word。库打开Word应用程序,打开指定的Word文档,并将其另存为PDF格式。

2024-04-14 13:27:01 413

原创 计算机常见的六大会议介绍:CVPR/ICCV/ECCV;NeurIPS/ICML/ICLR

CVPR、ICCV和ECCV是计算机视觉领域顶级的三个国际会议,而NeurIPS、ICML和ICLR则是机器学习领域最具影响力的三个国际会议。

2024-04-13 22:34:56 456

原创 Mathpix和Simpletex对比

在不超过 15 的素数中,随机选取 2 个不同的数,则这 2 个数的积是偶数的概率是 ( )\quad ( a\in \mathbb{R} $,i为虚数单位),的值为( ) A. l B.2 C.3 D.4。, 则实数 m 的值为( ) A.C.1 D.25. 已知向量。复数$z= \alpha+是 z 的共轭复数,若。

2024-04-09 13:00:23 830

原创 基于频繁模式挖掘的 GCC 编译时能耗演化优化算法

基于频繁模式挖掘的 GCC 编译时能耗演化优化算法1.摘要18年我尊爱的导师发在软件学报上的一篇论文。演化算法通过搜寻 GCC 编译器最优编译选项集对可执行代码的能耗进行改进,以达到编译时优化嵌入式软件能耗的目的.但这类算法未考虑多个编译选项之间可能存在相互影响,导致了其解质量不高且收敛速度慢的问题.针对这一不足,本文设计了一种基于频繁模式挖掘的文化基因算法 MA-FP,在演化过程中利用频繁模式挖掘得到出现频度高且对能耗有显著改进效果的一组编译选项,并以此作为启发式信息设计了“增添”和“删减”两种变异算

2024-03-12 15:34:23 725

原创 (一区)基于模型的连续和离散全局优化方法

Model-based methods for continuous and discrete global optimization1.摘要本文综述了下基于模型的连续和离散全局优化方法,并提出了一种叠加替代信息的新方法。2.介绍比较水。。作者说,本文是首次尝试提供对连续和离散建模方法的可理解的调查和分类。由于离散领域的MBO是一个相对较新的研究课题,因此引入了处理离散结构的六种策略。在描述了这些策略如何作为应用MBO的指导方针之后,本文讨论了替代模型的集合作为MBO的最新和很有前途的方法。3.分

2024-03-12 15:33:33 318

原创 (顶会)组合结构的贝叶斯优化

Bayesian Optimization of Combinatorial Structures1.摘要本文提出了一个算法(BOCS),它基于一个自适应的、可扩展的模型,即使数据稀缺,也能识别有用的组合结构。我们的采集函数率先使用半定编程来实现效率和可伸缩性。实验结果表明,该算法的性能始终优于其他组合方法和贝叶斯优化方法。2.介绍本文的主要贡献是:一种获得获取函数近似优化器的新方法,利用凸优化的算法思想来实现可伸缩性和效率。该方法克服了许多采集函数对大型组合领域所固有的有限的可扩展性。我们提

2024-03-12 15:32:35 289

原创 torchrun常见参数

【代码】torchrun常见参数。

2024-03-12 15:30:24 475

原创 垂直领域大模型搭建训练指南,ChemLLM论文介绍

论文是上海人工智能实验室的工作,想训练一个化学垂直领域的对话大模型,然而现有的化学数据往往是结构性的,所以这里论文提出了一套垂直领域数据制作和训练方法,为社区制作专有领域模型提供参考。ChemLLM在化学的三个主要任务上都超过了GPT-3.5,并且超过了GPT-3.5,在其中两个任务上都超过了GPT-4。值得注意的是,ChemLLM对相关的数学和物理任务也显示出了特殊的适应性,尽管它主要接受了以化学为中心的语料库的训练。原化学的表达是SMILES,不适合自然语言处理。

2024-02-27 16:46:36 1376 3

原创 19个大模型常用的评估数据集和训练数据集汇总

19个大模型常用的评估数据集和训练数据集汇总 名称 简介 测试(数据量) 训练(数据量) 地址 CEval 中文选择题测试,包括中学、高中、大学的多个学科 √,13948 × https://huggingface.co/datasets/ceval/ceval-exam GSM8K 小学数学题目,通过最后的数字检测正确与否 √,1320 √,8790 h

2024-02-21 20:46:50 806

原创 百度翻译api调用代码

【代码】百度翻译api调用代码。

2024-02-17 10:58:46 272

原创 怎么让视频进行加速处理并保存

在 Windows 和 macOS 上,你可以从 FFmpeg 官方网站(https://ffmpeg.org/download.html)下载预编译的可执行文件,然后按照官方文档或相关教程进行安装和使用。因此,它不仅限于 Linux 系统,也可以在其他操作系统上使用。请注意,加速倍数越大,可能会导致视频和音频的质量损失,因此你可能需要根据具体情况进行调整。此外,这只是一个基本的例子,你可以根据需要使用其他参数和过滤器进行更高级的调整。总之,FFmpeg 是一个跨平台工具,可以在不同的操作系统上使用。

2024-01-05 11:04:19 899

原创 API服务的快速搭建和测试

【代码】API服务的快速搭建和测试。

2023-12-29 15:45:13 512

原创 大模型:常见的文字表情包(可以直接加到微调数据里)

返回论文目录返回资料目录

2023-12-11 22:45:04 645

原创 大模型:高质量对话数据生成,Enhancing Chat Language Models by Scaling High-quality Instructional Conversations

指令微调的有效性已经被多个工作验证,ChatGPT更是是其中的代表。这个工作旨在提高开源模型的性能上限,提供了一个系统设计的、多样化的、信息丰富的、大规模的教学对话数据集UltraChat。UltraChat包含150万个高质量的多轮对话,并涵盖了广泛的主题和指令。UltraChat的统计分析揭示了其在尺度、平均长度、多样性、一致性等各种关键指标上的优势,巩固了其作为领先的开源数据集的地位。这篇文章认为在训练过程中使用的数据的质量和多样性,对进一步提高聊天语言模型的性能起着至关重要的作用。

2023-12-10 22:07:35 1127

原创 大模型加载的参数介绍及推荐表,temperature、top_k、top_p、num_beams、num_beam_groups、do_sample等

如果需要非常清晰读懂每个参数,需要了解一下与大模型配套的。

2023-11-29 17:05:15 4346

原创 分享一波chatgpt的常用prompt

【代码】分享一波chatgpt的常用prompt。

2023-11-27 21:36:12 1217

原创 1B(10亿)的token大概需要多少磁盘空间存储

【代码】1B(10亿)的token大概需要多少磁盘空间存储。

2023-11-16 14:46:53 1526

原创 大模型的全面回顾,看透大模型 | A Comprehensive Overview of Large Language Models

大模型综述,太全面了,截至2023.11

2023-11-14 23:51:37 797

原创 Slurm集群上单节点8卡全量微调大模型笔记

【代码】Slurm集群上单节点8卡全量微调大模型笔记。

2023-11-12 20:27:10 613

原创 怎么推算max_step和epoch之间关系,例如多少step一个epoch

(轮次)之间的关系取决于您的训练流程和超参数设置。通常情况下,一个step通常表示对一个batch的训练,而epoch则表示一次完整的数据集训练。是您希望运行的轮次数量。这个公式假设每个step处理一个batch数据,其中,总训练样本数是您的训练数据集中的样本总数,表示遍历整个数据集的次数。

2023-11-08 11:11:00 706

原创 source activate my_env 和conda activate my_env 有什么区别

是两个不同的命令,用于在Conda环境中激活特定的虚拟环境。它们的区别在于它们分别适用于不同版本的Conda。如果您使用较旧的Conda版本,那么source activate 仍然可用,但已被逐渐淘汰。它也用于激活特定的Conda虚拟环境,但它是更简单、更直观的方式,取代了source activate。它用于激活(进入)一个特定的Conda虚拟环境,使您可以在该环境中运行安装的软件包。,其中 my_env 是虚拟环境的名称。,其中 my_env 是虚拟环境的名称。以及更早的版本)中使用的方式。

2023-11-08 11:06:44 1855

原创 python输出当前的IP地址

【代码】python输出当前的IP地址。

2023-11-06 20:35:00 230

原创 集群外访问计算节点gpu上的web链接

无法直接访问计算节点。管理节点可以访问计算节点,计算节点无法访问自身外的网络。上运行,运行后给了一个web的地址,如下图所示。现在有一个程序,通过提交作业的方式在集群的。

2023-11-06 16:13:26 152

原创 大模型LLM论文目录

持续更新中ing!!!

2023-11-05 11:28:55 506

原创 Python中OS库的常用命令及示例

Python的**os**库是一个强大的库,用于与操作系统进行交互。它提供了许多功能,包括文件和目录管理、环境变量访问以及执行系统命令。在本篇博客中,我们将列举20个**os**库的常用命令,并为每个命令提供示例。

2023-10-31 15:37:42 205

原创 怎么用python代码查看可用的gpu,然后指定可用的gpu运行

【代码】怎么用python代码查看可用的gpu,然后指定可用的gpu运行。

2023-10-31 11:04:59 2239

原创 为什么大模型计算的时候只会利用KVcache来存放KV矩阵,Q矩阵每次不一样?

总之,KV Cache是一种用于提高Transformer架构的推理效率的技术,通过缓存K和V矩阵,从而避免不必要的计算,但由于Q矩阵通常不稳定,因此不会被缓存。KV Cache的思想是,对于K和V矩阵,由于它们相对稳定,可以在不同时间步骤缓存它们,这样,对于相同的输入,您不需要重新计算K和V矩阵,而可以重复使用它们。在Transformer中,自注意力机制的操作包括Q(Query)、K(Key)和V(Value)的计算。相反,Q矩阵是依赖于输入的,因此每次都不同,无法进行缓存,因此Q矩阵通常不被缓存。

2023-10-24 22:47:40 950 2

原创 Windows怎么在终端使用本地代理服务器

在本地已经有代理服务器的情况下,输入。

2023-10-24 21:46:46 246 1

原创 WinGet 换国内源使用帮助

若出现 0x80073d1b : smartscreen reputation check failed. 错误,请检查网络连接或暂时关闭 SmartScreen。

2023-10-24 18:12:24 1841

原创 windows的powershell中apt命令的替换命令

所以,如果你在 Windows 上需要安装、更新或卸载软件包,建议使用 Chocolatey 或 winget,而不是 apt 命令,因为 apt 是专门为 Linux 系统设计的包管理工具。:winget 是微软推出的包管理工具,可以在 Windows 10 及更高版本上使用。你可以使用 winget 来搜索、安装、更新和卸载应用程序。

2023-10-24 17:40:42 201

原创 docker命令实例(举例子学习)

【代码】docker命令实例(举例子学习)

2023-10-19 20:31:36 230

原创 Slurm集群常用命令

3. 显示运行的或已完成作业或作业步的记账信息。4. slurm文件编写常见参数。

2023-10-19 13:46:56 128

原创 没有root权限如何通过apt安装deb软件

一般来说使用apt安装软件,必须要有root权限,因为apt安装时需要写 /usr/bin,/usr/lib,/usr/share等目录,而这些目录只有root用户(或有sudo权限)才有写入权限的。之后一般会在指定目录下产生usr/bin/目录。所以要另辟蹊径,换种安装方式。

2023-10-18 23:33:14 851 1

原创 多模态大模型NextGPT整体结构图、模型示意图和使用模型时示意图

NextGPT模型图

2023-10-15 14:14:16 729

原创 docker stop了一个docker exec容器,要怎么再启动呢

【代码】docker stop了一个docker exec容器,要怎么再启动呢。

2023-10-12 23:02:26 916

原创 逐行代码学习ChatGLM2-6B大模型SFT微调(通过prompt ptune实现),项目中的ptune/main.py文件

【代码】逐行代码学习ChatGLM2-6B大模型SFT微调,项目中的ptune/main.py文件。

2023-10-05 21:13:11 770

大模型结构介绍,chatglm2模型的创新点

目录 1.GML核心创新 2.GML网络创新 3.ChatGML2的新改动 4.ChatGML2的微调

2023-10-30

大模型结构介绍,从Transformer到llama,再到llama2

大模型结构介绍

2023-10-30

大模型指令微调概述,大模型微调简单介绍ppt

目前学术界一般将NLP任务的发展分为四个阶段即NLP四范式: 第一范式:基于传统机器学习模型的范式,如 tf-idf 特征+朴素贝叶斯等机器算法; 第二范式:基于深度学习模型的范式,如 word2vec 特征 + LSTM 等深度学习算法,相比于第一范式,模型准确有所提高,特征工程的工作也有所减少; 第三范式:基于预训练模型 + fine-tuning的范式,如 BERT + finetuning 的NLP任务,相比于第二范式,模型准确度显著提高,但是模型也随之变得更大,但小数据集就可训练出好模型; 第四范式:基于预训练模型 + Prompt + 预测的范式,如 BERT + Prompt 的范式相比于第三范式,模型训练所需的训练数据显著减少。

2023-10-30

免费领取阿里云资源部署大模型ChatGLM2,可以训练

免费获得阿里云独家资源,以部署ChatGLM2大型模型,并享受卓越的微调能力。我们以用户为中心,提供了全面的手把手教学,无论您是初学者还是专家,都能轻松掌握使用这一超级福利的技巧。 ChatGLM2大模型不仅强大,而且多功能。您可以根据自己的需求对模型进行微调,以满足特定的应用场景。无论您是构建聊天机器人、自然语言处理应用还是进行大规模数据分析,这一资源都将是您的强大工具。 此外,我们为您提供了持续的技术支持和资源更新,以确保您的项目始终保持在技术领域的前沿。无需担心高昂的费用,免费领取这些资源,让您在各种领域中实现更多潜力。加入我们,开启您的数据科学和人工智能之旅,体验超级福利的独特魅力。"

2023-10-30

大模型前世今生-参考文献表

大模型前世今生-参考文献表

2023-10-23

Nemenyi的q-\alpha值的csv表,包括了0.05和0.1置信水平

Nemenyi的q_{\alpha}值的csv表,包括了0.05和0.1置信水平

2023-01-10

Friedman检验用到的F分布表,csv格式

用于Friedman检验,查其关键值,用于比较是否有显著差异

2023-01-10

自动计算元旦倒计时代码

自动计算元旦倒计时代码,python版本,可以直接运行,还带有注释方便使用和修改

2022-12-23

Transformer深度讲解,进一步给出其在NLP和CV下的发展,共95页ppt,全网最好的讲解,没有之一

1.Transformer背景介绍 2.Transfromer整体架构 3.Transformer输入部分 4.Transfromer的编码器 5.Transfromer的解码器 6.Transformer输出部分 7.Transfromer其他部分 1.GPT-1 和 Bert 2.GPT-2 3.GPT-3 Transformer在深度学习环境下背景: 17年自Attention is all you need提出后,开始在NLP(自然语言处理)领域大放异彩 20年后,开始在CV领域发光,到现在基本一统天下了 其在NLP和CV领域下的许多分类、分割、检测等任务下均刷榜 总结一下Transformer模型。 从论文本身来看,其最大的创新在于提出的注意力机制,即多头注意力层,并嵌入到一个模块化可堆叠的模型结构中。一开始Transformer被用于机器翻译,但它也能够用在几乎所有的NLP任务上。自它之后,整个深度学习重心开始转向NLP方面。 4..InstructGPT和ChatGPT 1.VIT 2.Clip与DallE-1 3.DiffusionModel和DallE-2

2022-12-21

NSGA-II多目标优化算法小白详细介绍ppt

非支配排序,拥挤度计算,pareto前沿,A Fast and Elitist Multi-objective Genetic Algorithm: NSGA-II NSGA算法 NSGA算法缺陷 NSGA-II算法 总结 1. 快速非支配排序法将时间复杂度改进为O(MN2); 2.使用拥塞距离代替代替共享函数算法保持种群多样性; 引入精英保留策略。 非支配排序的复杂度较高: O(MN3) (M是目标函数的个数,N是种群大小); 缺少精英保留策略; 需要人为指定共享参数σshare(共享小生境步骤)。 NSGA: nondominated sorting genetic algorithms-非支配排序遗传算法 nondominated:非支配 例:回家,两目标(费用,时间),均越小越好 动车A(270 , 7),普快B(120 , 10),飞机C(240,2) C(240,2)支配A(270 , 7); A(270 , 7)被C(240,2)支配; B(120 , 10)和C(240,2)不可比,即非支配。 目的:得到一组非支配的解--Pareto最优解集。

2022-12-21

GNN,GCN,图神经网络深度讲解100页ppt 包括基础的GNN和其多个变体

PART ONE/为什么需要图神经网络 PART TWO/什么是图神经网络(包括图的基本知识,及基本GNN的操作) PART THREE/图神经网络的变体(图神经网络的3个变体,图卷积神经网络(又可分为基于空间域的图卷积神经网络和基于频域的图卷积神经网络),基于注意力的图神经网络,基于自编码器的图神经网络)。包括DCNN(Diffusion-Convolution Neural Network、NN4G(Neural Networks for Graph)、MPNN:Message Passing Neural Network、GAT (Graph Attention Network)、图自编码器(graph autoencoder,GAE)、变分图自编码器(variational graph autoencoder,VGAE) PART FOUR/应用,在自然语言处理方面的应用,在计算机视觉方面的应用,在推荐系统方面的应用,在预测问题方面的应用

2022-12-19

CNN卷积神经网络讲解50多页PPT 卷积核,感受野,池化核多原理讲解

1.CNN基础结构 2.卷积操作细节讲解 3.图像基础知识 4.池化操作 可以不可以模仿人类大脑的这个特点,构造多层的神经网络,较低层的识别初级的图像特征,若干底层特征组成更上一层特征,最终通过多个层级的组合,最终在顶层做出分类呢? 答案是肯定的,这也是许多深度学习算法(包括CNN)的灵感来源

2022-11-22

生成对抗网络GAN( Generative Adversarial Networks)63PPT,GAN原理,介绍,变体详细

1.GAN背景 2.GAN原理 3.最原始GAN 4.GAN变体 5.整整63页的ppt,下载就是赚到 到2014为止,最广泛使用和最成功的机器学习形式是监督学习。通过给定包含{输入X,输出Y}的训练数据集,监督学习算法学习从输入到输出的映射关系,以分类问题举例,监督学习算法得到的模型能够较好的识别特定的类别(一张照片属于狗或猫的情况)。 然而现有的监督学习通常需要数百万个训练数据来达到超过人类表现的效果,这对训练数据集的获取带来了极大的挑战。

2022-11-22

自动编码器,多种自编码器深入浅出介绍,包括SAE,CAE,DAE,VAE

1.自编码器简介,包括(1.1什么是自编码器,1.2自编码器有什么用,1.3怎样构建自编码器,1.4自编码器及其变体) 2.稀疏自编码器(SAE),包括(2.1为什么要有稀疏自编码器,2.2稀疏自编码器介绍,2.3稀疏自编码器原理,2.4与自编码器的区别) 3.收缩自编码器(CAE),包括(3.1 预备知识,3.2 CAE目标,3.3 CAE构造) 4.去噪自编码器(DAE),包括(4.1什么是去噪自编码器,4.2去噪自编码器的结构) 5.变分自编码器(VAE),包括(5.1为什么用变分自编码器,5.2变分自编码器的结构)

2022-11-22

RNN循环神经网络PPT,涉及到LSTM,GRU、BRNN、BLSTM等等介绍,适合开会用,总共有50页,干货满满

1.干货满满,整整50页,远远比网络上其他RNN的PPT好,PPT修改过3、4次 2.常见激活函数,损失函数 3.从原理出发讲解LSTM神经网络与传统RNN的区别 4.讲解多个RNN的变体原理细节,GRU、BRNN、BLSTM。 5.RNN的应用场景 6.RNN的背景及其意义

2022-11-22

全连接神经网络(多层感知机)PPT,可以直接开会讲

1.单层感知机 2.多层感知机 3.常见梯度优化 3.常见损失函数 4.多个例子 5.可以直接开会讲,适合学习和汇报 6.常见的激活函数介绍 7.使用房价预测问题介绍了单层感知机模型 8.BP神经网络 9.前馈神经网络 10.梯度优化实例 11.MLP神经网络

2022-11-22

2009B眼科病床合理安排.rar

数学建模2009B题眼科病床合理安排,欢迎配合我的博客学习,https://blog.csdn.net/a1920993165/article/details/108171986

2020-08-22

2006B艾滋病疗法评价.rar

2006年国赛B题“艾滋病疗法的评价”,欢迎配合我的博客学习https://blog.csdn.net/a1920993165/article/details/108171045

2020-08-22

最佳灾情巡视路线优秀论文.rar

本题是旅行售货员问题的延伸-多旅行售货员问题. 本题所求的分组巡视的最佳路线,也就是m条 经过同一点并覆盖所有其他顶点又使边权之和达到 最小的闭链(闭迹).   如第一问是三个旅行售货员问题,第二问是四 个旅行售货员问题.   众所周知,旅行售货员问题属于NP完全问题, 即求解没有多项式时间算法.   显然本问题更应属于NP完全问题. 有鉴于此, 一定要针对问题的实际特点寻找简便方法,想找到 解决此类问题的一般方法是不现实的,对于规模较大 的问题可使用近似算法来求得近似最优解

2020-08-19

2016年国赛A题“系泊系统的设计”附件

2016年数学建模国赛A题“系泊系统的设计”https://blog.csdn.net/a1920993165/article/details/108032310的(我的博客)附件,免费学习下载

2020-08-16

2016年国赛A题题目.rar

2016年数学建模国赛A题,里面包括题目和评分标准,可用于学习参考,这里提供免费的下载不需要积分,可以去我的https://blog.csdn.net/a1920993165/article/details/107993927这找到讲解学习

2020-08-16

Lingo11.zip

好用的lingo软件,对于线性规划问题的求解十分方便,可用于数学建模竞赛或平常学习,版本为11,够用了,

2020-08-15

PDF转换软件.zip

pdf转换软件,支持pdf转换成word,合并多个pdf等多种操作。 里面有安装办法,是免费的,不用担心。 这样就可以避开消耗购买wps会员使用wps转换的费用。

2020-06-17

javaWeb书城项目源码

项目源代码,可以提供学习javaweb开发,里面包括结构图等帮助。

2018-07-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除