- 博客(649)
- 收藏
- 关注
原创 supervision CV视觉可视化辅助工具
参考:https://supervision.roboflow.com/latest/https://github.com/roboflow/supervision/tree/develop/examples版本:ultralytics-8.1.35supervision 0.16.0简单案例:跟踪案例https://github.com/roboflow/supervision/tree/develop/examples/heatmap_and_track运行结果:具体代码:
2024-03-28 17:04:27 174
原创 gradio ChatInterface快速创建大模型LLM对话聊天页面
参考:https://www.gradio.app/guides/creating-a-chatbot-fast。
2024-03-28 14:44:24 94
原创 FunASR 框架使用;api服务搭建
参考:安装版本:funasr 1.0.191、解耦modelscope版本限制(不再需要更新版本),所有模型不再需要指定model_revision,自动下载最新模型资源。2、根据模型自动安装该模型的三方依赖包,不再需要用户手动去安装了。
2024-03-26 16:32:16 17
原创 ASR-LLM-TTS 大模型对话实现案例;语音识别、大模型对话、声音生成
参考:https://blog.csdn.net/weixin_42357472/article/details/136305123(llm+tts)这里LLM用的是chatglm。
2024-03-25 17:42:13 190
原创 linux共享挂载文件到另外一台linux
NFS(Network File System)来共享文件系统并将其挂载到另一台 Linux 主机上。
2024-03-25 14:55:36 328
原创 flask before_request、before_first_request、after_request;AttributeError: ‘Flask‘ object has no attrib
解决方法:这是因为flask在版本2.3以后这个函数before_first_request已经取消,要么降级版本。flask before_request、after_request就是flask每次每一个请求都前后会额外自定义处理其他;before_first_request是这个整个flask程序运行前执行一次。这两个都是after_request导致,2)是因为没有return;3)是因为set_after(response)里没有传参;after_request使用必须传参和retrun返回。
2024-03-24 10:09:29 290
原创 分布式训练多机(节点)数据并行的数据划分DistributedSampler
参考:分布式训练数据看样子和模型一样,每个节点都要拷贝,注意路径也要一样;DistributedSampler是分配每个gpu上的数据索引值列表。
2024-03-24 09:49:11 14
原创 windows11 openssh服务开启;第三方ping不通局域网windows电脑;ssh连接内部ubuntu系统
参考:https://blog.csdn.net/2301_77554343/article/details/134328867。
2024-03-23 12:32:29 224
原创 docker: Error response from daemon: could not select device driver ““ with capabilities: [[gpu]]
报错:docker: Error response from daemon: could not select device driver “” with capabilities: [[gpu]].参考:https://blog.csdn.net/felton_cool/article/details/134327204。前面安装后可能会导致之前的/etc/docker/daemon.json 文件内容会丢失失效;因为前面更改过默认路径,所以/etc/docker/daemon.json 重新写上。
2024-03-21 19:53:21 110
原创 docker镜像安装空间不足no space left on device
报错:Error processing tar file(exit status 1): open /usr/local/lib/libmkl_tbb_thread.so.1: no space left on device。主要是系统空间不足,把docker默认地址改到外部磁盘上。
2024-03-21 15:40:28 346
原创 docker方式进行pytorch多机多卡分布式训练
docker ip共享与gpu指定1)ip共享docker网络有多种,这里选择host直接用宿主机的ip2)指定gpu。
2024-03-21 11:20:34 175
原创 分布式训练遇到问题:NCCL通信相关问题
3、如果服务器含有网卡比较多(或者docker服务影响),可以torchrun指定具体能互相通信的网卡,可以ifconfig查看。下面两台机器通信10.12.100.1、10.12.100.2是分别通过em2、eno4网卡通信,如果不指定容易报错。添加后检查互相机器上ping hostname 或ping ip是否通。1、相互机器互相hosts文件添加对应ip与hostname。解决方法(主要是网络通信问题)机器二: ip在 eno4上。机器一: ip在 em2上。2、机器都需要关闭防火墙。
2024-03-20 09:56:00 208
原创 nvidia-smi No devices were found;The Nouveau kernel driver is currently in use by your system
驱动已经安装,但是后面运行nvidia-smi 显示No devices were found。
2024-03-19 19:16:43 182
原创 pytorch 训练实时checkpoint保存;训练中断恢复
2)第二次直接在运行python minist_checkpoint.py 训练,会先从checkpoint模型中加载中断恢复继续训练。1)第一次运行在运行完epoch2,运行epoch3时候中断,这时候epoch2训练完的模型保存到checkpoint。一般是torch save保存相关权重及训练参数。这时候从epoch3轮开始训练。
2024-03-19 09:23:19 204
原创 linux源配置:ubuntu、centos;lspci与lsmod命令区别
参考:https://midoq.github.io/2022/05/30/Ubuntu20-04%E6%9B%B4%E6%8D%A2%E5%9B%BD%E5%86%85%E9%95%9C%E5%83%8F%E6%BA%90/2)再编辑源更新,源要与上面型号对应。
2024-03-16 11:57:38 622
原创 windows 免密码ssh登录linux;linux免密码ssh登录其他linux
参考:https://blog.csdn.net/qq285744011/article/details/118293937。2)把公钥复制到linux /root/.ssh/authorized_keys。3)然后就可以在windows下免密码登录了。1)windows先生成公钥私钥。生成后放在用户命令.ssh文件下。
2024-03-14 19:51:17 425
原创 torchrun、 torch.distributed.launch 多节点分布式训练使用案例
数据并行分布式图:梯度更新分布式训练参数含义:nnodes:节点的数量,通常一个节点对应一个主机,方便记忆,直接表述为主机node_rank:节点的序号,从0开始nproc_per_node:一个节点中显卡的数量-master_addr:master节点的ip地址,也就是0号主机的IP地址,该参数是为了让 其他节点 知道0号节点的位,来将自己训练的参数传送过去处理。
2024-03-14 15:46:52 533
原创 pip安装报错:ERROR: Could not build wheels for psutil
参考:https://github.com/giampaolo/psutil/issues/1143。解决方法:依据自己python版本安装,比如这里3.7版本。我这里ubuntu系统。
2024-03-14 10:34:08 357
原创 conda PackagesNotFoundError;An unexpected error has occurred. Conda has prepared the above report
参考:https://wenku.csdn.net/answer/3u2f0vgdaj报错:Solving environment: failed。
2024-03-12 10:52:48 362
原创 ubuntu arm架构添加apt安装源
参考:https://huaweicloud.csdn.net/63566929d3efff3090b5e339.htmlhttps://blog.csdn.net/seaofbits/article/details/123647256https://blog.csdn.net/yfy1127yfy/article/details/104228312aarch arm系统ubuntu 系统版本1)先备份2)添加源apt update更新报错: Some index files fail
2024-03-12 09:46:11 369
原创 CLIP 与 SigLIP 文本图像对其算法学习理解
参考:https://github.com/openai/CLIPCLIP:batch内的图文对做多分类softmax;比如下图第一行表示第一个文本与batch内哪个图片匹配(多分类);除了行还计算列,比如第一列表示第一个图片与batch内哪个文本匹配SigLIP:batch内的图文对做二分类sigmod;比如下图第一行表示 第一个文本分别与batch内每个图片做二分类CLIPSigLIP2*np.eye(n) - np.ones(n) 构建了label的矩阵,-1或者1的二分类;例如下列n=3
2024-03-12 08:58:52 242
原创 神经网络 梯度与神经元参数w、b关系;梯度与导数关系;梯度消失与爆炸
∂w∂cost参考:https://blog.csdn.net/weixin_44259490/article/details/90295146。
2024-03-08 09:24:13 1192
原创 gradio Audio页面录制不了声音,找不到麦克风;Error accessing the microphone: Cannot read properties of undefined
gradio服务器部署后,客户端浏览器点击麦克风录制不了;报错gradio Audio页面录制不了声音,找不到麦克风;这个报错信息可以邮件检查里看到Error accessing the microphone: Cannot read properties of undefined。
2024-03-06 09:20:45 416
原创 multiprocessing Event实现中断进程或程序;threading Event实现打断程序
主进程time.sleep(5)运行,当主进程设置事件 event.set()后子进程被关闭。1)去掉 p.join() 可以让程序继续运行,但子进程可能不会立即终止。如果不调用 p.join(),主进程会继续运行,而子进程会在后台继续运行。2)主进程设置event.set() 是怎么被子进程识别的。p.join() 方法会阻塞主进程,直到子进程结束。
2024-03-05 10:55:18 470
原创 python打包两种方式:setup.py、pyproject.toml;entry_points、project.scripts 可执行的命令行
参考:https://blog.csdn.net/qq_38844437/article/details/126628564https://click.palletsprojects.com/en/7.x/setuptools/#setuptools-integration学习写法:https://github.com/myshell-ai/MeloTTS/blob/main/setup.pyyourscript.py:setup.py:pyproject.toml参考:https://blog.
2024-03-05 09:30:33 457
原创 sparse transformer 常见稀疏注意力
参考:https://zhuanlan.zhihu.com/p/259591644a、transformer原始的 , Q · K^T,其中 K^T 表示 K 的转置b、每个token与前后三个做自注意力计算c、每个token与前后三个做自注意力计算,但这三个有间隔,就是比如第一个token看右面3,5,7d、全局token是第一二个token看所有的token,3及后面的token只看· K^T 矩阵的1、2token;sliding划窗见ba、全局token是第一二个token看所有的toke
2024-03-03 18:15:58 126 4
原创 funasr VAD语音端点检测;sherpa VAD+STT识别
Voice Activity Detection 语音活性检测(VAD)也被称为语音端点检测,基本原理是判断一个区间内的音频(区间被称为一个“语音帧”),是有效语音,还是无效语音。模型下载:https://k2-fsa.github.io/sherpa/onnx/pretrained_models/offline-paraformer/paraformer-models.html#csukuangfj-sherpa-onnx-paraformer-zh-2023-03-28-chinese。
2024-03-03 10:01:55 136
原创 github如果给第三方项目提PR(Pull Request)
参考:https://blog.csdn.net/Leventcoco/article/details/135871779点击fork然后就同步一份到自己名下了,后续修改在自己名下这项目上先修改:1、先下载代码到本地2、修改代码这里省略,自己在这clone下的项目里修改新增保存即可3、修改上传github建议直接命令行操作操作前设置下成功打印信息上面pull后在自己fork项目就会发现commit ahead of,这表示你的远程下游仓库已经同步了你在本地对代码的更改,点击Open pul
2024-03-01 17:14:53 537
原创 KWS 自定义唤醒词语音唤醒功能实现
安装:1、自定义唤醒词参考:https://k2-fsa.github.io/sherpa/onnx/kws/pretrained_models/index.html需要先编辑keywords_raw.txt文件,里面按规则自定义:然后运行命令,生成keywords.txt 文件:运行:keywords-file=keywords.txt 即为上面生成的keywords.txt文件后续功能可以基于这里后续实现:
2024-03-01 16:18:02 98
原创 yolov9 图像检测案例使用;自有数据单机训练和多机分布式训练
下载数据集需要登录获取认证下载,yolo格式数据集txt label集data.yaml说明文档label信息样式数据集yaml文件样式训练!看着16g显卡占用情况,最训练过程指标存放在!ls {HOME}/yolov9/runs/train/exp/下验证模型效果!使用训练模型推理!结果保存到Results saved to runs/detect/exp3下。
2024-02-28 14:50:11 94
原创 pydub、playsound播放声音;gradio、streamlit页面播放声音;gradio 页面图像、视频及调用摄像头
【代码】pydub、playsound播放声音。
2024-02-27 16:43:50 832
原创 LLM-TTS 大模型对话语音实时回复
1)推理用的vllm,参考https://blog.csdn.net/weixin_42357472/article/details/136165481。3)tts生成 edge_tts包,微软的需要联网。2)用的openai api LLM对话接口。4)电脑播放语音 playsound包。
2024-02-26 17:40:30 419
diffusers-flask-streamlit AIGC文生图代码案例,前端后端代码
2024-03-01
unidic-mecab 字符文件unidic-3.1.0下载
2024-03-01
yolov9 自有数据训练代码参考
2024-03-01
中文语音唤醒模型sherpa-onnx-kws-zipformer-wenetspeech-3.3M-2024-01-01 (C
2024-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人