- 博客(197)
- 资源 (1)
- 收藏
- 关注
原创 边缘检测-Tiny and Efficient Model for the Edge Detection Generalization
为了实现这一点,我们提出了微小和高效的边缘检测器(TEED)是一种轻量级的卷积神经网络,只有58K个参数,不到最先进模型的0.2%。我们提出的模型易于训练,并且在最初的几个epoch内快速收敛,同时预测的边缘图清晰且质量高。此外,我们提出了一个新的数据集来测试边缘检测的泛化,它包括用于边缘检测和图像分割的常用图像的样本。在这项工作中,我们考虑三个主要目标来解决边缘检测:简单,效率和泛化,因为当前最先进的(SOTA)边缘检测模型的复杂性增加了,以获得更好的准确性。
2024-03-19 11:03:53 413 1
原创 pytorch环境检查GPU是否可用
查看当前cuda是否可用于当前版本的Torch,如果输出True,则表示可用。# 编译当前版本的torch使用的cuda版本号。# 查看torch当前版本号。
2024-03-13 11:37:40 335
原创 SRS服务器ffmpeg 推流rtmp超时中断
The timeout in seconds to disconnect publisher when idle, which means no players. 已秒为单位的超时断开。# Note that 0 means no timeout or this feature is disabled. 0表示没有超时或者禁用此特性。SRS配置文件修改下面这项。
2024-03-05 09:56:13 562
原创 ffmpeg 推流报错 Error writing trailer of rtmp:// End of file
推流一段时间以后就会报这个错误,有没有人知道怎么解决呢?
2024-02-27 15:06:25 387
原创 ffmpeg命令生成器
FFmpeg CommanderFFmpeg Command Generatorffmpeg string creator
2024-02-05 17:15:48 1397
原创 SRS视频服务器使用记录
SRS是一个开源的()简单高效的实时视频服务器,支持RTMP、WebRTC、HLS、HTTP-FLV、SRT、MPEG-DASH和GB28181等协议。SRS媒体服务器和等客户端配合使用,提供的能力,是一个典型的发布 (推流)和订阅(播放)服务器模型。SRS支持互联网广泛应用的音视频协议转换,比如可以将或, 转成或或等协议。注意:SRS6属于开发版,不稳定。
2024-02-05 14:28:16 1020
原创 AIGC项目——Meta:根据对话音频生成带动作和手势的3d逼真数字人
我们的方法背后的关键是将矢量量化的样本多样性的好处与通过扩散获得的高频细节相结合,以产生更动态,更具表现力的运动。我们使用高度逼真的虚拟人物来可视化生成的运动,这些虚拟人物可以在手势中表达关键的细微差别(例如嘲笑和傻笑)。实验表明,我们的模型生成适当和多样化的手势,优于扩散和VQ-only方法。6-生成的面部和身体运动都被传递到我们训练过的头像渲染器中,以生成逼真的头像。1-我们捕获了一个新颖的、丰富的二元对话数据集,可以进行逼真的重建。从二元对话的音频中,我们生成相应的逼真的面部、身体和手势。
2024-01-30 17:19:21 893 2
原创 在本地电脑上打开服务器里面的localhost网址
1. ssh新建一个远程连接,将服务器的7860端口重定向到本机。在本地浏览器将127.0.0.1改成服务器ip但是无法访问。如果没有包安装pip install visdom。2.在服务器上启动visdom.server。远程连接服务器,启动了一个服务。本地电脑可以访问服务器的网址。
2024-01-30 16:11:53 767
原创 Git项目 Building/installing from source
【代码】Git项目 Building/installing from source。
2024-01-30 10:30:42 383
原创 mmocr 安装及快速运行
errorerror: subprocess-exited-with-errorpython setup.py bdist_wheel did not run successfully.note: This error originates from a subprocess,and is li_this is an issue with the package mentioned above, not pip.此版本如果不指定mmdet版本会报错,
2024-01-26 15:46:09 1054
原创 Segment Anything:SAM系列模型(SAM、EfficientSAM、MobileSAM、MobileSAM-v2、FastSAM)
这种设计受到《基于Trasformers的端到端目标检测》和Maskformer的启发,使用了一个修改的Transformer解码器block,后跟一个动态掩码预测头。修改后的解码器block在两个方向(提示到图像嵌入和图像嵌入到提示)上使用自注意力和交叉注意力来更新所有嵌入。在运行两个Block后,对图像嵌入进行上采样,并通过MLP层将输出标记映射到一个动态线性分类器(该分类器用于计算每个图像位置的掩码前景概率)。密集提示(即掩码)使用卷积进行嵌入,并与图像嵌入进行逐元素求和。
2024-01-19 11:34:43 916
原创 EfficientSAM 代码推理
经过推理测试3090GPU,官方测试图片1072*603 使用框或者点prompts 使用vitt模型需要41-58ms左右,显存7G左右。官方给的推理代码是CPU版本的,如果想使用GPU推理需要自己修改一下。使用全图分割耗时会更长。
2024-01-12 18:22:48 626 11
原创 Nougat:科学文档的OCR 使用记录
模型默认下载地址:/home/****/.cache/torch/hub/nougat-0.1.0-small。如果需要使用GPU,则需要重新安装和自己cuda版本对应的torch等,我这边是cuda11.8。显存占用17368 / 24576M 显存占用17G,16页的PDF 耗时30秒。vscode中使用如下插件可以查看mmd格式中的内容,文字可直接复制。在output目录下会生成.mmd格式的文件。python环境需要在3.8以上。环境配置好之后即可进行PDF识别。环境安装好之后默认使用cpu。
2024-01-04 10:36:09 811
原创 conda 虚拟环境使用
查看已有的虚拟环境conda env list创建虚拟环境且带pythonconda create -n test123python=3.7激活虚拟环境(To activate this environment)conda activate test123退出虚拟环境(To deactivate an active environment)conda deactivate
2023-12-20 16:07:58 585
原创 opencv常用算法
cv2.normalize()cv2.applyColorMap(T, cv2.COLORMAP_JET)cv2.bitwise_or() 可以用于提取ROI区域
2023-12-06 18:20:06 61
原创 sheel
在bash中,变量默认类型为字符串类型,无法直接进行数值运算c=1+2echo $c1+2使用 export 可把变量提升为全局环境变量export 变量名。
2023-08-21 12:24:10 255
原创 shell脚本开发
shell脚本语言属于弱类型的语言,无需声明变量类型,直接定义使用。shell语言定义的变量,数据类型默认都是字符串类型。调用历史记录命令:!
2023-08-12 23:06:10 214
原创 MM系列资料整理
一、MMdetection 系列源码解读资料????轻松掌握 MMDetection 整体构建流程(一)https://zhuanlan.zhihu.com/p/337375549
2021-11-06 21:12:13 696
原创 mmclassification-V0.14.0 安装+使用
安装mmclassification 版本需要和mmcv 版本对应mmdetection 安装参考我的另一篇博客:MMDection-V2.15.0安装+使用(新)如果已经安装了mmdetection的最新版本,那么对于mmclassification来说基础环境已经满足了,只需要在代码目录下执行,以下命令即可pip install -e . # or "python setup.py develop"...
2021-08-15 19:08:29 295
原创 MMDection-V2.15.0安装+使用(新)
安装概览conda create -n openmmlab python=3.7 -yconda activate openmmlabconda install pytorch==1.6.0 torchvision==0.7.0 cudatoolkit=10.1 -c pytorch -y# install the latest mmcvpip install mmcv-full -f https://download.openmmlab.com/mmcv/dist/cu101/tor..
2021-08-14 11:15:17 530 1
原创 MMDetection框架学习
来源:https://www.bilibili.com/video/BV1Pp4y167x7总体架构mmdetection模块化设计
2021-08-01 20:49:17 187
原创 Docker 学习笔记
1.环境查看2.Docker 安装官网:https://docs.docker.com/get-docker/CentOS安装3卸载docker帮助文档地址:https://docs.docker.com/reference/
2021-06-11 23:49:14 144 2
luna16数据集百度云资源
2019-10-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人