自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 语音识别框架speechbrain---speaker-recognition说话人识别/声纹识别:模型评价(2)

EER 与 minDCF计算—基于自己数据的模型(cosine)(1)构建验证verification文件def create_veri_file(data_folder, save_file): """ 生成验证txt文件 """ dev_save_path = [] with open(save_file, "w") as f: for file_path in os.listdir(data_folder): # ID

2021-06-09 11:24:11 1458 2

原创 语音识别框架speechbrain---speaker-recognition说话人识别/声纹识别:训练自己的数据(1)

SpeechBrain是使用pytorch实现的灵活,用户友好的语音工具箱,以便用户可以快速实现语音识别,语音增强,信号处理等等任务,目前比较新且无相关文档,现分享相关数据处理pipelinedata prepare(基于voxcleb_prepare.py)修改头文件路径 采样率 等信息修改csv生成文件方法(voxcleb_prepare中 _get_utt_split_lists)我的数据路径train—speaker_id—wav文件test—speaker_id—wav文件dev—

2021-05-17 10:24:16 2375 1

原创 python图像质量检测(七):图像条纹检测

python图像质量检测(七):图像条纹检测基于传统方式的图像质量检测需求:检测视频为是否有条纹噪声,此代码针对一帧图片进行检测,视频检测需要自行进行读取,并根据需求进行抽帧检测方式:1.提取彩色图像的色度分量。2.对色度分量求DFT频谱图。3.计算频谱图的异常亮点数,若大于A则认为发生条纹检测。参考文章:https://www.cnblogs.com/wqvbjhc/p/3768995.htmlhttps://wenku.baidu.com/view/bfb3158f856a561252d

2020-11-23 16:37:08 5040 1

原创 coco数据集转voc

一.coco数据集筛选需要的标签根据类别生成对应的json文件import jsonclassName = { 1:'person', 3: "car", 6: "bus", 8: "truck"}classNum = [1, 3, 6, 8]coco_json=r".\annotations\instances_train2017.json"def writeNum(Num): with open("COCO_train.json", "a+")

2020-06-28 11:35:57 296

原创 yolov3迁移学习,训练自己的数据

一、准备个人数据集、训练、测试1.在darknet目录下创建myData文件夹,目录结构如下,将labelimg工具标注好的图片和xml文件放到对应目录下:myData…JPEGImages#存放图像…Annotations#存放图像对应的xml文件…ImageSets/Main # 存放训练/验证图像的名字(格式如 000001.jpg或者000001),里面包括train.txt。这里给出的格式是: 000000,因为下面的代码中给出了图像的格式。类似如下格式:2.将自己的数据集图片拷贝

2020-06-04 10:50:39 5186 3

原创 python图像质量检测(一):黑屏检测

python图像质量检测(一):黑屏检测----基于传统方式的图像质量检测需求:检测视频为黑屏,此处针对一帧图片进行检测方式:将图像灰度化,检测偏暗的像素占总体比例,推断出是否黑屏 import cv2 # 把图片转换为单通道的灰度图 gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) # 获取灰度图矩阵的行数和列数 r, c = gray_img.shape[:2] piexs_sum = r * c # 整个

2020-05-20 11:55:28 5624 2

原创 ffmpeg h264转码,并且使用rtps推流

ffmpeg h264转码,并且使用rtps推流ffmpeg推流rtmp:各大网站都能很简单的找到ffmpeg -i “rtsp://admin:[email protected]:554/ch1/main/av_stream” -vcodec copy -acodec copy -f flv “rtmp://127.0.0.1:1935/live/”ffmpeg推流rtsp:这个需要去到ffmpeg的官方文档才能找到https://www.ffmpeg.org/ffmpeg-all

2020-05-19 16:25:18 2741

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除