自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(109)
  • 资源 (18)
  • 收藏
  • 关注

原创 【记录】pip升级安装报错:WARNING: You are using pip version 20.0.2, however version 20.2.3 is available.

报错:解决方案:python -m pip install --upgrade pip -i https://pypi.douban.com/simple指定源安装很重要,就是这一段 -i https://pypi.douban.com/simple

2022-01-14 10:41:43 727

原创 【机器学习:Recommendation System】推荐系统

推荐系统是一种人工智能或人工智能算法,通常与机器学习相关,它使用大数据向消费者建议或推荐其他产品。这些可以基于各种标准,包括过去的购买、搜索历史、人口统计信息和其他因素。推荐系统非常有用,因为它们可以帮助用户发现他们自己可能找不到的产品和服务。推荐系统经过训练,可以使用收集的有关人员和产品的交互数据来了解人员和产品的偏好、先前的决策以及特征。由于推荐系统能够在高度个性化的水平上预测消费者的兴趣和愿望,因此受到内容和产品提供商的喜爱。

2024-03-01 00:19:22 924 1

原创 【机器学习:推荐系统】什么是推荐系统?

推荐系统如何工作?推荐系统生命周期推荐系统算法使用推荐系统的好处推荐系统的类型协同过滤基于内容的过滤混合过滤现实生活中的推荐系统示例亚马逊Spotify脸书/元数据Netflix谷歌和 YouTube关于推荐系统的最终想法推荐系统(或称推荐器系统)是一种软件引擎,旨在根据用户以往的好恶、产品参与度和互动情况等向用户推荐商品。推荐系统能让用户对网站持续推荐的内容保持兴趣。推荐引擎通过帮助每一位消费者识别和发现他们喜爱的电影、电视节目、数字产品、书籍、文章、服务等,提供个性化的用户体验。

2024-03-01 00:19:16 1055

原创 【深度学习:微模型过度拟合】微模型简介或:我如何学会停止担忧并热爱过度拟合

起源微模型到底是什么?一维标记蝙蝠侠效率额外的好处面向数据的编程这篇文章的目的是介绍我们在 Encord 中用于自动化数据注释的“微模型”方法。我们已将这种方法部署在医学成像、农业、自动驾驶车辆和卫星成像等广泛领域的计算机视觉标记任务中。TLDR;什么:应用于数据分布的小域的低偏差模型。方法:在狭义任务的少数示例上过度拟合深度学习模型。原因:节省数百小时的手工贴标时间。构建检测蝙蝠侠的模型需要多少数据?黑暗骑士愿景这当然取决于您的目标。

2024-02-27 09:09:12 1005

原创 【机器学习:机器学习中的过拟合】它是什么以及如何防止它

它会受到异常值(例如,父亲是 NBA 球员的孩子)和随机性(例如,在不同年龄进入青春期的孩子)的影响。在前面对儿童身高与年龄进行建模的示例中,很明显,抽样更多学校将如何帮助您的模型。例如,如果我们的模型在训练集上的准确率达到 99%,但在测试集上的准确率仅为 55%,那么这将是一个很大的危险信号。套袋法使用复杂的基础模型,并试图 "平滑 "其预测结果,而提升法使用简单的基础模型,并试图 "提升 "其总体复杂度。过度拟合以及一般机器学习的一个关键挑战是,在实际测试之前,我们无法知道模型在新数据上的表现如何。

2024-02-27 09:01:25 770

原创 【深度学习:数据工具】为什么应该放弃内部培训数据工具(避免自行开发)

如果您的工具是建立在 CVAT 的基础上,就像我们合作过的大多数机器视觉团队一样,那么它很快就会被增加的工作量压垮,崩溃的速度比您说梅尔文资本(Melvin Capital)还要快。此外,通过尝试将开源工具生成的训练标签塑造成可查询的数据资产,制作一个好的 API 通常会变得很复杂。如果您是一家专业人工智能公司或投资人工智能的公司,培训数据是您业务的核心,也是您 IP 的重要组成部分。当您第一次构建管道时,这种成本不会立即显现出来,但随着应用程序的增长,可能会对您的团队造成相当大的拖累。

2024-02-26 20:45:39 657

原创 【前沿技术杂谈:人机交互 】将人机交互 (HITL) 集成到机器学习应用程序中是必要的,而不是选择。

[TOC](【前沿技术杂谈:人机交互 】将人机交互 (HITL) 集成到机器学习应用程序中是必要的,而不是选择。

2024-02-26 20:37:47 478

原创 【深度学习:标记数据】为医生标记数据缓解疼痛

在 120 分钟的项目中,CVAT 的平均(±SD)标记帧数为 2241±810(不到总数的 10%),而 CdV 的平均(±SD)标记帧数为 10674±5388(p=0.01)。最令人鼓舞的是,注释者中最资深的博士,也就是使用任何注释软件经验最少的人,使用 Encord 的效率提高了 16 倍。当然,通常情况下不会这样。与机器学习模型不同,机器学习模型向毫无戒心的注意力受害者提供狂欢的Netflix节目(错误的赌注是你最终观看了一集艾米丽在巴黎),错误或错误诊断溃疡性结肠炎对人们的健康有重大影响。

2024-02-25 19:00:09 983

原创 【深度学习:视频注释】如何为机器学习自动执行视频注释

自动视频注释可以解决其中的大部分问题,减少手动输入,节省时间和金钱,并确保您可以在保持质量一致的同时对更大的数据集进行注释和标记。当在视频中的对象上绘制多边形时,由专有算法支持,该算法在没有表示模型的情况下运行,它可以收紧多边形的周长,插值并跟踪移动对象(例如,人)中的各个部分(在本例中为衣服)。根据我们的经验,在极少数情况下,自动视频注释在视频注释项目中不能发挥有用的作用。自动分割是在对象周围绘制轮廓,然后使用算法自动“捕捉”到对象的轮廓,使轮廓更紧密,更准确地与从一帧到下一帧跟踪的对象和标签对齐。

2024-02-25 18:53:25 1149

原创 【深度学习:计算机视觉】计算机视觉的最佳数据集 [行业细分]

用于训练机器学习 (ML)、人工智能 (AI) 和其他基于算法的模型的数据集可以是任何东西,从电子表格到视频存储库。数据集只是一种说法,即您拥有一组数据,而不管其格式如何。对于计算机视觉 (CV) 和 ML 模型,数据集通常包含数千张图像或视频,或两者兼而有之。训练基于 ML 的模型来解决特定问题意味着确保您以最合适的格式选择了正确类型的图像或视频,并尽可能使用最高质量的注释和标签来生成所需的结果。劣质数据或数据集中成千上万的不相关图像或视频会对项目产生负面影响。ML 项目通常会在紧迫的时间内完成。

2024-02-23 11:33:06 768

原创 【深度学习:计算机视觉项目 】如何为您的计算机视觉项目选择正确的数据

您可以从摘要中选择显示严重异常值的属性,如绿色值。这样就可以分析数据集的质量。它们还提供了一些功能,让你在将数据分成训练、验证和测试数据集时,可以将离群值平均分割,或者完全消除离群值。例如,使用 "

2024-02-23 11:32:58 885

原创 【深度学习:TACO 数据集】探索 TACO 数据集【模型训练】

想象一下,您正在建造一个可以收集地面垃圾的自主机器人。作为机器学习工程师,您将负责赋予其在任何环境中检测垃圾的能力。这是一个挑战,但有了正确的检测系统,您将离更清洁的世界更近一步,并且您将建造一个很酷的人工智能机器人。下载开源垃圾数据集后,您意识到您的模型存在多种挑战,并且即使您应用了最先进的模型,性能也很差。这就是我们在这个以数据为中心的人工智能案例研究系列的第一部分中结束的地方。在上一篇文章中,我们分析了 TACO 数据集和标签,发现该数据集存在很多问题。

2024-02-22 11:10:25 782

原创 【深度学习:对象跟踪】对象跟踪完整指南 [教程]

对象跟踪涉及一种算法,用于跟踪目标对象的运动,并预测图像或视频中对象的位置和其他相关信息。对象跟踪与对象检测不同(许多人会熟悉 YOLO 算法):对象检测仅限于单个帧或图像,并且仅在输入图像中存在感兴趣的对象时才有效,而对象跟踪是一种用于预测目标对象位置的技术, 通过跟踪物体的轨迹,无论它是否存在于图像或视频帧中。对象跟踪算法可以根据任务和它们所训练的输入类型分为不同的类型。Image tracking 图像跟踪Video tracking 视频跟踪。

2024-02-22 11:10:13 882

原创 【深度学习:人体姿态估计】计算机视觉人体姿态估计完整指南

人体姿态估计 (HPE) 和跟踪是一项计算机视觉任务,随着计算能力和资源的不断增加,它变得越来越容易实施。它需要大量的计算资源和高度准确的算法模型来估计和跟踪人类的姿势和动作。姿态估计涉及检测、关联和跟踪语义关键点。例如人脸上的关键点,例如嘴角、眼角和鼻子。或肘部和膝盖。借助姿态估计,计算机视觉机器学习 (ML) 模型可让您跟踪、注释和估计人类、动物和车辆的运动模式。

2024-02-21 10:25:38 1873

原创 【深度学习:图像注释】计算机视觉图像注释完整指南

投入对项目产出有巨大的影响。在机器学习中,以数据为中心的 AI 方法认识到模型训练所依据的数据的重要性,甚至比所使用的模型或模型集更重要。因此,如果您是从事图像或视频注释项目的注释者,那么创建最准确的标记输入可能意味着成功与失败之间的区别。正确注释图像和图像中的对象将在以后为您节省大量时间和精力。计算机视觉模型和工具还不够智能,无法纠正项目手动注释和验证阶段的人为错误。当训练数据集包含的数据被正确标记时,它们更有价值。正如每个注释器团队经理都知道的那样,图像注释比许多人意识到的更加微妙和具有挑战性。

2024-02-21 10:25:29 1142

原创 【深度学习:大模型微调】如何微调SAM

Segment Anything 模型 (SAM) 是由 Meta AI 开发的细分模型。它被认为是计算机视觉的第一个基础模型。SAM在包含数百万张图像和数十亿个掩码的庞大数据语料库上进行了训练,使其非常强大。顾名思义,SAM 能够为各种图像生成准确的分割掩码。SAM 的设计允许它考虑人类提示,使其在 Human In The Loop 注释中特别强大。这些提示可以是多模式的:它们可以是要分割的区域上的点、要分割的对象周围的边界框,也可以是有关应分割的内容的文本提示。

2024-02-20 08:16:12 2027

原创 【深度学习:视频注释】5 个重要的视频注释功能

动态或基于事件的分类是最好的视频注释平台附带的强大功能,无论最初用于标记运动对象的注释类型如何,您都可以使用它们。预处理意味着如果视频出现问题(例如,同步帧问题、视频未正确显示、注释与正确的帧不匹配等),您可以避免重新标记所有内容,从而为您的注释团队节省无数时间以及项目开始时的大量预算。一旦您突出显示了特定对象的轮廓,就可以逐帧跟踪它,从而使基于人工智能的系统或在视频或一系列图像的其余部分中对同一对象进行手动注释变得更加容易。使用最好的视频注释工具,您不会遇到这个问题 - 它们应该能够处理任意长的视频。

2024-02-20 07:21:08 615

原创 【深度学习:数据注释工具】构建以数据为中心的 AI 管道的 5 个步骤

在训练计算机视觉模型或任何算法生成的模型时,以数据为中心将重点从模型转移到数据。释放 AI 的真正潜力意味着采购、注释、标记和构建更好的数据集。随着更高质量的数据进入模型,准确性和输出质量可以而且将会显着提高。任何以数据为中心的方法都取决于您获取、注释和标记要放入模型的正确数据的能力。寻找最佳训练数据的重要性如何确定要标记的内容的优先级如何确定在哪个数据子集上开始训练模型如何使用开源工具为计算机视觉应用程序选择数据。

2024-02-19 10:43:41 827

原创 【深度学习:数据注释工具】构建与购买:从业者的经验教训

该客户证实,内部资源最好花在其他地方:“在使用 Encord 之前,ML 团队不得不采取安全路线,因为追求失败的新想法的成本很高。正如一位体育分析 Encord 客户发现的那样(在他们找到我们之前),“用于数据注释的内部工具和界面存在局限性:构建和完善需要几个月的时间,结果是一个单一用途的工具。‍在 Encord,我们的计算机视觉主动学习平台被广泛的行业(包括医疗保健、制造、公用事业和智能城市)使用,以注释人体姿势估计视频并加速其计算机视觉模型的开发。我们已经设法使用灵活的 API 构建了相当无缝的集成。

2024-02-19 10:43:33 652

原创 【深度学习:图像注释工具】用于计算机视觉的最佳图像注释工具 [2024 年更新]

CVAT 是该领域最受欢迎的开源工具之一,自 2021 年以来下载量超过 100 万次 - CVAT 的其他流行的免费图像注释替代品包括 3D Slicer、 Labelimg、VoTT(视觉对象标记工具 - 由 Microsoft 开发)、VIA(VGG 图像注释器)、LabelMe 和 Label Studio。如果您正在开发一个独特的特定于用例的注释项目(例如 DICOM 格式的扫描或需要像素完美注释的高分辨率图像),其他商业图像注释平台将更适合:查看我们的博客探索最佳 DICOM 标签工具。

2024-02-18 09:41:32 788

原创 【深度学习:计算机视觉工具】如何使用低代码和无代码工具进行计算机视觉

自大流行以来,无代码和低代码开发市场经历了更快的增长。2020 年,该市场价值超过 100 亿美元,预计 2028 年将达到 940 亿美元,复合年增长率 (CAGR) 为 31.6%。当时,企业没有资源或预算来致力于软件开发项目。因此,最好的解决方案之一是让没有编码技能的团队构建网站、软件和应用程序,而实现这一目标的最佳方法是使用无代码和低代码开发平台。无代码和低代码解决方案已经在多个领域流行起来。然而,鉴于大流行给组织带来的时间和资源限制,有必要寻找许多人以前不会考虑的解决方案。

2024-02-18 09:41:25 787

原创 【深度学习:开源数据注释】开源数据注释完整指南

开源数据注释工具是一款专门为图像和视频数据集的图像标记和数据注释而设计的软件。注释是训练计算机视觉模型的重要组成部分,因为需要标签和数据注释来训练模型以产生组织所需的结果/结果。开源工具可以免费使用。任何人都可以下载和使用它们,因此与软件即服务 (SaaS) 产品不同,无需支付许可费或按月订阅费。开源工具通常由类似于慈善机构的基金会通过社区捐赠或科技公司的赞助来维护。

2024-02-17 11:11:09 623

原创 【深度学习:DICOM 注释工具】在 DICOM 注释工具中寻找的 7 个功能

最终,这会导致注释质量降低,因为注释者会丢失他们正在查看的图像中的重要数据。这似乎是显而易见的,但一个基本的考虑因素是你正在查看的注释工具是否可以原生支持 DICOM 文件(如果它可以原生支持其他文件格式,如 NIfTI),它也会有所帮助)。因此,如果您得出的结论是需要更好的解决方案来标记医学图像(尤其是 DICOM 或 NIfTI 格式),那么您将四处寻找图像标记工具。因此,为了帮助您找到合适的平台,我们创建了一份指南,介绍您在选择用于注释和标记 DICOM 图像的工具时需要寻找的七个功能。

2024-02-17 11:10:58 717

原创 【机器学习:数据集拆分】机器学习数据集的训练、验证、测试拆分

训练-测试拆分是机器学习中的一种技术,其中数据集分为两个子集:训练集和测试集。训练集用于训练模型,而测试集用于评估最终模型的性能和泛化能力。当机器学习模型在训练数据上表现良好,但无法泛化到新的、看不见的数据时,就会发生过度拟合。当经过训练的模型从训练集中学习噪声或不相关的模式时,就会发生这种情况,从而导致模型在测试集或验证集上的性能不佳。交叉验证是一种用于评估机器学习算法的模型性能和泛化能力的技术。它涉及将数据集划分为多个子集或折叠。机器学习模型在这些子集的组合上进行训练,同时在其余子集上进行测试。

2024-02-15 11:35:01 1621

原创 【深度学习每日小知识】交并集 (IoU)

交并集 (IOU) 是一种性能指标,用于评估注释、分割和对象检测算法的准确性。它量化数据集中的预测边界框或分段区域与地面实况边界框或注释区域之间的重叠。IOU 提供了预测对象与实际对象注释的对齐程度的衡量标准,从而可以评估模型准确性并微调算法以改进结果。IOU 的计算方法是用预测区域和真实区域的交集面积除以它们的并集面积。IOU的公式可以表示为:IOU = 交集面积 / 并集面积IOU 值越高,表明预测区域与实际区域之间的对齐程度越好,反映出模型越准确。

2024-02-15 11:34:50 1241 1

原创 【前沿技术杂谈:AI 模型训练成本】到 2030 年,AI 模型训练成本预计将从 1 亿美元增加到 5 亿美元

OpenAI 最近的一份报告发现,到 2030 年,训练大型 AI 模型的成本预计将从 1 亿美元上升到 5 亿美元。这是一个惊人的增长,这意味着只有最富有的公司和个人才能负担得起开发和使用人工智能技术的费用。然而,随着人工智能模型训练成本的不断上升,未来可能只有最富有的公司和个人才有能力开发和使用人工智能技术。根据 OpenAI 最近的一份报告,到 2030 年,训练大型 AI 模型的成本将从 1 亿美元上升到 5 亿美元。值得注意的是,人工智能的开发成本并不是决定谁有能力使用人工智能技术的唯一因素。

2024-02-14 07:49:15 755

原创 【前沿技术杂谈:迁移学习】欧洲人工智能法案对人工智能开发者的意义 [2023 年 12 月更新]

与大多数欧盟立法一样,《人工智能法》起源于欧盟的一系列委员会。该法案是两个机构的心血结晶,即欧洲内部市场和消费者保护委员会(“IMCO”)和公民自由、司法和内政委员会(“LIBE”),这两个委员会似乎比开发人员更喜欢冗长的缩写词,它们于 2021 年 4 月 21 日首次通过欧盟委员会提出了该法案。既然我们已经解决了这个问题,下面我们就来谈谈人工智能的一些法律定义🎉。

2024-02-14 07:49:04 921

原创 【深度学习:迁移学习】图像识别预训练模型的迁移学习

迁移学习通常是指将针对一个问题训练的模型以某种方式用于第二个相关问题的过程。在深度学习中,迁移学习是一种技术,通过这种技术,神经网络模型首先在与正在解决的问题类似的问题上得到训练。然后将训练过的模型中的一个或多个层用于针对相关问题训练的新模型中。迁移学习是计算机视觉领域的一种流行方法,因为它能让我们以省时省力的方式建立精确的模型。在迁移学习中,学习过程不是从零开始,而是从解决不同问题时学到的模式开始。这样就能充分利用以前的学习成果,避免从头开始。

2024-02-12 08:54:16 1202

原创 【深度学习每日小知识】全景分割

全景分割算法将语义分割和实例分割相结合,可以区分对象的一般类及其组成部分或实例。它们可以处理各种对象类,例如物体(例如天空、草地和道路)和事物(例如车辆、人和建筑物),并精确地分割和标记整个类和对象的特定部分。对象。通过在这个动态研究领域开发新的策略和方法,全景分割算法的准确性和效率正在得到提高。它是计算机视觉中的一项关键任务,具有多种用途,例如增强现实、对象识别以及图像和视频分析。全景分割作为一个整体,是一种彻底的图像分割方法,需要将图像或视频分解为单独的对象及其组成部分,并用适当的类别标记每个像素。

2024-02-12 08:54:05 688

原创 【深度学习:语义分割】语义分割简介

什么是图像分割?了解语义分割数据采集语义分割的深度学习实现全卷积网络上采样跳跃连接U-NetDeepLab多尺度物体检测金字塔场景解析网络(PSPNet)语义分割的应用医学影像自动驾驶汽车农业图片处理语义分割的缺点使用 Encord 加速细分语义分割:关键要点计算机视觉算法旨在从图像和视频中提取重要信息。其中一项任务是语义分割,它提供有关图像中各种实体的粒度信息。在继续之前,我们先简要介绍一下图像分割的总体情况。图像分割模型使机器能够理解图像中的视觉信息。

2024-02-11 11:26:42 953

原创 【深度学习每日小知识】卷积神经网络(CNN)

在深度学习领域,卷积神经网络(CNN)彻底改变了视觉分析领域。凭借从图像中提取复杂模式和特征的能力,CNN 已成为图像分类、目标检测和面部识别等任务不可或缺的一部分。本文全面概述了 CNN,探讨了其架构、训练过程、应用和优势。从理解卷积层到掌握池化层和全连接层的力量,深入研究 CNN 的世界,发现它们如何改变人工智能时代的视觉分析。

2024-02-11 11:26:32 868

原创 【深度学习:MPT-30B】提高开源基础模型的标准

中进一步深入探讨了编程能力,其中我们将 MPT-30B、MPT-30B-Instruct 和 MPT-30B-Chat 的 HumanEval 分数与现有开源模型(包括为代码生成而设计的模型)进行了比较。我们还创建了 MPT-30B-Chat,这是 MPT-30B 的对话版本。今天,我们很高兴通过 MPT-30B 扩展 MosaicML 基础系列,MPT-30B 是一种获得商业用途许可的新型开源模型,其功能明显比 MPT-7B 更强大,并且性能优于原始的 GPT-3。请继续关注我们的基础系列中的更多型号!

2024-02-10 09:27:05 1461

原创 【深度学习: ChatGPT 】经验教训:使用 ChatGPT 作为 ML 工程师一天

很少有技术发展能像 OpenAI 发布 ChatGPT 那样迅速和鲜明地抓住公众的想象力。在推出后的两个月内,它就获得了超过 1 亿用户,这是历史上最快的公共应用程序。虽然许多人认为 ChatGPT 在技术上是一次飞跃,但它真正的火花并不是基于巨大的技术进步(GPT3,它所基于的模型已经存在了近 3 年),而是因为它是一个人工智能应用程序,完美地针对个人人类互动进行了校准。正是它作为一个人工智能系统的炫耀性,可以展示现实世界的价值,让公众如此敬畏。

2024-02-10 09:26:53 783

原创 【深度学习:Bard】我们 AI 之旅的重要下一步

现在是一个非常激动人心的时刻,因为我们将深入的研究和突破转化为真正帮助人们的产品。这就是我们在大型语言模型方面所经历的旅程。两年前,我们推出了下一代语言和对话功能,由对话应用程序语言模型(简称 LaMDA)提供支持。我们一直在开发一项实验性的对话式 AI 服务,由 LaMDA 提供支持,我们称之为 Bard。今天,我们又向前迈进了一步,在未来几周内向公众更广泛地开放之前,向值得信赖的测试人员开放。Bard 力求将世界知识的广度与我们大型语言模型的力量、智慧和创造力相结合。

2024-02-09 10:38:43 736

原创 【前沿技术杂谈:多模态文档基础模型】使用多模态文档基础模型彻底改变文档 AI

此外,研究人员还开发了 LayoutXLM,这是一种基于 LayoutLMv2 的多模态预训练模型,但可以执行多语言文档理解,以满足使用各种语言的不同用户的需求。与包含扫描文档图像和数字生成的 PDF 文件的固定布局文档不同,许多基于标记语言的文档(如基于 HTML 的网页和基于 XML 的 Office 文档)通常是实时呈现的。随着时间的推移,文档人工智能的技术进步使其在金融、医疗保健、能源、政府服务和物流等各个行业的应用,为这些行业的人们节省了大量时间,因为他们现在可以避免手动处理。

2024-02-09 10:38:20 885

原创 【深度学习:SegGPT】在上下文中分割所有内容 [解释]

在其中,由Xinlong Wang,Xiaosong Zhang,Tue Cao,温 Wang,Chunhua Shen和Tiejun Huang组成的BAAI团队展示了计算机视觉挑战难题的另一部分:一个通才模型,允许通过上下文推理解决图像和视频中的一系列分割任务。现有模型的问题在于,切换到新模式或分割视频而不是图像中的对象需要训练新模型。您还可以设置 SegGPT,以便随着注释者完善和纠正其辅助标记,它会随着时间的推移进行学习和改进,从而随着时间的推移获得更好的性能并进一步简化注释过程。

2024-02-08 21:33:41 1292

原创 【深度学习:掌握监督学习】掌握监督学习综合指南

监督学习是一种机器学习,算法从标记数据中学习以进行预测。简单来说,这就像教机器根据您提供的示例识别数据中的模式或关系。这些示例(也称为训练数据)由输入特征及其相应的目标标签组成。目标是构建一个模型来从这些训练数据中学习,以便对新的、看不见的数据进行准确的预测或分类。在机器学习中,通常有四种主要的学习范式:监督学习、自我监督学习、无监督学习和强化学习。与监督学习相反,无监督学习处理数据集中未标记的数据;自监督学习是指模型在没有明确监督或标记的情况下从数据中学习;

2024-02-08 21:33:32 836

原创 【深度学习:自动化数据标签 】如何自动化数据标签 [示例 + 教程]

通过利用人工智能技术执行数据标注任务,企业可以降低人为错误的风险,提高模型开发的速度和效率,并最大限度地降低与手动标注相关的成本。但是,需要注意的是,自动分割算法的准确性取决于输入数据质量和分割任务的复杂性。通过使用用于自动数据标记的注释工具,组织可以减少为机器学习模型创建高质量训练数据集所需的时间和成本。但是,重要的是要确保所使用的工具适合特定任务,并且标记的数据经过仔细验证和验证以确保其质量。自动数据标记是使用软件工具和算法,使用有助于识别和分类数据的标签或标记来自动注释或标记数据。

2024-02-07 21:02:54 1136

原创 【深度学习: AutoAugment】使用 AutoAugment 提高深度学习性能

通过增强ImageNet数据,我们获得了新的最先进的精度,top1精度为83.54%,而在CIFAR10上,我们实现了1.48%的错误率,这比科学家设计的默认数据增强提高了0.83%。AutoAugment是一种自动为计算机视觉数据集设计自定义数据增强策略的方法,例如,指导基本图像转换操作的选择,例如水平/垂直翻转图像,旋转图像,改变图像的颜色等。AutoAugment不仅可以预测要组合的图像转换,还可以预测使用的每个图像的概率和转换的大小,这样图像就不会总是以相同的方式进行操作。

2024-02-07 21:01:22 943

原创 【深度学习: 计算机视觉】如何改进计算机视觉数据集

无论哪种方式,当您的机器学习团队尝试解决困难的边缘情况并且没有足够的原始数据时,始终可以创建或购买一些可以提高训练模型准确性的合成数据。如果您可以从开源或专有数据集访问所需的数据量,则继续为模型提供数据 - 并相应地调整数据集标签和注释 - 直到它开始生成您需要的结果。现在您已经获得了足够的数据来继续训练和重新训练模型,应该可以开始实现您所需的性能和准确性标准。这些结果将向您展示模型失败的原因和位置。但是,如果这是不可能的,并且您无法从其他开源的真实数据集中获取所需的数据,那么还有另一种解决方案。

2024-02-03 12:28:27 860

【信号处理:小波包转换(WPT)/小波包分解(WPD) 】C++源代码

【信号处理:小波包转换(WPT)/小波包分解(WPD) 】C++源代码

2024-01-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除