自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 收藏
  • 关注

原创 博客文章创作计划

计划在2023年完成,每个一级标题代表一个专栏。

2023-07-13 19:55:12 93

原创 《数据结构题集(C语言版)》第2章(线性表)习题自解答

《数据结构题集(C语言版)》是《数据结构(C语言版)》(严蔚敏)的配套书籍。本文是第2章(线性表)习题的部分自解答,完成后经过订正、简单测试运行。

2020-04-02 10:39:38 3608

原创 使用判别分析(DA)进行三维荧光光谱快速分类的实验报告

首先收集4个不同来源的公开光谱数据集,然后使用主成分分析-线性判别分析(PCA-LDA)、偏最小二乘判别分析(PLSDA)建立识别模型。最后对分类结果进行分析比较。

2024-04-09 20:13:06 886

原创 VGG16-CF-VGG11实验报告

目前结合三维荧光图像与CNN的研究很多。本实验使用VGG16网络对三维荧光数据进行分类,使用改进的VGG11网络拟合荧光组分。

2024-03-05 18:44:43 1374

原创 Typora实用配置

可以在“首选项”面板上启用此功能。默认情况下,文档每5分钟保存一次。如果要更改时间间隔,打开高级设置>

2024-03-03 21:45:40 225

原创 《中国计算机学会通讯》2022年第10期读书笔记

在我国科技走向自立自强的新形势下,计算机技术发展又面临70年未有之大变局,CCCF如何更上一层楼,发挥更大的作用,值得深思。在CCCF出刊200之际,CCCF前主编李国杰院士为CCCF以后的发展指明了方向。

2024-03-03 21:26:59 933

原创 商用数据标注平台参考-华为云ModelArts

ModelArts是面向开发者的一站式AI开发平台,为机器学习与深度学习提供海量数据预处理及半自动化标注、大规模分布式Training、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。

2024-03-03 21:11:27 967

原创 LabelImg官方文档摘录

LabelImg是一个图形化的图像标注工具。它是用Python编写的,并使用Qt作为其图形界面。标注保存为XML文件,支持格式:PASCAL VOC。YOLO、CreateML。

2024-03-03 19:24:49 300

原创 本科毕业论文片段示例(基于JavaEE的数据标注项目管理系统)

本文提供了两个章节的示例:系统详细设计、结束语。

2024-03-02 23:15:58 926

原创 开题报告《基于JavaEE的数据标注项目管理系统的设计与实现》

选题将项目管理运用于数据标注活动,开发与实现一个专门解决数据标注项目管理问题的软件平台,有利于使得数据标注活动组织更科学、规范和高效。

2024-03-02 22:44:10 1496

原创 《无线网络技术》考试版笔记

无线网络是对固定网络的极好补充而非替代,无线局域网的实现标准是IEEE 802.11。世界的移动性正变得越来越高,而无线网络具有移动性和灵活性的特点,可被快速部署。相应地,无线电频谱正成为一种关键资源。

2024-03-01 23:27:27 965

原创 数据标注项目管理-外文资料摘录

《管理数据标注项目的最佳实践》《数据标注团队的领导》是与数据标注项目管理相关的两篇外文资料。

2024-03-01 20:03:07 266

原创 《Flask入门教程》学习笔记

《Flask入门教程》提供了入门 Flask 所需的最少信息,作者李辉(Grey Li)是《Flask Web 开发实战》的作者、Pallets Team 成员。

2024-02-29 20:17:15 1318 1

原创 日立F-4700FL数据分析实验报告

实验设定日立F-4700FL为荧光分光光度计,可输出三维光谱扫描结果到计算机。D和L为两种化合物。对4种不同的溶液进行三维光谱扫描,得到的光谱文件如下。溶质光谱文件无K.txtDD.txtLL.txtD+LH.txt光谱文件(txt)的内容格式如下。Sample: ...File name: ...Run date: ...Operator: ...Comment: ...Instrument...Instrument pa

2024-02-29 14:19:56 484

原创 数据标注工程——概念、方法、工具与案例

通过对人工智能数据标注的概念、方法、工具与案例的系统介绍,结合对图像、视频、语音、文本和3D点云等类别数据的具体标注案例的分析与操作,使初学者可以快速掌握数据标注的基础知识和常用方法,使从业者在提升数据标注技术水平的同时,掌握工程化数据标注的项目组织、管理和质量控制的技术与方法。

2024-02-28 21:19:48 948

原创 刘鹏《数据标注工程》读书笔记

本书系统地介绍了数据标注的基本概念、分类、流程、质量检验、管理和应用等。本书既可以作为培养应用型人才的课程教材,也适用于初学者,以及广大的数据标注行业从业者。

2024-02-28 15:02:38 788

原创 《面向机器学习的数据标注规程》摘录

本标准确立了数据标注规程框架,规定了数据标注的具体规程。本标准适用于面向人工智能研究或开发应用等需要实施数据标注的企业、高校、科研院所、政府机构等。

2023-12-16 17:43:13 1110

原创 《PMBOK指南第6版》笔记

二十世纪中期,项目经理开始致力于将项目管理确立为一种职业,其中一个方面就是对知识体系(BOK)的内容,即项目管理达成一致意见。这一知识体系后来称为“项目管理知识体系”(PMBOK)。项目管理协会(PMI)制定并发布了《项目管理知识体系指南》。PMI将PMBOK定义为描述项目管理专业范围内知识的术语。PMBOK包括已被验证并广泛应用的传统做法,以及本专业新近涌现的创新做法。

2023-12-16 17:20:34 912

原创 深度优先搜索DFS与记忆化搜索

深度优先搜索算法是一种用于遍历或搜索树或图的算法。这个算法会尽可能深地搜索树的分支。当节点v的所在边都己被探寻过,搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源节点可达的所有节点为止。如果还存在未被发现的节点,则选择其中一个作为源节点并重复以上过程,整个进程反复进行直到所有节点都被访问为止。

2023-12-07 22:44:46 880

原创 用BFS求最短路 - 习题6道

可用BFS求解图中两个结点之间的最短路径。这样的图通常在形式上为矩形点阵(网格迷宫),每个可走的点(网格,下同)为图的结点,图的边则描述了从一个结点与其相邻结点直接连通的状态。在二叉树的BFS中,结点的访问顺序恰好是它们到根结点距离从小到大的顺序。类似地,图的BFS的过程就是把从起点到终点过程中遍历的点建成以起点为根结点,终点为叶节点的一棵树(称为最短路树,或者BFS树)的过程。

2023-11-19 17:13:59 158

原创 组合数学(下):概率、博弈

计算机科学的核心内容是使用算法处理离散数据。随着计算机科学的日益发展,组合数学的重要性也日渐凸显。组合数学,又称为离散数学。广义的组合数学就是离散数学,狭义的组合数学是离散数学除图论、代数结构、数理逻辑等的部分,主要研究满足一定条件的组态(也称组合模型)的存在、计数以及构造等方面的问题。 组合数学的主要内容有组合计数、组合设计、组合矩阵、组合优化(最佳组合)等。

2023-11-16 21:37:28 106

原创 组合数学(上):数列、排列、组合

计算机科学的核心内容是使用算法处理离散数据。随着计算机科学的日益发展,组合数学的重要性也日渐凸显。组合数学,又称为离散数学。广义的组合数学就是离散数学,狭义的组合数学是离散数学除图论、代数结构、数理逻辑等的部分,主要研究满足一定条件的组态(也称组合模型)的存在、计数以及构造等方面的问题。 组合数学的主要内容有组合计数、组合设计、组合矩阵、组合优化(最佳组合)等。

2023-11-16 12:30:10 89

原创 论文阅读[121]使用CAE+XGBoost从荧光光谱中检测和识别饮用水中的有机污染物

本文介绍一种基于EEM的饮用水中有机污染物检测新方法,该方法适用于在水质背景波动的情况下,低浓度分析物的光谱信号较弱的情况。首先使用CAE降低EEM的维数并从中提取多层特征,接着使用XGBoost分类器来识别有机污染物。

2023-11-10 20:48:03 550

原创 并查集与最小生成树

并查集是一种树型的数据结构,用于处理一些不相交集合的合并及查询问题,常常在使用中以森林来表示。

2023-11-10 18:55:48 101

原创 动态规划笔记+经典习题十道

动态规划通常应用于最优化问题,即要做出一组选择以达到一个最优解。在做选择的同时,经常出现同样形式的子问题。当某一特定的子问题可能出自于多于一种选择的集合时,动态规划是很有效的;关键技术是存储每一个子问题的解,以备它重复出现。利用这种简单思想,可将时间复杂度从指数级别降低到多项式级别。

2023-11-04 23:45:29 657

原创 贪心算法经典习题7道

贪心算法:在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,算法得到的是在某种意义上的局部最优解。贪心算法不是对所有问题都能得到整体最优解,关键是贪心策略的选择。

2023-11-02 16:25:25 231

原创 长整数加法 - C++实现

整数长度不超过1000。每组数据有一行,包含两个数字a,b。对于每组数据输出一行,即a+b的值。

2023-10-30 21:12:33 68

原创 《C程序设计》笔记(ch1-2)

每件事都需要事先设计出“行动步骤”。许多问题往往需要使用者参考已有的类似算法的思路,重新设计解决特定问题的专门算法。

2023-10-24 23:39:27 323

原创 论文阅读[51]通过深度学习快速识别荧光组分

本文开发了一个基于深度学习方法的快速荧光识别网络模型,通过简单地输入单个3D-EEM光谱来快速预测荧光成分的数量和光谱。

2023-10-21 23:09:17 1255 1

原创 荧光EEM平滑教程(去除散射)

数据预处理是对荧光EEM进行PARAFAC分析的必要准备步骤。 所有EEM都包含瑞利和拉曼散射,去除散射的过程称为平滑。

2023-10-19 12:02:53 631

原创 Matlab工具箱N-way的使用

MATLAB的N-way工具箱提供了一组函数和算法,利用一些多线性模型来对多维数据集进行建模。开发环境:MATLAB 5.x支持的约束:非负、单峰工具箱下载:https://ucphchemometrics.com/wp-content/uploads/2023/09/Nway-Version-3.5.zip在线教程:https://ucphchemometrics.com/n-way-course/本文余下部分为教程笔记。

2023-10-16 22:39:29 239

原创 论文笔记与复现[156]PARAFAC. tutorial and applications

本文介绍了PARAFAC的多维分解方法及其在化学计量学中的应用。PARAFAC是PCA向高阶数组的推广,但该方法的一些特性与普通的二维情况截然不同。例如,可以从多维光谱数据中恢复出纯光谱。

2023-10-12 21:18:50 632 1

原创 Linux安装日志

对于初学者来说,同时管理两个系统可能会有极大的数据损失风险(在操作硬盘的时候)。所以要万分小心,做好备份。多系统的用户需要在硬盘上预留未使用的空间。一般来说安装程序会利用空闲空间分区并安装新系统,保留已有的分区和系统。Ubuntu 22.04需要:25GB空闲磁盘空间、安装介质(U盘)

2023-10-12 15:17:13 52

原创 数据标注管理系统的设计与实现 - 文献综述

随着人工智能的兴起,各类领域对数据标注的需求度越来越高,数据标注的重要性也不断凸显,但是其在发展过程中也面临着一些挑战和问题。数据标注不仅需要有系统的方法、技术和工具,还需要有质量保障体系。标注平台在包含标注工具全部功能的基础上将所有标注环节工具化,可有效地对标注任务进行全局管理和跟踪。

2023-10-07 11:27:31 1473

原创 Windows文件资源管理器使用

介绍:文件管理是操作系统的核心功能之一,从桌面上的“我的电脑”到“此电脑”,资源管理器始终是电脑用户最为熟悉的软件。(相比之下,移动终端的文件管理功能就很弱。)资源管理器的桌面程序名为“文件资源管理器”,在任务管理器中的进程名为“Windows资源管理器”。本文不涉及鼠标的拖放操作。Windows版本:Windows 11(以下简称W11)打开资源管理器:打开桌面上的“此电脑”,或者按Win+E。

2023-10-06 21:12:50 198

原创 SCIBERT论文阅读(预训练语言模型 - 科学文本)

SCIBERT是一个基于BERT的预训练语言模型,用于解决缺乏大规模、高质量、带标签的科学数据的问题。它利用在大型多领域科学出版物上的无监督预训练来提高下游科学NLP任务的性能。

2023-10-06 09:54:52 1229 1

原创 卫星通信论文阅读 - Networking in Heaven as on Earth (HotNets 2018)

随着基于卫星的互联网服务提供商开始破坏市场,互联网将经历重大转型。星座由数百到数千颗卫星组成,有望为最遥远的区域提供低延迟的互联网。本文以SpaceX星座为例,描述了空间操作ISP的业务和互连模型,以及如何把它们集成到当今互联网的主干中。结果显示,即使在10%的部署下,它也为大多数区域提供了高水平的连通性。然而,这种连通性是间歇性的,这对将卫星网络集成到互联网骨干网带来了挑战。

2023-10-04 11:12:12 545

原创 《阿里巴巴Java开发手册》摘录

版本:嵩山版。

2023-09-30 21:39:20 35

原创 【调研报告】人工智能时代的学习

随着人工智能日益深入地影响到经济社会发展的不同层次,教育活动也与人工智能形成了碰撞和融合。人工智能技术的运用正在极大变革着人们的学习方式与思维方式。面对人工智能技术对学校活动所产生的诸多影响,人们应该坚持学习者的本性和自身法则,让人工智能时代的学习方式变革更加具有活力,从而对人类社会的发展和个性的形成起到更为积极的影响。

2023-09-30 15:50:57 338

原创 《数据库原理与应用》课程作业自解答(9.4第二版)

数据库技术产生于20世纪60年代末,是数据管理的有效技术,是计算机科学的重要分支。数据库技术是信息系统的核心和基础,它的出现极大地促进了计算机应用向各行各业的渗透。目前,数据库已经成为每个人生活中不可缺少的部分。

2023-08-31 19:20:18 143

数据标注团队的领导:自然语言处理+机器学习;监督学习;训练数据;标注员之间的共识;领导+指导和评估数据标注团队的质量和进度

内容概要:提取(社交)网络数据并对大型文档集合进行有效搜索,需要大量已标注的、带标签的训练数据语料库,以便从中构建和验证分类器。随着数据的重要性和价值的增长,行业和政府组织正在对大型团队进行投资,他们标注的数据规模是前所未有的。虽然人们对机器学习了解很多,但很少关注管理和领导标注工作的方法和注意事项。本文介绍了几个指标,用于在大型标注团队中对表现和质量进行衡量和监控。在作者为支持美国政府情报分析而领导的标注工作的背景下,提出并评估了最佳领导实践的建议。调查结果显示,经过谨慎的管理最佳实践,标注员利用率、标注员之间的共识和标注率都有显著提高。 适用人群:对机器学习和自然语言处理感兴趣的人、需要进行数据标注或使用标注数据的人、对数据标注项目的管理和领导感兴趣的人。 使用场景:支持美国政府的一项智能文档搜索和实体抽取的项目,该项目需要大量的高质量的标注数据来训练和测试机器学习分类器。 目标:为数据标注领域提供一些管理和领导的最佳实践,以及一些可用于监控标注进度和质量的客观度量。

2024-03-01

管理数据标注项目的最佳实践

内容概要:数据标注对于现代机器学习至关重要,彭博社已经积累了多年的大规模标注经验。2019年秋季,彭博社首席技术官办公室及其全球数据部门联合举办了一次研讨会,参会者由30多名经验丰富的标注项目经理组成。 在研讨会结束后,领导者与参会者一起撰写了本报告。本报告涵盖了从开始一个新的标注项目到定义标注项目、管理时间线、选择工作人员、选择标注工具、编写和测试标注指南,以及培训工作人员的各个方面。 目标:提供关于管理数据标注项目的最佳实践,帮助项目管理人员和数据标注团队有效地规划和执行数据标注项目。 适用人群:主要是数据标注项目的管理者,特别是那些负责指导、监督和协调数据标注工作的人员。

2024-02-29

T∕CESA 1040-2019 信息技术 人工智能 面向机器学习的数据标注规程

T∕CESA 1040-2019 信息技术 人工智能 面向机器学习的数据标注规程

2023-12-16

Tasker v5.9.2-安卓手机自动化神器

Tasker是一个针对Android的应用程序,它根据用户在配置文件中定义的场景(应用程序、时间、日期、位置、事件、手势)执行任务(动作集)。场景也可以是定时器或主屏幕小部件。 本软件在不需要root或特定桌面软件的前提下深刻地扩展了你对安卓设备的控制和它的功能。5.9.2是官方发布的最后一个免费版本。

2023-12-08

荧光EEM平滑教程示例数据Xstart.mat

荧光EEM平滑教程示例数据Xstart.mat

2023-10-19

三维荧光经典论文使用的数据claus2.mat

论文标题:PARAFAC. tutorial and applications(第9节)

2023-10-17

Matlab工具箱N-way教程示例数据claus.mat

Matlab工具箱N-way教程示例数据claus.mat

2023-10-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除