自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 资源 (1)
  • 收藏
  • 关注

原创 操作系统八股文背诵版

临近秋招,整理了一下前段时间找实习时被问过的高频八股(多为互联网大厂)+一些自己的补充。这些只是最基础最基础必须全文背诵的八股!答案很简略,基本都是自己的理解,如有勘误还请指出,虚心改正。

2023-08-08 22:51:06 212

原创 计算机网络八股文背诵版

无状态指的是不会记录客户状态信息,即每个“请求-响应”都独立。传统静态页面,前后请求不需要关联。如何使HTTP有状态?cookie。】【:8080】三个部分分别是协议、主机、端口号当浏览器从一个域名的网页去请求另一个域名的资源,以上三者任一不同均为跨域。

2023-08-08 22:47:27 501

原创 数据库八股文背诵版

事务是数据库执行的逻辑单位,包含一系列读写操作,整个单元不可分割,是原子性的。ACID,即原子性、一致性、隔离性、持久性(一致性是指,事务执行前后,数据库都必须处于一致的状态,如转账)聚集索引。支持事务、行级锁、外键表文件为xxx.ibd,包括表结构、数据、索引非聚集索引。不支持事务、行级锁、外键;访问速度快存储文件格式:xxx.sdi->表结构;xxx.MYD->数据;xxx.MYI->索引表数据存储在内存中,只作临时表或缓存使用;hash索引文件只有xxx.sdi。

2023-08-08 22:38:19 436

原创 本地搜索攻击算法详解——DNN的黑盒对抗性扰动方法

基于对抗的测试输入生成方法是从机器学习和深度学习的角度入手,通过向原始样本添加微小扰动的方式产生对抗样本,使DNN系统进行错误分类。其又分为白盒、灰盒和黑盒攻击,顾名思义,黑盒攻击就是在无法获取模型内部结构信息的情况下,仅通过模型的输入输出来生成对抗样本。本次讲解黑盒攻击的一个经典代表算法——本地搜索攻击算法(论文:《Simple Black-Box Adversarial Perturbations for Deep Networks》)

2023-06-29 22:07:25 693

原创 DLFuzz:深度学习系统中的差分模糊测试框架

本文提出了差分模糊测试框架,在不需要交叉引用其他DL系统和人工标签的情况下,为DL系统产生更多高神经元覆盖率的对抗输入。首次将模糊化测试的基本思想与DL测试相结合,并对其有效性进行了验证。

2023-04-06 16:37:18 689 2

原创 基于流形的图像分类器测试生成

粗略阅读论文《Manifold-based Test Generation for Image Classifiers》,这篇论文在测试输入生成的方法上创新,提出了一种基于流形的测试生成框架,生成了更加真实的测试用例。变分自动编码器(CVAE)的变体捕获数据集的分布域模型,从该流形中采样新的测试用例,使用解码器将其映射到输入维度,得到更有可能是遵循真实分布的测试输入。在流形空间上应用基于搜索的测试生成。生成所需数量的故障揭示输入后,再选择应用适应度函数,确定测试用例的优先级,并选择产生高分的测试用例。

2023-03-24 17:13:52 104

原创 OOD检测方法总结及两种在测试输入生成中的应用

OOD检测方法总结及两种在测试输入生成中的应用

2023-02-23 11:48:22 976

原创 广义OOD数据检测方法的概念辨析

广义OOD检测包含了异常检测(AD)、新颖性检测(ND)、开集识别(OSR)、分布外(OOD)检测和离群点检测(OD)五个子问题

2023-01-23 18:50:36 1110

原创 AI系统测试的数据分布研究

很难判断识别的错误是否确实是DL应用程序有意义的错误。因此提出了一种新的OOD指导的测试技术,旨在生成与底层DL系统任务相关的新的unseen的测试用例。结果表明,该技术能够在CIFAR-10上滤除高达55.44%的错误测试用例,在增强鲁棒性方面效率提高了10.05%。

2022-12-02 16:44:35 341

原创 在MacOS上使用Aircrack-ng获取WiFi密码

用户与路由器建立连接时确认身份,是通过发送一个将密码进行hash加密后的握手包进行的。因此我们只需要监听并获得该握手包,通过比对字典中的hash值即可确定密码明文。

2022-11-16 23:20:16 2361 4

原创 Cats Are Not Fish:深度学习测试中的分布外数据研究

该论文主要是对深度学习测试用例生成中的分布外数据(OOD)的讨论,并根据实验结果提出了一系列针对未来研究方向的建议,对提升测试用例生成的质量有一定的帮助。

2022-10-27 23:19:07 510

原创 code2vec相关文献总结

​AI for test基本都有涉及到源代码的表示问题(如:将源代码转换为向量,使用向量进行聚类,针对聚类结果进行测试用例优先级排序),其中code2vec就是一种将代码转化为词向量的工具,详见code2vec介绍PPT。​

2022-10-12 22:03:27 555

原创 DeepXplore相关文献总结

使用工具connected papers绘制了和DeepXplore相关的文献脉络图,并了解各个文献的主要工作如下。

2022-09-18 18:55:37 1069

原创 使用快速排序、堆和桶解决「TopK问题」(Python)

TopK问题即求解第K个最大or最小元素的问题,一般使用快排和堆来实现。

2022-09-16 20:25:04 915

原创 ADAPT——具有自适应神经元选择策略的DNN有效白盒测试

本文提出一种用于DNN的新白盒测试技术ADAPT,该技术使用了一种新方法来改进现有的神经元选择策略,通过不断适应正在进行的测试过程来有效地进行神经元选择。对现实世界网络模型和数据集的实验表明,就覆盖率和发现的对抗性输入而言,ADAPT比现有的测试技术更有效。

2022-09-08 19:38:10 802

原创 Java垃圾回收机制总结

Java垃圾回收机制:垃圾回收(GC,Garbage Collection)是 Java 虚拟机(JVM)垃圾回收器提供的一种用于在空闲时间不定时回收无任何对象引用的对象所占据的内存空间的一种机制。注意:回收只是清理“垃圾”占用的内存空间而非对象本身。

2022-09-07 13:44:22 1299

原创 使用程序切片来提高集群测试选择的效率和有效性

程序切片对每个测试用例的执行配置文件进行过滤,以突出显示受修改影响的软件部分,称为切片过滤。给定P中的si语句:x = z,在P'中更改为y = z,使用以下 3 个切片的并集:〈si,{x}〉处的前向切片;以使用变更为例,如果一条语句 si ,从P中的x = y更改为P'中的x = z,则〈si,{x}〉处的前向切片,〈si,{z}〉处的后向切片的并集将会被使用。它可以减小执行配置文件(例如语句)的大小,以进行有效的集群分析,为 CTS 处理大型软件提供了更多潜在的可扩展性。收集测试用例的执行配置文件。.

2022-08-31 21:31:48 181

原创 机器学习的冒烟测试

为此,基于输入域的等价类分析开发了一套冒烟测试,以识别输入域中可能揭示错误的有问题的区域。此外,机器学习算法具有许多超参数,可以配置开发的机器学习模型的复杂性(例如决策树的深度、神经元的数量),也可以配置优化算法(例如牛顿梯度下降或随机梯度下降),而由于问题的指数性质,用网格搜索对超参数进行穷举测试通常是不可能的。因此提出了一种简单方法,其中测试的数量只随超参数的数量线性增长。将方法应用于三个最先进的机器学习库,以评估测试有效性,即是否能检测到以前没有检测到的真实错误。...

2022-08-04 16:02:16 255

原创 11种DNN测试用例优先级指标

粗略阅读论文《An Empirical Study on Test Case Prioritization Metrics for Deep Neural Networks》。本文相当于是对各种测试用例优先级指标的归纳,可以用于了解这些指标,以便在自己的实验设计中使用。主要工作:从故障检测比率、准确性、相关性角度研究了 11 个测试用例优先级度量,共分为4类:惊喜充分性、置信度分散性、变异不确定性和变异率。对两个基准数据集和 DNN 模型的指标进行了实证研究。实验结果表明,基于置信度分散的指标在

2022-05-04 19:07:33 862

原创 通过多边界聚类和优先级排序(MCP)来促进神经网络再训练

本周阅读了论文《Multiple-Boundary Clustering and Prioritization to Promote Neural Network Retraining》,该论文主要提出了一种叫MCP的方法,选择有效的输入子集对DL模型进行再训练,以提高模型的质量。在我们的研究中,可以考虑本文的边界聚类的算法思想。主要工作:前提:测试工作中,常通过标记从测试上下文中收集有效输入子集来重新训练DL模型,提高模型质量。本文提出:多边界聚类和优先级排序(MCP)——将测试样本聚

2022-04-26 19:34:06 1548

原创 通过DNN的情绪指标(sentiment)对测试输入进行排序

本周粗略阅读了论文《Input Prioritization for Testing Neural Networks》,该论文研究了通过DNN的三种情绪指标(sentiment)来对测试输入进行优先级排序的有效性,对今后的研究方向有一定提示。例如,我们可以将文中提到的这些情绪指标糅合到自己的优先级排序方法中,或者将这些指标进行结合,比较它们的效果等等。由于阅读的是英文原文,有一些词汇不知道如何翻译,所以在括号后标注了原单词。如有不当,欢迎指正。主要工作:本文从模型执行的计算中得到 DNN 的情绪

2022-04-23 20:55:57 943

原创 DeepOrder:持续集成测试中测试用例优先级的深度学习

本周粗略阅读了论文《DeepOrder: Deep Learning for Test Case Prioritization in Continuous Integration Testing》,该论文是在传统软件测试中使用AI帮助测试用例选择的代表。主要工作:提出DeepOrder:在CI中,使用任意数量测试执行历史记录(持续时间、执行状态),基于多个因素学习失败的测试用例,对测试用例进行排序。贡献: 使用有监督学习,用历史测试数据训练基于回归的回归测试优先级深度学习模型;

2022-04-11 15:27:08 1765

原创 TestRank:一种结合测试用例内在属性和上下文属性对其进行排序的测试优先级技术

本周阅读论文《TestRank: Bringing Order into Unlabeled Test Instances for Deep Learning Tasks》,阅读笔记如下。主要工作:提出了一种测试优先级技术TestRank,根据错误揭示功能排序未标记的测试实例。该技术同时利用测试实例的固有属性和上下文属性:首先在测试实例和训练样本上构建相似性图,然后进行基于图的半监督学习,提取上下文特征。然后对于特定的测试实例,将从图神经网络(GNN)中提取的上下文特征和使用DL模型本身获得的内

2022-04-06 17:33:46 1244

原创 一种深度神经网络的测试输入选择算法

本周粗略阅读了《Test Input Selection for Deep Neural Networks》,该论文主要提出了一种深度神经网络的测试输入选择算法,该算法与DeepXplore相比表现更好。主要工作:本文提出了一种测试子集选择算法,通过选择值得标注的测试输入来缓解Oracle问题的算法。该算法可以在标记预算有限的情况下自动选择覆盖率高但规模小的测试用例集。与DeepXplore算法相比,该算法可以生成更小的测试集,具有更高的覆盖率。贡献: 提出了一种基于动态规划和DNN结构覆

2022-03-31 20:05:04 1158

原创 DeepGini——对海量测试进行排序以增强深度神经网络的稳健性

论文《DeepGini: Prioritizing Massive Tests to Enhance the Robustness of Deep Neural Networks》提出了一种DNN测试优先级排序方法DeepGini,该方法不仅优于现有神经元覆盖技术,而且对提高DNN质量有帮助。本文参考了这篇【论文转述】,侵删。主要工作:提出了DeepGini:一种基于DNN统计视角设计的测试优先级技术,可以将测量错误分类概率的问题简化为测量集合杂质的问题,使能够快速识别可能被错误分类的测试。

2022-03-24 15:26:20 1522

原创 通过聚类方法改进测试用例优先级排序技术

论文《A Clustering Approach to Improving Test Case Prioritization: An Industrial Case Study》结合聚类方法,利用代码覆盖率、代码复杂性、真实故障的历史数据以及组合技术帮助改进了测试用例优先级排序技术,在回归测试中提供了一个很好的思路。实验对象:Microsoft Dynamics Ax步骤: 聚类 优先级排序 聚类:使用Matlab实现凝聚层次聚类方法(测试用例对之间的距离):先将代码覆盖相似

2022-03-22 19:24:33 800

原创 PACE——深度神经网络测试的实用准确度估计方法

PACE 是论文《Practical Accuracy Estimation for Efficient Deep Neural Network Testing》中提出的一种用于DNN测试中的估计测试集准确性的方法。同时,该论文也对PACE的有效性进行了实验。主要工作:实现了一个方法PACE,该方法选择一小组测试输入(即测试输入的子集),精确估计整个测试集的准确性。PACE步骤: 根据测试能力对测试输入聚类 MMD-critic算法,选择每组的原型(最能代表该组测试能力的测试输入

2022-03-17 21:34:52 1695

原创 FLAST——测试是否flaky的快速静态预测方法

本周阅读论文《Know You Neighbor: Fast Static Prediction of Test Flakiness》,主要了解了FLAST方法的思想和flaky tests的概念。Flaky Tests:指在被测对象和测试条件都不变的情况下,有时失败、有时成功的测试。本文提出了FLAST方法,使用k-Nearest Neighbor分类器来预测测试是否flaky。本文贡献: Idea:一种基于测试代码静态分析的基于相似性的flakiness检测方法。 Eva

2022-03-11 09:24:03 554

原创 深度学习系统的测试选择

本周粗略阅读了论文《Test Selection for Deep Learning Systems》,并参考了陈老师实验室发布的翻译,记录个人的阅读笔记,侵删。本文主要内容:本文基于模型不确定性对一组测试选择指标进行了实证比较,假设不确定性最大的样本同样也是信息量最大的样本,应优先使用再训练来改进。在五个模型和三个图像分类问题上评估,证明了基于不确定性的度量具有很强的识别错误分类输入的能力,比惊讶指标(Surprise Adequacy)强三倍,并且优于覆盖相关指标。还发现这些指标可以在再

2022-02-10 19:13:14 928 2

原创 秘密共享者:神经网络中无意识记忆的评价与测试

本周粗略阅读了论文《The Secret Sharer: Evaluating and Testing Unintended Memorization in Neural Networks》,并参考了陈老师实验室发布的翻译,记录个人的阅读笔记,侵删。本文主要内容总结:深度神经网络模型的无意识记忆带来了隐私泄露的风险。因此,本文提出了一种定量评估该风险的方法,使深度学习从业者能够选择训练方法,以最大限度地减少记忆,从而有利于隐私保护。论文重点内容:研究原因:在生成文本模型中,如果对敏感数据

2022-02-03 20:36:23 1908

原创 利用测试执行历史提高测试有效性

本周课堂汇报需要讲解论文《Improving Test Effectiveness Using Test Executions History: An Industrial Experience Report》的后半部分(第Ⅳ-Ⅷ节),记录阅读笔记。这篇论文主要研究了使用测试执行历史来进行测试选择和优先级排序的技术在实际项目中提高测试有效性。测试执行历史中包含了非常重要的信息——历史测试失败频率、测试失败之间的关联和测试开销。本文前半部分,测试选择从这三个信息的角度出发分别设计了FreqSelect

2021-12-13 15:50:50 212

原创 测试信息可视化辅助故障定位

本周阅读了论文《Visualization of Test Information to Assist Fault Localization》,以下记录重点。Abstract:调试过程中最昂贵、最耗时的组件之一是定位错误或故障。本文提出了一种利用可视化技术来辅助完成定位的新技术并实现了一个使用该技术的工具。该技术使用颜色直观地映射每个程序语句在测试套件执行结果中的参与程度。基于这种可视化映射,用户可以检查程序中的语句、识别失败中涉及的语句、定位潜在的错误语句。1 Introduction

2021-11-09 17:56:20 289

原创 深度学习缺陷特征的综合研究

本周阅读了论文《A Comprehensive Study on Deep Learning Bug Characteristics》,以下总结论文要点。研究数据来源:来自Stack Overflow的高质量帖子:可以了解开发人员在使用深度学习库构建软件时遇到的错误。 Github关于5个深度学习库(Caffe, Keras, Tensorflow, Theano, Torch)的错误修复提交:可以了解在开源软件中发现并修复的错误。问题:RQ1(bug类型):哪些类型的bug更常见?

2021-11-05 21:42:44 656

原创 深度学习系统变异算子的实证评估

本周阅读了论文《An Empirical Evaluation of Mutation Operators for Deep Learning Systems》,实验部分特别是RQ2没太看懂,在此对该文章内容做简单总结,等待之后进一步补充。基本概念:变异测试:将人为故障注入系统。假设暴露(杀死)该人为故障的能力可以等同为暴露真实故障的能力。DNN故障不一定是影响传统软件的逻辑故障,而是取决于模型怎么训练的。DeepMutation(DM):DL变异算子框架,包含源级算子、模型级算子两种。

2021-11-04 19:36:55 1030

原创 神经元覆盖率(NC)对于测试深度神经网络有意义吗?

阅读论文《Is Neuron Coverage a Meaningful Measure for Testing Deep Neural Networks?》。记录阅读笔记。全文内容总结:在以往研究中,基于增加NC可以提高测试集质量的隐含假设,NC被用于指导测试生成。本文设计了一种新的促进多样性的正则化算法,该算法可以嵌入现有的对抗性攻击算法(CW、PGD)中。并评估增加NC是否能生成测试套件满足:能检测对抗性攻击 产生自然输入 对特定类别预测没有偏见结果却发现:增加NC会使生成有

2021-10-21 19:53:09 1948 3

原创 深度神经网络模型覆盖准则与模型的相关性

精读论文《Correlations between Deep Neural Network Model Coverage Criteria and Model Quality》。记录阅读笔记。研究问题:神经网络模型覆盖率与模型质量之间是否存在与传统软件测试中相似的单调性。1 introductionDNN:由输入层、输出层和多个内层组成,每层包含一组神经元。在模型推理or预测过程中,某一层的神经元激活值根据上一层的值计算,如果该值小于0,则将其设置为0,并对后续层的贡献为0,即神

2021-10-21 14:18:04 1395 1

code2vec论文阅读汇报PPT

参考了知乎专栏:https://zhuanlan.zhihu.com/p/293374541。侵删。

2022-06-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除