海苔小饼干-CSDN博客

原创操作系统八股文背诵版

临近秋招，整理了一下前段时间找实习时被问过的高频八股（多为互联网大厂）+一些自己的补充。这些只是最基础最基础必须全文背诵的八股！答案很简略，基本都是自己的理解，如有勘误还请指出，虚心改正。

2023-08-08 22:51:06 212

原创计算机网络八股文背诵版

无状态指的是不会记录客户状态信息，即每个“请求-响应”都独立。传统静态页面，前后请求不需要关联。如何使HTTP有状态？cookie。】【:8080】三个部分分别是协议、主机、端口号当浏览器从一个域名的网页去请求另一个域名的资源，以上三者任一不同均为跨域。

2023-08-08 22:47:27 501

事务是数据库执行的逻辑单位，包含一系列读写操作，整个单元不可分割，是原子性的。ACID，即原子性、一致性、隔离性、持久性（一致性是指，事务执行前后，数据库都必须处于一致的状态，如转账）聚集索引。支持事务、行级锁、外键表文件为xxx.ibd，包括表结构、数据、索引非聚集索引。不支持事务、行级锁、外键；访问速度快存储文件格式：xxx.sdi->表结构；xxx.MYD->数据；xxx.MYI->索引表数据存储在内存中，只作临时表或缓存使用；hash索引文件只有xxx.sdi。

2023-08-08 22:38:19 436

原创本地搜索攻击算法详解——DNN的黑盒对抗性扰动方法

基于对抗的测试输入生成方法是从机器学习和深度学习的角度入手，通过向原始样本添加微小扰动的方式产生对抗样本，使DNN系统进行错误分类。其又分为白盒、灰盒和黑盒攻击，顾名思义，黑盒攻击就是在无法获取模型内部结构信息的情况下，仅通过模型的输入输出来生成对抗样本。本次讲解黑盒攻击的一个经典代表算法——本地搜索攻击算法（论文：《Simple Black-Box Adversarial Perturbations for Deep Networks》）

2023-06-29 22:07:25 693

原创 DLFuzz：深度学习系统中的差分模糊测试框架

本文提出了差分模糊测试框架，在不需要交叉引用其他DL系统和人工标签的情况下，为DL系统产生更多高神经元覆盖率的对抗输入。首次将模糊化测试的基本思想与DL测试相结合，并对其有效性进行了验证。

2023-04-06 16:37:18 689 2

原创基于流形的图像分类器测试生成

粗略阅读论文《Manifold-based Test Generation for Image Classifiers》，这篇论文在测试输入生成的方法上创新，提出了一种基于流形的测试生成框架，生成了更加真实的测试用例。变分自动编码器（CVAE）的变体捕获数据集的分布域模型，从该流形中采样新的测试用例，使用解码器将其映射到输入维度，得到更有可能是遵循真实分布的测试输入。在流形空间上应用基于搜索的测试生成。生成所需数量的故障揭示输入后，再选择应用适应度函数，确定测试用例的优先级，并选择产生高分的测试用例。

2023-03-24 17:13:52 104

原创 OOD检测方法总结及两种在测试输入生成中的应用

OOD检测方法总结及两种在测试输入生成中的应用

2023-02-23 11:48:22 976

原创广义OOD数据检测方法的概念辨析

广义OOD检测包含了异常检测（AD）、新颖性检测（ND）、开集识别（OSR）、分布外（OOD）检测和离群点检测（OD）五个子问题

2023-01-23 18:50:36 1110

原创 AI系统测试的数据分布研究

很难判断识别的错误是否确实是DL应用程序有意义的错误。因此提出了一种新的OOD指导的测试技术，旨在生成与底层DL系统任务相关的新的unseen的测试用例。结果表明，该技术能够在CIFAR-10上滤除高达55.44%的错误测试用例，在增强鲁棒性方面效率提高了10.05%。

2022-12-02 16:44:35 341

原创在MacOS上使用Aircrack-ng获取WiFi密码

用户与路由器建立连接时确认身份，是通过发送一个将密码进行hash加密后的握手包进行的。因此我们只需要监听并获得该握手包，通过比对字典中的hash值即可确定密码明文。

2022-11-16 23:20:16 2361 4

原创 Cats Are Not Fish：深度学习测试中的分布外数据研究

该论文主要是对深度学习测试用例生成中的分布外数据（OOD）的讨论，并根据实验结果提出了一系列针对未来研究方向的建议，对提升测试用例生成的质量有一定的帮助。

2022-10-27 23:19:07 510

原创 code2vec相关文献总结

AI for test基本都有涉及到源代码的表示问题（如：将源代码转换为向量，使用向量进行聚类，针对聚类结果进行测试用例优先级排序），其中code2vec就是一种将代码转化为词向量的工具，详见code2vec介绍PPT。

2022-10-12 22:03:27 555

原创 DeepXplore相关文献总结

使用工具connected papers绘制了和DeepXplore相关的文献脉络图，并了解各个文献的主要工作如下。

2022-09-18 18:55:37 1069

原创使用快速排序、堆和桶解决「TopK问题」（Python）

TopK问题即求解第K个最大or最小元素的问题，一般使用快排和堆来实现。

2022-09-16 20:25:04 915

原创 ADAPT——具有自适应神经元选择策略的DNN有效白盒测试

本文提出一种用于DNN的新白盒测试技术ADAPT，该技术使用了一种新方法来改进现有的神经元选择策略，通过不断适应正在进行的测试过程来有效地进行神经元选择。对现实世界网络模型和数据集的实验表明，就覆盖率和发现的对抗性输入而言，ADAPT比现有的测试技术更有效。

2022-09-08 19:38:10 802

原创 Java垃圾回收机制总结

Java垃圾回收机制：垃圾回收（GC，Garbage Collection）是 Java 虚拟机（JVM）垃圾回收器提供的一种用于在空闲时间不定时回收无任何对象引用的对象所占据的内存空间的一种机制。注意：回收只是清理“垃圾”占用的内存空间而非对象本身。

2022-09-07 13:44:22 1299

原创使用程序切片来提高集群测试选择的效率和有效性

程序切片对每个测试用例的执行配置文件进行过滤，以突出显示受修改影响的软件部分，称为切片过滤。给定P中的si语句：x = z，在P'中更改为y = z，使用以下 3 个切片的并集：〈si,{x}〉处的前向切片；以使用变更为例，如果一条语句 si ，从P中的x = y更改为P'中的x = z，则〈si,{x}〉处的前向切片，〈si,{z}〉处的后向切片的并集将会被使用。它可以减小执行配置文件（例如语句）的大小，以进行有效的集群分析，为 CTS 处理大型软件提供了更多潜在的可扩展性。收集测试用例的执行配置文件。.

2022-08-31 21:31:48 181

原创机器学习的冒烟测试

为此，基于输入域的等价类分析开发了一套冒烟测试，以识别输入域中可能揭示错误的有问题的区域。此外，机器学习算法具有许多超参数，可以配置开发的机器学习模型的复杂性(例如决策树的深度、神经元的数量)，也可以配置优化算法(例如牛顿梯度下降或随机梯度下降)，而由于问题的指数性质，用网格搜索对超参数进行穷举测试通常是不可能的。因此提出了一种简单方法，其中测试的数量只随超参数的数量线性增长。将方法应用于三个最先进的机器学习库，以评估测试有效性，即是否能检测到以前没有检测到的真实错误。...

2022-08-04 16:02:16 255

原创 11种DNN测试用例优先级指标

粗略阅读论文《An Empirical Study on Test Case Prioritization Metrics for Deep Neural Networks》。本文相当于是对各种测试用例优先级指标的归纳，可以用于了解这些指标，以便在自己的实验设计中使用。主要工作：从故障检测比率、准确性、相关性角度研究了 11 个测试用例优先级度量，共分为4类：惊喜充分性、置信度分散性、变异不确定性和变异率。对两个基准数据集和 DNN 模型的指标进行了实证研究。实验结果表明，基于置信度分散的指标在

2022-05-04 19:07:33 862

原创通过多边界聚类和优先级排序（MCP）来促进神经网络再训练

本周阅读了论文《Multiple-Boundary Clustering and Prioritization to Promote Neural Network Retraining》，该论文主要提出了一种叫MCP的方法，选择有效的输入子集对DL模型进行再训练，以提高模型的质量。在我们的研究中，可以考虑本文的边界聚类的算法思想。主要工作：前提：测试工作中，常通过标记从测试上下文中收集有效输入子集来重新训练DL模型，提高模型质量。本文提出：多边界聚类和优先级排序（MCP）——将测试样本聚

2022-04-26 19:34:06 1548

原创通过DNN的情绪指标（sentiment）对测试输入进行排序

本周粗略阅读了论文《Input Prioritization for Testing Neural Networks》，该论文研究了通过DNN的三种情绪指标（sentiment）来对测试输入进行优先级排序的有效性，对今后的研究方向有一定提示。例如，我们可以将文中提到的这些情绪指标糅合到自己的优先级排序方法中，或者将这些指标进行结合，比较它们的效果等等。由于阅读的是英文原文，有一些词汇不知道如何翻译，所以在括号后标注了原单词。如有不当，欢迎指正。主要工作：本文从模型执行的计算中得到 DNN 的情绪

2022-04-23 20:55:57 943

原创 DeepOrder：持续集成测试中测试用例优先级的深度学习

本周粗略阅读了论文《DeepOrder: Deep Learning for Test Case Prioritization in Continuous Integration Testing》，该论文是在传统软件测试中使用AI帮助测试用例选择的代表。主要工作：提出DeepOrder：在CI中，使用任意数量测试执行历史记录（持续时间、执行状态），基于多个因素学习失败的测试用例，对测试用例进行排序。贡献：使用有监督学习，用历史测试数据训练基于回归的回归测试优先级深度学习模型；

2022-04-11 15:27:08 1765

原创 TestRank：一种结合测试用例内在属性和上下文属性对其进行排序的测试优先级技术

本周阅读论文《TestRank: Bringing Order into Unlabeled Test Instances for Deep Learning Tasks》，阅读笔记如下。主要工作：提出了一种测试优先级技术TestRank，根据错误揭示功能排序未标记的测试实例。该技术同时利用测试实例的固有属性和上下文属性：首先在测试实例和训练样本上构建相似性图，然后进行基于图的半监督学习，提取上下文特征。然后对于特定的测试实例，将从图神经网络（GNN）中提取的上下文特征和使用DL模型本身获得的内

2022-04-06 17:33:46 1244

原创一种深度神经网络的测试输入选择算法

本周粗略阅读了《Test Input Selection for Deep Neural Networks》，该论文主要提出了一种深度神经网络的测试输入选择算法，该算法与DeepXplore相比表现更好。主要工作：本文提出了一种测试子集选择算法，通过选择值得标注的测试输入来缓解Oracle问题的算法。该算法可以在标记预算有限的情况下自动选择覆盖率高但规模小的测试用例集。与DeepXplore算法相比，该算法可以生成更小的测试集，具有更高的覆盖率。贡献：提出了一种基于动态规划和DNN结构覆

2022-03-31 20:05:04 1158

原创 DeepGini——对海量测试进行排序以增强深度神经网络的稳健性

论文《DeepGini: Prioritizing Massive Tests to Enhance the Robustness of Deep Neural Networks》提出了一种DNN测试优先级排序方法DeepGini，该方法不仅优于现有神经元覆盖技术，而且对提高DNN质量有帮助。本文参考了这篇【论文转述】，侵删。主要工作：提出了DeepGini：一种基于DNN统计视角设计的测试优先级技术，可以将测量错误分类概率的问题简化为测量集合杂质的问题，使能够快速识别可能被错误分类的测试。

2022-03-24 15:26:20 1522

原创通过聚类方法改进测试用例优先级排序技术

论文《A Clustering Approach to Improving Test Case Prioritization: An Industrial Case Study》结合聚类方法，利用代码覆盖率、代码复杂性、真实故障的历史数据以及组合技术帮助改进了测试用例优先级排序技术，在回归测试中提供了一个很好的思路。实验对象：Microsoft Dynamics Ax步骤：聚类优先级排序聚类：使用Matlab实现凝聚层次聚类方法（测试用例对之间的距离）：先将代码覆盖相似

2022-03-22 19:24:33 800

原创 PACE——深度神经网络测试的实用准确度估计方法

PACE 是论文《Practical Accuracy Estimation for Efficient Deep Neural Network Testing》中提出的一种用于DNN测试中的估计测试集准确性的方法。同时，该论文也对PACE的有效性进行了实验。主要工作：实现了一个方法PACE，该方法选择一小组测试输入（即测试输入的子集），精确估计整个测试集的准确性。PACE步骤：根据测试能力对测试输入聚类 MMD-critic算法，选择每组的原型（最能代表该组测试能力的测试输入

2022-03-17 21:34:52 1695

原创 FLAST——测试是否flaky的快速静态预测方法

本周阅读论文《Know You Neighbor: Fast Static Prediction of Test Flakiness》，主要了解了FLAST方法的思想和flaky tests的概念。Flaky Tests：指在被测对象和测试条件都不变的情况下，有时失败、有时成功的测试。本文提出了FLAST方法，使用k-Nearest Neighbor分类器来预测测试是否flaky。本文贡献： Idea：一种基于测试代码静态分析的基于相似性的flakiness检测方法。 Eva

2022-03-11 09:24:03 554

原创深度学习系统的测试选择

本周粗略阅读了论文《Test Selection for Deep Learning Systems》，并参考了陈老师实验室发布的翻译，记录个人的阅读笔记，侵删。本文主要内容：本文基于模型不确定性对一组测试选择指标进行了实证比较，假设不确定性最大的样本同样也是信息量最大的样本，应优先使用再训练来改进。在五个模型和三个图像分类问题上评估，证明了基于不确定性的度量具有很强的识别错误分类输入的能力，比惊讶指标（Surprise Adequacy）强三倍，并且优于覆盖相关指标。还发现这些指标可以在再

2022-02-10 19:13:14 928 2

原创秘密共享者：神经网络中无意识记忆的评价与测试

本周粗略阅读了论文《The Secret Sharer: Evaluating and Testing Unintended Memorization in Neural Networks》，并参考了陈老师实验室发布的翻译，记录个人的阅读笔记，侵删。本文主要内容总结：深度神经网络模型的无意识记忆带来了隐私泄露的风险。因此，本文提出了一种定量评估该风险的方法，使深度学习从业者能够选择训练方法，以最大限度地减少记忆，从而有利于隐私保护。论文重点内容：研究原因：在生成文本模型中，如果对敏感数据

2022-02-03 20:36:23 1908

原创利用测试执行历史提高测试有效性

本周课堂汇报需要讲解论文《Improving Test Effectiveness Using Test Executions History: An Industrial Experience Report》的后半部分（第Ⅳ-Ⅷ节），记录阅读笔记。这篇论文主要研究了使用测试执行历史来进行测试选择和优先级排序的技术在实际项目中提高测试有效性。测试执行历史中包含了非常重要的信息——历史测试失败频率、测试失败之间的关联和测试开销。本文前半部分，测试选择从这三个信息的角度出发分别设计了FreqSelect

2021-12-13 15:50:50 212

qq_40479372的博客