顺其自然~-CSDN博客

原创 VR眼镜、VR一体机、VR头显

VR眼镜通常指的是需要外接手机的VR设备，这类产品较为简单且成本较低，主要提供基础的虚拟现实体验。它们利用手机作为显示屏来展现3D画面，因此体验质量很大程度上取决于手机屏幕的类型和分辨率。VR眼镜包括Gear VR、暴风魔镜、cardboard等，本身只包含光学结构，需要放入手机配合使用。

2024-04-30 14:43:49 125

转载 VR开发平台-OSVR

雷蛇及其合作伙伴联合创建了一个虚拟现实开放式平台：OSVR开源虚拟现实系统(Open-Source Virtual Reality)。OSVR旨在支持软件插件(Unity 3D)、虚幻引擎4和英雄引擎（HeroEngine）、输入硬件（Sixsense和Leap Motion等）及其他虚拟现实的设备，包括Oculus rift DK2和Vrvana Totem。

2024-04-30 13:41:41 10

绕一个支点高速转动的刚体称为陀螺(top)。通常所说的陀螺是特指对称陀螺，它是一个质量均匀分布的、具有轴对称形状的刚体，其几何对称轴就是它的自转轴。陀螺仪原理图在一定的初始条件和一定的外在力矩作用下，陀螺会在不停自转的同时，环绕着另一个固定的转轴不停地旋转，这就是陀螺的旋进(precession)，又称为回转效应(gyroscopic effect)。陀螺旋进是日常生活中常见的现象，许多人小时候都玩过的陀螺就是一例。

2024-04-30 08:55:09 7

转载 XR核心算法 - 6DoF

6DoF（Six degrees of freedom tracking，六自由度追踪）是指用户可以在物理空间内任何位置、任何方向自由地观看节目素材。用户移动可以被传感器或输入控制器捕获到，同时支持用户空间位移和头部姿态变化。典型的应用场景是用户自由走动并同时通过 HMD 观看 VR 视频内容。3DoF与6DoF技术对比图一3DoF与6DoF技术对比图二1、3DoF的VR眼镜（设备），是指该VR设备可以检测到头部向不同方向的转动，但是不能检测到头部的前后左右的空间位移。

2024-04-29 14:33:38 12

原创 VR眼镜对眼睛的影响及应对措施

总之，虽然VR眼镜在长时间使用时可能会导致一些视觉不适和疲劳，但通过适当的使用习惯和预防措施，可以最大程度地减少对眼睛的影响。：如果VR设备的显示屏分辨率低，经过光学放大后画面模糊不清，也会导致眩晕及眼疲劳，长期如此可能会影响视力。：近距离用眼会让眼睛的调节功能过度使用，可能引起调节性近视，这是一种暂时性的视力下降。：VR设备的LED屏幕可能会发出蓝光，长时间接触高强度的蓝光可能对眼睛造成伤害。：确保VR眼镜的显示屏与眼睛的距离适宜，不要太近，以减少眼睛的负担。的功能，应尽量启用这些设置来保护眼睛。

2024-04-29 13:39:37 186

原创 maya与3dsmax的区别与联系

Maya和3ds Max都是Autodesk公司开发的专业3D计算机图形软件，它们在特定的行业领域和使用环境上有所区别。：Maya初期的设计理念是用于动画和纹理，因此在影视制作方面，尤其是动画电影的制作，Maya优于3ds Max。例如，《精灵鼠小弟》和一些高预算的动画及科幻电影如《变形金刚》通常使用Maya来制作完成。而3ds Max虽然也能制作动画，但更适合于材质和渲染，因为它可以轻松访问材质设置，并且拥有丰富的插件和素材库。

2024-04-28 11:41:39 398 2

转载 UnityVR（HTCVive设备开发）

创建VRTK(添加VRTK_SDK Manager) 👉 创建空GameObject （添加VRTK_SDK Setup组件）☺：课程使用HTC Vive设备开发，使用 SteamVR1.2.2 和 VRTK3.2.1 版本开发。☺：将游乐项目在VR里体验，使用新版VRTK实现了射线与UI的交互、新版VRTK的使用。实现的功能：创建动态图片、左右点击按钮相关代码。实现的功能：实现射线碰撞到UI触发相关视频。②：VRTK3.2.1下载：下载链接。实现的功能：开始结束按钮的相关逻辑。

2024-04-25 18:28:58 28

转载三维扫描仪

三维扫描仪（3D scanner）是一种科学仪器，用来侦测并分析现实世界中物体或环境的形状（几何构造）与外观数据（如颜色、表面反照率等性质）。搜集到的数据常被用来进行三维重建计算，在虚拟世界中创建实际物体的数字模型。这些模型具有相当广泛的用途，举凡工业设计、瑕疵检测、逆向工程、机器人导引、地貌测量、医学信息、生物信息、刑事鉴定、数字文物典藏、电影制片、游戏创作素材等等都可见其应用。三维扫描仪的制作并非仰赖单一技术，各种不同的重建技术都有其优缺点，成本与售价也有高低之分。

2024-04-25 16:21:40 26

转载跨平台的电子书阅读器-Koodo Reader

15）自定义字体，字体大小，行间距，段落间距，阅读背景色，文字颜色，屏幕亮度，文字下划线、斜体、文字阴影、字体粗细。11）自定义源文件夹，利用 OneDrive、百度网盘、iCloud、Dropbox 等进行多设备同步。（包含新功能和 bug 修复，但也可能引入更多未知 bug）13）听书功能，翻译功能，词典功能，触控屏支持，批量导入图书。2、cd 到项目文件夹，运行以下代码进入客户端模式。14）支持目录，书签，笔记，高亮，书架，标签。12）双页模式，单页模式，滚动模式。3、运行以下代码进入网页模式。

2024-04-25 15:57:37 26

原创 VR游戏开发流程

这一阶段主要是对游戏的概念、玩法、故事情节等进行构思和规划。这是游戏开发的基础，需要确定游戏的核心理念和目标受众。：在策划的基础上，进一步细化游戏的设计方案，包括UI界面设计、游戏场景设计以及游戏角色设计等。这一阶段可能需要使用到3D设计工具来展现空间立体的设计思路。建模：根据设计文档，使用三维软件制作游戏中的物体和场景。这一步是创建游戏世界的关键环节，需要将设计师的构想转化为虚拟空间中的实体模型。动画：为模型添加动作和行为，使其在游戏中能够移动和互动。动画制作是赋予游戏角色和物体生命力的过程。

2024-04-25 14:23:50 355 2

原创 VR与头号玩家

高质量的VR头戴设备是基础，它需要配备精确的IMU传感器来捕捉头部动作，特别是转动，以确保动作捕捉的准确性和降低显示延迟。（vr眼镜）：为了支持实时交互式3D全息动态视景的生成，需要一个强大的计算机系统来处理复杂的图形和数据。：为了实现与虚拟环境中的物体进行真实互动，触感手套可以提供触觉反馈，让用户感受到抓取、触摸等动作的真实感觉。（vr手套）这种设备可以让用户在虚拟世界中自由移动，同时保持身体在原地，增强沉浸感。（vr跑步机）

2024-04-25 10:12:24 448

原创 Torch和PyTorch

PyTorch是Torch的科学计算框架的Python接口，提供了更多的高级功能和更灵活的设计，PyTorch继承了Torch的底层库，并使用了C和C++作为主要接口，同时结合了caffe2，使得PyTorch在处理动态数据和复杂模型时更加灵活。4、Torch 在一些方面比 PyTorch 更早成为流行的深度学习框架，但 PyTorch 在近年来逐渐取代了 Torch，成为了研究和工业界广泛使用的深度学习框架之一。2、Torch 是由 Facebook 的研究团队开发的，而 PyTorch 是由。

2024-04-23 11:13:47 143

转载循环神经网络-RNN

有时候，我们仅仅需要知道先前的信息来执行当前的任务。这一坨，要消除这种情况就需要把这一坨在求偏导的过程中去掉，至于怎么去掉，一种办法就是使 ∂ S j ∂ S j − 1 ≈ 1 {\frac{\partial{S_{j}}}{\partial{S_{j-1}}}}\approx1∂。答案是，还有很多依赖因素。因为RNN结构能够很好利用序列之间的关系，因此针对自然界具有连续性的输入序列，如人类的语言,，语音等进行很好的处理，广泛应用于NLP领域的各项任务，如文本分类，情感分析，意图识别，机器翻译等。

2024-04-14 17:23:21 66

转载注意力机制

注意力机制的一种非正式的说法是，神经注意力机制可以使得神经网络具备专注于其输入（或特征）子集的能力：选择特定的输入。注意力可以应用于任何类型的输入而不管其形状如何。在计算能力有限情况下，注意力机制（attention mechanism）是解决信息超载问题的主要手段的一种资源分配方案，将计算资源分配给更重要的任务。注意力一般分为两种：一种是自上而下的有意识的注意力，称为聚焦式（focus）注意力。聚焦式注意力是指有预定目的、依赖任务的、主动有意识地聚焦于某一对象的注意力；另一种是。

2024-04-14 16:02:15 52

转载 Encoder-Decoder综述理解

的过程实际上是一个“信息有损的压缩过程”，如果信息量越大，那么这个转化向量的过程对信息的损失就越大，同时，随着序列长度（sequence length）的增加，意味着时间维度上的序列很长，RNN模型就会出现梯度弥散的问题。一般情况下，输入端的形式各种各样（例如图片，文本、语音等），输出端的形式一般是文本格式，输入序列和输出序列的长度可能会有较大的差异（例如，一对一，多对多，多对一，一对多等）。通过上文可以知道编码器和解码器之间有一个共享的向量（上图中的向量c），来传递信息，而且它的长度是固定的。

2024-04-14 12:00:25 72

转载 Self-Attention

自注意力机制（Self-Attention）是 Transformer 模型的核心组成部分，它允许模型在处理序列数据时同时考虑序列中的所有位置，以此来捕捉序列内的长距离依赖关系。Self-Attention 的工作机制包括以下几个关键步骤：1、输入表示：首先，模型接收一个输入序列，通常是一个单词或标记的序列，每个单词或标记被转换为一个密集向量表示，这些向量集合构成了输入矩阵。2、计算注意力分数：模型通过计算输入矩阵中的每个单词与其他所有单词之间的关系来得到注意力分数。这一过程涉及到三个矩阵的操作，即查询（Q

2024-04-14 11:16:11 40

转载词嵌入 (Word2Vec, GloVe)

但是，通过词嵌入，模型知道"durian（榴莲）"是一种和"apple"相近的东西，"cultivator（培育者）"是一种和"farmer"类似的东西。“给定各元素的访问概率（在这个问题里是单词在语言里的出现概率），对所有元素建立一颗二叉树，以最小化访问叶节点的路径长度的期望”是一个经典的问题，这个问题的解法叫做哈夫曼编码。使用了词嵌入的话，模型虽然不知道“苹果农民”是什么，但它知道"apple"和"orange"是很相似的东西，能够很快学会这句话的"Robert Lin"也是一个人名。

2024-04-12 15:04:14 51

转载以AutoGPT为例浅谈智能体Agent

AutoGPT是一个AI agent（智能体），也是开源的应用程序，结合了GPT-4和GPT-3.5技术，给定自然语言的目标，它将尝试将其分解成子任务，并在自动循环中使用搜索引擎和其他工具来实现这一目标，它由GPT-4驱动，自主地开发和管理业务。官网对GPT的优势描述如下：🌐 用于搜索和信息收集的互联网接入 / Internet access for searches and information gathering。

2024-04-11 21:52:10 63

转载大模型训练过程概述

以上4个阶段构成了完整的GPT模型训练的pipeline，从中可以看出训练大模型是一个非常艰巨的任务，例如对庞大算力资源的要求、对高质量语料数据的要求。另外，在训练大模型的时候一般需要基于一些优化框架，如DeepSpeed，这些工程化方面的任务也有不少坑。因此，对于一般的企业而言通常不建议自己训练基础大模型，如果必须进行私有化部署，可以根据实际情况选择一款开源大模型，如有必要可基于开源大模型进行微调，通过这个途径可以用比较少的投入来高效地落地大模型应用。大模型训练过程概述。

2024-04-11 21:25:58 58

原创 Gemma

Gemma是谷歌研发的AI大模型，是Gemini模型的开源版本。当地时间2024年2月21日，谷歌公司宣布，AI大模型Gemma即日起在全球范围内开放使用。谷歌将发布两种权重规模的模型：Gemma 2B和Gemma 7B。每种规模都有预训练和指令微调版本，使用条款允许所有组织（无论规模大小）负责任地进行商用和分发。谷歌介绍，Gemma模型与其规模最大、能力最强的AI模型Gemini共享技术和基础架构。Gemma是，专为各种文本生成任务设计。

2024-04-11 11:32:27 620

转载共享GPU内存，专用GPU内存，及 UMA统一内存架构

专用GPU内存是指安装在图形处理单元（GPU）上的内存。这种内存是专门为GPU设计的，通常是GDDR类型（如GDDR5、GDDR6），专为高速图形处理优化。

2024-04-11 09:07:24 77

原创 LLMs、Embedders 和 Vector Databases

LLMs（大语言模型）、Embedders 和 Vector Databases 是自然语言处理和机器学习领域的三个相关但不同的概念。下面分别解释这三个概念，并说明它们之间的关系。

2024-04-10 17:19:37 972

转载 ollama 使用技巧集锦

从帮助文件可以看，我们通过设置环境变量（OLLAMA_MODELS）来指定模型目录，可以通过系统设置里来配置环境变量（系统变量或者用户变量）记得替换你的模型的完整路径另外不同模型的template 和 stop parameter不同，这个不知道就不写，或者网上搜索然后执行。使用*，意味着任何应用都可以访问ollama，如果你没有特别的要求，可以考虑用它。导入模型的时候，确保硬盘可用空间在模型大小的2倍以上，，搜Octopus-v2，找有GGUF标识的，为例，先查看模型信息，从模型文件信息里得知。

2024-04-10 16:19:59 488 1

原创 GGUF是什么

GGUF是一种，由开发者Georgi Gerganov提出。具体来说，GGUF代表的是GPT-Generated Unified Format，这是一种针对大规模机器学习模型设计的二进制格式文件规范。它的主要优势在于能够将原始的大模型预训练结果经过特定优化后转换成这种格式，从而可以更快地被载入使用，并消耗更低的资源。：通过采用紧凑的二进制编码格式，GGUF能够有效地减少文件大小，使得模型数据更加高效地存储和传输。

2024-04-10 16:05:48 678

转载 Huggingface的介绍

Huggingface即是网站名也是其公司名，随着transformer浪潮，Huggingface逐步收纳了众多最前沿的模型和数据集等有趣的工作，与transformers库结合，可以快速使用学习这些模型。目前提到NLP必然绕不开Huggingface。进入Huggingface网站，如下图所示。其主要包含：1）Models（模型），包括各种处理CV和NLP等任务的模型，上面模型都是可以免费获得2）Datasets（数据集），包括很多数据集。

2024-04-09 16:52:12 76

转载使用LM Studio在本地运行LLM完整教程

打开“Model Configuration”，然后打开“Prompt Format”，向下滚动到“Pre-prompt / System prompt”，选择“>”符号打开。根据计算机的能力/速度，较大的模型将更准确，但速度较慢。对许多人来说，运行本地LLM需要一点计算机知识，因为它通常需要在命令提示符中运行它们，或者使用更复杂的web工具，如Oobabooga。点击左边的一个模型，右边就会显示可用的版本，并显示那些根据你的电脑规格应该可以工作的模型(#2)。模型搜索列表中可以看到安装/下载文件的大小。

2024-04-09 15:50:24 118

转载大模型应用的平民化：LLaMA.cpp

上篇聊到，LoRA 可以缓解大模型精调的难题，从而每位研究者都可以站在巨人的肩膀上，训练自己的个性化模型。但当完成精调后，这些模型如何传播，是否能在消费级硬件上用起来，仍存在很大挑战1）LLMs 动辄数十上百亿的参数，对运行机器的内存提出了很高的要求，毕竟只有将模型权重塞进 RAM，推理方可进行；2）模型加载至内存后，推理顺畅与否，又与 CPU、GPU 等计算单元密切相关，要知道很多大语言模型是在顶级专用 GPU 集群上加速训练的，换到个人电脑上，五秒蹦出一个词，也很难说用了起来。好在上游已有。

2024-04-09 15:01:51 66

转载利用AnythingLLM构建自己的私人ChatGPT

AnythingLLM是一个全栈应用，可以使用现有的商业化LLM（大型语言模型）或者流行的开源LLM和向量数据库方案，来建立一个没有妥协的私人ChatGPT，既能在本地运行，也能远程托管，能和您提供的任何文件智能对话。AnythingLLM把您的文件分成了叫作工作区的东西。工作区的作用有点像线程，但是你的文件都被容器化了。工作区间可以分享文件，但他们不互相交流，这样可以让每个工作区的环境都很清爽。AnythingLLM的一些有趣特性：1）支持多用户和权限设置。

2024-04-09 13:37:42 286

原创常见视频加密算法

然而，Agi and Gong 表明由于帧间的相关性和主要是由于P帧和B帧中的I-block没有加密，这种仅加密I帧的方法不能达到一个令人满意的密级。经编码后的视频数据，要按标准规定的特定结构排列组织，收方按相同的标准结构解码，才能正确恢复原视频图像。该算法的原理是对这些头信息数据加密，将其变成随机序列，再与其它数据混合，使接收方在不知道密钥的情况下难以区分结构信息数据和视频信息数据，更难以知道数据结构和数据的具体内容，难以按原数据结构解码接收到的视频编码数据，无法获得原图像，达到加密目的。

2024-04-09 08:55:19 735

转载大模型RAG（检索增强生成）

本文概述 RAG 的核心算法，并举例说明其中的一些方法。RAG融合是一个强大的功能，能够提高RAG应用的语义搜索效率。通过使用语言模型生成多个查询并对搜索结果进行重新排序，RAG融合可以呈现更丰富多样的内容，并提供了一个额外的层次，用于调整应用。此外，RAG融合还可以实现自动纠正、节省成本以及增加内容多样性。但是，需要注意一些权衡，比如潜在的延迟问题、自动纠正的挑战以及成本影响。对于依赖常见概念但可能出现内部行话或重叠词汇的应用来说，RAG融合尤其有用。

2024-04-07 14:06:32 72

原创技术白皮书

总的来说，技术白皮书是一个重要的信息资源，它不仅为决策者提供了必要的技术信息，还帮助他们理解和评估技术的潜力，从而做出更加明智的决策。：技术白皮书的目的之一是教育读者，让他们了解新技术的产品和服务，这对于决策者来说是一个学习和适应新技术的过程。：技术白皮书为高层决策者提供了一个全面的技术概览，帮助他们从宏观的角度理解技术的整体情况和潜在价值。：技术白皮书通过提供深入的技术分析和案例研究，帮助决策者识别和规避潜在的技术和市场风险。：根据当前的技术发展和市场趋势，预测技术的未来发展方向和改进空间。

2024-04-06 08:56:34 399

原创通过二维码实现内外网隔离交换

通过二维码实现内外网隔离交换是一种创新的数据交换方法，它能够在保证数据安全性的同时，提高数据交换的效率。这种方法主要利用了二维码的存储和识别特性，结合加密技术，实现了在物理隔离的网络环境下进行数据传输的目的。下面详细介绍这种方法的实现流程和优势。

2024-04-02 10:58:37 339

原创磁力链接介绍

利用分布式哈希表技术来寻找和下载文件。磁力链接使用了一种名为“分布式哈希表”（Distributed Hash Table，DHT）的技术。这项技术允许用户直接通过文件的哈希值进行资源搜索和下载，而无需先下载一个种子文件（如BT种子）。磁力链接的优势在于它的便捷性和高效性，用户可以快速开始下载过程，因为不需要额外的种子文件。此外，由于磁力链接是基于文件内容的元数据，而非特定的位置，因此它属于统一资源名称（URN），这与基于位置的统一资源定位符（URL）不同。

2024-03-25 21:23:27 544

原创混合专家模型

门控机制是混合专家模型（MoE）中负责选择和结合专家模型输出的关键部分。门控机制的工作原理是根据输入数据的特性来决定哪些专家模型应该被激活并进行预测。这个过程中，每个专家模型都会被赋予一个权重或者概率，这些权重或概率反映了相应专家对当前输入数据的适用程度。然后，门控机制会利用这些权重来加权各个专家的输出，从而得到最终的预测结果。1）评估输入：门控机制首先对输入数据进行评估，以确定哪些专家模型最适合处理这些数据。2）分配权重。

2024-03-25 21:08:03 749

原创芯片组介绍

芯片组是，它们负责将计算机的微处理器（CPU）与机器的其他部分相连接，是决定主板性能的重要部件。（上北）：负责处理CPU与内存之间的数据交换，以及与图形处理器（GPU）的通信。它通常位于CPU附近，以提供较快的数据传输速度。（下南）：则处理CPU以外的其他输入/输出操作，如硬盘、USB接口、声卡等外围设备的数据传输。随着技术的发展，现代的芯片组已经从多颗芯片简化为一两颗芯片，甚至有些功能被集成到了CPU内部，这样的设计被称为单芯片芯片组或集成芯片组。

2024-03-25 20:58:02 904

转载 Grok-史上最大开源LLM，参数高达3140亿

就连激活参数仅（86B）就超过了最大的 Llama。为 Grok 提供动力的引擎 Grok-1，是在数万个 GPU 集群（外媒 Techcrunch 透露，可能是由 Oracle 提供的）上花了几个月时间开发的，训练数据来自网络（截至 2023 第三季度）和人类助手的反馈，xAI 将其称之为“AI 导师”。不管怎样，马斯克成立的 xAI 公司仅仅用了 8 个月不仅创建了 Grok，还将 Grok-1 开源出来，其行动速度远超乎众人的想象，甚至 OpenAI 的员工也表达了他们对 Grok 的强烈兴趣。

2024-03-25 15:15:58 100

空空如也

空空如也