JarodYv-CSDN博客

原创 Sora 技术实现

本文通过 Sora 技术报告和 Sora 团队核心成员过往的论文，来追溯 Sora 的技术实现方案。

2024-02-20 16:56:54 1034

翻译 Sora 技术报告：作为世界模拟器的视频生成模型

本技术报告重点关注：1. 我们将所有类型的视觉数据转化为统一表示的方法，从而能够大规模训练生成模型；2. 对 Sora 模型能力和局限性的定性评价。本报告不包含模型和实施细节。

2024-02-17 23:56:35 200

原创 OpenAI Sora 初体验

OpenAI 发布全新文生视频模型 Sora。其对细节的关注、无缝的角色刻画以及生成视频的绝对质量真正将可能性提升到了一个新的高度。

2024-02-16 21:00:42 3940 3

原创个人 AI 的革命：Nvidia‘s Chat with RTX 深度探索

Nvidia推出的 Chat with RTX 预示着个人 AI 新时代的到来。2 月 13 日，Nvidia 官宣了自家的 AI 聊天机器人，这不仅是人工智能交互的渐进式改进；更代表了个人如何利用自己的数据进行洞察、研究和知识发现的巨大转变。

2024-02-15 20:44:49 2298 2

原创刘谦春晚魔术的数学原理

2024春晚刘谦表演了一种魔术，通过一系列操作后，最后剩下的一张牌能与之前拿出的牌拼成一张完整的牌。这个魔术利用了同余理论，通过一些故弄玄虚的手段迷惑观众，但实际上只需要关注牌的配对情况就可以揭示原理。

2024-02-12 12:35:21 968

原创陶哲轩如何用 GPT-4 辅助数学研究

快快围观加州理工数学系教授、菲尔茨奖得主陶哲轩如何用 GPT-4 辅助数学研究。

2024-02-04 11:33:53 1060

原创 OpenAI 开发者大会 Sam Altman 45分演讲带来哪些干货和狠货

北京时间 11 月 7 日凌晨，美国人工智能公司 OpenAI 的开发者大会正式开启，创始人 Sam Altman 在台上和同事，只用 45 分钟时间，就「轰」出了团队最新的成果 GPT-4 Turbo，后者不仅更快、有更长的上下文、而且更好的控制。

2023-11-07 10:24:20 318 1

原创【万字长文】向 AI 提问的艺术

本文作为一份提示工程技巧汇总，旨在帮助您理解并运用各种提示技术，从而让 AI 生成高质量答案。

2023-10-23 15:24:59 540 1

原创在 Mac M1 上运行 Llama 2 并进行训练

Llama 2是由领先的人工智能研究公司 Meta（前Facebook）开发并发布的下一代大型语言模型 (LLM)。旨在帮助开发人员和企业组织构建基于人工智能的生成工具和用户体验。本文将指导你完成在 Mac M1 上设置 `Llama 2` 的过程，并根据使用你自己的数据对其进行精调。

2023-10-23 13:42:18 2618 5

原创【白话机器学习系列】白话梯度下降

梯度下降是机器学习中最常见的优化算法之一。理解它的基本实现是理解所有基于它构建的高级优化算法的基础。本文详细为大家推导了 MSE 作为损失函数时的梯度下降公式。

2023-09-09 09:02:11 618 2

原创用 Python 微调 ChatGPT (GPT-3.5 Turbo)

备受期待的 GPT-3.5 Turbo 微调功能现已推出，为开发人员提供了完美定制人工智能模型的关键解决方案，并以前所未有的方式扩展这些自定义模型。本文将你经历人工智能进化的惊心动魄之旅。

2023-09-08 13:51:06 2707 2

原创 Stable Diffusion — ControlNet 超详细讲解

ControlNet 是一个控制预训练图像扩散模型（例如 Stable Diffusion）的神经网络。它允许输入调节图像，然后使用该调节图像来操控图像生成。本文为大家深入剖析 ControlNet 的工作原理。

2023-09-07 15:58:02 6801 1

原创【白话机器学习系列】白话 Dropout

Dropout 是神经网络的一种正则化技术，它在训练时以指定的概率 p（常见值为 p=0.5）丢弃一个单元（连同连接）。在测试时，所有单元都存在，但权重按 p 缩放（即变为 pw）。

2023-06-19 14:45:54 1292 1

原创【白话机器学习系列】白话Broadcasting

张量之间进行运算需要满足一定的维数条件的，形状大小不满足条件的两个张量之间是无法进行运算的。为了能执行运算，我们通常需要将较小的张量被“拉伸”到与较大张量兼容的形状，这一步“拉伸”操作就是 Broadcasting。

2023-06-05 12:17:47 552 2

原创 Stable Diffusion 超详细讲解

本文将在《Stable Diffusion原理详解》和《Diffusion Model 深入剖析》这两篇文章的基础上，进一步细致地讲解 Stable Diffusion 的算法原理。

2023-06-03 10:42:19 16468 4

原创【白话机器学习系列】白话张量

张量（Tensor）是向量和矩阵向 n 维的推广。了解张量如何相互作用是机器学习的基本功。本文将用通俗的语言和图例，配合 PyTorch 中张量操作方法为大家深入浅出地讲解张量的必要知识。

2023-06-02 10:52:56 785 1

原创【白话机器学习系列】白话向量点积

点积（Dot Product）是机器学习中最常见的向量操作。本文将通过简洁易懂的语言配合大量图形为大家介绍点积运算及其背后的数学意义。

2023-06-01 11:16:51 1014

原创 TimSort——最快的排序算法

TimSort 算法是 Tim Peters 于 2001 年为 Python 语言创建的。该算法建立在插入排序和归并排序的基础之上，兼具插入排序和归并排序的优点。TimSort 的平均时间复杂度为 O(nlog(n)) ，最好情况 O(n) ，最差情况 O(nlog(n)) 。空间复杂度 O(n) ，是一个稳定的排序算法。

2023-05-31 15:52:47 2990 1

原创让 Python 真正支持多线程

Python 至今都缺乏对多线程的原生支持。本文深入探讨 Python 无法引入多线程的背后机制，以及如何使用子解释器 API 编写真正并发的 Python 代码。

2023-05-30 10:15:43 1644 1

原创如何成为机器学习工程师

机器学习工程师是一个综合要求很高的交叉学科岗位，要求从业者学习很多必要技能和工具，以应对实际项目中遇到的各种挑战。本文能为励志成为机器学习工程师的人提供一个清晰的成长路线图。

2023-05-29 15:03:10 425 2

原创 Diffusion Model 深入剖析

本文深入到 Diffusion Model 内部，深入剖析 Diffusion Model 的工作原理以及它是如何生成图像的。本文要点总结：1. 扩散模型分为正向扩散和逆向扩散两部分。2. 正向扩散可以使用闭合的公式来完成。3. 可以使用经过训练的神经网络完成逆向扩散。4. 为了逼近去噪步骤 q，我们只需要使用神经网络 εθ 来近似噪声 εt。5. 对简化损失函数的训练产生更好的样本质量。

2023-05-27 18:05:02 3546 5

原创【万字长文】深度解析 Transformer 和注意力机制（含完整代码实现）

本文几乎涵盖了关于 Transformer 和注意力机制的所有必要内容，包括自注意力、查询、键、值、多头注意力、掩码多头注意力和 Transformer 架构，以及完整的PyTorch实现。希望阅读完本文大家对 Transformer 能有深入的理解。

2023-05-25 15:19:57 3815 20

原创 Lamini：大语言模型精调框架

Lamini 致力于解决 LLM 驱动开发中最困难的挑战之一。该框架提供了一个简单且一致的编程模型来抽象跨不同 LLM 的微调过程。我们很可能会在不久的将来看到 Lamini 被纳入不同的 LLM 框架。

2023-05-23 13:55:37 1440 1

原创 5个值得一试的开源大语言模型

本文为大家整理了5个效果优秀和开源大语言模型，供大家学习研究。

2023-05-22 17:53:06 2400 1

原创 Hugging Face Transformers Agent

本文我们探索了🤗Hugging Face Transformers Agents 的功能，并将其与🦜🔗LangChain Agents 进行了比较。

2023-05-17 17:44:27 1095 1

原创 Mojo：比 Python 快 35000 倍的 AI 编程语言

Mojo是一门刚刚发布的面向 AI 开发人员的编程语言。Mojo 被设计为 Python 的超集，所以如果你已经掌握了 Python，学习 Mojo 会很容易。关键是 Mojo 将 Python 的易用性与 C 语言的性能相结合，速度比 Python 快 **35000** 倍！让你鱼与熊掌兼得。如果您对 AI 感兴趣并且已经了解 Python，那么 Mojo 绝对值得一试。这篇文章将带给你有关 Mojo 的所有信息。

2023-05-11 20:38:49 2905 3

原创用LangChain构建大语言模型应用

LangChain 是一个开源 Python 库，任何可以编写代码的人都可以使用它来构建 LLM 支持的应用程序。该包为许多基础模型提供了通用接口，支持提示管理，并在撰写本文时充当其他组件（如提示模板、其他 LLM、外部数据和其他工具）的中央接口。

2023-05-01 21:11:35 6747 3

原创 Twitter推荐算法解读

最近 Twitter 开源了其最宝贵的财产——推荐算法！本文将带你了解 Twitter 是如何做内容推荐的。

2023-04-25 19:20:25 1277 2

原创 Pandas 2.0发布——更快的速度更低的内存占用

Pandas 是一个用于操作数据的 Python 库，在 Python 开发人员中非常流行。4月3日，Pandas 2.0正式发布。得益于 PyArrow的引入，Pandas 2.0 实现了更快、更节省内存的操作。

2023-04-12 12:14:01 1186 1

原创 BloombergGPT: 首个金融垂直领域大语言模型

NLP 在金融技术领域的应用广泛且复杂，主要应用场景包括情感分析、命名实体识别到问答等。大语言模型 (LLM) 已被证明可以有效处理上述任务；但是，鲜少没有报道过有专门针对金融领域的文献。本作中，我们展示了 BloombergGPT 这个拥有 500 亿参数的语言模型，它采用大量金融数据训练而来。我们基于 Bloomberg 大量的数据源构建了一个 3630 亿个token数据集，这可能是迄今为止最大的特定领域数据集，并增加了来自通用数据集的 3450 亿个token。

2023-04-10 13:59:51 3141 2

原创开源大语言模型(LLM)汇总（持续更新中）

随着ChatGPT的火爆，越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总，跟踪每天不发的大语言模型和精调语言模型。

2023-04-06 16:12:36 21034 8

原创 Stable Diffusion XL：更快，更强

总的来说，新模型并没有给我留下深刻印象。MidJourney、Leonardo AI 和 Microsoft Image Generator 仍然有更好看的生成效果。尽管 Stable Diffusion XL 与之前的 AI 模型相比似乎没有显着进步，但它仍然向前迈进了一步，并且肯定还有进一步改进的空间。我期待Stability AI官方能够公布更多细节，而且我坚信最终正式发布的产品会比预览模型更好。

2023-04-04 15:39:17 3175 3

原创图解NLP模型发展：从RNN到Transformer

本文以NLP模型发展为脉络，详细地解释了RNN、LSTM、GRU、seq2seq、注意力机制和Transformer。每一个技术都给出了清晰的图形化解释，便于大家理解。其中重点解释了Transformer的各个部分，因为Transformer 作为一个重要的里程碑，影响并创建了许多先进的 NLP 模型，如 GPT-3、BERT 等。

2023-03-24 12:11:34 2991 3

原创文心一言 vs GPT-4 —— 全面横向比较

本文从语义理解、内容创作、逻辑推理、编码能力、数学能力、人格模拟6个维度对文心一言和GPT-4进行了全面系统地横向比较。

2023-03-20 18:44:10 42219 75

原创 GPT-4 API 接口调用及价格分析

对开发者来说，GPT-4最激动人心的是API接口同步发布。我今天获得了API访问权限，本文将跟大家分享GPT-4 API接口的使用以及大家关心的价格分析。

2023-03-19 15:48:02 54559 23

原创 OpenAI 发布GPT-4——全网抢先体验

总的来说，GPT-4在推理能力上比GPT-3.5进步巨大，很多之前的问题都得到了修正和改良。我还没有测试GPT-4的多模能力，后面我会继续进行更多的测试，并即时更新文章分享给大家。

2023-03-15 11:52:23 51804 50

原创 π-Day快乐：Python可视化π

祝大家 π Day快乐！

2023-03-14 14:52:56 1889 1

原创学会这12个Python装饰器，让你的代码更上一层楼

装饰器是一个重要的抽象思想，可以在不改变原始代码的情况下扩展代码。本文整理了项目中经常用到的12个装饰器，值得每一个Python开发者掌握。

2023-03-12 12:29:02 5791 2

原创万字长文：Stable Diffusion 保姆级教程

万字长文，超详细一步一步教你在本地部署运行当下超火的Stable Diffusion模型，生成各种风格图像。

2023-03-10 11:25:19 78976 109

原创盘点全球10大女性技术先驱

在女神节来临之际，我为大家盘点一下为编程做出卓越贡献的10大女性先驱。

2023-03-08 08:00:00 1240 1

基于TextCNN实现文本分类

本资源是https://jarod.blog.csdn.net/article/details/127636618的配到资源，详细讲解了如何从零开始用TensorFlow搭建TextCNN，完成文本分类任务。包含完整源代码和教程文档。模型搭建在Jupyter环境，可以根据教程文档或参考源代码自己一步一步实现自己的TextCNN，并在自己的数据集上训练出自己的模型。模型在测试集上准确率达到96.45%，可以满足生产使用。

2023-02-19

Rust机器学习之Linfa完整项目代码（含数据集）

本资源是我的博客文章《Rust机器学习之Linfa》https://blog.csdn.net/jarodyv/article/details/128089875 的完整项目代码和数据集，供大家学习参考。 Linfa 是一组Rust高级库的集合，提供了常用的数据处理方法和机器学习算法。Linfa对标Python上的scikit-learn，专注于日常机器学习任务常用的预处理任务和经典机器学习算法，目前Linfa已经实现了scikit-learn中的全部算法。 Rust的机器学习生态已经非常完善，然而社区仍在不断努力，向着Python快速靠近。面向未来，Rust快速、安全的特性会使它成为机器学习领域不可忽视，甚至是主流的编程语言。

2023-02-13

用二元泊松模型预测2022年世界杯结果模型源码

本资源是用二元泊松模型预测2022年世界杯结果的R语言模型源码网上有很多文章用双泊松（Double Poisson）模型来预测世界杯比赛结果。但是双泊松模型有一个严重的缺陷，那就是它假设比赛中两队的比分是条件独立的。而我们都知道，在对抗性比赛中，两队的比分是存在关联的，因为两队都会根据场上的比分形势调整策略。比如足球比赛，当主队1:0领先，且距离比赛结束只剩10分钟时，落后的客队会孤注一掷，甘愿冒更大风险去争取平局。但如果主队3:0甚至4:0领先时，领先的主队可能会稍微放松下来，甚至教练会用新人换下主力，此时落后的客队更容易进1球（甚至主队会礼貌性让球）。所以比赛中两队比分是相关的，这种相关性可以通过依赖性参数来描述。二元泊松（Bivariate Poisson）模型可以度量两队比分的依赖性参数，用二元泊松模型对比赛进行的预测准确率更高，在1/8决赛已经进行的4场比赛中，二元泊松模型预测正确率100%。

2023-02-13

TA关注的人

基于TextCNN实现文本分类

Rust机器学习之Linfa完整项目代码（含数据集）

用二元泊松模型预测2022年世界杯结果模型源码

Discrete mean estimates and the Landau-Siegel zero.pdf

emma-2.0.5312-lib.zip

CSDN编辑器如何加入SVG图片