- 博客(285)
- 资源 (10)
- 收藏
- 关注
原创 AI大模型开发架构设计(8)——从 AI 编程助手到 AI Agent 应用实战
Python 是不是构建 AI Agents 的最好语言?Code Review Bot 无状态设计 & 运行部署。设计 Lightweight AI Agents。当人类询问是否会下雨时?降低 LLM 幻觉的方法。
2024-02-02 08:10:00 933
原创 AI大模型开发架构设计(6)——AIGC时代,如何求职、转型与选择?
AIGC 新时代,已有的工作机会会不会减少?AIGC新时代,我们到底要学什么?AIGC新时代,我们怎么应对?
2024-01-27 18:02:11 517
原创 AI大模型开发架构设计(5)——人人能学会的Llama-2大模型微调
Meta联合微软在 2023年7月19日,共同宣布开源了 Llama-2 大模型亚马逊 Azure、Huggingface 等都宣布提供 Llama-2 云服务器阿里云、腾讯云、百度云等也都提供了 Llama-2 云服务Llama-2不但免费,还可以商业化使用有机会打破 ChatGPT 的垄断地位,进一步降低开发者的使用成本。
2024-01-27 17:59:45 1212
原创 AI大模型开发架构设计(4)——人人需要掌握的大模型微调
- Prompt Engineer(提示词工程)- LangChain(一个框架的名字)- Fine-tuning(微调)
2024-01-21 23:09:40 936
原创 AI大模型开发架构设计(2)——AI绘画技术架构&应用实践
Diffusion Model(扩散模型)→Image Information Creator。Decode Model(扩散模型)→放大 Diffusion Model 的输出到完整图像。Language Model(语言模型)→Text Encoder(文本编码)训练Encoder模型。
2024-01-20 11:11:39 1073 1
原创 AI大模型开发架构设计(1)——LLM大模型Agent剖析和应用案例实战
LLM Agent 可以理解为一个以 LLM 为大脑的智能体(类比人),集成了规划、记忆、工具使用等能力。当“记忆”非常多时,如何在大量“记忆”力快速找到最相关的那些“记忆”?Auto-GPT 的效果很大程度上归功于它复杂的。工具使用能力-function calling。工具使用能力-HuggingGPT。Auto-GPT 的主要框架设计。CoT任务拆解的缺陷是什么?LLM和传统规划方式结合。Auto-GPT 的输出。LLM + 向量数据库。LLM的记忆是什么?
2024-01-20 10:14:40 2326
原创 数据结构与算法(六)
1、四边形不等式技巧2、状态压缩的动态规划3、DC3生成后缀数组4、后缀数组解决面试题5、动态规划猜法中和外部信息简化的相关问题6、哈夫曼树7、最大网络流算法之Dinic算法
2024-01-05 09:14:14 358
原创 数据结构与算法(五)
1、哈希函数2、资源限制类题目3、有序表4、根据对数器找规律、根据数据量猜解法5、分治技巧、卡特兰数6、子数组达到规定累加和的最大长度系列问题、矩阵处理技巧题
2023-12-29 17:35:50 824
原创 数据结构与算法(四)
1、单调栈;2、KMP算法;3、Manacher算法;4、蓄水池算法;5、二叉树的Morris遍历;6、线段树;7、IndexTree;8、AC自动机
2023-12-11 08:10:04 959
原创 数据结构与算法(三)
1、链表及其相关面试题2、二叉树常见面试题和二叉树的递归套路3、贪心算法4、并查集5、图的数据结构、宽度&深度优先遍历6、最小生成树、最短路径问题
2023-10-14 22:58:14 164
原创 数据结构与算法(二)
1、时间复杂度、空间复杂度、排序算法和二分法2、异或运算3、单双链表4、归并排序5、堆排序6、快速快速7、前缀树8、基数排序
2023-09-23 23:15:49 179
原创 AIGC学习笔记(1)——AI大模型提示词工程师
1、Prompt工程之原理2、Prompt工程之原则3、Prompt工程之迭代4、Prompt工程之应用
2024-01-06 17:35:59 1396
原创 多线程与高并发——并发编程(7)
1、CountDownLatch应用&源码分析2、CyclicBarrier应用&源码分析3、Semaphone应用&源码分析
2023-09-10 19:47:39 121
原创 多线程与高并发——并发编程(6)
1、ConcurrentHashMap的存储原理2、ConcurrentHashMap的扩容原理3、ConcurrentHashMap的红黑树操作原理4、ConcurrentHashMap的计数器5、CopyOnWriteArrayList的实现原理
2023-09-09 23:31:16 479
原创 多线程与高并发——并发编程(5)
1、什么是线程池2、JDK自带的构建线程池的方式3、ThreadPoolExecutor应用&源码剖析4、ScheduleThreadPoolExecutor应用&源码剖析
2023-09-09 15:50:32 117
原创 多线程与高并发——并发编程(4)
1、阻塞队列基本概念2、ArrayBlockingQueue原理3、LinkedBlockingQueue原理4、PriorityBlockingQueue原理5、DelayQueue原理6、SynchronousQueue原理
2023-09-03 20:39:00 2241
原创 多线程与高并发——并发编程(3)
1、锁的分类2、深入synchronized3、深入ReentrantLock4、深入ReentrantReadWriteLock
2023-08-31 23:02:55 149
原创 多线程与高并发——并发编程(2)
介绍并发编程的三大特性:原子性、可见性、有序性synchronized、CAS、Lock锁、ThreadLocal
2023-08-25 21:54:29 162
原创 大数据高级开发工程师——Spark学习笔记(10)
1、Checkpoint的基本介绍、如何使用2、SparkStreaming与SparkSQL整合3、SparkStreaming的容错:节点失败容错、数据丢失容错、Task运行慢容错4、优雅关闭5、SparkStreaming与Kafka整合:整合0-8、0-10,如何保证exactly-once及代码实现
2022-11-15 09:20:33 537 1
原创 大数据高级开发工程师——Spark学习笔记(9)
1、Spark Streaming简介2、Spark Streaming架构流程3、什么是DStream4、DStream算子操作5、使用SparkStreaming操作不同数据源6、SparkStreaming任务提交7、SparkStreaming的Transformation高级算子8、SparkStreaming的Output算子
2022-11-06 20:12:45 751
原创 大数据架构师——音乐数据中心平台离线数仓综合项目(三)
1、业务需求:机器详细信息统计、日活跃用户统计2、模型设计3、数据处理流程4、使用Azkaban配置任务流,调度任务5、使用Superset进行数据可视化展示
2022-08-15 23:10:27 869
原创 大数据架构师——数据湖技术(二)
Spark与Iceberg整合HiveCatalog、HadoopCatalogSpark与Iceberg整合DDL操作Spark与Iceberg整合DQL操作Spark与Iceberg整合DML操作
2022-08-05 23:21:29 825
原创 大数据架构师——音乐数据中心平台离线数仓综合项目(二)
数据仓库分层设计数据处理流程使用Azkaban配置任务流使用Superset数据可视化TW_SINGER_RSI_D歌手影响力日统计表和TW_SONG_RSI_D歌曲影响力日统计表。TO_CLIENT_SONG_PLAY_OPERATE_REQ_D客户端歌曲播放表。TO_SONG_BASEINFO_D歌曲基本信息日全量表。TW_SONG_FTUR_D歌曲特征日统计表。TO_SONG_INFO_D歌库歌曲表。在安装azkaban的节点。............
2022-07-25 08:52:41 1382 2
原创 大数据高级开发工程师——Spark学习笔记(7)
SparkSQL架构设计与实现Catalyst执行过程:Parser、Analyzer、Optimizer、Planner、代码生成与执行SparkSQL参数调优
2022-07-22 08:29:49 1422
原创 大数据高级开发工程师——Spark学习笔记(6)
SparkSQL概述SparkSQL的四大特性DataFrame概述DataFrame常用操作DataSet概述SparkSQL如何读取外部数据源SparkSQL自定义函数
2022-07-16 16:37:32 590
原创 大数据高级开发工程师——Spark学习笔记(5)
Spark读写HBaseSpark的序列化与反序列化Spark数据倾斜原理与现象分析Spark中数据倾斜的解决方案
2022-07-14 08:20:10 1182 3
原创 大数据架构师——数据湖技术(一)
什么是数据湖?大数据为什么需要数据湖?数据湖技术之IcebergIceberg概念及特点Iceberg数据存储格式Iceberg特点Iceberg数据类型Hive 与 Iceberg 整合
2022-07-07 09:32:13 3407 1
原创 大数据高级开发工程师——Spark学习笔记(1)
- Spark是一个快速(基于内存),通用、可扩展的计算引擎,采用==Scala语言==编写。- ==2009年==诞生于UC Berkeley(加州大学伯克利分校,CAL的AMP实验室),2010年开源,2013年6月进入Apach孵化器。- 同年由美国伯克利大学 AMP 实验室的 Spark 大数据处理系统多位创始人联合创立==Databricks==(属于 Spark 的商业化公司-业界称之为==数砖==-数据展现-砌墙-侧面应正其不是基石,只是数据计算)。...
2022-07-05 09:30:51 568
azkaban-4.0.0编译安装包.zip
2022-01-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人