自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 llm3实践教程(InternStudio 版)-笔记

环境配置下载模型Web Demo 部署坑:1、我本地之前link过,路径不对。2、路径对了可能不需要改代码:搞定后。

2024-04-26 17:59:24 209

原创 Lagent & AgentLego 智能体应用搭建-笔记

Lagent 是一个轻量级开源智能体框架,旨在让用户可以高效地构建基于大语言模型的智能体。同时它也提供了一些典型工具以增强大语言模型的能力。工具目测不如langchain上的多,天气搜索之类没有,不过python解释器好几个,不知道差别是啥又搞了一个12.2的虚拟机,进去一愣,看来是挂载的存储没换,配置换了。👍。

2024-04-24 10:35:12 191

原创 大模型评测-笔记

基座模型基本和我的映像差不多,chat我以为偏向于更多的rlhf呢。instruct才是增加工具能力之类的。config内容其实不长,可以稍微看看。

2024-04-23 19:46:16 193

原创 LMDeploy 的量化和部署-作业

【代码】LMDeploy 的量化和部署-作业。

2024-04-23 15:59:56 71 1

原创 LMDeploy 的量化和部署

lmdeploy 已安装。

2024-04-23 10:11:36 191

原创 xtuner作业

其实主要依据前面ft-medqa修改一下就行。准备工作。

2024-04-19 12:32:16 130 1

原创 XTuner 大模型单卡低成本微调实战

max_epochs = 3意味着只训练3次。按最近文章说gpt2大概训练1000次才能一个参数记住2bit信息,100次大约只能记住1比特。估计训练3次微调能记住的还是太少了些。不过训练3次时间也不短,一次10分钟,三次估计半小时了。

2024-04-17 00:14:43 156

原创 茴香豆rag笔记

interlm的茴香豆rag体验

2024-04-14 22:43:48 191

原创 轻松玩转书生·浦语大模型趣味 Demo

1.8B讲故事还差点意思。猪猪Chat-InternLM2使用 Lagent 运行 InternLM2-Chat-7B 模型

2024-04-07 17:45:03 173

原创 书生·浦语大模型全链路开源体系

07:17 - 20B模型在推理数学代码等方面的性能优于GP3.5和germini pro08:38 - 模型在综合性能方面达到同量级的开源模型领先水平11:26 - 模型内生的计算能力和数据分析功能能够处理复杂的任务和数据分析14:34 - 模型选型是第一步,需要考虑模型的复杂度和算力16:47 - 书生浦语的全链条工具体系开源,包括数据、预训练、微调、部署、评测、应用等环节18:51 - 书生万卷cc数据集开源,包括2013年至2023年的互联网公开内容,并进行精细化的清洗和处理。

2024-04-07 15:25:06 319

原创 浅谈小型网游服务器端技术架构成本分析

       俺不敢说大型网游,是因为市面上那些pc网游我没有经验,不知道怎么做。先说说我经历的网游,wap网游,一款宠物为主的mmorpg,最高峰值在线2600+,现在我在一家sns游戏公司工作,一款类似开心农场的sns游戏日访问用户40万+,当然,这个网游是主程序架构达的非常不错,我才加入不久,正在学习中。我做了一个简单类似转盘的模块,每天将近30万独立用户玩。其实俺以前也做过笔记...

2010-01-31 22:37:40 443

原创 游戏项目的技术开发成本

      在游戏行业已经有多个年头了,在手机游戏行业混,所以项目多是中小型项目。从j2me单机游戏,商业模拟游戏,到java的wap网游。基本上这些都是用java开发的。不同的项目有不同的经验教训。我且先从几个方面说起。1、软件项目是否易于动态开发甚至动态发布?很多j2ee项目,以及一些c/s架构的项目,很难做到这两点。在我做商业模拟游戏项目的时候,第一款联想笔记本连锁专卖店项目,是采用...

2010-01-07 23:11:10 390

Case Classes and Pattern Matching(分支类和模式匹配)

Case Classes and Pattern Matching(分支类和模式匹配)      本章介绍分支类和模式匹配,这两个孪生兄弟可以帮你处理那些常规的,没有封装的数据结构。这两种构造在处理树形递归数据的时候非常有用。 如果你早先做过函数语言编程, 那模式匹配你可能比较熟悉,但分支类你可能就比较陌生了。分支类是scala在允许模式匹配支持对象的一种方法,这种方法可以节省很多废话。通常情...

2009-10-03 23:06:32 151

Tomcat和IIS配置

最近公司要做一个网站,放几个免费小游戏上去,看看网上的反应如何。设计网站的时候考虑了一下,得有blog和bbs这两个功能。服务器是iis+tomcat。我只会java,所以只选了java相关的资源,找了DLOG4J和onet forum这两个,选这两个主要是可以省掉汉化和破解问题。在tomcat上直接运行和配置dlog4j和onetforum很容易。但当iis和tomcat协作的时候,就出现问题了...

2007-12-09 17:56:32 280

css和javascript的分工与协作

        最近ajax在国内开始流行,很多程序员赶上了这个潮流,不幸的是,在这个大浪中,太多人拘泥于j2ee或者php等的经验,对服务器端做的事情转到客户端的javascript有热情,对css分离内容与表现不太有热情,一般的也就是知道该这么做,在论坛上可以看到很多程序员用ajax也只是在旧的table布局下套用了一点ajax的元素。这样没有充分发挥基于web标准开发的威力,只能算是旧瓶勾兑...

2007-08-30 23:20:34 182

BS-CS架构比较

        公司开发项目由b/s转向C/S结构,原本做服务器的我,随着这次项目的转型,更多的工作转向Web前台开发。        第一个印象就是B/S结构读取数据非常方便,C/S要写很多网络命令封包,做的好一点可以直接用xml传数据,不过我开发的时候还是停留在传2进制的数据上,这样程序代码多一点,网络带宽会省很多。B/S如果基于老套的javaWeb开放框架,数据和表现都在一起传送,所以可以...

2007-08-21 00:13:55 118

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除