自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据虫巢

从半个大数据老鸟进化到一个大数据老鸟,偶尔码点代码,写点文章,说点故事,讲点经历,灌几口鸡汤;此外还是个超级大奶爸,梓尘兄的超级小弟,掌握了冲奶、哄娃等秘技.这里有生活,有技术,有行业,也有小文艺,...

  • 博客(80)
  • 问答 (1)
  • 收藏
  • 关注

原创 闲话人工智能系列02:AI大胸弟帮我写了13000多字的魔幻图文小说

作者·夏虫『数据虫巢』全文6898字题图·AI绘图“教员曾说过,没有调查就没有发言权。对AI到底能做到什么程度,其实我也很好奇,但我很少主动去说什么,尝试去证明什么--因为我还没有去调研。但雾里看花花不见,水中望月月难寻,不如自己拨开迷雾,亲自下水走一遭。”PS:提示,本篇我会用“文生图”的实践举例子,并附上文生图的一些技巧和经验,以及中间穿插对于AI的更深一步的理解,最后做了AI写小说的尝试和...

2024-03-28 07:38:41 839

原创 闲话人工智能系列01:到底有多少智能,还需要多少人工

作者·夏虫『数据虫巢』全文5448字题图·AI生成“以前,我们总是调侃AI:有多少人工,就有多少智能。人工智能更多人喜欢称之为‘人工智障’。有一天,我们突然发现逻辑好像变了,你不需要做太多东西,貌似也有一点点厉害了,有人说AGI(通用人工智能)已经在路上了。只有亲自接触了其中,参与了其中,你才知道到底有多少人工,有多少智能。又或者说现在到底有多少智能,我们还需要额外的多少人工?”正如上一篇文章《...

2024-03-22 07:20:10 724

原创 数据与广告系列三十八:大模型,展望AI化的原生广告未来

作者·夏虫『数据虫巢』全文7685字图·丽宁十八弯“大模型AI,作为当红炸子鸡,而商业化广告,顶级的现金流业务,当他们碰撞在一起的时候,会产生什么样的火花呢?”为什么要聊大模型与广告?广告自然不用多说,系列到了第三十八篇,其实前面章节聊过了广告的业务,中间十几个章节聊了广告的整个智能化链路,包含了定向、召回、排序、重排等等。按我的规划,后面几篇依然可能会侧重于技术,但是可能就不是当下技术了,而是...

2024-03-13 12:05:28 1036

原创 数据与广告系列三十七:广告,商业化的高雅,中间商赚差价的无奈

作者·黄崇远『数据巢』全文8872字题图ssyer.com“商业化广告,看着其技术复杂又富有挑战性,业务覆盖行业的方方面面又似乎不可或缺,但究其本质,依然是中间商赚差价的生意而已,但细究其背后的深层原因,却又远不止这么简单。”百度以搜索起家,实际上做的是商业化的事,2023年3季度营收344亿,90%应该都是商业化带来的;字节以头条信息流为核心,最大的营收也是广告,乃至于其另一个山头抖音,虽然大...

2024-02-04 18:55:56 1085

原创 数据与广告系列三十六:排序Rank,胸怀日月游星辰大海,脚踏黄土一步一个脚印...

作者·黄崇远『数据虫巢』全文15920字题图ssyer.com“繁花迷人眼,排序模型已经推导到了极致,排序的终点到底在哪里,是继续走向无限演化,还是去繁从简。但可能真相是:弱水三千只取一瓢,自饮而酸甜自知。也可能是胸怀日月遨游星辰大海,但是脚踏黄土一步一个脚印。”上一篇《数据与广告系列:数据与广告系列三十五:召回,没有什么是一个双塔解决不了的,如果有,那就多来几个》,正是2023年1月。敲下这个...

2024-01-23 20:36:39 888

转载 推荐石塔西的《互联网大厂推荐算法实战》

荐语“初识石塔西是他在知乎上的《负样本为王:评Facebook的向量化召回算法》,那是2020年,我还在带着团队做商业化召回,至今依然对“排序是特征的艺术,召回就是样本的艺术”深以为然。再次实打实的有交集是去年5月份,乃是机缘巧合下得知石塔西准备整理专栏出书了,但是遇到了问题,转而线上出线上书籍,笔者还在公众号上帮忙进行了宣传。如今,得知石塔西书籍出版终于尘埃落地,亦是大喜。我对于坚持不懈的人,...

2024-01-15 20:42:19 186

转载 游记系列-2023西南行记

的作者|夏虫题图:泸沽湖·天空之境“这不是一场说走就走的旅行,这是一场有预谋的旅行,这是一场人与人之间的修行。”这是一趟旅行,一次心灵的放空;这是一个挑战,一次灵魂的磨砺。当然,这也是一场人生的修行。人生不正如此吗,有所见有所得。01这是一场说走,一个多月后才走的旅行八月中下旬的一天,我正在工作,微信上许絮发来信息:“国庆我们去云南吧。”十秒后,我回道:“好,我来查下攻略。”这就是这次西南八日...

2023-11-06 20:54:53 99

转载 石塔西的《互联网大厂推荐算法实战》上线啦!

PS:史塔西的文章还是很有质量的,成体系的内容输出更是有质量保障,感兴趣的可以关注下(感觉好像我也得努力下了,数据与广告系列还没有完,也给自己加个油)。为什么是“上线”而非“出版”?你没眼花,我也没写错,是“上线”而非“出版”,个中原因,请容我慢慢道来。如果你对八卦不感兴趣,可以直接跳到本文的第2部分,看看我给出的“你需要读这本书”的理由。如果你是我的铁粉,相信我在推荐算法领域的水平,相信我不会东...

2023-05-12 11:30:27 685

转载 机器学习与数据挖掘的核心价值

机器学习与数据挖掘方向的核心目标是通过机器学习的建模方式解决人与物的匹配问题,以及通过对人行为数据的建模或挖掘研究,解决物的分发和调度问题。而在应用的领域中,又常常会围绕搜索、广告、推荐等几大常见等应用领域中展开。2023年4月22日,09:00-12:30,由OPPO商业数据挖掘组组长黄崇远老师出品的DataFun第3届数据科学在线峰会-机器学习与数据挖掘论坛将如期举办。本次论坛中,我们特别邀请...

2023-04-20 16:38:58 389

原创 2023:热血无法掩盖懦弱,沉默不能丧之勇气

作者|黄崇远题图:ssyer.com,CCO协议“我曾一度以为,我们行为的模式准则是单一的,最起码在一段时间内是明确的,但实际上这个世界是多变的,我从未料想到,是如此的多变以及不可预测性。”按往年的尿性,2022年的简单复盘,以及对于新的一年2023年的方向思考,早应该出来的,但是。整个2022年,我到底干了些啥,“沉迷于杀戮”而不可自拔?说好的抬头看天,低头思考的呢。整个2022年,在工作领域...

2023-02-14 08:00:36 147

转载 首个数据智能“知识地图”即将发布(为感谢读者朋友们,附一些刊印白皮书赠送)

“DataFun组织的‘数据智能知识地图’直播活动,邀请了还挺多大咖的,免费的,可以关注一波,Datafun组织的技术活动,值得信赖。为了感谢读者朋友们的长期支持,夏虫也特地向大川要了五六本Datafun刊印的《2022数据智能知识地图》,大概长下面这样,欢迎转发以及文后留言,先到先得哦,也欢迎你向你的朋友们推荐【数据虫巢】。”以下为活动正文:1月7日,13:00-18:30,DataFun将召...

2023-01-04 18:09:19 777

原创 数据与广告系列三十五:召回,没有什么是一个双塔解决不了的,如果有,那就多来几个

作者·黄崇远『数据虫巢』全文19476字题图ssyer.com“广告推荐的召回,没有什么是一个双塔解决不了的,如果有,那就多来几个。当然,这是戏说,但对于召回技术来说,确实是崛起于双塔,或者说双塔技术为推荐广告的召回提供了更广阔的想象空间,但实际上召回发展的路上,却不止于双塔。”如题引,我们今天的主题包含了两层,业务视角是召回,技术视角是双塔技术的演化,而逻辑的推进是两者的有机结合,最终我们会沿...

2023-01-03 13:23:05 903

原创 数据与广告系列三十四:定向智能化,是好东西,但终究是英雄迟暮

作者·黄崇远『数据虫巢』全文10382字题图ssyer.com“算是对个人过去比较长一段时间工作的总结吧,也算是对广告算法技术体系中一个垂直领域时代谢幕的祭奠。”主体的内容很大一部分算是对笔者个人过去比较长一段时间的总结和回顾吧,只是行文逻辑可能更多会从技术领域的演化视角来展开,这部分内容基本上已经在datafun组织的“2022年在线数据科学峰会”上分享过,所以也不存在技术不可言说的问题(并且...

2022-09-14 13:37:10 48

原创 数据与广告系列三十三:搜索广告,如何在用户搜索过程中优雅的夹带“私货”

作者·黄崇远『数据虫巢』全文共9897字题图ssyer.com“搜索这种东西,天然跟广告是相悖的,因为没有人是奔着搜索广告的内容而去的。所以在做搜索广告产品以及算法逻辑的时候,一边需要考虑用户搜索本身诉求的满足,一方面又得顾及到Money,就会做得分外痛苦。而今天,我们的主题就是,如何在用户搜索得过程中,优雅地夹带私货’。这将是一个非常有趣,又充满挑战的话题。”想要一边愉快的赚着钱,一边让用户“...

2022-09-01 07:34:43 27

原创 数据与广告系列三十三:搜索广告,如何在用户搜索过程中优雅的夹带“私货”...

作者·黄崇远『数据虫巢』全文共9897字题图ssyer.com“搜索这种东西,天然跟广告是相悖的,因为没有人是奔着搜索广告的内容而去的。所以在做搜索广告产品以及算法逻辑的时候,一边需要考虑用户搜索本身诉求的满足,一方面又得顾及到Money,就会做得分外痛苦。而今天,我们的主题就是,如何在用户搜索得过程中,优雅地夹带私货’。这将是一个非常有趣,又充满挑战的话题。”想要一边愉快的赚着钱,一边让用户“...

2022-09-01 07:34:43 369

原创 数据与广告系列三十二:重排ReRank,广告推荐算法链路上的背叛者,生态系统格局的重塑者...

作者·黄崇远『数据虫巢』全文23138字题图ssyer.com“在推荐系统又或者计算广告中,重排ReRank明目张胆的把召回、粗排、精排几个链路逻辑辛苦生成的序给打乱,但却敢号称是为了大局着想。这是一个非常有意思的算法阶段,细思下去充满乐趣,当然也充满挑战。”在整个系统推荐或者计算广告中,重排ReRank并没有如排序Rank这般知名度高,甚至再往前追溯的召回阶段都比他更...

2022-04-25 20:09:28 2462

原创 数据与广告系列三十二:重排ReRank,广告推荐算法链路上的背叛者,生态系统格局的重塑者...

作者·黄崇远『数据虫巢』全文23138字题图ssyer.com“在推荐系统又或者计算广告中,重排ReRank明目张胆的把召回、粗排、精排几个链路逻辑辛苦生成的序给打乱,但却敢号称是为了大局着想。这是一个非常有意思的算法阶段,细思下去充满乐趣,当然也充满挑战。”在整个系统推荐或者计算广告中,重排ReRank并没有如排序Rank这般知名度高,甚至再往前追溯的召回阶段都比他更被为人所熟知,更不用说精排...

2022-04-25 20:09:28 279

原创 2022:眯眼看世界、回首望自己(附送给订阅朋友们的福利)

作者·黄崇远『数据虫巢』全文共4122字题图ssyer.com“马上2021年春节了,还是写点什么吧。算是给过去一年的自己一个交代、一个认可、一种反思;给未来一年的自己一个目标、一个信念...

2022-01-27 16:30:00 586

原创 数据与广告系列三十一:智能调价oCPX,你以为赚的是保价,其实你丢的是流量...

作者·黄崇远『数据虫巢』全文12050字题图ssyer.com随着计算广告生态的进一步发展,有越来越往智能化方向发展迭代的趋势。关于投放层的智能化,当属“广告动态智能出价”,或者更严谨的点...

2022-01-23 16:21:17 1182

原创 数据与广告系列三十:从oCPX的无形调控之手到定向价值定位

作者·黄崇远『数据虫巢』全文共6005字题图ssyer.com“从定向的优化目标出发,理解oCPX的无形调控之手,最后在回归到定向逻辑的定位价值问题。”本文的背景是,站在定向或者智能广告...

2021-12-05 23:30:42 548

原创 数据与广告系列二十九:推荐系统与计算广告的和而不同

作者·黄崇远『数据虫巢』全文共3600字题图ssyer.com“从推荐系统的演化过程中洞见计算广告的核心要素,但两者又存在着本质的差异,这也是计算广告自身差异的源点。”我们在第2章开篇时...

2021-09-03 00:21:47 419

原创 关于推荐系统中产品经理如何定位的问题

作者·黄崇远『数据虫巢』全文共2821字题图ssyer.com“推荐系统看着是一个偏技术的问题,但实际上少不了产品逻辑的赋能,很多时候产品逻辑能起到的是四两拨千斤的作用。”在很多时候,我...

2021-08-25 07:45:00 178

转载 那个点燃了火堆,并且拥有200多个笔名的男人

“今天我们要聊的是一个人,在历史的尘埃中,那个点燃了火堆,并且拥有200多个笔名的男人,以及其背后很多时候我们并没有深入去思考的问题。”(图来源于《觉醒者》,侵删)对,就是图中的这个表情...

2021-08-10 19:44:20 176

原创 数据与广告系列二十八:IAA游戏广告,广告界的庞氏骗局

作者·黄崇远『数据虫巢』全文共4056字题图ssyer.com“IAA游戏广告,本质是中间商赚差价,以及流量的击鼓传花,层层套娃,总有一层绷不住成本与营收的ROI,然后死亡,一批死亡让另...

2021-08-09 18:29:00 4768

转载 搜索>推荐>广告:新一代算法模型的探索与思考!

2021年8月15日,DataFunSummit:互联网核心应用算法峰会将如约而至。本次峰会的形式再次创新,由阿里妈妈与DataFun联合策划、DLP-KDD workshop主席团倾情...

2021-08-07 21:17:19 112

转载 读书:找到锚点,然后把自己给钉死

“万物皆可度量,我们要善于寻找到自己的锚点,不管是构建防御还是用于进攻。”本文算是《怪诞行为学》的读书笔记,这本书按大的类型上应该是心理学的范畴,但是讨论的具体场景又是经济学的很多场景,...

2021-08-06 09:04:38 311

原创 推荐与广告技术架构的迭代逻辑

作者·黄崇远『数据虫巢』全文共4520字题图ssyer.com“所有的技术架构并不是一蹴而就的,都是在需求迭代中逐步的探索,并且不断的适应业务的发展,才逐步发展成最终我们所看到的样子。”...

2021-08-04 07:43:00 271

原创 用户画像修炼笔记--GIAC参会小纪

作者·黄崇远『数据虫巢』全文共3549字题图ssyer.com“好的东西适合记下来,尤其是别人的炼丹心得。”参加了2021年全球架构师大会(GIAC),好些年没有参加类似的大会了,不过花...

2021-08-01 08:36:04 183

原创 数据与广告系列二十七:智能定向独特业务的独有炼丹配方

作者·黄崇远『数据虫巢』全文共4534字题图ssyer.com“没点独特的东西,怎么好意思说自己在炼仙丹。”本文强接上文《数据与广告系列二十六:知识迁移的Embedding应用,智能化定...

2021-07-20 09:21:32 251

原创 数据与广告系列二十六:知识迁移的Embedding应用,智能化定向的解药

作者·黄崇远『数据虫巢』全文共4348字题图ssyer.com“效果广告后定向时代,虽有千般万难,我们一样还得解决定向智能的问题。”需要提前说明的是,这一篇会涉及到本系列之前聊过的不少相...

2021-07-15 12:37:00 173

原创 数据与广告系列二十五:Embedding的起源与演化,以及序列构建与目标拟合派的流派之争...

作者·黄崇远『数据虫巢』全文共9665字题图ssyer.com“按我自己的理解,重新梳理了embedding的逻辑,并给他们造了一个江湖。”为什么会今天写这个话题,其实早在系列的第十九就...

2021-07-01 21:04:00 509

原创 数据与广告系列二十四:效果广告后定向时代如何逆流而上

作者·黄崇远『数据虫巢』全文共4338字题图ssyer.com“在效果广告的发展历程中,当前已经处于后定向时代,或者说是弱定向时代,我们是应该顺应潮流还是应该逆流而上?”不管是顺应潮流还...

2021-06-18 01:11:24 249

原创 假如让我来设计“腾讯视频”的推荐系统

作者·黄崇远『数据虫巢』全文共4966字题图ssyer.com“虽然我一向警惕被推荐系统带着走,但我也讨厌低效。”这是一个带着故事背景的技术话题,轻松愉快但又不乏对于技术深度的思考。01...

2021-05-21 09:10:00 423 1

原创 《深度学习推荐系统》笔记03:被玩坏了的模型,我们要做减法

作者·黄崇远『数据虫巢』全文共5838字题图ssyer.com“我们从另外一个视角,或者另外一些思考方式来学习或者说认识推荐相关的模型。”整个推荐技术发展到了如今,其实成熟度已经非常高了...

2021-04-29 01:03:30 167

原创 《深度学习推荐系统》笔记02:立于道,工于技

作者·黄崇远『数据虫巢』全文共5201字题图ssyer.com“有道方可言术,道为总略,术为途径。只有在方向和思考逻辑没有错误的情况下,不断完善自己的技法,才能不断成长,并且熟而生巧、举...

2021-03-16 23:51:00 188

原创 《深度学习推荐系统》笔记01:如何驾驭一个完整的知识体系结构

作者·黄崇远『数据虫巢』全文共6190字题图ssyer.com“好书的内容就如一盏明灯,顺着灯光指引可能你可以走到尽头,但你也可以边走边想,就着灯光合着星辰,或许你也可以走出一条自己的路...

2021-03-09 23:49:26 377 1

原创 2021变局之年:虔心修行,藏器于身,待时而动

作者·黄崇远『数据虫巢』全文共1309字题图ssyer.com“在此2020之前,我们从未想过世界有如此之变,而2021到来之时,自己又该如何处之。并且,或许这只是开端而不是结束。”谨...

2021-01-03 15:34:55 363

原创 数据与广告系列二十三:计算广告的商业本质

作者·黄崇远『数据虫巢』全文共4800字题图ssyer.com“计算广告,从多方博弈以及发展历程的角度看,其本质是ROI的平衡;但从商业角度的看,本质是信息差的利用。”已经有半年未更新这...

2020-12-12 13:22:50 208

转载 【大会信息分享】新一代推荐算法核心技术与实践

导读:12月20日,09:00-12:40,受DataFunTalk组委会邀请,阿里妈妈资深算法专家朱小强老师将担任DataFunTalk年终大会推荐算法论坛出品人,并邀请来自阿里、快手...

2020-12-10 00:04:55 1532

原创 数据与广告系列二十二:智能化投放中扩量场景的技术实现策略

作者·黄崇远公众号『数据虫巢』全文8968字题图ssyer.com“人不够,系统给你凑。”这个系列上一篇《数据与广告系列二十一:关于品牌广告,奔涌吧后浪》是五月底,这两个月时间倒不是停...

2020-07-25 21:56:15 717

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除