八月远方 - 动态 - 第 916 / 1320 页
2025-01-30 10:00

海底捞如何培养百万年薪店长?

发布时间:2025-01-30 09:32:57


文丨杨亚飞

2025 年元旦一大早,敏姐照例到大融城里的海底捞门店上班,但这次她的日程有变,从过去管一家店,变成管理商场里的三家店,学习成为多管店店长。

这是海底捞推出“红石榴计划”后的新变化。过去半年来,焰请、小嗨爱炸、小嗨火锅、火焰官、喵塘主麻辣烤鱼、沸派·甄鲜小火锅、从前印象等一批副牌相继冒出。据36氪未来消费不完全统计,前述副牌目前已合计开出近50家。其中,焰请门店数已经达到25家,另有10家待开业中。

主品牌规模增长放缓后,海底捞发展第二品牌的野心写在明面。而像敏姐这样的海底捞店长,也是多品牌成败的关键一环——创始人定创业方向,但门店运营和实际开拓速度,取决于能找到多少好的店长。

相比于外聘,从海底捞体系里打拼出来的店长,是最合适的人选。

敏姐是典型的“老员工”:07 年毕业入职,已有 17 年工龄。海底捞是她唯一的一份工作经验,物流专业背景的她,最初入职到蜀海供应链,从人事主管一路干到人事高级经理,后跟着“种子计划”下店,2018年12月,她成了新开的西安大融城店的预备店长,一干就是六年多。

截至2024 年上半年,海底捞共有 1343 家店,敏姐正是一千多位门店经理之一。在2024年之前,绝大多数人像敏姐一样,只守着一家海底捞门店,但随着多品牌的陆续浮出,很多店长的想法和职业规划,在这一年永远变了。

投资是投人,海底捞的内部创业也是如此。元老级员工最先被盯上。

在2020年首次推多品牌战略时,海底捞先动员了所有的统筹教练。焰请烤肉铺子的创始人杨华,在1999年就加入海底捞,从门店基层一路干到统筹教练,2022年内部下海创业。杨华还是创业委员会的主教练。

创业都知是九死一生,但海底捞要放手一搏。杨华告诉36氪未来消费,“我们做好了做100次,成功一次的准备。”如果创业失败,公司承担损失大头,创始人承担小头,并且可以二次、三次创业。

“海底捞的风格是先开枪,而不是先瞄准,”一位海底捞的内部认识说,“开100枪,总是有打中的。”

不过,选好创业1号位,是提升命中率的关键。海底捞创业办公室主任、小嗨炸串创始人王强表示,创业者包括三类人,一是奋斗多年的老员工,二是互联网背景的管理者,三是引入的外部创业者。

敏姐迈出多管店这一步,也是1号位的号召力。“杨华姐是从西安走出去的店长,我也是西安的店长。”敏姐告诉36氪未来消费,这听起来有点“盲目”,但杨华是她们的榜样。

在去年4月的集团抱团大会上,敏姐第一次听到了杨华的宣讲,彼时焰请还只有一家店,敏姐说,那时候“红石榴计划的名字还没有出来。”此后,她跑到同城的焰请首店学习,看完后她判断自己也能开一家出来。

但像敏姐这样的店长,要想获准多管店,还有两个硬性门槛,一是负责的海底捞门店考评达到B级,二是在老店培养出一支预备团队。焰请大融城店的大堂经理、后堂经理等骨干分子,便是敏姐从老店挑出来的二套班子。

“我们不会做开 100 间或者 200 间店的计划,”杨华说,多品牌的开店数,取决于有少好的干部和商铺。

餐饮圈有句话,「好铺子是等出来的」,敏姐的想法最终落地也是等到了一个机会。去年中,敏姐注意到隔壁商户因经营不善闭店,铺子一下子空了出来。

海底捞店是西安大融城的配套商户,这个关系在前,焰请店的实际筹备进展也快很多。6月份签约,一个月多就走完合同流程,而过去常规要3-6月,并在8月16日正式开门营业。

因为只有一墙之隔,敏姐同时管两家店容易很多,她给自己做心理建设,“想象成多了30张桌子,”另外,烤肉跟火锅的区别主要在于菜品,前者肉类菜品更多,她说,“就是后厨新增加一个功能间。”

海底捞的门店考核核心是过程管理,他们信奉的理念是,过程做好了,结果不会差。四色卡是最重要的考核指标,这一考评方式也被霸王茶姬等同行效仿。

多品牌同样沿用四色卡考核,大方向依然抓服务、卫生、菜品出品、食品安全等均衡指标。门店服务则是熟悉的“海底捞风”,同样有洗发、编发、美甲、川剧变脸等服务。

“我们的团队最核心的能力是,一手抓员工,一手抓顾客。”杨华说,他们有很多办法照顾好员工,给到足够的激励。而创始人只需要把店长在他们各自的品类业务层面培训合格,“这是最低成本的培训。”

同样期待开新店的,是敏姐团队里的员工。一家新店开出,会新增大堂经理、后堂经理以及部分特岗。不管怎么说,下面人的升迁机会都变多了。

选拔人员也是敏姐多管店最花精力的工作,她要带着后备班子,处理施工、客诉、菜品更新等工作,磨合时间在半年到一年不等。

创业风险对应着回报。王强表示,创始人有股权激励,创始人和管理团队还有基础薪酬和分红权。此外,涉及多部门的协同,设有奖金包,做阶段性激励。

对于敏姐这样的多管店店长,前三个月享有权责豁免权,如果期内实现盈利,可以直接从门店分润。分润也是店长多管店的主要收入来源,这之外,他们的管理能力,也可以通过管理徒子徒孙“变现”。

为了“连住利益”,海底捞设计了一套特别的店经理分润体系。店经理既可以直接从自管餐厅分润,也可以拿更低的自管餐厅分润比例,但同时可以从直系的徒子、徒孙管理餐厅分润。

“徒弟徒孙是他们的永久产权,”杨华说,这是海底捞的价值观,“教会了徒弟,师傅过得更好。”

由于能从徒子徒孙的门店抽成,海底捞店长一直以高薪酬闻名。徒子徒孙多的老店长,月薪可以达到10万以上,但这只属于少数的A级店长,且更多出现在高速扩张期。而在主品牌降速当下,薪酬的上限要打个大的折扣。

将店长体系与多品牌打通,为的是再造一批高薪店长。

杨华说,一位普通的火锅店或者烤肉店店长,可能只能赚1-2万元,但在海底捞,店长如果能培养四套后备班子,可以在一个商场里开四家店,挣四份钱。

不过,是否让店长多管店,海底捞内部有过分歧。最终推行还是想“双手改变命运。”海底捞创始人张勇曾在内部直言,想让优秀的店长可以年薪百万。

店长拿到分红的前提是门店模型能跑通,这考验创委会的眼力。新的创业项目提报,首先要由创业委员会评估,当项目启动后,创业委员会会在3个月/6个月/一年,定期对项目进行考评。

一旦经营不善,则有两条闭店流程,一是创委会征求创始人意见,后者判断无法起死回生,由创始人发起;二是项目两两PK,如果数据不断变差,由创业委员会综合评估做闭店处理。

海底捞内部还有一个“创业备忘录”,他们意识到,很多创业的底层逻辑、遇到的挑战和解题方法相通。据36氪未来消费了解,每个月会举行内部创业者大会,基于创始人问题反馈,不断更新备忘录,产品研发、工程成本控制,以及财务模型的测算,均可以从中找到参考答案。

开业两个多月时间,敏姐团队管理的焰请门店拿到了A级评级。随着越来越多店长的加入,如今焰请对店长的申请门槛,已经从B级提高到A级。敏姐自己的精力则又重新腾出来,放在新开的包间店上。

餐饮做的是人的生意,也是用人的生意。留住人才只有两种方式,透明化的晋升,或者直接的激励。前者对应是荣誉感,后者是真金白银。

星巴克之所以被称为餐饮「黄埔军校」,很大部分在于他们有着业内最成熟的店长培养体系。肯德基中国的1万家店,也曾被认为是“前无古人”,这赖于一套高度标准化的门店运营体系。他们如今都成了本土新势力挖墙脚的对象。

餐饮加盟热催生了超级加盟商,而海底捞的多管店,则意在培养一批“超级店长”,在一个区域市场,放大基层管理者的能力。一个商场里容不下两家海底捞,但可以容下四家多品牌店,而它们只需要一个店长。

“店长相当于家族长,在一个商场里,每个徒弟替他管理一个品牌。”杨华说,在方圆500米的管理路径,没有任何的管理效率能达到这个程度。

星巴克有做类似调整。不久前,据媒体报道,星巴克计划将部分门店组建多店社区(MSC),由一位店长同时管理两家门店,打破过去单店管理的方式。

显然,头部品牌开一家店容易,但培养出一个好店长并不容易。前者是冲量,后者才能拉开经营差距。据36氪未来消费了解,米村拌饭在近期主动放缓了开店速度,其中一个重要的因素是,没办法快速培养出那么多的店长。

相比如今多品牌的多点开花,海底捞的加盟业务进展缓慢。难度显而易见,海底捞以服务著称,但服务最难通过加盟复制。相比于去陌生的地方开疆拓土,同商场、多品牌的组合业态,让店长及其团队更有可能兼顾多家店。

海底捞很早便在做多品牌尝试,但跟多数餐饮同行类似,一直不温不火,且孵化的快餐品牌在2021年曾大量闭店。而在过去的2024年,他们的多品牌发力,更明显在“避短扬长”,基于自身的供应链体系摸索。

目前跑的最快的焰请,便与火锅供应链有重合和互补,业内有“火锅烤肉不分家”一说,“海底捞可以涮的牛肉的部位,跟用来烤的部位是完全不一样的,”杨华说,“原来谈的可能是某个部位,我们现在谈的是整头牛的价格。”

杨华在海底捞是“连续创业者”,从五谷三餐切换到烤肉,这种改变对她来说,也是意识到自己更擅长做高客单、有空间提供情绪价值的品类。手下的店长,也切换成她最熟悉的一批人。

2024年12月底,海底捞在无锡举行了“红石榴计划”的首次线下预备大会。现场报名的海底捞店长众多,杨华便收到了足足200份的申请。经过评估她最终给160多位店长发证,成为储备的多管店长。

“人才是唯一不可以用钱来解决的问题,这才是最核心的问题。”杨华说。


来源:36氪

 

2025-01-30 10:00

微软CEO纳德拉:DeepSeek有“真创新”,AI成本下降是趋势

发布时间:2025-01-30 09:49:05


微软CEO纳德拉在电话会上强调,DeepSeek R1模型目前已可通过微软的AI平台Azure AI Foundry和GitHub获取,并且很快就能在Copilot+电脑上运行。纳德拉称DeepSeek“有一些真的创新”,AI成本下降是趋势:“缩放定律(Scaling Law)在预训练和推理时间计算中不断积累。多年来,我们已经看到了AI训练和推理方面的效率显著提高。在推理方面,我们通常看到每一代硬件的性价比提高2倍以上,每一代模型的性价比提高10倍以上。”(界面)


来源:36氪

 

2025-01-30 10:00

微软:预计资本开支将在未来数年扩大

发布时间:2025-01-30 09:31:02


微软表示,预计资本开支将在未来数年扩大。企业预定超预期。微软在云产能方面仍然受抑。(财联社)


来源:36氪

 

2025-01-30 10:00

IBM第四季度营收175.53亿美元,净利润同比下降11%

发布时间:2025-01-30 09:30:05


IBM今天发布了该公司的2024财年第四季度及全年财报。报告显示,IBM第四季度营收为175.53亿美元,与上年同期的173.81亿美元相比增长1%,不计入汇率变动的影响为同比增长2%;来自于持续运营业务的净利润为29.27亿美元,与上年同期的32.85亿美元相比下降11%;不按照美国通用会计准则,来自于持续运营业务的运营净利润为37亿美元,同比增长3%。(新浪科技)


来源:36氪

 

2025-01-30 10:00

美联储宣布维持联邦基金利率目标区间不变

发布时间:2025-01-30 09:23:27


当地时间1月29日,美国联邦储备委员会宣布,将联邦基金利率目标区间继续维持在4.25%至4.5%之间。这是美联储自2024年9月连续降息以来首次维持利率不变。美联储在当天发表的声明中表示,美国经济继续以稳健的步伐扩张。近几个月来失业率稳定在较低水平,劳动力市场状况依然稳固,但通货膨胀仍“一定程度上处于高位”,经济前景“不确定”。(央视新闻)


来源:36氪

 

2025-01-30 10:00

Meta2024年四季度营收483.9亿美元,同比增长21%

发布时间:2025-01-30 09:18:50


Meta当地时间1月29日公布2024年第四季度及全年财报。2024年第四季度和2024年全年营收分别为483.9亿美元和1645.0亿美元,同比分别增长21%和22%。预计2025年第一季度营收为395亿至418亿美元。预计2025年全年的资本支出将在600-650亿美元之间。(界面)


来源:36氪

 

2025-01-30 10:00

软银正商谈向OpenAI投资最高达250亿美元

发布时间:2025-01-30 09:16:25


据英国金融时报,软银正商谈向OpenAI投资最高达250亿美元。(财联社)


来源:36氪

 

2025-01-30 10:00

2025春节档总票房破26亿

发布时间:2025-01-30 09:12:30


36氪获悉,据灯塔专业版,截至1月30日8时56分,2025年春节档(1月28日-2月4日)档期总票房(含预售)突破26亿。


来源:36氪

 

2025-01-30 10:00

特斯拉2024年Q4营收257.1亿美元

发布时间:2025-01-30 09:08:11


特斯拉2024年Q4营收257.1亿美元,市场预期271.5亿美元,上年同期251.67亿美元。第四季度毛利率为16.3%。Q4净利润23.17亿美元,市场预期22.41亿美元,上年同期79.28亿美元。(界面)


来源:36氪

 

2025-01-30 09:00

微软第二财季云营收409亿美元,市场预期411亿美元

发布时间:2025-01-30 09:00:00


微软2025财年Q2营收696亿美元,市场预期688.4亿美元,上年同期620.2亿美元。Q2净利润241.08亿美元,市场预期233.8亿美元,上年同期218.7亿美元。第二财季云营收409亿美元,预期411亿美元。Azure和其他云服务营收涨31%。2025财年Q2智能云业务营收255亿美元,上年同期258.8亿美元,市场预期259.8亿美元。(财联社)


来源:36氪

 

2025-01-29 21:00

2025大年初一票房破纪录

发布时间:2025-01-29 20:24:22


36氪获悉,据灯塔专业版数据,截至1月29日19时,2025年大年初一总票房超17.0亿,超2021年大年初一票房,刷新中国影史单日最高票房纪录。


来源:36氪

 

2025-01-29 18:00

尽管市场普遍低迷 印度IPO热潮持续

发布时间:2025-01-29 17:54:18


尽管市场普遍抛售,印度最新上市的股票表现良好,平均发行价上涨15%。首次公开募股(IPO)的需求仍然强劲,目前正在处理超过60个IPO申请,预计今年将筹集250至300亿美元。去年印度股市的强劲反弹遭遇挫折,因市场担心经济和盈利增长放缓,印度50指数创下自2001年以来最糟糕的月度跌幅。(财联社)


来源:36氪

 

2025-01-29 18:00

挪威主权财富基金2024年回报率为13%

发布时间:2025-01-29 17:52:26


1月29日,挪威主权财富基金2024年回报率为13%,即2220亿美元,但连续第二年未能达到其自我设定的目标,尽管蓬勃发展的美国科技行业带来了收益。该基金在公告中表示到2024年对股票的投资增长18%。(财联社)


来源:36氪

 

2025-01-29 18:00

宇树科技回应春晚个别机器人“失误”:加了一些搞笑的“小彩蛋”

发布时间:2025-01-29 17:41:43


1月29日,在昨日晚间的2025央视春晚中,著名电影导演张艺谋携手杭州宇树科技、新疆艺术学院带来了一个名为《秧 BOT》的节目。人形机器人穿着花坎肩,拿着手绢扭秧歌,看起来十分喜感,甚至还能“0 帧起手转手绢”。

不过有细心的观众发现,在表演的时候,有个别机器人出现“失误”,比如突然来个超级夸张的欢乐舞步,或者把手绢飞得比人还高,或者怪异的一些其他动作。对此,据九派新闻报道,宇树科技市场部的工作人员陈女士表示,确实在表演里加了一些搞笑的“小彩蛋”,人形机器人的“怪异”“犯错”或“故障”能给大家带来欢乐。(金融界)


来源:36氪

 

2025-01-29 18:00

2025大年初一电影观影人次达3076.3万 显著超过去年同期水平

发布时间:2025-01-29 17:37:15


根据国家电影专资办统计,截至1月29日17时,2025年春节大年初一票房已达15.82亿元,观影人次已达3076.30万,显著超过去年春节同期市场水平,春节档票房(含预售)已达20.41亿元。


来源:36氪

 

2025-01-29 18:00

新研究确认一颗位于宜居带上的“超级地球”

发布时间:2025-01-29 17:22:13


1月29日,英国牛津大学28日发布公报说,一个国际研究小组已证实在一颗类太阳恒星的宜居带附近存在“超级地球”。这一成果为未来寻找可能适合生命生存的类地系外行星提供了更多线索。(财联社)


来源:36氪

 

2025-01-29 18:00

阿斯麦(ASML)股价在欧洲上涨11% 第四季度订单超过预期

发布时间:2025-01-29 17:19:05


阿斯麦(ASML)股价在欧洲上涨11%,第四季度订单超过预期。ASML周三公布第四季度订单额为70.9亿欧元,远超分析师所得的平均预估35.3亿欧元。


来源:36氪

 

2025-01-29 18:00

小米:春晚唤醒全球小爱同学超亿次

发布时间:2025-01-29 17:17:50


36氪获悉,小米智能助手“小爱同学”官方账号发文称,昨晚到今天中午,春晚唤醒全球小爱同学超亿次。


来源:36氪

 

2025-01-29 16:00

今日全社会跨区域人员流动量预计近2亿人次

发布时间:2025-01-29 15:20:41


据央视新闻,2025年综合运输春运工作专班数据显示,2025年1月29日(春运第16日,农历正月初一),全社会跨区域人员流动量预计19702万人次,其中,铁路客运量550万人次,公路人员流动量18881万人次(高速公路及普通国省道非营业性小客车人员出行量17682万人次、公路营业性客运量1199万人次),水路客运量65万人次,民航客运量206万人次。


来源:36氪

 

2025-01-29 16:00

飞猪:春节假期前两天出游订单量快速攀升,多地门票、租车、线路游翻倍增长

发布时间:2025-01-29 15:19:51


36氪获悉,1月29日,春节假期进入第二天。来自飞猪的数据显示,春节假期前两天出游订单量持续攀升。境内游方面,机票、定制游以及包含餐饮玩乐等权益的酒店套餐订单量同比去年大幅增长;出境游方面,订单规模在去年高基数上继续强劲增长,其中国际邮轮订单量同比去年增长超6倍。飞猪数据显示,上海、北京、广州、成都、杭州、重庆、深圳、西安、南京、昆明等是假期前两天旅游热度最高的城市。


来源:36氪

 

2025-01-29 16:00

B站春晚直播:观看人数超1亿、千万用户参与答题

发布时间:2025-01-29 15:19:06


36氪获悉,1月29日,B站作为蛇年春晚独家弹幕视频合作平台,公布了除夕当晚的相关数据。数据显示,除夕当晚,B站春晚直播间观看人数创历史新高,超1亿人,30岁以下观众占比为83%,直播弹幕数超过1.2亿。B站定制化的春晚答题互动,超过1000万用户参与。直播当晚,《秧BOT》《春意红包》《喜上枝头》三个节目,舞台表演融合未来科技、非遗文化、宋画艺术等,成为了当晚用户评论互动前三的节目。


来源:36氪

 

2025-01-29 16:00

阿里云通义千问旗舰版模型Qwen2.5-Max升级发布

发布时间:2025-01-29 09:06:40


36氪获悉,01月29日 大年初一,阿里云通义千问旗舰版模型Qwen2.5-Max全新升级发布。Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新探索成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。


来源:36氪

 

2025-01-29 15:00

摩根大通:廉价的AI模型对全球股市具有净正面影响

发布时间:2025-01-29 14:15:28


摩根大通表示,更便宜的人工智能模型的出现对全球股市来说是一个“净利好”,因为它将推动增量增长,带来提前的效率收益,并拉低通胀


来源:36氪

 

2025-01-29 15:00

2025春节档新片票房破16亿

发布时间:2025-01-29 14:14:50


36氪获悉,据灯塔专业版,截至1月29日11时58分,2025年春节档上映新片总票房(含点映及预售)突破16亿。


来源:36氪

 

2025-01-29 14:01

两位科学家关于AI for science的开年演讲

发布时间:2025-01-29 11:55:05


2025年1月12日下午,科学公益机构北京市海淀区智识前沿科技促进中心举行了主题为“AI for Science,AI for Good”的年度科学盛事。

⾹港⼤学计算与数据科学学院院长、忆⽣科技创始⼈马毅、亚马逊云科技上海人工智能研究院院长张峥分别以探索智能本质之路和大模型时代,教育的新挑战 —— 从流水线到文艺复兴为主题做了新年科学演讲,以下为观点摘编:

1. 之前我讲一句爱因斯坦的话,讲的是science,Everything should be made as simple as possible,but not any simlper。所有的事情都应该解释得尽可能的简单到不能再简单。要简化,把世界的规律用最简单的方式找到,但是不能再简单,一再简单就解释不了现象。这两句话在我看来是智能的本质。

2. DNA就是自然界第一个大模型,生命最早就是靠DNA,一代一代的自然变异,物竞天择,适者生存。不断的修改,试错,传承下去,个体没有什么智能,群体有智能,通过自然选择。这种过程现在有一个很流程的名字,强化学习,不是不能进步,代价很大,一将功成万骨枯。现在的大模型就是这样的,我们并不了解它的机制,各个团队在不断试错,百模大战,群魔乱舞,适者生存,机制都一样,现象也一样,不是不能进步,代价很大,你没有几亿美元不要想做这个事情。

3. 5亿年前个体出现大脑神经系统,开始出现了眼睛,个人从外部世界获取信息,造成了寒武纪生命大爆发。大脑一定程度上取代了DNA的作用,个体具有了智能,所以在生物物种智能叫做基因遗传和自然选择进化,个体具有后天学习与适应的智能,这是一个非常大的跳跃,智能机制的跳跃。

4. 后来到了人,动物开始群居,出现信息交流,开始出现语言、文字,智能机制在提高,不再是个人学习,而且我学习的东西还通过语言和文字交流传承下去,语言文明取代了DNA另一部分作用。这是群体智能。

5. 几千年前另一件事情发生了:数学和科学,人类学会了抽象的能力,很多的知识超越了从经验数据里提取的能力,这就是人的智能。在上个世纪40年代,预知未来一定要了解历史,作学问的一定要把历史搞清楚,真正的智能这件事情的起源在哪里,现在一说就是五六年前的AI,这是完全错误的,真正对智能感兴趣的是40年代,因为很大一部分科学家希望机器能够模拟动物或者人的能力,包括对有用信息是如何存储的,他的学生发明了控制论,如何提升自己的决策,冯诺依曼的《博弈论》,如何通过人脑学习,人工神经网络第一个数学模型,想知道模拟外部世界感知能力,这个系统是什么,机理是什么,当时有一本书维纳的《控制论》,他对这帮学生来说,他们认为智能后面的数学机制是统一的,只要你找到了这些机制,动物和机器是分不开的。

6. 最近这十年,2012年的时间神经网络在算力和数据的加持下确实了不起,就是深度网络的实现变得可能,文本、图像包括科学的发展突飞猛进。主要是对以前意识到这个机制的实现,从技术上变成可能,甚至认为我们技术取得进步,包括我对以前的同事都说,可能白盒子就够了,只要它工作对不对,一定意义从工程角度是可以的,但这从科学角度是不能接受的。懂历史的都知道,只要一件事情很有影响,又是黑盒子就会被人利用,自古以来如此。我们光从这个角度就要搞清楚,到底智能是什么,到底神经网络在干什么。

7. 如何把智能定义成一个科学问题,它的科学问题到底是什么,它的数学问题是什么,它的正确的科学方法该怎么证明,现在必须上日程,不然很多人就会炒作和恐惧。原子弹、病毒,如果不清楚就变成很大的问题,这是在座科学家的责任,必须搞清楚。我们要真的变成一个科学问题讲清楚,智能到底要学什么,要做什么,生命为什么能存在,它的基本的机制是什么?然后才是怎么去学,为什么有神经网络,怎么把这件事情做对做好做高效?这是我们一定要回答的一个问题。

8. 每个人,甚至阿猫阿狗都是牛顿,只是它自己不知道,它都对外部世界建立了非常好的精准的物理模型,当一个物体往下落的时候鸟和猫很快可以接到,甚至比人还快,它能利用以前学习到的规律对外部物理世界做精准预测。牛顿定理描述阿猫阿狗学到的东西,只是语言和形式不一样。

9. 如果数学在一条线上,但东西没有,你知道怎么填空,这就是AI做的事。GPT就在完形填空,Tansformer就是在做这件事。还可以做什么,去噪,我们观测到有噪声,规律找到以后可以去噪,图像不清楚可以去噪,现在你们看到AI生成的听到的声音和图像就是在做这件事,把这件事情做对。还可以做什么呢,纠错,我观察到东西有错误,但是跟我的规律不符,一个东西被遮挡了,我们的大脑从来在做这件事,我不用看所有的东西,当家作主我可以完形填空,损毁了可以恢复,甚至远远超过人的想象,就在做这件事。

10. 既然是这样,我们整个统一的数学问题就是要从高维数据里学到这些数据的定位分布,然后把它组织好,结构化。大脑就在做这件事情。找到数据之间的相关性,找到规律,现在在高维的空间,一百万的像素,一千万的像素空间中一张图,但是结构就几维,宇宙是千变万化的,但是多少维的模型,现在最高维的,有些数学家说9维就够了,11维就够了,一直从宇宙大爆炸到现在观测到所有物理现象,用9维或者11维空间就可以完全描述,很简单,规律很简单,现象千变万化。

11. 怎么学习,从经验到原理,神经网络又在干什么呢,比如我们知道学习的时候就要找数据的分布,把这个熵减掉,找到它的规律,怎么做呢,这是一个很复杂的函数,目标很复杂,爬山大家会吧,局部的优化会吧,自然界没那么聪明,我也不知道怎么做,但我知道怎么把现在的变得好一点,一步步逐渐优化,把进来的数据稍微组织一下,使得熵减少一点,一层一层地做,神经网络每一层都在对数据做整理,让输出比输入好一点点,所以神经网络的整个角色,它的功能变得一目了然,就在做压缩,在实现这些数学算子,实现这个功能。你马上可以把这些算子用数学方法推导出来,你知道要优化这个目标函数,求导会吧,求了导以后做梯度下降,梯度下降了以后,你可以发现这个算子就有Tansformer的结构,而且推导出来的算子和结构更加简洁,最后学到的数学,学到的结构更加有统计意义,几何意义,就在聚类分类,完全知道神经网络的目标,你就可以设计它了,每一层要实现什么目的,一目了然,完全可解释可控,每一个算子,每一个参数在做什么都可以搞得很清楚。

12. 最初的白盒计算,到现在几十个亿,原来通过经验设计很多冗余不清楚的地方都可以做到,现在的Tansformer是二次复杂度,现在优化可以变成线性复杂度的算子,而且不是猜出来的,是算出来的,更加高效,原来不必要的东西全可以不要。

13. 这还只是在学习,从外部的数据学到分布组织好,但你做的对不对,有没有丢掉的,数据够不够你并不清楚,你的记忆到底完整不完整,怎么验证你得到的模型压缩去噪以后够了呢,怎么弄,只有一招,回去用,去预测。所以我们验证我们的书和记忆是不是完整,一定要回去验证。今年的诺奖得主就在做这件事,就是想把autoencoding做好,只是当时的方法是受物理的启发,现在看起来不是很对,但它的问题是对的。怎么做这件事情呢,我知道在做压缩,所有的设计全部是白盒,没有任何猜的,这些算子都是数学答出来的,非常清楚。跟经验的,这是通过经验的MIE设计出来的效果一模一样,甚至更好。

14. 还有一件事情,光encoding就够了吗,自然界没有这个说法,阿猫阿狗有这个记忆吗,没有,我们所有的学习都在大脑,我们控制不了外部世界。但自然界没有机会。当一个山羊看到老虎朝它冲过来的,等一等,我测一下你的距离和速度,我还不太会,这种早就被淘汰了,你的学习全部是自主学习。为什么现在有些人说要训练模型呢,很简单,这些人想卖数据给你,想卖芯片给你对吧。因为这种训练代价很大,而我们的小蚂蚁,小动物都能高效的自主学习,不需要太多的数据,因为机制不一样。

15. 你从小大脑每天都在学习,但是你前面学过的东西不会忘,闭环的系统是不会忘的,而且这样的系统在生物里就是有这样的特征,就是这样组织它的记忆,在猴子大脑里研究,组织的非常好,这是正交的空间,而且是稀疏表达,通过闭环、反馈、自控制在学习,这些机制在自然界里都可以看到。

16. 我建议现在年轻人好好读读历史,认真去看,不要上来就觉得人工智能在干什么,他们当时在讲,达特茅斯这些年轻人避开维纳和冯诺依曼,这些人想出头,想做动物感知和预测不一样的智能,人在做什么,50年代图灵提出图灵测试,他们想人如何解决抽象解决问题的能力,而且能够证明,这才是人的智能。当我们对过去十年的智能发展做的事情跟40年代机器智能、动物智能,50年代人的智能相比的话,你会发现哪个和哪个更近,过去十年人工智能还差得远。

17. 过去十年科学往往是两个方法,一个叫归纳法,一个叫演绎法,这两者都有它的道理,相辅相成。过去十几年我们在技术上面突飞猛进,主要靠归纳法,但是我希望今后的十年,如果智能变成科学的问题,science的问题,数学的问题,应该要有很好的数学理论框架,这也是我们计算机泰斗讲的,回归理论基石,探寻智能本质。过去那么多的训练,现在就是呼唤英雄的时代,大道至简,找到智能后面的机理原理和它的思想,多一点思想,少一点技术。

1. 技术的发展要放在人类长河里中看,有一个人在网上总结,假如说把过去25万年看成一本书,每一页书是250年,你会发现这本书上绝大部分的地方都是空白,农耕社会都是在后面的时候才发生,这很自然。但这样的书给你一个错觉,好像人类在前面就在躺平或发呆,什么都没做。我觉得一个可以说的例子,就是《人类简史》,里面讲了一个很重要的观点,人类的进步或者退步是因为被小麦驯化。因为是简史,就给你一个印象,就是这个发生非常突然。其实在农耕社会,农耕成为生活的方式花了大概一千年的时间,人类花了很长时间就是在农耕上做试验,并没有立刻放弃狩猎采集活动,而是尝试了很多不同的生活方式,最后才变成农耕生活,小麦成为主要的能量来源。换句话讲,我们不能说小麦驯化人类是错误的观点,但是假设回顾到那时候的历史,我们的祖先在那个时候做了自己的选择和优化。

2. 我们把自己看作一个智能体,把大模型也看作一个智能体,我们做一个比较。这是大家都熟悉的教育系统,它是一个流水线,从小学、到中学然后开始大学生涯,后面做一些高等教育。走过独木桥再走纲丝,然后成为各种各样的专门人才,科学家、工程师、医生、律师、管理者等等之类的,作家等等,这是现在教育的流水线。教育的流水线的特点是它高度模块化,高度的标准化,什么原因?因为我们要把它做成一个高效率的流水线,AI时代可以对里面某些地方有调整,有的人可以学的快,有的人学的慢一点。但是人就是这么长的。有研究说每一代人的IQ比前一代都好一点,抽象思维,城市生活带来的结果是每一代抽象思维能力更高一些,并不是我们更聪明。每个个体逃避部分过这个,一开始还是混沌的,还是要学习,这个流水线生产出来的产品是什么?我们认为在某一领域的单一的专精专家是成功的标志,可以发一些论文,非常厉害,可能对周边临近的领域也有了解,这是我们现在人才流水线打造出来比较成功的产品。

3. 还有一种流水线,听上去非常没道理,就是背诵,先背,背完之后你跟我做,然后再把你修理成一个好的某种智能体,听上去有没有道理,但恰恰这是大语言模型走过的路。它的第一个任务,预训练就是不停背下一个单词,问题在于它的量非常之大,GPT3当初训练样本是150万本书左右,以我自己为标杆,在一个好的年度我最多能够读20本书,但现在我估计一年5本书读完就了不起了。估算一下,一生可以读1000本书,GPT3在3个月里读完150万本书。

4. 这本质上是训练的一个程序,这个训练做的就是打印下一个字符,并不是一个随机的字符,而是符合这个文本里统计规律的,给了前面的X个字符,我知道X+1的字符最可能是什么,这是第一步。第二步,它跟我做,这步非常精妙,它想要做的事情是我有一些事例,比如我有一个文章让你把总结做出来,这是其中一个任务,大概有十几个这样的任务,比如总结,问答,头脑风暴,做信息的抽取之类的。为什么做这件事情,因为我们人类的工作,我们每个人每天要做的工作里了不起就是那些类型,但大语言模型一个大家没想到的地方,它一旦学习N个类型的能力,它可以把它们组合起来,比如说有人给我发一个邮件,有一个会议你要去演讲,我会把那个事情先总结一下,然后用一种巧妙的方式拒绝或者答应,你会把这里几个能力组合在一起,这是大语言模型的第二步。第三步,比较简单,就是胡萝卜+大棒子,把这个大模型揍成一个比较乖巧的人类,所谓用强化学习的方法做一些价值对齐。这个很有意思,要有帮助,还要真实的,无害的,这是它的学习方式。

5. 我们先讨论一下数据本身的性质,左边这个是正态分布,只要是好多的要素迭代起来的结果,最后都是正态分布,我肯定是三个方差之外的身高,今天早上我坐飞机过来的时候,发现前面有一个庞然大物,姚明,这么高,这是正态分布。还有一个分布,当个体和个体之间进行纠缠、扰动、抱团取暖,必然造成一个后果就是长尾分布,它不像正态分布这么简单,。但长尾分布背后有好几个不同的原因,第一个是我有优先连接,假如说我的朋友多,你的朋友少,同样我的发言被听到和点赞的更多,这是很自然的。还有累计效应,一个很有钱,就很可能更有钱,他可以投资,通过反馈增加他的财富,这些长尾定律代表了宇宙里质量陨石的大小是符合长尾定律的。城市也是,社会网络里的热搜也是的,它一定会倾向于一个长尾分布,但不代表它是稳定的,今天的热搜内容和明天的内容一定不一样,但是一定会有热搜这个情况,哪一天世界上没有热搜的新闻了,这是很奇怪的。

6. 我们世界上所有的现象是符合长尾分布的,那么大语言的语料反映这个现实世界必然也是长尾定律,换句话,有很多非常简单的故事,但是有些非常非常复杂的故事,虽然是在同一个品类下,比如冲突,人和人之间的冲突天天发生,但是国与国之间的冲突几十年一次,它要发生的原因非常复杂。

7. 这就代表着大语言模型用多少数据多少算力可以把模型训练的多好,因为数据本身的复杂度就是这样的,它的性能必然是这样的,不是一个时间的结果,而是从信息论里可以推出来的结果。也带来一个什么后果,一旦把所有找到的数据都能滚过一遍,必然就会放缓,长尾的一个重要的标志是说,我要再进步一点点,数据要翻倍,坊间听说过GPTo5出不来,撞墙了,本质是这个原因。

8. 为什么大模型那么强大,因为它是规模超级大的,多层次的,模式补全,为什么说多层次,能把原来打碎的数据都可以切到里面,模式就是词尾的接龙,把程序写完,这是最基本的。然后把任务完成,然后用思维链的方式把这个拆解,最后就是目标驱动的程序。它的层次在不同层次里随意切换,并且重复。我们人是不是也是在做这件事,在日常工作里基本上做到这样非常好,大部分的任务里都比人类出色。你作为一个专家与初学者最关键的不同,就是你的思维深度在哪里,大一大二只能编程,后来变成软件架构师。

9. 假如说把现在的大语言模型早500年送给人类会发生什么事情,不需要数学,也不需要物理,什么都可以解释,什么都可以做了,今天反而会没有大模型,这是一个非常有意思的悖论。

10. AI教育现在到底是什么,第一个就是挑战现在教育的极限,不要不让学生用AI,放开了让他们用,因为对任何目标来说,我们要用上AI,使得我们的目的,使得我们任何学习目标能够两倍到十倍提升。假如说用了AI以后,现在的任务变得简单,那就做更难的挑战,比如说你这学期的大作业要比之前难一倍,或者用一半的时间把东西学完,因为我们要准备好学生将来进入职场的时候这就是他们的条件,他们必须跟有AI的场景里一起工作,假如说不让他们用的话,这就是浪费时间,但是我们让他们用,必须要有新的挑战,这是第一点。

11. 第二点,要学会像文艺复兴时期的科学家思考。因为现在走过独木桥再走纲丝成为人才都是非常狭隘、非常专业的人才。把自己变成一个广谱的人才。在没有DNA和摄像头的前提下怎么抓坏蛋,这是几百年前困扰苏格兰警察的问题,有个法国警察想了一个方法,人体上胳膊多长、脸怎么样,十几个特点分发给警局抓坏蛋,这就是最简单的特征工程。之后达尔文的表弟,他把抓坏蛋的艺术提高了一倍,那时候数据相关性理论是他建立的。之后就成立了第一个统计系的系,我说机器学习里最基本的概念你知道怎么来的呢,它为什么会被发明,是谁,什么时候,没有人知道。我挑战一下马老师,马老师也不见得知道,开玩笑。我们很容易变成一个非常狭隘的专家,但你只要有一点点好奇心,你可以对变成很广阔的上下文有很好的理解。

12. 我们应该把AI变成一个好的老师,没有怎么办,我们要提高自己的学习能力,换言之,我们在没有AI的情况下,比前AI的时代能力要强。假如说今天大家开车,没有GPS就不知道怎么开车了,所以GPS是一个非常糟糕的技术,我们要超过它,用了AI以后你要变得更聪明,有了AI以后你可以飞起来,没有AI也不能躺平,三个目标是相辅相成,你要挑战极限,变成一个广谱的人,有机会打破独木桥和钢丝的狭隘陷阱。

13. 最后推荐一本书《THE ACE OF WONDER》,有人问过气球有什么用,这是富兰克林关于气球有什么用里的一句话,还有天文望远镜、化学。这本书最后讲了一群诗人,其中有一个人写了特别有名一本书《科学怪人》,这些人对技术进步的感觉非常像,一方面兴奋,一方面恐惧,这是18世纪后发生事情。某种意义上确实是在重复自己。


来源:36氪

 

2025-01-29 13:00

巅峰77亿的虎扑如今只值5亿?这是误解

发布时间:2025-01-29 10:10:01


前天,迅雷宣布,与虎扑的运营方上海匡慧互联网科技有限公司达成协议,计划以人民币5亿元现金收购虎扑。

三个月前,「暗涌Waves」就从一位体育社区的CEO口中听闻此事。我们也曾正面问过虎扑现任CEO殷学斌有没有考虑过收购这个选项,他当时停顿了五秒后回答,没有。

比起收购本身,5亿这个数字更被人在意。2019年上半年,虎扑曾获得字节跳动12.6亿的投资,准备二次冲击上市。彼时虎扑的估值达到过峰值77亿。从77亿到5亿,“男性消费力不如狗”的旧调又被重弹。

但这实际上存在一种误读。虎扑二次冲击上市时,囊括了识货、路人王等有除社区以外的业务。2020年,虎扑创始人程杭对36氪透露过虎扑的收入构成,“广告、电商、创新变现三者比例大致在48%、38%、14%”。

有知情人士告诉我们,“现在社区就是‘虎扑’的主要业务,原来的识货、造物等等已不在‘虎扑’的经营范围。”

而这次迅雷收购的主体上海匡慧互联网科技有限公司,就是社区业务。直白点说,包括识货等电商业务或创新业务的拆分,是“虎扑”从77亿跌到5亿的主要原因。并且在如此下行的环境中,采取现金而非换股的方式,5亿并不过分。

另据殷学斌对「暗涌Waves」透露,“2021年后,虎扑一直是盈利的,而且活得很好。收入、流量都在持续增长。”尽管九成用户是男性,但结构有优势,“都是年轻人、大学生。”而虎扑接下来的业务重点是,锚定用户讨论和表达的体验,努力做产品上的创新,做成男性主流话题讨论的社区。

一种说法认为,虎扑IPO的屡次失败与过于单一的变现模式有关。2017年虎扑递交的招股书中,广告收入占比高达61%,包含电商在内的增值业务只占20%。一位同样做体育社区业务的CEO认为,虎扑的用户没有足够的黏性,只能靠品牌广告变现,实在过于单一。

而据「暗涌Waves」了解,业务拆分后,虎扑目前的广告占比更加极致,高达90%。以至当殷学斌在虎扑二十周年的现场问观众,打开虎扑,最先看到的是什么?观众调侃说“京东和淘宝”。

作为一家穿越PC、移动互联网但仍然活跃在一线的社区——同期的天涯已经化为历史的尘埃,虎扑(或者说程杭本人)更让人惊讶的是它的投资与孵化能力:成立动域资本投资了数个体育明星项目;先后于内部孵化的两个电商业务——得物与识货,在今天的价值已经远超虎扑社区本身。

可以理解为,虎扑社区现在只是平行于识货等众多项目的一部分,最具价值的或许是创始人对这个品牌名字的感情。

懒熊体育创始人韩牧曾在虎扑18周年时撰文称,程杭已经有意跟公司保持了距离——私下里,他会称“虎扑”已经是兄弟们的事业了。他还说,“最近一两年,听到不少关于虎扑出售的消息,但好在,没有交易成功。因为在我看来,虽然虎扑在某些时候盈利能力没有那么强,而程杭本人也有套现需求,但虎扑这样的公司仍然是一个‘取之不穷的宝藏’。”

去年11月,已经甚少露面的虎扑创始人程杭和联合创始人杨冰(也是得物创始人)来到了虎扑二十周年的生日会。

在现场,认为虎扑不衰弱是因为“男人喜欢和男人在一起”的程杭开玩笑说,本来请了著名的脱口秀演员杨笠,“但对方说跟我们价值观不合拒绝了”。而杨冰则回顾了创办虎扑的历程,“有一种接近于孩子的快乐...那个年代,社交平台还是可以骂人的。”

回头看,这已是最后的告别。

图片来源 |IC Photo

排版|姚楠

文 | 施嘉翔

本文来自微信公众号“暗涌Waves”,作者:施嘉翔,36氪经授权发布。


来源:36氪

 

2025-01-29 13:00

软银将以40亿美元估值投资机器人初创公司Skild AI

发布时间:2025-01-29 12:38:36


软银据悉正在洽谈对机器人初创公司Skild AI进行5亿美元投资,这家公司目前估值已达到40亿美元(当前约290.61亿元人民币)。


来源:36氪

 

2025-01-29 13:00

特朗普亲自给马斯克下任务:把滞留太空的两名宇航员接回来

发布时间:2025-01-29 12:20:25


据央视新闻,当地时间28日,美国总统特朗普在其社交媒体平台“真实社交”上发文表示,他已指示美国太空探索技术公司(SpaceX)及其首席执行官马斯克,采取行动接回滞留在国际空间站的两名美国宇航员。

 

这两名宇航员于去年6月5日搭乘波音“星际客机”飞赴空间站,这是“星际客机”首次载人试飞任务。飞船原定于6月14日返航,但因推进器故障和氦气泄漏等问题,返航时间一再推迟。(第一财经)


来源:36氪

 

2025-01-29 13:00

苹果和SpaceX联手支持iPhone上的星链卫星网络

发布时间:2025-01-29 12:19:52


苹果公司一直在与SpaceX和T-Mobile秘密合作,在其最新的iPhone软件中增加对星链(Starlink)网络的支持,为该公司内部的卫星通信服务提供另一种选择。(财联社)


来源:36氪

 

2025-01-29 13:00

除夕夜网络支付峰值创同期历史新高

发布时间:2025-01-29 12:19:08


从网联清算公司了解到,今年除夕夜,网联清算公司和中国银联处理的全行业网络支付峰值为每秒10.9万笔,较去年增长4.61%,创历史新高。


来源:36氪

 

上一页 下一页