八月远方 - 动态 - 第 414 / 1320 页
2025-05-12 11:00

中指研究院:4月50城住宅平均租金环比小幅下跌

发布时间:2025-05-12 10:03:34


36氪获悉,中指研究院的最新数据显示,4月住房租赁行业进入淡季,租房需求回落,重点城市住宅平均租金小幅下跌。全国50个城市住宅平均租金为35.2元/平方米/月,环比下跌0.32%,跌幅较3月扩大0.27个百分点;同比下跌3.40%,跌幅与3月持平。


来源:36氪

 

2025-05-12 10:00

成本80美元、不搞营销,这家非主流泳池机器人公司营收已过亿|Insight全球

发布时间:2025-05-12 09:00:34


文|胡依婷

编辑|袁斯来

编者按:当出海越来越成为一家中国公司核心战略时,如何征战全球市场就成为一个极其专业的话题。在全球化的演变中,已有不少中国品牌站立潮头。鉴于此,硬氪特推出「Insight全球」专栏,从品牌成长与变迁,探索中国品牌出海的前沿方向与时代契机,为出海玩家与行业提供思考与启发。  这是我们专栏第43期——从中芯国际、科大讯飞再到军方水下项目,早在进入泳池机器人领域前,邓卓明已经积累了丰富的水下技术经验。即使彼时少有人看好,他依旧选择在2021年创立「思傲拓」,并在半年内推出数款产品验证市场。如今,思傲拓将千元级性能的泳池机器人价格下放至不到400美元,全球营收以过亿。思傲拓的产品单台成本不过百,极致的成本控制令人惊叹,对此,我们与邓卓明聊了聊。

 

从客厅、庭院到泳池,中国企业们紧紧盯住了海外消费者的家庭场景。

随着净化空气、割草、扫雪这类需求带动的百亿规模市场被发掘后,泳池清洁这一稍小体量的市场也吸引了一众硬件创业者们。

QYR(恒州博智)数据显示,2024 年全球泳池清洁机器人市场销售额达到了10.18 亿美元,预计2031年将达到17.31亿美元。

事实上,泳池清洁这一赛道已存在超40年,但专攻于此的企业较少,市场集中度高。整体来看,Dolphin(以色列)、Polaris(西班牙)、BWT(英国)、Hayward(美国)等国际品牌常年主导市场,不过,近年来星脉创新、元鼎智能、望圆科技和思傲拓等国内厂商纷纷进入,并拿下大额融资。

思傲拓属于很另类的一类创业公司。它成立于2021年10月,总部位于深圳,面向北美、欧洲市场销售水下清洁机器人。与动辄近千或数千美元的定价相比,思傲拓将价格下放至199-399美元,2024年营收超亿元,在亚马逊销量排名第四位。

仅在今年一季度,凭借性价比优势,思傲拓的出货量已超越去年全年,销售额突破5000万元,并进入盈利状态。

“目前我们单件产品的成本不超过90美元,即使定价再降我们也仍然有盈利空间。”思傲拓创始人邓卓明告诉硬氪。

此外,2023年,Dolphin的母公司Maytronics,全球泳池机器人市占第一的厂商与思傲拓合作成立新品牌“Niya”。思傲拓为其供应电机、传感器等核心部件。截至目前,累计已出货十几万台。

庭院机器人赛道早已挤满了创业者,产品覆盖各个价位段,看上去已经没有什么空白机会。思傲拓不依赖营销,低价却没有陷入价格战怪圈,还能获得极其丰厚的利润。这种正向循环在硬件利润普遍微薄的当下显得不同寻常。我们和思傲拓创始人邓卓明聊了聊,希望能了解这家低调公司背后的秘密。

与自扫地机器人切入泳池赛道的对手不同,邓卓明拥有丰富的水下技术经验。

大学毕业后,邓卓明在中芯国际和联发科从事芯片研发,而后在科大讯飞研发机器人。2016年他开始接触无人船和军方反潜、探测类水下项目。

此外,邓卓明也是国内最早一批做电动救生圈的研发人员。“水下装备防水、电池密封等让行业头疼的问题之前我们都遇到过。”邓卓明告诉硬氪。

时间来到2019年,邓卓明开始把目光投向C端。久未有功能创新但又具备市场空间的家庭泳池清洁机器人吸引了他的注意。由于欧美人工费用较高,家庭泳池的清洁需求也多,Pool & Hot Tub Alliance数据显示,仅美国就有1070万个游泳池。

彼时,邓卓明正带领团队参加创新创业大赛。投资人没看上他的产品,理由是行业不热,亚马逊也没跑出数据。

这是一次让人沮丧的碰壁。邓卓明憋了一股气,领着电子工程师和嵌入式工程师,在深圳宝安租下70平米办公室,闷头搞研发。

整个过程充斥着坎坷。由于能耗极大影响着续航,思傲拓团队用2年时间改造电机传动系统,使内置的行星齿轮寿命从业内平均500小时提升到2000小时,降低摩擦从而减少能耗。

在技术上,邓卓明绝不吝惜投入。即使国内电机厂众多,但由于泳池清洁机器人规模不大等原因,思傲拓难以找到满意的电机。

“没有电机厂可以为我们做很细致的开发,比如齿轮传动怎么做,用什么润滑油效果最好,怎么降低成本?这些他们都很难考虑到。”邓卓明介绍道。

由此,思傲拓决定自研并自产电机、齿轮箱和传感器这类关键部件,出于成本考量,其自主设计了无刷直流电机(BLDC),全面使用国产器件,采用极简设计,把泳池机器人平台化,减少BOM。同时,在设计机器人的时候,思傲拓已经考虑使用自动化组装产线,使用较少的人工提高产能。

 

思傲拓泳池机器人核心部件,图源企业

这直接压缩了生产成本,将单台泳池机器人的成本降低到80-90美金。

借助这一优势,思傲拓的泳池机器人在搭载无刷电机且具备爬墙能力的性能下,将价格下放至400美元。而目前具备同等功能的泳池清洁机器人价格普遍在五百至数千美元不等。

此外,泳池清洁机器人以清洁功能为核心,思傲拓产品在体积小于同类产品的同时将吸污容量增大,可适用于18-80平方米的家庭泳池,清洁池水、池壁、池底的沙尘、落叶和污垢。

2023年,思傲拓一口气推出了3款产品。如今,思傲拓已推出SAT 1X与2X 系列,前者定价199美元,后者为399美元,在亚马逊、TEMU和eBay均已上线。邓卓明告诉硬氪:“现在我们的产品出一台就能卖一台,退货率还只有2-3%,远低于同行。”

邓卓明说话不喜欢修饰,有时候过于直白朴素。

“我觉得基于现在能实现的清洁功能,这个产品就是300 -400美元之间。这个价格已经顶天了,再高一点我觉得都是在收割智商税,除非你有真正的功能去改变现有的这个状态把清洁功能做得比现在更强。”他告诉硬氪。

他不屑于搞营销,也对同行烧钱的行为感到费解。与动辄数百人的硬件创业公司相比,思傲拓团队只有40多人。思傲拓的办公室空荡荡,搬进新地点后很多工位仍是空置,没有什么装饰,看着像是一家经营不善的公司。

邓卓明的成本都花在技术研发上。当然,他的口气还是很平淡,“水下的场景较为简单,技术路线并不多。”——这完全不是创业团队热衷的那类克服万难终于成功的故事。

如果要清洁一个家庭泳池,清洁人员会使用有缆设备吸出池中的沙子、落叶并刷洗泳池,过程并不复杂。

但要保证稳定作业,泳池清洁机器人需解决定位与信号干扰问题。邓卓明告诉硬氪,水下没有特征点,如果采用惯导+视觉的方案,只要遇到障碍点,惯性导航就会全部失效。声学定位系统才是正确的方案。

由此,思傲拓选择了USBL声学系统。目前这一系统多用于海洋石油勘探、打捞等工业场景与潜艇定位导航、水下武器系统制导等军用领域,一套系统高达数十万元。

借助自身研发经历,邓卓明将USBL声学系统做到民用级并下放至泳池清洁机器人中。“这套系统覆盖到单件产品上只需要不到100元。”他补充道。

 

思傲拓泳池机器人作业,图源企业

思傲拓的声学系统承担了水下定位功能。据了解,美国普通家庭的泳池面积在18-80平方米之间。面积不同时,水下的回波干扰情况将存在差异;当泳池面积较小,定位波形可能经过数次反射,使机器人难以分辨准确的定位。而思傲拓的产品可根据泳池大小自动调整增益,调节接收信号强弱等参数。

除自产自销外,邓卓明告诉硬氪,2023年底Dolphin的母公司Maytronics受到成本优势的吸引,找到思傲拓为其供应电机和传感器等产品及产线,到现在累计已经出货超10万台。

今年,思傲拓的产品供不应求,产能成为摆在面前的关键问题。“现在处于爆单状态,新客户找我,我也根本没法供,只能给老客户供一供。”邓卓明展示着他被催货的聊天记录说道。

这算是一种求之不得的烦恼。当产量爬坡后,邓卓明还要继续搅局,“我们要尽最大的努力出最多的货,把价格再降低一点,同行在的市场我们都会进,要让市场再卷一点。”


来源:36氪

 

2025-05-12 10:00

4月份北京CPI环比由降转升,同比降幅收窄

发布时间:2025-05-12 09:57:17


36氪获悉,据北京市统计局消息,4月份,受节日效应等季节性因素影响,北京市居民消费价格环比由降转升,同比降幅收窄。从环比看,CPI环比由上月下降0.2%转为上涨0.3%。其中,食品价格由上月下降1.7%转为持平。从同比看,CPI同比下降0.3%,降幅比上月收窄0.1个百分点。


来源:36氪

 

2025-05-12 10:00

高铁轨交板块异动拉升,金鹰重工涨停

发布时间:2025-05-12 09:52:50


36氪获悉,截至发稿,高铁轨交板块异动拉升,金鹰重工、神州高铁双双涨停,雷尔伟、晋西车轴、科安达、铁科轨道、鼎汉技术等跟涨。


来源:36氪

 

2025-05-12 10:00

港股涨幅收窄,恒生科技指数涨0.7%

发布时间:2025-05-12 09:51:12


36氪获悉,港股涨幅收窄,恒指现涨0.6%,恒生科技指数涨0.7%。医药股下挫,石药集团跌近5%,药明生物跌超4%,中国生物制药跌超3%。


来源:36氪

 

2025-05-12 10:00

韩国生物制药巨头宣布注销1000亿韩元股票

发布时间:2025-05-12 09:48:50


韩国领先的生物制药公司Celltrion周一表示,将注销价值1000亿韩元(约合7200万美元)的股票,以提高股东价值。该公司在当天的新闻发布会上表示,将于5月21日注销589276股股票,今年注销的股票总额将达到9000亿韩元。(新浪财经)


来源:36氪

 

2025-05-12 10:00

军工板块低开高走,天箭科技4连板

发布时间:2025-05-12 09:41:54


36氪获悉,截至发稿,军工板块低开高走,天箭科技、成飞集成均4连板,贵航股份直线涨停,晨曦航空、航天南湖、中航成飞等纷纷拉升。


来源:36氪

 

2025-05-12 10:00

中信证券:风险偏好回暖,景气主题轮动

发布时间:2025-05-12 09:40:33


36氪获悉,中信证券指出,资金风险偏好回升,围绕行业高景气度行业主题以及新概念主题进行展开,建议优先配置一季报表现出众的行业主题方向。随着一季报发布完毕,市场进入一个较为主题躁动的时期。从主题环境来看,综合流动性指标和市场风格特征,市场在一季报高景气的行业主题上持续布局,并对新的主题概念表现更强的偏好。从催化因素分析,建议重点关注国内的对内循环的稳楼市促消费刺激政策等。结合市场环境、催化因素以及综合量化指标研判,建议关注印巴冲突、消费电子、外骨骼机器人、脑机接口4个主题。


来源:36氪

 

2025-05-12 10:00

创新药板块盘初下挫,迈威生物跌超10%

发布时间:2025-05-12 09:36:09


36氪获悉,截至发稿,创新药板块盘初下挫,迈威生物跌超10%,益方生物、舒泰神跌超9%,百济神州跌超8%,荣昌生物、百利天恒纷纷下挫。


来源:36氪

 

2025-05-12 10:00

消费电子板块盘初拉升,朝阳科技涨停

发布时间:2025-05-12 09:34:14


36氪获悉,截至发稿,消费电子板块盘初拉升,朝阳科技涨停,蓝思科技、安克创新、歌尔股份、立讯精密、捷邦科技等纷纷上扬。


来源:36氪

 

2025-05-12 10:00

纺织服装板块开盘领涨,华纺股份5连板

发布时间:2025-05-12 09:31:03


36氪获悉,截至发稿,纺织服装板块开盘领涨,华纺股份5连板,宏达高科、华升股份涨停,迎丰股份、华利集团、凤竹纺织等纷纷高开。


来源:36氪

 

2025-05-12 10:00

A股三大指数集体高开

发布时间:2025-05-12 09:27:24


36氪获悉,A股三大指数集体高开,沪指高开0.33%,深成指高开0.92%,创业板指高开1.55%;机器人、光模块概念领涨,恒而达涨停,远大智能、新易盛涨超4%;黄金、医药医疗板块跌幅居前,百济神州跌超6%,赤峰黄金、湖南黄金跌超3%;宁德时代涨超2%,公司此前公告,在港上市最高发行价为263港元/股,5月20日开始在港交所买卖。


来源:36氪

 

2025-05-12 10:00

央行公开市场开展430亿元7天期逆回购操作

发布时间:2025-05-12 09:22:36


36氪获悉,央行公开市场开展430亿元7天期逆回购操作,操作利率1.40%。Wind数据显示,今日无逆回购到期。


来源:36氪

 

2025-05-12 10:00

恒指开盘涨1.38%,恒生科技指数2.15%

发布时间:2025-05-12 09:22:18


36氪获悉,恒指开盘涨1.38%,恒生科技指数2.15%;汽车、零售板块领涨,蔚来涨超4%,理想汽车、携程涨超3%,美团、小鹏汽车、吉利汽车涨超2%;医药板块跌幅居前,乐普生物跌超11%,百济神州跌超5%。


来源:36氪

 

2025-05-12 10:00

人民币兑美元中间价调升29个基点

发布时间:2025-05-12 09:17:17


36氪获悉,人民币兑美元中间价报7.2066,调升29个基点。前一交易日中间价报7.2095。


来源:36氪

 

2025-05-12 10:00

现货黄金向下触及3260美元/盎司,日内跌2%

发布时间:2025-05-12 09:16:58


36氪获悉,现货黄金向下触及3260美元/盎司,日内跌2.00%。


来源:36氪

 

2025-05-12 10:00

中国银河证券:A股市场“科技叙事”逻辑明晰,建议关注后续产业趋势的催化机会

发布时间:2025-05-12 09:15:33


36氪获悉,中国银河证券研报指出,预计A股市场将维持区间震荡格局。配置上,建议关注三大方向:第一,业绩确定性相对较强、股息回报整体稳定的红利板块具备防御属性。第二,A股市场“科技叙事”逻辑明晰,建议关注后续产业趋势的催化机会。第三,关注大消费板块的配置机会,政策密集支持服务消费,“两新”政策扩围提质,带动行情修复。


来源:36氪

 

2025-05-12 10:00

特朗普称将免费获波音747当专机

发布时间:2025-05-12 09:15:29


当地时间5月11日晚,美国总统特朗普在其社交平台“真实社交”上发文称,“美国国防部免费获得一架波音747型飞机,以临时替换已服役40年的老旧‘空军一号’总统专机,交易公开透明。”特朗普称,美国民主党人对这笔交易非常恼火,并坚持要求共和党方面为这架飞机支付高价。当天早些时候,据美国广播公司等媒体援引知情人士消息报道称,特朗普政府准备接受卡塔尔王室赠送的一架价值4亿美元的波音747-8型飞机,以临时充当“空军一号”。(CCTV国际时讯)


来源:36氪

 

2025-05-12 10:00

越南将平均零售电价上调4.8%

发布时间:2025-05-12 09:09:17


根据越南财政部网站上的一份声明,从5月10日起,越南电力公司将平均零售电价上调4.8%,至每千瓦时2,204.0655越南盾。该价格不含增值税。据报道,这是自2023年以来的第四次上调。(新浪财经)


来源:36氪

 

2025-05-12 10:00

中信证券:出口管制进一步强化,战略金属或迎价值重估

发布时间:2025-05-12 09:07:11


36氪获悉,中信证券研报指出,5月9日,国家出口管制工作协调机制办公室组织商务部等部门召开打击战略矿产走私出口专项行动现场会,会议指出,加强战略矿产资源出口管制事关国家安全和发展利益,打击战略矿产走私出口成为当前迫切且重要的工作任务。我们认为战略矿产在当前国际政治背景下具备极强的战略属性,加强打击走私出口亦将加强供给刚性,稀土、钨和锑等战略金属价格有望持续上涨,战略金属板块或迎来价值重估,持续推荐战略金属产业链配置价值。


来源:36氪

 

2025-05-12 10:00

鸿海计划2027年在日本市场推出电动巴士

发布时间:2025-05-12 09:05:48


据报道,鸿海集团继敲定日本三菱汽车小客车订单,预计2026年下半年将在新西兰与澳洲推出小客车后,双方后续有望扩大合作,计划2027年在日本市场推出电动巴士。(财联社)


来源:36氪

 

2025-05-12 10:00

沃尔格林加大对处方配药机器人的投入以削减成本

发布时间:2025-05-12 09:02:03


沃尔格林正在扩大由微型履约中心服务的零售店数量,同时该公司正努力实现业务好转,并准备进行私有化。这些中心使用机器人为那些服用药物来控制或治疗糖尿病、高血压或其他病症的患者配药,数量达数千份。依赖这些中心为药房工作人员腾出了时间,减少了他们的日常任务,消除了库存浪费,并使他们能够直接与患者互动,还能提供更多诸如疫苗接种和检测等临床服务。(新浪财经)


来源:36氪

 

2025-05-12 10:00

用 AI 作过一次弊的学生可能会一直用 AI 作弊


Chungin Lee 曾在 ChatGPT 帮助下写作文,最终成功入学哥伦比亚大学,之后他几乎每一份作业都使用生成式 AI 作弊。他就读的是计算机科学专业,他说自己的入门编程作业是扔进 ChatGPT 然后直接将结果上交。他估算自己递交的每一篇作文有八成是 AI 写的。他会对作文进行润色,让它看起来是自己人工写的。那么他为什么要如此费劲考入常春藤盟校,然后将所有学习都交给机器人?他说常春藤盟校是找到合伙人和妻子的最佳场所。他找到了自己的合伙人,在开发了三款不怎么成功的 APP 之后,他们创造的远程编程面试作弊工具引发了广泛关注。他和合伙人从投资者手中筹集到了 530 万美元,用于开发另外一款 AI 应用。Lee 表示,他们将目标瞄准研究生入学标准化考试,以及所有校园作业、测验和考试,让学生可以在几乎所有地方都能作弊。哥伦比亚大学对他进行了纪律处分,不是因为他在作业中作弊,而是因为他开发了作弊用的 AI 工具。Lee 表示,他学校里认识的学生几乎没有一个不在用 AI 作弊。他并不认为这是一件坏事,认为我们距离一个没有人认为使用 AI 做作业是作弊的世界只剩下几年,或者可能是几个月时间。其他学生也认为没有人能抗拒一个能让所有作业都变得更容易,而且目前看起来没有任何后果的工具。


  • 发布:2025-05-11 23:47:49

 

2025-05-12 10:00

放弃 Google 搜索比预期的更简单


研究人员曾付费给用户使用微软 Bing 搜索引擎两周,结果发现部分人还想继续用。《华盛顿邮报》的科技专栏作家受此启发也尝试使用了基于 Bing 的 DuckDuckGo,发现放弃 Google 搜索比预期的更简单。今天 Google 的搜索质量已经无法让它的竞争对手望尘莫及,就用户体验而言 DuckDuckGo 大多数情况下并不比 Google 差,而且它收集的数据要比 Google 少得多,它也不会保存搜索内容的历史。使用 Google 更多是一种习惯。


  • 发布:2025-05-12 00:04:48

 

2025-05-12 10:00

过去 20 年最强地磁风暴带来的经验和启示


2024 年 5 月 10 日,近二十年来首次 G5 级强地磁风暴袭击地球,此时恰逢 NASA 与多个美国政府机构进行太空天气的防灾模拟演习期间,这场被命名为 Gannon 的强地磁风暴,让原本防灾演习转立刻转变为实战。Gannon 风暴对地面与太空环境皆造成显著冲击。美国中西部地区一些依赖 GPS 导引的大型农业机具运作时偏离原来行走的方向,造成的农损平均达 17,000 美元。飞行中的客机为躲避辐射暴增与通讯中断的风险临时调整航线。大气层中的热气层温度急升至约摄氏1150度,大气因而膨胀导致卫星绕地球运行的阻力增加。NASA 的 ICESat—2 卫星因阻力增加、高度下降而进入安全模式,CIRBE 卫星则提前约五个月进入大气层。ESA 的 Sentinel 任务也需耗费更多燃料来维持轨道的高度。火星也受到了这次太阳日冕物质抛射的影响,整个火星被观测到被极光笼罩。


  • 发布:2025-05-12 00:30:35

 

2025-05-12 09:00

美团独家投资A轮,「自变量机器人」连续完成两轮数亿元融资|36氪首发

发布时间:2025-05-12 08:50:00


文|王方玉

编辑|苏建勋

36氪获悉,具身智能公司「自变量机器人」近日完成数亿元A轮融资,由美团战投领投、美团龙珠跟投。

本轮融资将用于持续加速全自研端到端通用具身智能大模型与机器人本体的同步迭代,以及未来多个应用场景的智慧化方案合作和落地。

除了今年2月对外披露的光速光合、君联资本领投的数亿元Pre-A++轮融资外,A轮融资前自变量机器人还完成了由华映资本、云启资本、广发信德投资的数亿元Pre-A+++轮融资。

自成立起不到一年半时间内,自变量机器人目前已完成7轮融资,累计融资金额超10亿元。

自变量机器人(X Square Robot)成立于2023年12月,聚焦“通用具身大模型”的研发,以真实世界数据为主要数据来源,构建具备精细操作能力的通用机器人。

作为国内最早采用完全端到端路径实现通用具身智能大模型的公司之一,自变量机器人致力于构建统一感知、规划与控制的一体化系统架构。

公司自主开发的「Great Wall」操作大模型系列的「WALL-A」模型具备多模态信息融合能力,可以整合不同类型的感知数据、自然语言指令与运动控制信号,实现输入到输出的端到端映射。

基于大规模通用知识预训练与多任务学习机制,「WALL-A」模型在部分未见过的新任务场景中已展现出零样本泛化能力——广泛场景的零样本泛化是实现通用机器人的关键标志之一。

同时,自变量机器人构建了以模型驱动的数据闭环体系。公司自主研发了数十个数据处理模型和多代数据采集设备,用于实现数据质量的自动化控制与数据采集效率的全面提升。

硬件层面,公司自主研发并持续优化适配多模态大模型控制的机器人本体,更好地满足开放环境中的精细操作和稳定运行需求。目前,自变量的机器人本体已在多步骤复杂任务场景中落地应用。

值得关注的是,从去年底起,自变量机器人已在多模态输出和具身思维链方面取得突破,早于Gemini Robotics今年3月公布思维链研究成果的时间。

公司研发的模型架构以多模态输出为核心,实现了端到端的信息融合,使机器人在视觉、语言和动作等多种信息通道间实现高效对齐,显著提升了模型在超长序列任务中的上下文推理与自我反馈能力。

公司在动态环境感知、实时任务规划和超长程任务等方面也持续取得新进展。以上突破与进展进一步提升了机器人在复杂开放环境中的自主决策能力和执行效率。

自变量机器人创始人兼CEO王潜认为:具身智能的发展短期有赖于模型算法优势,中期依靠数据优势,长期核心在于产品优势。自变量始终围绕这三大方向加深积累,并率先在国内开放性服务场景落地实践,探索不同场景下的服务闭环。

公司的核心团队汇聚了来自世界知名人工智能与机器人实验室的专家及海内外顶级高校的学者,致力于推动具身智能与机器人技术的创新与发展。核心团队成员包括全球最早提出注意力(Attention)机制(Transformer结构的核心)的研究者,国际顶级机器人实验室的专家,中国首批千亿级大模型的技术负责人,以及机器人硬件领域的专家等。


来源:36氪

 

2025-05-12 09:00

「阶跃星辰」的一次豪赌

发布时间:2025-05-12 08:23:39


文|邓咏仪

编辑|苏建勋

5月8日,久不露面的阶跃星辰CEO姜大昕,出现在北京的一场媒体沟通会上。

“在多模态领域,如果任何一个方面有短板,都会延缓探索AGI进程。”姜大昕给出了一个鲜明的判断。过去一年中,他在不同场合都在反复提及:多模态是实现AGI的必经之路。

在六小龙中,比起在融资、市场声量上有烈火烹油之势的其他选手,阶跃星辰的低调格外显眼。

这家公司最不声不响,但又能有独特的身位而被记住——过去两年中,它没有参与应用投流的狂热之中,在To C应用上也仅是有所试水。

多模态如今成为了阶跃最亮眼的标签,这家公司正在倾注大部分力量探索这一道路。

成立两年,阶跃一共发布了22款自研基座模型,覆盖文字、语音、图像、视频、音乐、推理等。这其中,有16款是多模态模型,占比超7成。阶跃也因此在行业内被称为“多模态卷王”。

但多模态的发展阶段和语言模型并不相同。

在技术路线已经收敛的语言模型领域,几乎所有公司都已经沿着差不多的技术路线迭代,但多模态的技术探索尚在早期。从顶尖大厂到AI初创,都像在迷雾中穿行。

在2024年Sora震撼全球时,不少AI创业者就有着不一样的意见。“Sora出来的时候,其实我们比较失望,我们觉得它的主线应该是做理解生成一体化,但他们只做了生成,没怎么做理解。”姜大昕表示。

姜大昕对《智能涌现》表示,如果对标语言模型的技术演进时间线,阶跃所押注的“理解+生成一体”的原生多模方向,可能还处在GPT 1.0之前,Transformer刚出来时的阶段。

多模态的一大难点,是融合过程中不能损失单个模态的性能,尤其是不能降智。阶跃采取的技术路线可以说是“难上加难”:同一个大模型,既要做理解,也要做生成。这是阶跃星辰从成立之初,就定下的发展主线。

做理解和生成,是原生多模方向的一体两面,这意味着:

能理解:模型能理解画面中的物体关系,这需要生成端来监督

能生成:生成的内容,也需要理解来控制,保证其不是超出物理世界认知的

直到2025年GPT-4o image的发布,吉卜力、拟人化的风格滤镜点燃全球,多模态又重回全球AI舞台的中心。而DeepSeek为代表的推理模型的进步,也能够为多模态的技术探索,补足一块重要的拼图。

多模态和Agent,是2025年当仁不让的两个关键词。在过去一年中,姜大昕也在不同场合反复强调:多模态是AGI的必经之路。而Agent,则是当下业界在AGI道路上探索出来的初始形态。

当前,阶跃也在重点布局Agent这一领域。在汽车、手机、具身智能、IoT等关键应用场景里,阶跃已经和Oppo、吉利汽车集团、千里科技等企业合作,将Agent应用在关键场景中。

在DeepSeek一飞冲天,引爆全球之后,它的另一面是——当原来坚如磐石的技术壁垒被击穿,所有人都不得不走到了一个焦虑的十字路口上:接下来,技术路线该怎么走?

大厂有存量的场景和用户,尚有充足的时间腾挪方向,加大火力。对大模型初创而言,这个拷问尤为紧迫。短短两个月时间内,大模型六小虎有裁撤团队、砍To C应用者;也有停止投流者,重新将重点放到语言模型中。

对创业公司而言,去探索更前沿、更未知的领域,或许是这个阶段更重要、也更确定的事。

对阶跃而言,这也是一场豪赌——现在,阶跃内部已经组织起不同技术路线的数支团队。“哪一条路线都有可能出现突破,要形成并发的状态。”姜大昕说。

在这次沟通会上,姜大昕除了披露了未来的模型和产品计划外,也对当下的多模态领域给出了关键判断,经《智能涌现》编辑整理:

追求智能的上限仍然是当下最重要的一件事。我也在很多场合不停的重复:多模态是实现AGI的必经之路。

过去两年,我们看到整个行业的模型进化,基本上还是遵循了这个路线图:模拟世界—探索世界—归纳世界。

从技术路线上讲,眼下的发展,也是从单模态到多模态,从多模融合到理解生成一体化,再从强化学习到AI for Science。

阶跃从一开始就始终认为:多模态对通用人工智能非常重要。为什么?

首先,AGI对标的是人类的智能,人的智能是多元化的,每个人除了有来自语言的符号智能,还包括视觉智能、空间智能和运动智能等等,这些智能是需要通过视觉和其他模态来进行学习的。

从应用角度来讲,我们无论做什么应用,都需要AI能听、能看、能说,这样它才能更好地理解用户所处的环境,并且和用户进行更为自然的交流。多模态可以让智能体充分地理解和感知这个世界,这样它可能更好地理解用户的意图。

所以,在多模态领域,任何一个方向出现短板,都会延缓实现AGI的进程。

在多模态层面,下一步的模型发展趋势有两点:一是,在预训练的基础模型上加上强化学习,可以激发模型推理的时候产生长思维链,极大地提高模型的推理能力。

从OpenAI发布o1,到春节前DeepSeek R1发布,我觉得这是一个标志,推理模型从一个趋势变成了范式,现在语言模型基本上是推理模型一统天下。

这是非常火热、大家都争前恐后在做创新的地方。稍微更新一点的,大家不太注意的一个能力,其实是如何把推理引入到多模态领域。

比如,我给一张这个图片(足球比赛),问这个模型这张图片是谁的地方,是谁的主场?这是把模型的感知能力和内部知识能结合起来,一起去做推理,就比原先的视觉理解就强化了很多。

 

△来源:阶跃星辰

第二个趋势是多模理解生成一体化,更准确的讲,是视觉领域的理解生成一体化,理解和生成都用一个模型来完成。

为什么一定要做一体化?比如这个视频中,老师写板书,老师的手的姿势,粉笔在黑板上写的痕迹,比如Sora是可以去模拟之后的样子的。但是老师写了一半停下来说他以后会写什么内容,这是需要理解模型来预测的。

生成的内容是需要理解来控制的,你为了保证生成的内容是有意义的、有价值;

而反过来,理解是需要生成来监督的。只有当我能够生成,生成的时候,我才知道我是真正地理解了。

理解生成一体化,能更好地帮助生成的推理。

我举个例子:人在画一幅大画的时候往往不是一下子就全画完的,现在模型画图的时候一次性就出图了,但人画的时候会有一个构思,可能想大的结构是什么样的,后面再画细节,是一步一步画出来。

画图实际上是一个思维链的过程,为什么我们模型生成的时候不是思维链?就是没有理解生成一体化,我要画一个框架根据这个框架再画点东西再生成、根据生成的东西再生成,甚至觉得这笔画得不太好,反过来改一改再生成,现在就还是堵到这个问题上,就是理解生成不一体,所以他很难用长思维链一步一步的方式去做生成。

 

△来源:阶跃星辰

在语言领域,Predict next token(预测下一个字元)是唯一任务,整个训练的过程就是看你判断Predict得对不对。

平移到视觉领域,大家就会问:我们能不能用一个模型去做predict next frame(预测下一个画面)?这是视觉领域的一个灵魂拷问。很不幸,这个问题仍然没有被解决。

没有解决的原因在于模态的复杂度。大家说,语言是很复杂的,但是从统计来说,语言是一个简单的东西,因为语言至多就十几万个token。

但在视觉,一张图片,我们先不说视频,一张图片1024×1024,就是100万维,每个维度还是一个连续的空间,难度是不一样的。

在语言领域,2017年Transformer出来,对业界最大的意义在于,这是一个可以scale(扩大规模)的文本的理解生成一体化的架构,在那之前,其他的模型基本都不能Scalable。

2020年的GPT-3,意义在于:我们第一次把海量的互联网数据放到了这个scalable的架构上,用一个模型处理所有NLP(自然语言处理)的任务;

2022年,ChatGPT出来了,就是在预训练的模型的基础上再加上指令跟随,这是GPT-3.5做的事情;

GPT-4的时候,这个能力就进一步增强了,"GPT4时刻",指的就是在这个模态上,我们的模型真正能达到跟人的智能差不多的水平。

现在,我们加上了推理,就可以解决非常复杂的问题。

再往后是什么呢?很多人就觉得应该是在线学习或者是自主学习,就是能够不断地自己根据环境去学习到新的知识。

到目前为止,我们觉得语言模型的技术路线基本上收敛了,没有出现别的分支。所以,我们相信其实视觉也是可以follow同样的路线。

那第一步就是有一个非常scalable的架构。多模态的“理解生成一体化”这件事,类比到语言模型,甚至应该是在Transformer这个level的事情。那时候还没有GPT,Transformer是2017年出来的,GPT-1是2018年出来的。

我觉得DeepSeek出来给我们一个经验,就投流的逻辑是不成立的。DeepSeek从 来没有做投流,它如果放开这个流量,破亿是没有问题的。

当然,我们要重新思考一下,AI时代的产品的流量增长,是不是真的像传统的互联网还是靠投流上去的,DeepSeek出来以后,给大家一个重新看待这个问题的窗口。

不光是DeepSeek,像《哪吒2》《黑神话悟空》其实都有一些共性,不是靠传统的铺天盖地地投流积累用户的。

模型的突破是早于商业化的。我刚才做了一个比喻,先有GPT-3.5才会有 ChatGPT,先有多模融合和推理模型,才会有现在成熟的Agent。先要有了多模理解生成一体化,尤其是scalable的一体化,才能真正地做到人形机器人的泛化。

如果是那个东西突破了以后,它的价值就不光是在Agent这方面了,我最想看到它在具身智能的泛化、包括建立世界模型方面有新的突破表现。

 

△来源:阶跃星辰

2025年,我们将产品名称“跃问”改名叫“阶跃 AI”,就是意味着它从一个类ChatGPT的产品,到Agent的能力的转变。

对Agent的产品和商业化层面,我们的智能终端其实是ToC的,虽然我们和头部企业合作,但阶跃这些和头部企业合作的产品,最终是服务C端。

为什么我们还会坚持基础大模型研发?我觉得现在这个行业的趋势技术发展还是在非常陡峭的区间。

2024年Sora刚出来,给大家的震撼很大,但今年回头去看,大家会觉得Sora没有什么神奇的。阶跃不想在这个过程中放弃主流增长或前进的趋势,所以我们还是会坚持做基础模型的研发。

在应用的角度来,我们一直觉得应用和模型是相辅相成的,也就是说模型可以决定应用的上限,应用给模型提供具体的应用场景和数据。

数据也是非常重要的,产品形态随着模型的演变,这是动态发展的。

随着模型能力不断的增强,有什么样的模型,决定了有什么样的应用可以被解锁、可以成熟和繁荣。

最早期的时候,比较流行的是各种各样的聊天机器人;有了Agent以后,我们就可以用它来解数学题、写代码;

下一步是非常火热的智能体,我们相信终将从数字世界走向物理世界,延伸到智能驾驶和人形机器人等领域。

Agent其实在2023年就被讨论,但到2025年变得非常火热。我的理解是,Agent爆发需要两个必要的条件,一个是多模态的能力,另外一个是慢思考的能力,这两个能力恰好在2024年的时候取得了突破性的进展。

我们选择了智能终端Agent作为我们的方向。首先是,Agent要能更好地帮助人类去完成任务,理解用户所处环境和任务的上下文。很多的终端是用户的感知和体验的延伸,比如手机、耳机,在发起任务的时候,它已经知道任务的上下文了。

第二是,很多的智能终端或者是终端的设备,就是帮你完成任务。比如说微波炉,我家里的微波炉有上百功能,但是我很少用,所以我希望它是一个Agent,将来放一个芯片在微波炉里,就可以直接跟它对话,智能终端是完全有能力实现这件事情的。

我们其实现在在智能终端上也选取了几个重要的终端:手机、车,还有机器人。

我们和各个方向的头部企业展开了深度的合作。比如Oppo的一键问屏的功能,背后使用了阶跃的多模态的模型。拍照片,处理照片,或者是识别一下照片里面的人物做一些问答,导航功能都可以。

对于成为垂类行业的供应商,而不是直接To C或者To B,我们是觉得这个东西很新,头部企业已经有了大量的用户,有了场景,我们才能去尝试这个模型究竟怎么做。

如果我们上来做ToC的话,我们第一件事情还要做grow user(用户增长)和场景增长。

所以,我们先和合作伙伴一起合作,等这件事情探索清楚了,将来是不是自己做,我觉得都是有可能的。

现在所有的设备都是孤立的,其实有一个很诱人的场景,对一个用户来说是,希望它的Agent或者是助手,是能跨设备的,这件事情谁来做?我想肯定有很多人在思考。

 

欢迎交流

 

欢迎关注

本文来自微信公众号“智能涌现”,作者:邓咏仪,36氪经授权发布。


来源:36氪

 

2025-05-12 09:00

一季度“万亿之城”稳健开局,新兴产业亮点频出

发布时间:2025-05-12 08:59:51


我国有27座城市2024年的地区生产总值超过1万亿元,被称为“万亿之城”。近期,这些城市的统计部门公布了一季度经济运行情况,其中8城市地区生产总值增速为6%及以上,18城市为5.4%及以上,多数跑赢5.4%的一季度国内生产总值增速“大盘”。多个“万亿之城”一季度投资、消费和出口“三驾马车”发展态势良好,经济增长动力强劲,新能源汽车、机器人、生物医药等新兴产业表现亮眼。专家表示,一季度国民经济开局良好,新质生产力培育壮大,高质量发展向新向好,彰显我国经济的韧性和潜力。(中证网)


来源:36氪

 

2025-05-12 09:00

中信建投:机器人进展持续突破,短期科技成长主线或持续占优

发布时间:2025-05-12 08:56:21


36氪获悉,中信建投研报指出,车展后,新供给带来的整体内需改善及科技成长仍为汽车板块两条清晰投资主线,内需改善在当下,后者依赖技术迭代、客户拓展及风偏上修。机器人方面,近期特斯拉订单等预期持续催化,维持年内规模量产指引,当前或临近定点量产节点,行情预计将进入“去伪存真”的验证期。


来源:36氪

 

2025-05-12 09:00

5月以来基金调研百余家公司,电子行业最受关注

发布时间:2025-05-12 08:54:52


随着年报和一季报披露完成,5月以来多家基金公司展开密集调研,合计调研上市公司109家。这些公司主要集中在电子、机械设备、计算机等领域,其中20家公司获得基金扎堆调研。据证券时报·数据宝统计,5月至今,共计109家上市公司获得基金调研。以申万行业划分,电子、机械设备、计算机排名前三,分别有18家、11家和9家公司获得调研;电力设备、基础化工、纺织服饰、医药生物、汽车板块随后,获调研公司数量均在5家及以上。(证券时报)


来源:36氪

 

上一页 下一页